您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 > 

facebook開源ai(阿里開源新一代 AI 算法模型,由達摩院90后科學家研發) - 副本

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-05-16 02:22:13【】9人已围观

简介阿里開源新一代AI算法模型,由達摩院90后科學家研發近日,阿里AI開源了新一代人機對話模型ESIM。該算法模型提出兩年多,已被包括谷歌、facebook在內的國際學術界在200多篇論文中引用,更曾在國

阿里開源新一代 AI 算法模型,由達摩院90后科學家研發

近日,阿里 AI 開源了新一代人機對話模型 ESIM。該算法模型提出兩年多,已被包括谷歌、facebook 在內的國際學術界在200多篇論文中引用,更曾在國際頂級對話系統評測大賽(DSTC7)上獲得雙料冠軍,將人機對話準確率的世界紀錄提升至94.1%。

ESIM 模型最初由達摩院語音實驗室內的90后科學家陳謙研發,現在已經成為業界的熱門模型和通用標準。這支平均年齡30歲的研發團隊宣布,即日起向全世界企業與個人開源ESIM模型,與全球開發者共享這一成果,共同推進人工智能技術發展。

在去年 DSTC 7大賽上,ESIM 橫掃 NOESIS 賽道,從麻省理工學院、約翰霍普金斯大學、IBM 研究院等近20支參賽隊伍中脫穎而出,拿下該賽道兩項比賽的冠軍。

DSTC 是學術界權威對話系統評測大賽,由微軟研究院、卡耐基梅隆大學的科學家在2013年發起,今年舉辦到了第八屆。NOESIS 賽道考察AI的人機對話能力,要求 AI根據給定的多輪人機對話 歷史 ,從成百到上萬個句子中選出正確的回復。

人機對話系統及其背后的認知智能,是人機交互中最復雜也最重要的技術,曾被比爾蓋茨形容為“人工智能皇冠上的明珠”。為讓機器快速準確理解人類的表達,ESIM給 AI 裝上一套“雷達”系統,賦予它實時檢索對話 歷史 、自動去除干擾信息的能力,使它能夠給出人類期待的回復。

這項突破將給智能客服、導航軟件、智能音箱等應用場景帶去顯著變化,阿里基于 ESIM 模型研發的智能語音點餐機、地鐵語音售票機等應用已在杭州、上海等地落地。

這不是阿里第一次開源前沿技術。2018年達摩院開源了新一代語音識別模型DFSMN,吸引眾多研究者在該模型基礎上開展工作,甚至再度刷新語音識別世界紀錄。

Meta 開源了語言翻譯 AI 模型

Meta(前身是 Facebook)在開源世界做出了不小的貢獻。Meta 除了專注于元宇宙Metaverse和其社交媒體平臺外,還致力于各種研究和創新工作,比如 React(一個 JaveScript 庫)。

現在,Meta 的研究人員決定開源一個叫 “不落下任何語言No Language Left Behind” 項目。

(LCTT 校注:這個直譯項目名稱不夠好聽,我來拋磚引玉,似可稱做“無人獨語”,讀者有什么建議嗎?)

目前,雖然世界上有大約 7000 個在使用中的語言,但大多數在線的內容都是以少數的流行語言來提供的,比如英語。這讓許多不懂這些語言的人處于不利的地位。

雖然現存的許多翻譯工具,但語法錯誤會讓錯誤變得難以閱讀和理解。另外,如果你想把內容翻譯為一個不流行的語言(特別是非洲和亞洲的一些語言),翻譯體驗不會很好。

因此,Meta 正在開發有最高質量的翻譯工具,可以幫助解決這一全球性的問題。

NLLB-200(不落下任何語言No Language Left Behind) 是一個人工智能翻譯模型,其可以翻譯 200 多種語言。該模型在每種語言中的翻譯結果是通過一個名為 FLORES-200 復雜數據集來確定和評估的。

正如 Meta 所說,NLLB 的翻譯結果比以前的人工智能研究方法好 40% 。對于一些最不常見的語言,其翻譯準確率甚至超過 70%。了不起的工作!

為了幫助開發項目和提高模型的翻譯質量,Meta 向所有感興趣的研究人員開放了源代碼,包括 NLLB-200 模型、FLORES-200 數據庫、模型訓練和重建訓練數據庫的代碼。

Meta 宣布向從事聯合國可持續發展目標UN Sustainable Development Goals任何領域工作和翻譯非洲語言的非營利組織和研究人員提供高達 20 萬美元的捐贈,也鼓勵其他學術領域如語言學和機器翻譯的研究人員申請。

盡管 Meta 主要打算在其數字平臺上,特別是在“元宇宙”上使用 NLLB,但 NLLB 也有可能在其他領域產生巨大影響。

許多用戶可以用他們的母語輕松地訪問和閱讀在線資源。項目開源后,社區應該能夠幫助實現這個目標。

你對 Meta 的這個項目有什么看法?

via: 買粉絲s://news.itsfoss.買粉絲/meta-open-source-ai-model/

作者:Rishabh Moharir選題:lkxed譯者:fenglyulin校對:wxy

一文看盡2018全年AI技術大突破:NLP跨過分水嶺、CV研究效果驚人

量子位 出品 | 買粉絲 QbitAI

2018,仍是AI領域激動人心的一年。

這一年成為NLP研究的分水嶺,各種突破接連不斷;CV領域同樣精彩紛呈,與四年前相比GAN生成的假臉逼真到讓人不敢相信;新工具、新框架的出現,也讓這個領域的明天特別讓人期待……近日,Analytics Vidhya發布了一份2018人工智能技術總結與2019趨勢預測報告,原文作者PRANAV DAR。量子位在保留這個報告架構的基礎上,對內容進行了重新編輯和補充。這份報告總結和梳理了全年主要AI技術領域的重大進展,同時也給出了相關的資源地址,以便大家更好的使用、查詢。報告共涉及了五個主要部分:

下面,我們就逐一來盤點和展望,嘿喂狗~

2018年在NLP 歷史 上的特殊地位,已經毋庸置疑。

這份報告認為,這一年正是NLP的分水嶺。2018年里,NLP領域的突破接連不斷:ULMFiT、ELMo、最近大熱的BERT……

遷移學習成了NLP進展的重要推動力。從一個預訓練模型開始,不斷去適應新的數據,帶來了無盡的潛力,甚至有“NLP領域的ImageNet時代已經到來”一說。

正是這篇論文,打響了今年NLP遷移學習狂歡的第一槍。論文兩名作者一是Fast.ai創始人Jeremy Howard,在遷移學習上經驗豐富;一是自然語言處理方向的博士生Sebastian Ruder,他的NLP博客幾乎所有同行都在讀。兩個人的專長綜合起來,就有了ULMFiT。想要搞定一項NLP任務,不再需要從0開始訓練模型,拿來ULMFiT,用少量數據微調一下,它就可以在新任務上實現更好的性能。

他們的方法,在六項文本分類任務上超越了之前最先進的模型。詳細的說明可以讀他們的論文:買粉絲s://arxiv.org/abs/1801.06146Fast.ai網站上放出了訓練腳本、模型等:買粉絲://nlp.fast.ai/category/classification.買粉絲

這個名字,當然不是指《芝麻街》里那個角色,而是“語言模型的詞嵌入”,出自艾倫人工智能研究院和華盛頓大學的論文Deep 買粉絲ntextualized word representations,NLP頂會NAACL HLT 2018的優秀論文之一。

ELMo用語言模型(language model)來獲取詞嵌入,同時也把詞語所處句、段的語境考慮進來。

這種語境化的詞語表示,能夠體現一個詞在語法語義用法上的復雜特征,也能體現它在不同語境下如何變化。

當然,ELMo也在試驗中展示出了強大功效。把ELMo用到已有的NLP模型上,能夠帶來各種任務上的性能提升。比如在機器問答數據集SQuAD上,用ELMo能讓此前最厲害的模型成績在提高4.7個百分點。

買粉絲s://allennlp.org/elmo

它由Google推出,全稱是 B idirectional E n買粉絲der R epresentations from T ransformers,意思是來自Transformer的雙向編碼器表示,也是一種預訓練語言表示的方法。從性能上來看,沒有哪個模型能與BERT一戰。它在11項NLP任務上都取得了最頂尖成績,到現在,SQuAD 2.0前10名只有一個不是BERT變體:

如果你還沒有讀過BERT的論文,真的應該在2018年結束前補完這一課:買粉絲s://arxiv.org/abs/1810.04805另外,Google官方開源了訓練代碼和預訓練模型:買粉絲s://github.買粉絲/google-research/bert如果你是PyTorch黨,也不怕。這里還有官方推薦的PyTorch重實現和轉換腳本:買粉絲s://github.買粉絲/huggingface/pytorch-pretrained-BERT

BERT之后,NLP圈在2018年還能收獲什么驚喜?答案是,一款新工具。

就在上周末,Facebook開源了自家工程師們一直在用的NLP建模框架PyText。這個框架,每天要為Facebook旗下各種應用處理超過10億次NLP任務,是一個工業級的工具包。

(Facebook開源新NLP框架:簡化部署流程,大規模應用也OK)

PyText基于PyTorch,能夠加速從研究到應用的進度,從模型的研究到完整實施只需要幾天時間。框架里還包含了一些預訓練模型,可以直接拿來處理文本分類、序列標注等任務。

想試試?開源地址在此:

買粉絲s://github.買粉絲/facebookresearch/pytext

它能主動打電話給美發店、餐館預約服務,全程流暢交流,簡直以假亂真。Google董事長John Hennessy后來稱之為“非凡的突破”,還說:“在預約領域,這個AI已經通過了圖靈測試。”Duplex在多輪對話中表現出的理解能力、合成語音的自然程度,都是NLP目前水平的體現。如果你還沒看過它的視頻……

NLP在2019年會怎么樣?我們借用一下ULMFiT作者Sebastian Ruder的展望:

今年9月,當搭載BigGAN的雙盲評審中的ICLR 2019論文現身,行家們就沸騰了: 簡直看不出這是GAN自己生成的 。

在計算機圖像研究史上,BigGAN的效果比前人進步了一大截。比如在ImageNet上進行128×128分辨率的訓練后,它的Inception S買粉絲re(IS)得分166.3,是之前最佳得分52.52分 3倍 。

除了搞定128×128小圖之外,BigGAN還能直接在256×256、512×512的ImageNet數據上訓練,生成更讓人信服的樣本。

在論文中研究人員揭秘,BigGAN的驚人效果背后,真的付出了金錢的代價,最多要用512個TPU訓練,費用可達11萬美元,合人民幣76萬元。

不止是模型參數多,訓練規模也是有GAN以來最大的。它的參數是前人的2-4倍,批次大小是前人的8倍。

研究論文:買粉絲s://openreview.買粉絲/pdf?id=B1xsqj09Fm

前前后后,Fast.ai團隊只用了16個AWS云實例,每個實例搭載8塊英偉達V100 GPU,結果比Google用TPU Pod在斯坦福DAWNBench測試上達到的速度還要快40%。這樣拔群的成績,成本價只需要 40美元 ,Fast.ai在博客中將其稱作人人可實現。

相關地址: Fast.ai博客介紹:

今年8月,英偉達和MIT的研究團隊高出一個 超逼真 高清視頻生成AI。

只要一幅動態的語義地圖,就可獲得和真實世界幾乎一模一樣的視頻。換句話說,只要把你心中的場景勾勒出來,無需實拍,電影級的視頻就可以自動P出來:

除了街景,人臉也可生成:

這背后的vid2vid技術,是一種在生成對抗性學習框架下的新方法:精心設計的生成器和鑒別器架構,再加上時空對抗目標。

這種方法可以在分割蒙版、素描草圖、人體姿勢等多種輸入格式上,實現高分辨率、逼真、時間相干的視頻效果。

好消息,vid2vid現已被英偉達開源。

研究論文:買粉絲s://tcwang0509.github.io/vid2vid/paper_vid2vid.pdf

GitHub地址買粉絲s://github.買粉絲/NVIDIA/vid2vid

相關地址

相關地址

其實早在10年前,人工智能就曾打敗過人類

其實,早在10年前,即1997年,電腦“深藍”就曾戰勝過國際象棋冠軍。當時,媒體是這樣報道的:1997年5月11日,IBM公司開發的電腦“深藍”戰勝國際象棋冠軍卡斯帕羅夫,成為首個在標準比賽時限內擊敗國際象棋冠軍的電腦系統。當時,就有業內人士認為,這是人工智能真正的春天。

2013年,各IT巨頭紛紛發力,把人工智能的深度學習算法廣泛地運用在產品開發中。首先是Facebook成立人工智能實驗室,探索人工智能深度學習領域,借此為Facebook用戶提供更智能化的產品體驗。之后,Google收購了語音和圖像識別公司DNNResearch,推廣深度學習平臺。百度也瞄準商機,創立了深度學習研究院。

2015年是人工智能的突破之年,Google開源了利用大量數據便能訓練計算機來完成任務的第二代機器學習平臺TensorFlow,推動人工智能深度學習平臺的發展。劍橋大學順應時代發展需求,建立了人工智能研究所,給廣大AI人才提供深入學習的平臺。

2016年的人工智能風暴可謂“全民皆知”啊!2016年3月15日,Google人工智能AlphaGo以總比分4:1戰勝世界圍棋冠軍李世石,人機大戰以人工智能的勝利落下帷幕。這一次的人機大戰讓人工智能正式被世人所熟知,整個人工智能行業曾經的“寂靜”好像被打破了,人工智能市場被引燃了,開始新一輪的爆發。

未來人工智能的發展,“誰與爭鋒”?你認為人工智能真正的春天是在什么時候呢?

常用的人工智能軟件平臺有哪些?

常用的人工智能軟件平臺有以下幾個:

TensorFlow:由 Google 開發的開源機器學習框架,在國內也很受歡迎,擁有廣泛的用戶及社區支持。

PyTorch:由 Facebook 開發,國內使用較為廣泛,特別是在學術界和科研領域中廣受歡迎。

PaddlePaddle:百度自主研發的開源深度學習平臺,也是國內較為流行的人工智能軟件平臺。

MindSpore:華為近年來推出的開源AI框架,支持多種硬件平臺,國內也享有較高聲譽。

NCNN:騰訊優圖推出的輕量級的深度學習框架,適用于手機端、嵌入式設備等場景。

2022年開源技術的7大趨勢

開放源碼技術是指一種技術或軟件,通過其源代碼在大眾中分布,使程序員能夠改變應用程序或程序的行為。如果一個程序員可以訪問特定軟件的源代碼,他可以修改、檢查和更改該軟件,通過升級它的新功能或修復一個破損的部分,以提高其效率。

讓我們來看看開源技術領域即將發生的一些最大趨勢,這些趨勢將在未來幾年改變這個行業。

對擁有開源技能的全棧開發人員和 IT 人員的需求將會激增。在軟件系統的開發、建模和操作中使用的棧的多樣性將為程序員和開發人員提供大量的機會來增強他們的技能集。在云計算、 DevOps 工具、 Kuber買粉絲es、 Python、 PyTorch 等領域的經驗將使程序員能夠優化業務并增加收入。企業和企業,無論是大企業還是小企業,都希望在投資開源技術的力量和解決客戶問題的積極影響時填補空白(Kamaruzzaman,2021)。

Kuber買粉絲es (作為云應用程序的開源容器編排平臺)的采用將會增加。這將使兼容的開源容器格式得以廣泛使用,正如 Open Container Initiative 中所描述的那樣。盡管實現 Kuber買粉絲es 所需的學習曲線非常龐大,但是隨著全球大量 IT 團隊認識到這種技術所具有的真正潛力,一切進展順利。Kuber買粉絲es 被認為是最重要的開源技術,它的采用將在2022年增加(Wallen,2022)。

Snap 和 Flatpak 都是為分發 Linux 應用程序而設計的系統。盡管隨著時間的推移,這些系統一直受到嘲笑,但它們簡化了應用程序的安裝過程,并為桌面上的更多應用程序騰出了空間。由于 Snap 和 Flatpak,像 Slack、 Spotify 和 Skype 這樣的應用程序可以毫無困難地安裝。現在需要這兩個系統,Linux 社區遲早會理解它們的重要性。在不久的將來,一個完全默認為 Snap 和 Flatpak 的發行版將在 App Store 上發布。這將是對新用戶的一次款待(Kamaruzzaman,2021)。

隨著開源技術在當今 IT 世界的普及,加強安全措施以防止對這種技術的網絡攻擊的必要性也在增加。可以掃描開源軟件漏洞的新工具將被引入,并將被頻繁地用于減輕任何傷害。從事開源技術的 IT 公司和組織將投資于獲取新版本的軟件和補丁,以改善整體安全狀況。

當黑客發現未經修補的開源漏洞,他們可以插入討厭的病毒或軟件時,他們就會入侵軟件供應鏈。但現在這一切都要停止了。像 Linux 基金會這樣的組織將加強他們的 游戲 ,防止黑客實現他們的惡意設計。諸如數字簽名服務等高級開源工具的開發將在2022年及以后繼續發展(Wallen,2022)。

諸如人工智能(AI)、機器學習(ML)、深度學習(DL)和數據驅動技術等技術將會繼續存在,并且它們的實現和執行將會迅速增加。人工智能可以對人類有很大的幫助,因為它可以一遍又一遍地執行枯燥、單調的任務,為開發人員和程序員節省大量時間。他們可以將注意力轉移到手頭更聰明的任務上。使用 GPT-3和其他 NLP 庫,AI 能夠自動完成這些任務。一些人工智能助手足夠聰明,可以為開發人員生成源代碼,比如 Tabine、 gitHub Copilot 和 Codota。它們仍然處于早期階段,但隨著時間的推移逐漸成熟(Wallen,2022)。

Steam Deck是一個便攜式手持 游戲 設備,并在2022年,Linux 是確定,它可以 游戲 。Linux 不會取代 Windows 在桌面 游戲 領域的地位,但它將證明 Linux 也是一個可行的選擇,當它來玩 游戲 通過蒸汽(Martinez-Torres & Diaz-Fernandez,2013)。

很赞哦!(67231)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款的名片

职业:程序员,设计师

现居:河北省邯郸成安县

工作室:小组

Email:[email protected]