AI在大家心目中已經(jīng)不再陌生,AI可以寫文章、寫詩、寫PPT、智能對(duì)話、生成圖片,甚至有些還能生成視頻,今天方維網(wǎng)絡(luò)給大家整理了國(guó)內(nèi)外出名的AI大模型:
文心大模型:文心大模型是百度推出的一套產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型,既包含基礎(chǔ)通用的文本、圖像、視頻、語音、對(duì)話、NLP大模型,也包含聯(lián)合研發(fā)的跨模態(tài)、生物計(jì)算大模型,以及面向重點(diǎn)任務(wù)領(lǐng)域和行業(yè)的大模型,以及豐富的工具與平臺(tái),支撐企業(yè)與開發(fā)者進(jìn)行高效便捷的應(yīng)用開發(fā)。文心大模型的新升級(jí)包括新增11個(gè)大模型,大模型總量增至36個(gè),構(gòu)建起業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型體系,以及基于大模型的文心一言、文心一格等產(chǎn)品的升級(jí)和推出。
M6大模型:這是阿里巴巴達(dá)摩院研發(fā)的超大規(guī)模語言模型,參數(shù)規(guī)模高達(dá)10萬億,遠(yuǎn)超谷歌、微軟此前發(fā)布的萬億級(jí)模型。M6大模型使用高達(dá)512張GPU,歷時(shí)三個(gè)多月才得以完成訓(xùn)練。它擁有強(qiáng)大的文本生成能力,如小說創(chuàng)作、文案撰寫、摘要生成、代碼編寫、對(duì)話問答等,同時(shí)與圖像生成關(guān)系緊密,可生成圖片描述、文案創(chuàng)意、海報(bào)設(shè)計(jì)等。
紫東太初:紫東太初是由中國(guó)科學(xué)院自動(dòng)化研究所、華為等單位聯(lián)合研發(fā)的多模態(tài)大模型,實(shí)現(xiàn)了以圖生音、以音生圖、以音寫文、圖文問答、圖圖問答、以文搜圖等眾多跨模態(tài)功能,并且具有大規(guī)??缒B(tài)檢索能力。其兼具有跨模態(tài)理解和生成能力,具有了在無監(jiān)督情況下多任務(wù)聯(lián)合學(xué)習(xí)、快速遷移到不同領(lǐng)域數(shù)據(jù)的強(qiáng)大能力。
國(guó)外公司的大模型有
GPT系列:由OpenAI公司開發(fā)的GPT(Generative Pre-trained Transformer)系列模型是自然語言處理領(lǐng)域的重要模型之一。GPT-3是該系列的最新版本,具有1750億個(gè)參數(shù),可以生成高質(zhì)量的自然語言文本。
BERT:BERT(Bidirectional Encoder Representations from Transformers)是Google公司開發(fā)的一種基于Transformer架構(gòu)的預(yù)訓(xùn)練模型,用于自然語言處理任務(wù)。它在多項(xiàng)基準(zhǔn)測(cè)試中取得了最佳性能,并被廣泛應(yīng)用于各種NLP任務(wù)。
T5:T5(Text-to-Text Transfer Transformer)是Google公司開發(fā)的另一種基于Transformer架構(gòu)的模型,它將所有NLP任務(wù)都轉(zhuǎn)化為文本生成任務(wù),具有高度的靈活性和通用性。
ViT:ViT(Vision Transformer)是Google公司開發(fā)的一種基于Transformer架構(gòu)的計(jì)算機(jī)視覺模型,它將圖像分割成小塊,并使用Transformer來處理這些小塊,從而在圖像分類、目標(biāo)檢測(cè)等任務(wù)上取得了很好的性能。
Swin Transformer:Swin Transformer是一種基于Transformer架構(gòu)的計(jì)算機(jī)視覺模型,由微軟亞洲研究院開發(fā)。它通過引入Shifted Windows和Swin Transformer blocks等技術(shù),在保持計(jì)算效率的同時(shí)提高了模型的性能。
DALL-E 2:DALL-E 2是OpenAI公司開發(fā)的一種基于深度學(xué)習(xí)的圖像生成模型,可以根據(jù)用戶提供的文本提示生成高質(zhì)量、高分辨率的圖像。
Codex:Codex是OpenAI公司開發(fā)的一種基于GPT-3的模型,專門用于代碼生成和理解。它可以根據(jù)自然語言描述生成相應(yīng)的代碼片段,并理解代碼的功能和語義。
這些AI大模型在自然語言處理、計(jì)算機(jī)視覺、圖像生成等領(lǐng)域取得了顯著的成果,并為人工智能的發(fā)展做出了重要貢獻(xiàn)。然而,它們也需要大量的計(jì)算資源和數(shù)據(jù)來進(jìn)行訓(xùn)練和推理,因此通常只有大型科技公司和研究機(jī)構(gòu)才能承擔(dān)得起這樣的開銷。