比特派最新錢包|亞馬遜追趕微軟谷歌,兩日推出多項(xiàng) AI 功能:多樣 LLM 選擇、打破數(shù)據(jù)孤島是其兩大戰(zhàn)略 - AI新智界
圖片來源:由無界 AI生成
在新興的生成式人工智能領(lǐng)域,云計(jì)算巨頭亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)一直被認(rèn)為落后于其競爭對手微軟 Azure 和谷歌云(Google Cloud)。
但在過去兩天的 AWS Re:Invent 大會上,亞馬遜奮起直追,昭告了它希望成為生成式 AI 領(lǐng)域領(lǐng)頭羊的愿望。
繼昨日 AWS 首席執(zhí)行官 Adam Selipsky 宣布推出了名為 Amazon Q 的新型聊天機(jī)器人,升級款的 AI 系統(tǒng)處理器 Trainium2,并與英偉達(dá)拓展伙伴關(guān)系外。今日,AWS 數(shù)據(jù)與人工智能副總裁 Swami Sivasubramanian 在其主題演講中又發(fā)布了一系列公告。
以下是今天 14 項(xiàng)功能要點(diǎn):
1. 更多 LLM 選擇:通過 Bedrock,亞馬遜 AWS 已為企業(yè)客戶提供了對模型的訪問權(quán)限?,如自己的預(yù)訓(xùn)練基礎(chǔ)模型 Titan,以及來自第三方的基礎(chǔ)模型,如 AI21 的 Jurassic、Anthropic 的 Claude、Meta 的 Llama 2 和 Stable Diffusion。
正如此前 9 月,亞馬遜向 Anthropic 投資? 40 億美元的熱忱一樣,Sivasubramanian 宣布將為 Anthropic 提供更多模型支持。他大肆宣揚(yáng)了 Bedrocks 對 Anthropic 的 Claude 模型的支持,AWS 成為首家支持 Claude 2.1? 的云提供商。據(jù)悉,該模型擁有業(yè)界領(lǐng)先的 20 萬 token 上下文窗口、且準(zhǔn)確性更高,幻覺率更低。此外,Sivasubramanian 還宣布了 Bedrocks 對 Meta 的 Llama 2、70B(一種開源模型)的支持,這表明 AWS 將繼續(xù)支持開源。
2. 支持多模式向量嵌入:矢量嵌入是一種將文本和其他文件轉(zhuǎn)化為稱為矢量的數(shù)字表示的技術(shù)。這些向量可以讓模型更容易地理解相似詞語之間的關(guān)系,例如“貓”與“小貓”的意思相近,繼而使模型能夠?yàn)橛脩籼峁└嚓P(guān)的回復(fù)。亞馬遜此前曾宣布采用 Titan 文本嵌入技術(shù),并在內(nèi)部將其用于亞馬遜上的產(chǎn)品推薦,但它只適用于文本。
今天,Sivasubramanian 宣布,泰坦多模型嵌入技術(shù)(Titan Multi-model Embeddings)將全面投入使用,這將使在 LLM 中提供多模態(tài)搜索和推薦選項(xiàng)變得更加容易。
3. 文本生成模型 Titan TextLite 和 Titan TextExpress 已全面上市:TextLite 是一種輕量級模型,適用于聊天機(jī)器人內(nèi)的文本摘要、文案撰寫和微調(diào),而 Titan TextExpress 則適用于開放式文本生成和對話聊天。
4. 泰坦圖像生成器(Titan Image Generator?)可在預(yù)覽模式下生成隱形水印,以確保安全:這種模式使客戶能夠使用簡單的語言提示,生成用于增強(qiáng)現(xiàn)有圖像的高質(zhì)量逼真圖像。用戶可以使用自己的數(shù)據(jù)自定義圖像,創(chuàng)建反映自己品牌的內(nèi)容。Sivasubramanian 表示,該模型在不同的數(shù)據(jù)集上進(jìn)行訓(xùn)練,以實(shí)現(xiàn)準(zhǔn)確的輸出,同時(shí)還能減少毒性和偏差。
他說,人類評估員的測試結(jié)果表明,該模型的得分高于其他競爭模型。此外,該模型生成的所有圖像默認(rèn)都帶有隱形水印,“旨在幫助避免虛假信息的傳播……并具有防篡改功能”。他說,Titan Image Generator 是市場上第一款帶有這種水印的產(chǎn)品。
在主題演講中,Sivasubramanian 以一張鬣蜥圖片為例,展示了該模型的編輯功能。其中一項(xiàng)功能叫做“outpainting”,允許用戶替換圖片的背景,在演示案例中,Sivasubramanian 用雨林圖片替換了普通背景。此外,他還展示了如何改變圖片主體,以及如何使用自然語言來改變鬣蜥的朝向。
5.使檢索增強(qiáng)生成(RAG)更容易:亞馬遜正在使用 RAG 讓 LLMs 搜索自己的專有數(shù)據(jù)存儲。通常情況下,RAG 非常復(fù)雜,工程師必須將數(shù)據(jù)轉(zhuǎn)換為矢量嵌入,并將其存儲到矢量數(shù)據(jù)庫中,需要的時(shí)間在數(shù)周甚至數(shù)月。為此,亞馬遜發(fā)布了亞馬遜 Bedrock 知識庫,允許企業(yè)用戶只需將 LLM 指向他們的數(shù)據(jù)位置(如 S3 存儲桶),AWS Bedrock 就能獲取相關(guān)文本或文檔,并自動完成所有矢量轉(zhuǎn)換。此外,它還可與 Vector Engine、Redis Enterprise Cloud 和 Pinecone 等流行的矢量數(shù)據(jù)庫配合使用。亞馬遜還宣布將“很快”支持 Amazon Aurora,、MongoDB 和更多數(shù)據(jù)庫。
6. 亞馬遜 Bedrock 模型評估預(yù)覽:這是企業(yè)評估、比較和選擇最適合其用例的基礎(chǔ)模型的一種方法。
7. 自動“代理”應(yīng)用 RAG DIY:生成式 AI 代理(Agents)最近很熱,因?yàn)樗鼈兛梢栽谝欢ǔ潭壬献灾餍袆?。Agents 是通過動態(tài)調(diào)用各種應(yīng)用程序接口來執(zhí)行復(fù)雜任務(wù)的人工智能應(yīng)用程序,亞馬遜通過 Agents for Amazon 對此提供了支持,該代理于昨天全面上線。
今天早上,Sivasubramanian 展示了一個名為 RAG DIY 的假想代理,以展示代理的能力。由 LLM 驅(qū)動的 RAG DIY 助手基于 Bedrock 中的 Claude 2,允許人們使用自然語言提問來完成家居和其他項(xiàng)目。Swami 舉了一個例子:例如一位女士想更換浴室的梳妝臺。那么,她可以向該助手詢問任何類型的產(chǎn)品,并收到一份詳細(xì)的步驟、材料和工具清單,以及所需的許可證。該助手會利用用戶的輸入,并調(diào)用 Titan image generator 的圖像,然后,RAP DIY 應(yīng)用程序使用多模態(tài)模型嵌入來搜索其大量庫存,并檢索所需的所有產(chǎn)品。通過調(diào)用專門用于摘要任務(wù)的 Cohere Command 模型,該助手還可以為她提供任何產(chǎn)品的用戶評論摘要。
8. Gen AI 創(chuàng)新中心幫助企業(yè)建立定制模型:AWS 今年早些時(shí)候宣布成立創(chuàng)新中心,為企業(yè)建立基礎(chǔ)模型提供專家?guī)椭?,包括?shù)據(jù)科學(xué)和戰(zhàn)略專業(yè)知識。AWS 今日宣布,從明年開始,它將為圍繞 Anthropic 的 Claude 模型構(gòu)建提供定制支持,包括提供專家團(tuán)隊(duì),幫助企業(yè)利用自身數(shù)據(jù)對模型進(jìn)行微調(diào)。
9. 用于模型訓(xùn)練的 Sagemaker Hyperpod 移至 GA:越來越多的公司發(fā)現(xiàn),基礎(chǔ)模型的訓(xùn)練過程極具挑戰(zhàn)性。它需要海量數(shù)據(jù)、創(chuàng)建和維護(hù)由數(shù)千個 AI 加速器組成的昂貴集群、編寫代碼以在集群間分配模型訓(xùn)練。近日,亞馬遜宣布與 Nvidia 達(dá)成合作,而這確保了對最新 GPU 集群的訪問,因此 Hyperpod 可以為客戶完成所有這些工作。AWS 表示,Hyperpod 可以將模型訓(xùn)練時(shí)間最多縮短 40%。此外,AWS 還宣布了 Sagemaker 在推理、訓(xùn)練和 MLOps 方面的一系列其他功能。
10. 重要的數(shù)據(jù)庫集成,包括矢量支持:亞馬遜為管理數(shù)據(jù)的企業(yè)公司提供了最廣泛的云數(shù)據(jù)庫,但這些數(shù)據(jù)庫仍然是孤島式的,使得企業(yè)公司更難通過 LLM 輕松訪問這些數(shù)據(jù)。亞馬遜已經(jīng)意識到了這一點(diǎn),并正在努力打破這些孤島,而微軟對其 Fabric 計(jì)劃?的吹捧也刺激了亞馬遜。目前,亞馬遜已開始投資于這一所謂的零 ETL 愿景,并從去年開始實(shí)施?,整合了自己的一些數(shù)據(jù)庫,如 Aurora 和 Redshift。
今日,AWS 宣布整合 Amazon OpenSeach 和 Amazon S3,讓用戶可以在一個地方分析和可視化所有日志數(shù)據(jù),而無需創(chuàng)建任何 ETL 管道。昨日,亞馬遜宣布在其 Redshift lakehouse 數(shù)據(jù)庫與其流行的 Aurora Postgres、Dynamo DB 和 Redis MySQL 數(shù)據(jù)庫之間,以及 DynamoDB 與 OpenSearch 之間實(shí)現(xiàn)零 ETL 集成。
但企業(yè)對集成的渴望還包括允許在多個數(shù)據(jù)庫中存儲和查詢矢量數(shù)據(jù)。最近,亞馬遜為其 Aurora MySQL(一種基于云的關(guān)系數(shù)據(jù)庫)添加了矢量搜索支持?。今年 7 月,亞馬遜在預(yù)覽模式下為其 OpenSearch Serverless 產(chǎn)品推出?了矢量數(shù)據(jù)庫功能 Vector Engine。今天,該功能已進(jìn)入全面可用狀態(tài)。
同樣在今天,AWS 宣布其兩個更受歡迎的數(shù)據(jù)庫 --DocumentDB 和 DynamoDB 都支持矢量搜索,DocumentDB 客戶可以在同一個數(shù)據(jù)庫中同時(shí)存儲源數(shù)據(jù)和矢量數(shù)據(jù)。
11. 矢量搜索可用于 Redis 的內(nèi)存數(shù)據(jù)庫(預(yù)覽模式):Sivasubramanian 強(qiáng)調(diào)了銀行等注重安全的大型公司在欺詐檢測或?qū)崟r(shí)聊天機(jī)器人等用例中使用“超快”矢量搜索的需求。他說,DB for Redis 現(xiàn)在可以存儲數(shù)百萬個向量,并為向量查詢提供個位數(shù)毫秒的響應(yīng)時(shí)間。
12. 結(jié)合 Neptune Analytics,現(xiàn)已進(jìn)入 GA:Sivasubramanian 補(bǔ)充說,客戶正在尋找利用圖形分析來分析相互關(guān)聯(lián)數(shù)據(jù)的方法,因此亞馬遜正在將矢量搜索與圖形分析能力結(jié)合起來,以發(fā)現(xiàn)數(shù)據(jù)間更多隱藏的關(guān)系 -- 這可以讓 LLM 變得更加強(qiáng)大。Neptune Analytics 是亞馬遜圖形數(shù)據(jù)庫 Neptune 的分析引擎,它允許數(shù)據(jù)科學(xué)家從亞馬遜 Neptune 圖形數(shù)據(jù)或 S3 上的數(shù)據(jù)湖中找到聯(lián)系,速度比以前快“80 倍”。它將圖形和矢量數(shù)據(jù)存儲在一起。Sivasubramanian 以 Snap 公司為例,該公司使用 Neptune Analytics 在“短短幾秒鐘內(nèi)”就找到了其 5000 萬活躍用戶中的數(shù)十億個連接。
13. 讓第三方在凈室數(shù)據(jù)上執(zhí)行機(jī)器學(xué)習(xí)(預(yù)覽模式):亞馬遜宣布,客戶可以在所謂的“凈室”中與第三方共享數(shù)據(jù),然后讓他們在數(shù)據(jù)上運(yùn)行機(jī)器學(xué)習(xí)(ML)模型,以獲得預(yù)測性見解。這項(xiàng)服務(wù)被稱為 AWS Clean Rooms ML。Sivasubramanian 表示,雖然基本的 ML 模型現(xiàn)在就可以使用,但專業(yè)的醫(yī)療保健和其他模型將在“未來幾個月”推出。
14. 用于亞馬遜 Redshift 中生成式 SQL 的 Amazon Q:Amazon Q? 是一款為特定企業(yè)量身定制的人工智能助手,是 AWS 昨天發(fā)布的重頭戲。亞馬遜今天宣布 Q 可以支持 SQL,即客戶日常用于查詢文件的主要編碼語言。有時(shí)這些 SQL 查詢可能很復(fù)雜,但現(xiàn)在用戶可以使用 Q 將自然語言提示轉(zhuǎn)化為定制的查詢建議,用于分析亞馬遜 Redshift lakehouse 中 PB 級的非結(jié)構(gòu)化數(shù)據(jù)。目前該功能還處于預(yù)覽階段。不久,用戶還可以使用 Q 創(chuàng)建使用自然語言的數(shù)據(jù)集成管道(AWS 稱之為 Amazon Glue)。
從這兩日的宣告來看,亞馬遜尋求差異化的戰(zhàn)略主要在兩個方面。首先是為客戶提供選擇。昨日,Selipsky 在會上暗暗影射了微軟,稱微軟依賴于一家 LLM 公司(OpenAI),而亞馬遜則計(jì)劃向許多供應(yīng)商提供服務(wù)。其次,亞馬遜的另一項(xiàng)戰(zhàn)略是打破各種數(shù)據(jù)庫之間的孤島,讓企業(yè)客戶在使用 LLM 時(shí)可以更輕松地利用他們的專有數(shù)據(jù)。
生成式 AI 的熱潮已經(jīng)席卷到了云計(jì)算巨頭間,亞馬遜 AWS 會迎頭趕超,還是微軟 Azure、谷歌 Cloud 將繼續(xù)領(lǐng)跑?
參考來源:
https://venturebeat.com/ai/amazon-awss-barrage-of-gen-ai-announcements-aim-to-outdo-microsoft/