豆包ai官方下載app,豆包的包法大全
作者 | 虞景霖
編輯 | 鄧詠儀
半年來悶不做聲的字節,終于發布自家大模型的最新進展了!
沒有一點點訊號,8月17日,字節跳動宣布開始對外測試AI對話產品“豆包”,進入官網(https://www.doubao.com/ )直接注冊使用或通過官網提供的二維碼下載App即可使用。
來源:豆包app
在“豆包”發布前,字節最新的AI進展,是6月被曝光的內部AI項目“Grace”。
據Tech星球報道,Grace在7月就開始小范圍內測,再到如今改名“豆包”,正式與公眾見面。
不過,據36氪最新獲得的信息,字節Grace并不能算是豆包前身,Grace在內部的定位更像是個AI應用貨架,“豆包”只是Grace團隊開發的第一款產品。目前,掃描豆包官網的App下載按鈕,官網會顯示安卓和IOS App都只能下載Beta測試版本。
“豆包”體驗感如何?從名字“豆包”還有可愛的虛擬3D形象就可以看出,字節并不是希望做一個像ChatGPT那樣的“學霸”工具,而是一個更親民的產品。
進入默認頁,可以發現“豆包”將頁面分為兩部分,左邊是四個AI機器人,包括豆包、超愛聊天的小寧、英語學習助手和全能寫作助手。右邊是AI機器人對應的對話框。
來源:豆包app
四個AI助手有什么區別呢?
聽豆包自己介紹——
來源:豆包app
總結來說,它們四個各有所長——
豆包是班長,哪里需要哪里搬;
超愛聊天的小寧是中國好同桌,聊天逗趣好搭子;
英語學習助手是英語課代表,全方位提高你的英語成績;
全能寫作助手是語文課代表,文學素養全靠它。
但這并不代表用戶只能使用這四個默認AI機器人,就像在ChatGPT建立新對話框一樣,用戶可以通過創建新的對話框來“另起一個”,還可以編輯新對話的名字或者刪除該對話。
來源:豆包
如果你向豆包提問:豆包是誰?可以做什么?
來源:豆包
來源:豆包
自ChatGPT橫空出世,同樣作為生成式人工智能,豆包和其他生成式人工智能大語言模型相比,有什么優勢和劣勢?
來源:豆包
下面再來看看“豆包”的“語言理解能力”。
來源:豆包
若提問四大名著,“豆包”回答準確,且在理解小說內容方面表現良好。
相比之下,豆包在“總結”劣勢方面表現得相當誠實——它的準確性確實有待提高。
當我們隨機輸入一道數學題:
來源:豆包
正確的答案應該是[0,1),即使重新回答,也依然提供了錯誤答案......
來源:豆包
如果不是數學學科又會如何?
來源:豆包
回答正確!
另外,從測評來看,“豆包”僅支持回答“有科學依據”的問題。
來源:豆包
除了中文,“豆包”還支持英文對話,點擊右上角即可切換語言。
來源:豆包
有傳言稱國產大模型缺乏自己的數據庫,需要大量借助英語國家的數據進行訓練,“豆包”是否會這樣,切換語言測試一下:
從講笑話來看,“豆包”在中英文的表現半斤八兩。
來源:豆包
無聊的時候可以找“超愛聊天的小寧”聊天,它是否是一個合格的聊天好搭子呢?讓我來測試一下!
來源:豆包
小寧的“默認狀態”就好像水豚,相當穩定與嚴肅。但十分聽話,當你希望它切換風格的時候它能立即切換。
全能寫作助手不僅可以根據要求生成詩歌,還提供了閱讀鑒賞功能。
來源:豆包
盡管這首《田間之歌》的詩句并不那么優美,但這首詩可僅僅只用了10s不到。
當我們向“英語學習助手”提問時,它的回答表現又如何呢?
來源:豆包
根據提問建議,我嘗試詢問它“ban”和“interdict”兩詞的區別,可以看到,“英語學習助手”的回答并不完全是英文。
如果覺得英文的回答中仍然不好理解,可以讓“英語學習助手”把它轉化為中文,雙語切換,十分絲滑~
總體而言,“豆包”目前能夠支持一些簡單問答,準確性有待提升。
并且,現在豆包是僅支持文字生成,暫時還沒有上圖片功能。
豆包也還沒有聯網。根據字節官方介紹,“豆包”的訓練數據截至2023年之前,因此無法回答2023年的相關問題。
埋頭苦干半年,字節大模型“潛行”相較于國內其他互聯網企業,字節盡管早在2月就開始了大模型團隊組建,但到真正發布第一款產品“豆包”,可謂是姍姍來遲。
字節在人工智能領域布局已久。2016年,字節就成立了人工智能實驗室AI Lab,聚焦于自然語言處理、機器學習、數據挖掘等方面的研究。
不過,國內“大模型之戰”掀起后,字節一直沒有公布任何底層大模型的進展。
反倒是在6月,火山引擎先發布了大模型服務平臺“火山方舟”,給國內大模型公司提供算力和其他配套服務。
來源:火山引擎
而到最近發布豆包,字節大模型團隊其實悄悄放出了不少進展。
7月,一個名為BuboGPT的大模型正式上線Github,背后同樣是字節跳動團隊。
BuboGPT是一個多模態大模型——BuboGPT能夠將文本、圖像和音頻等多模態輸入進行整合,在圖像音頻數據處理方面表現出了出色的對話能力。
官網:https://bubo-gpt.github.io/
來源:BuboGPT
BuboGPT最牛的地方在于聽音辨位。
來源:BuboGPT
以上圖為例,只需要上傳一段音頻一個圖像,BuboGPT就能快速識別音頻來自于圖像的哪個地方,并且貼心地用邊界框幫你框出來!
從BuboGPT中,也可以看出字節大模型的方向——結合圖像和文字,做多模態的應用嘗試。
可以想見,這和字節的業務密切相關——作為APP工廠,字節旗下有抖音等多個C端應用,在音視頻上的應用場景非常豐富,在這方面發力,也是合情合理。
快手AI來“踢館”不過,字節扔的豆包還熱乎著,字節的老對家——快手,顯然是按捺不住了。
8月18日晚,快手突然宣布,“快手AI對話”安卓版本開放內測——此前,快手AI已經在8月初進行過一波小范圍測試了。
但字節豆包還是一個獨立app,但顯然快手在應用上想搶先一步,快手AI對話直接就內置在快手中。
使用方法上,用戶只需要點擊快手搜索首頁右上角的AI圖標,直接輸入內容或者點擊引導問題,就可以開始對話。
另外,用戶也可以觸發「搜索智能問答」卡片,通過底部入口使用這項功能。
來源:快手
在大模型的支持下,用戶能夠更加高效的找到自己感興趣的主播或者視頻。
來源:快手
來源:快手
快手AI對話,也是首個基于大語言模型在短視頻直播行業落地的應用產品。
國內大模型混戰依舊火熱,各家廠商在辛勤耕耘底層的大語言模型時,在應用端的爭奪也已經開始——
AI 大模型逐漸進入各種終端和國民級應用之中。比如最近,華為和小米都已經把大模型放到自家手機系統當中了。
如今,“抖快”均發布AI應用,無疑是國內大模型落地的又一個重要節點。
來源:公開網絡
參考資料:
https://arxiv.org/pdf/2307.08581.pdf