GPT-4o為何背離OpenAI打起感情牌 原因揭開
“你為什么說(shuō)話的時(shí)候也會(huì)嘆氣?”
“是嗎?我不知道,可能只是習(xí)慣,也許是從你那兒學(xué)的。”
在電影《her》中,AI語(yǔ)音助手Samantha擁有迷人的聲線(由演員斯嘉麗配音),溫柔體貼地替男主處理好各種郵件,提醒開會(huì)。在生活上,她又幽默風(fēng)趣,時(shí)常讓男主開懷大笑。
就在今天的凌晨1點(diǎn),OpenAI將這個(gè)“Samantha”帶到了我們的現(xiàn)實(shí)世界。
打破機(jī)器與人的邊界
“哇,慢一點(diǎn),Mark別喘太快,你可不是個(gè)吸塵器。”
技術(shù)人員Mark在演示中,讓新的旗艦?zāi)P虶PT-4o對(duì)他的呼吸進(jìn)行反饋。他在現(xiàn)場(chǎng)裝出氣喘吁吁的樣子,大口喘氣。GPT-4o立馬給出了這樣幽默的回復(fù)。
這個(gè)能夠感受你的呼吸節(jié)奏、用豐富的情緒作出回答的,就是OpenAI這次發(fā)布會(huì)的“主角”—— 實(shí)時(shí)語(yǔ)音助手GPT-4o。
語(yǔ)音助手早已進(jìn)入普通人的家里,一聲“小愛同學(xué)”就可以得知今天的天氣和新聞。但這與電影中的語(yǔ)音助手差距就在于對(duì)話的自然性。
與人類對(duì)話和與機(jī)器對(duì)話有什么區(qū)別?
OpenAI的研發(fā)團(tuán)隊(duì)也在不斷地問自己這個(gè)問題。為什么有的語(yǔ)音助手一聽就是機(jī)器,真實(shí)感的關(guān)鍵是什么?
OpenAI在電影《her》中找到了答案。語(yǔ)音助手的真實(shí)感關(guān)鍵在于三點(diǎn):
首先是實(shí)時(shí)性。我們?cè)谧匀粚?duì)話時(shí),在「聽」和「說(shuō)」的同時(shí)會(huì)思考接下來(lái)說(shuō)什么,而機(jī)器卻是需要人類說(shuō)完,給到完整的指令,才會(huì)反應(yīng)之后執(zhí)行。這就帶來(lái)了2、3秒的延遲。
而這次的GPT-4o,它可以在短至 232 毫秒的時(shí)間內(nèi)響應(yīng)我們。這比現(xiàn)有的響應(yīng)速度提高了6~9倍!并且,這個(gè)速度是接近人類在對(duì)話中的響應(yīng)速度的,更加強(qiáng)了“對(duì)話感”。
其次是隨機(jī)性。技術(shù)人員Mark在演示中,多次用新的問題打斷GPT-4o對(duì)上一個(gè)問題的回答。但它仍然能夠絲滑回應(yīng)。并且可以以多種不同的情感風(fēng)格生成語(yǔ)音。
在發(fā)布會(huì)現(xiàn)場(chǎng),GPT-4o在講一個(gè)關(guān)于機(jī)器人和愛情的睡前故事時(shí),不斷切換情緒,越來(lái)越“戲劇化”,它的“機(jī)靈勁兒”逗得全場(chǎng)觀眾哈哈大笑。
最后也是最關(guān)鍵的一點(diǎn):視覺。
我們?cè)诹奶鞂?duì)話時(shí),除了語(yǔ)音信息以外,視覺信息同樣重要。OpenAI也關(guān)注到了這一點(diǎn)。
在電影《her》中,男主將Samantha放入口袋,在沙灘上約會(huì),欣賞海岸的美景。在OpenAI的官方視頻中,ChatGPT替盲人用戶“觀察”著這個(gè)世界,并幫用戶順利的打上了車。
GPT-4o可聽、可說(shuō)、可看,像是一個(gè)能力超群的朋友。
討好用戶是為打倒谷歌?
這次的發(fā)布會(huì)看個(gè)熱鬧的同時(shí),外界對(duì)于OpenAI保持了疑問的態(tài)度,為什么這次AI的態(tài)度會(huì)一反常態(tài),甚至不惜違背之前定下的規(guī)則。
從OpenAI發(fā)布ChatGPT開始,它的主要定位是服務(wù)企業(yè)。規(guī)則中還專門提示用戶“不建議和ChatGPT產(chǎn)生情感關(guān)系”。在今年年初GPTstore上線后,OpenAI還專門刪除了不少虛擬女友類的內(nèi)容。
而現(xiàn)在,OpenAI卻和原來(lái)背道而馳。
從發(fā)布會(huì)預(yù)熱開始,就與電影《her》深深綁定。音頻AGI研究負(fù)責(zé)人Alexis Conneau專門將自己的主頁(yè)背景更換為電影《her》的劇照。在發(fā)布之后,Altman也緊接著在推特發(fā)布了內(nèi)容為“her”的博文。而這部電影的主題正是人類和人工智能助手的愛情故事。
并且在直播演示中,三位技術(shù)大佬不斷展示GPT-4o幽默、搞怪、害羞等擬人化的情緒。現(xiàn)場(chǎng)GPT-4o還回答了“哎呀別說(shuō)了,你都讓我臉紅了!”的語(yǔ)句。
要知道,在此之前,如果你對(duì)ChatGPT發(fā)出有關(guān)性別的設(shè)定,它會(huì)直接冰冷地回答:“我無(wú)法完成此提示,因?yàn)榧僭O(shè)個(gè)人的性別可能會(huì)令人反感。”
OpenAI如此改變的原因到底是什么?
歸結(jié)這是一次精彩的宣傳戰(zhàn)。而最終目標(biāo),就是為了“狙擊”谷歌。
OpenAI現(xiàn)在有超過1億用戶,但從去年6月份開始,用戶增長(zhǎng)就已見頂。但谷歌在全球有近30億的用戶,龐大的用戶基礎(chǔ)是谷歌的優(yōu)勢(shì)所在。想要成為AI行業(yè)的領(lǐng)頭企業(yè),谷歌是OpenAI必須要征服的一座大山。
如今,AI賽道的搶占已經(jīng)悄然打響。
在這個(gè)賽道中,所有玩家都在瘋狂爭(zhēng)奪領(lǐng)地,建立護(hù)城河。在這個(gè)過程中,OpenAI也逐漸意識(shí)到C端用戶的重要。
直播僅僅用17分鐘的演示就已經(jīng)吊足了所有看客的胃口。首席技術(shù)官M(fèi)ira還在最后宣布, 在未來(lái)的幾周內(nèi),GPT-4o會(huì)向所有人免費(fèi)開放!
用技術(shù)和價(jià)格爭(zhēng)取更多的用戶,是OpenAI現(xiàn)在的核心任務(wù)。
搜索哪去了?
在發(fā)布會(huì)之前,關(guān)于OpenAI將發(fā)布搜索引擎的新聞一度引起了熱議。還有網(wǎng)友扒出SearchGPT的頁(yè)面,收到了灰度測(cè)試。當(dāng)網(wǎng)友們都以為這次發(fā)布會(huì)將隆重推出搜索服務(wù)時(shí),OpenAI卻選擇再向前走一步。
搜索引擎旨在查找和提供信息。而智能助手則是著重自動(dòng)化和優(yōu)化任務(wù)執(zhí)行,其功能范圍包含了信息查找,但絕不僅止于此。
傳統(tǒng)的搜索引擎,通過用戶關(guān)鍵詞查詢的方式開啟信息檢索,將搜索到的信息以網(wǎng)頁(yè)鏈接的形式進(jìn)行羅列。
在2023年中,搜索市場(chǎng)又涌現(xiàn)了不少“新生力量”——AI搜索。例如,Perplexity AI、Arc Search等,大多遵從了“Answer First”原則——在面對(duì)用戶發(fā)出的對(duì)話式提問時(shí),優(yōu)先用文本總結(jié),而非網(wǎng)頁(yè)鏈接的方式來(lái)回答用戶提出的問題。在回答的文本中,還會(huì)以引用的小標(biāo)識(shí)形式來(lái)標(biāo)注信息來(lái)源,用戶點(diǎn)擊后才會(huì)進(jìn)入相關(guān)網(wǎng)頁(yè)。
有了AI大模型的加持,搜索的交互從「關(guān)鍵詞查詢」到了「對(duì)話式提問」,用戶體驗(yàn)上了一個(gè)臺(tái)階。
但是,聲音是語(yǔ)言的關(guān)鍵,視覺才是人類輸入的第一信息。
這一次,OpenAI直接拓寬了開啟交互的渠道,將一個(gè)單調(diào)的對(duì)話框變成一個(gè)語(yǔ)音鍵、一個(gè)攝像頭,甚至可以同時(shí)調(diào)動(dòng)三者,實(shí)現(xiàn)多模態(tài)交互。所有讓人興奮不已、眼花繚亂的功能只告訴了我們一個(gè)信息:
你的下一個(gè)搜索工具,何必是瀏覽器?
如此一個(gè)“集大成者”的智能助手是否讓你感覺一絲熟悉?沒錯(cuò),就是Siri。
在OpenAI的發(fā)布會(huì)之前,已經(jīng)有消息爆出OpenAI和蘋果達(dá)成了合作,Siri將接入ChatGPT。消息的真實(shí)性尚且無(wú)法確定。
與此同時(shí),被瞄準(zhǔn)的谷歌也不會(huì)坐以待斃。據(jù)傳,在明日開啟的2024年I/O開發(fā)者大會(huì)上,谷歌或?qū)⑸?jí)智能助手Pixie。它的出現(xiàn)能否將比賽推向新的熱潮?蘋果的Siri又會(huì)花落誰(shuí)家?
毫無(wú)疑問,這個(gè)夏天AI的世界將會(huì)令我們更加驚喜。
本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com




