安徽|北京|重慶|福建|甘肅|貴州|廣東|廣西|海南|河北|河南|湖北|湖南|黑龍江|江蘇|江西|吉林|遼寧|內(nèi)蒙古|寧夏|青海|山東|山西|陜西|上海|四川|天津|新疆|兵團(tuán)|云南|浙江

首頁(yè) > 教育科技

“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新發(fā)布!
2024年05月14日 14:34 中國(guó)新聞網(wǎng)

  中新網(wǎng)5月14日電(中新財(cái)經(jīng) 吳家駒)不是GPT-5,而是GPT-4o。

  北京時(shí)間5月14日,研發(fā)ChatGPT的OpenAI公司,推出了具備“聽(tīng)、看、說(shuō)”能力的GPT-4o。

  OpenAI網(wǎng)站稱,GPT-4o的“o”代表“omni”。在英語(yǔ)中“omni”常被用作詞根,用來(lái)表示“全部”或“所有”的概念。

  該公司首席執(zhí)行官山姆·奧特曼(Sam Altman)此前已預(yù)告,最新發(fā)布的產(chǎn)品“不是GPT-5,不是搜索引擎,但我們一直在努力開(kāi)發(fā)一些我們認(rèn)為人們會(huì)喜歡的新東西”。

  據(jù)介紹,GPT-4o可以實(shí)時(shí)對(duì)音頻、視覺(jué)和文本進(jìn)行推理,接受文本、音頻和圖像的任意組合輸入,并生成文本、音頻和圖像的任意組合輸出。

  OpenAI稱,GPT-4o可以在短至232毫秒的時(shí)間內(nèi)對(duì)音頻輸入做出反應(yīng),平均反應(yīng)時(shí)間為320毫秒,這與人類在對(duì)話中的反應(yīng)時(shí)間相近。此外,它在英語(yǔ)和代碼文本方面的性能與GPT-4 Turbo相當(dāng),在非英語(yǔ)語(yǔ)言文本方面也有顯著提高。同時(shí)在API(應(yīng)用程序接口)方面,速度更快,成本也降低了50%。

  現(xiàn)場(chǎng),OpenAI展示了GPT-4o的多個(gè)應(yīng)用場(chǎng)景。

  例如,在一個(gè)演示中,OpenAI前沿研究負(fù)責(zé)人馬克·陳(Mark Chen)通過(guò)手機(jī)與ChatGPT進(jìn)行對(duì)話。Chen和ChatGPT說(shuō),他正在進(jìn)行演示有些緊張,于是ChatGPT就“像朋友一樣”,對(duì)他進(jìn)行了安慰。同時(shí),ChatGPT還能從Chen急促的喘氣聲中,聽(tīng)出他的緊張,然后對(duì)他說(shuō)“慢一點(diǎn)。Mark,你不是吸塵器。吸氣,然后數(shù)到四。”

GPT-4o檢測(cè)人的表情。圖自X平臺(tái)
GPT-4o檢測(cè)人的表情。圖自X平臺(tái)

  在另一個(gè)演示中,OpenAI后訓(xùn)練團(tuán)隊(duì)負(fù)責(zé)人巴雷特·佐夫(Barret Zoph)把自己的臉對(duì)著鏡頭,讓GPT-4o看看自己的情緒如何。在演示的過(guò)程中,Zoph先打開(kāi)了手機(jī)的后置攝像頭,拍到了木質(zhì)桌面,于是ChatGPT說(shuō),“我看到的好像是木質(zhì)表面。”而讓ChatGPT再試一次后,ChatGPT對(duì)Zoph說(shuō),“你看起來(lái)很開(kāi)心,笑容燦爛,也許還有一絲興奮!

  同時(shí),OpenAI還在官網(wǎng)發(fā)布了一系列演示視頻:GPT-4o可以幫助學(xué)習(xí)數(shù)學(xué)、學(xué)習(xí)西班牙語(yǔ)、準(zhǔn)備面試,可以通過(guò)畫面判斷出你正在過(guò)生日,然后給你唱生日快樂(lè)歌,可以根據(jù)要求唱不同風(fēng)格的催眠曲,甚至還可以當(dāng)“石頭剪刀布”的裁判。而在這些視頻中,GPT-4o與演示者的對(duì)話流暢,說(shuō)話語(yǔ)氣就“像真人一樣”。

  有網(wǎng)友表示,根據(jù)目前展示的視頻來(lái)看,GPT-4o在語(yǔ)音交互體驗(yàn)上提升了不少。有網(wǎng)友認(rèn)為,GPT-4o對(duì)算力的需求更大了。也有網(wǎng)友提出,既然GPT-4o具備了“視覺(jué)”,它是否可以代替盲人看世界。

  OpenAI稱,通過(guò)GPT-4o,公司跨文本、視覺(jué)和音頻端到端地訓(xùn)練了一個(gè)新模型,這意味著所有的輸入和輸出都由同一個(gè)神經(jīng)網(wǎng)絡(luò)處理。由于GPT-4o是OpenAI第一個(gè)結(jié)合了所有這些模式的模型,因此公司在探索該模型的功能及其局限性方面仍處于起步階段。

  對(duì)此,山姆·奧特曼在社交媒體表示,最初的ChatGPT展示了語(yǔ)言界面的雛形,而新的ChatGPT則給人截然不同的感覺(jué)。它快速、智能、有趣、自然,而且“樂(lè)于助人”。“隨著我們?cè)黾?可選的)個(gè)性化功能、訪問(wèn)信息的功能、代表你采取行動(dòng)的功能等,我真的看到了一個(gè)令人興奮的未來(lái),我們可以用電腦做比以往更多的事情!(完)

責(zé)任編輯:王雨蜻

友情鏈接: 中國(guó)政府網(wǎng) 陜西省人民政府 陜西省委統(tǒng)戰(zhàn)部 西安市人民政府 人民網(wǎng) 新華網(wǎng) 中央電視臺(tái) 央廣網(wǎng) 群眾新聞網(wǎng) 西部網(wǎng) 西安日?qǐng)?bào) 華商網(wǎng) 西西新聞
本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
Copyright ©1999-2023 chinanews.com. All Rights Reserved