GPT-4正式推出,能使用幾乎所有編程語言,將陸續對開發者開放API
OpenAI 宣布正式發布 GPT-4,它擁有圖像識別功能、高級推理技能、以及處理 25000 個單詞的能力,在單詞處理能力上是 ChatGPT 的八倍,并可以用所有流行的編程語言寫代碼。OpenAI 還表示 GPT-4 大大優于現有的大型語言模型、以及大多數下一代(SOTA,State Of The Arts)模型。
(來源:資料圖)
據介紹,GPT-4 在模擬律師考試中的成績超出 90% 的人類考生,在 SAT(Scholastic Aptitude Test,俗稱「美國大學聯考」)的閱讀考試中超出 93% 的人類考生,在 SAT 數學考試中超出 89% 的人類考生。
而同樣面對律師資格考試,GPT-4 的上一版 GPT-3.5 的得分,僅僅超出 10% 左右的人類應試者。在現場演示中,GPT-4 還生成了關于復雜稅務查詢的答案,盡管無法驗證其答案。
在美國,每個州的律師考試都不一樣,但一般包括選擇題和作文兩部分,涉及合同、刑法、家庭法等知識。GPT-4 參加的律師考試,對于人類來說即艱苦又漫長,需要兩天才能完成。而 GPT-4 卻能在專業律師考試中脫穎而出。
通過律師考試并不意味著它已準備好取代真正的律師。畢竟通過司法考試的人大有人在,因此 GPT-4 不能成為真正的律師,但它確實展示了一定的本領,也能快速啟動一些法律任務。
(來源:資料圖)
圖像識別、高級推理、龐大的單詞掌握能力,是 GPT-4 的三大特點。
就圖像識別功能來說,GPT-4 可以分析圖像并提供相關信息,例如它可以根據食材照片來推薦食譜,為圖片生成圖像描述和圖注等。但是,出于對潛在濫用的擔憂,OpenAI 推遲了圖像描述功能的發布。也就是說,GPT-4 的圖像輸入功能還處于尚未公開的預覽階段,目前僅能在 OpenAI 的直播中觀看效果。
就高級推理功能來說,GPT-4 能夠針對 3 個日程做出會議時間安排,回答存在上下文關聯性的復雜問題。
就詞匯量來說,由于最多可以處理 25000 個單詞,因此在理解和生成長篇內容上,GPT-4 的能力更強。
GPT-4 和上一代就有哪些區別?
OpenAI 聲稱 GPT-4 是其「最先進的人工智能系統」,是該公司在擴展深度學習系統上的最新里程碑,并表示該模型比以往任何時候都更具有創造性和協作性,因為它可以更準確地解決復雜問題。
OpenAI 表示其花費了六個月的時間,來讓 GPT-4 比上一代更安全。該公司通過改進監控框架,并與醫學、地緣政治等敏感領域的專家進行合作,以確保 GPT-4 所給答案的準確性和安全性。
GPT-4 的參數量更多,這意味著它將比上一版更接近人類的認知表現。GPT-4 還接受了各種多模態信息的訓練,這讓它不僅可以理解和解釋輸入數據,還可以理解輸入數據所在的上下文。此外,當同時執行多任務時,GPT-4 的表現也更加出色。
與舊版本一樣,GPT-4 由深度學習技術開發而來,是在公開可用和已被許可數據上進行的訓練,并使用強化學習和人工反饋進行微調。不過,GPT-4 是在全新的深度學習堆棧上訓練的,并由 OpenAI 和微軟 Azure 團隊一起構建。毫無疑問的是,GPT-4 比上一代模型接受了更多數據訓練和計算訓練。
如果你使用過 ChatGPT 就會發現,它的輸入類型是純文本,輸出則是語言文本和代碼。而 GPT-4 的多模態,意味著用戶可以輸入不同類型的信息,例如視訊、聲音、圖像和文本。同樣的,具備多模態能力的 GPT-4 可以根據用戶提供的信息,來生成視訊、音頻、圖片和文本。哪怕你同時將文本和圖片發給 GPT-4,它也能根據這兩種不同類型的信息生出文本。
(來源:資料圖)
OpenAI 表示 GPT-4「離經叛道」的可能性要小得多,對于不被允許的內容請求,GPT-4 的響應可能性降低了 82%。在 OpenAI 的內部對抗性真實性評估中,GPT-4 得分比 GPT-3.5 高 40%。
當任務復雜性達到足夠的閾值時,兩代模型之間的差異就會出現。整體來看,GPT-4 比 GPT-3.5 更可靠、更有創意,并且能夠處理更細微的指令。
百奧幾何公司創始人[1]、加拿大魁北克省人工智能研究中心(Mila)副教授、加拿大高等研究院(CIFAR)人工智能講席教授唐建表示:「GPT-4 最重要的是做了 multi-modality training(多模態訓練),之前主要用的是文本和代碼數據,現在還利用了圖像數據;另外,GPT-4 還用了 ChatGPT 收集到的一些數據。」
可以確定的是,GPT-4 的穩健性已經得到保障,而 OpenAI 的主要挑戰是確保它可以準確地解決所遇到的每個問題。
此外,OpenAI 表示將把 GPT-4 的文本輸入功能加入 ChatGPT 中,由付費用戶優先使用,并通過等候名單發布 API。其將允許開發者把 AI 集成到自己的應用程序中,同時 OpenAI 將對約 750 個單詞的提示收取約 3 美分,對約 750 個單詞的回復收取 6 美分。
此外,OpenAI 使用了 Azure Translate 來訓練 GPT-4,從而實現用多語種回答問題。
然而,OpenAI 以「競爭」為由,沒有公布有關具體模型大小、以及訓練 GPT-4 的硬件詳細信息。而有了這些信息,對手們就可以重新創建模型,這也是 OpenAI 不公開的主要原因。
微軟:新 Bing 正在 GPT-4 上運行
在 OpenAI 推出 GPT-4 之后,其合作伙伴兼投資股東微軟也立馬有所回應。微軟表示:「新的 Bing 正在 GPT-4 上運行,這是我們為搜索定制的。」
如果你在過去五周的任何時間里使用過新 Bing 的預覽版,那麼就已經體驗過這個強大模型的早期版本。隨著 OpenAI 對 GPT-4 以及更高版本進行更新,Bing 也從這些改進中受益。所以 Bing 搜索引擎早已經用上 GPT-4 了,因此用戶可以使用 Bing 編寫文本、回復消息等。
目前來看,GPT-4 將專門開放給 ChatGPT Plus 用戶,每月支付 20 美元之后可以獲得高級訪問權限,總而言之目前暫不支持免費使用。
對于 ChatGPT,美國伊利諾伊大學香檳分校計算機系教授李博表示,短期來看她覺得 ChatGPT 作為文章寫作、代碼生成的輔助查錯工具還不錯,但是還不能完全依賴 ChatGPT 來做回答和搜索,因為它的回答不能保證正確性。長期來看,她認為 ChatGPT 可以和不同的 AI 模型工具結合,做更友好的自動問答系統、學習工具等輔助性工具。此外李博認為,如果要長久發展并用于重要領域中,ChatGPT 的可信賴性保證、糾錯能力等非常重要。
另據悉,OpenAI 還宣布與語言學習應用程序 Duolingo 、以及專為視障人士設計的應用程序 Be My Eyes 的背后公司建立合作,以便為殘障人士提供支持。
美國非營利教育機構可汗學院,將使用 GPT-4 為學生創建人工智能導師(名為「Khanmigo」);冰島政府將用其幫助維護冰島本土語言;金融公司摩根士丹利,則使用 GPT-4 來管理、搜索和組織其龐大的內容庫。
概括來說在具體應用上,GPT-4 的高級推理技能,可以為用戶提供更準確、更詳細的回答;鑒于 GPT-4 具備更強大的語言能力和圖像識別能力,因此可以簡化市場營銷、新聞和社交媒體內容的創建過程;在教育領域,GPT-4 可以通過生成內容、以及以類似人類的方式來回答問題,故能在一定程度上幫助學生和教育工作者。不過,對于將 GPT-4 用于學術目的,人們的看法并不一致,因為學生可能會在沒有完全理解相關知識的情況下依靠它來完成作業,而這和我們接受教育的目的是相悖的。
OpenAI 創始人 Sam Altman 也表示,盡管 GPT-4 的未來非常令人期待,但是仍然存在缺陷,所生成的內容仍然存在一定的偏見性,也仍然存在一定的「幻覺」,也就是 GPT-4 會創建「不正確但聽起來似是而非」的虛構信息。
事實上,Sam Altman 一直對于 GPT-4 持有相對務實的評價,在 1 月份接受關于 GPT-4 的采訪時他說:「人們的期望越高,失望就越大,」「現在有很多炒作...... 我們沒有實現真正的 AGI,但這似乎是對我們的期望。」
(來源:資料圖)
「狂潮」與隱憂相伴相生
回顧歷史,最早描述 GPT 的論文發表于 2018 年,GPT-2 于 2019 年公布、GPT-3 則于 2020 年公布。這些模型基于巨大的文本數據集訓練而來,其中大部分是從互聯網上抓取的數據。
事實上,OpenAI 原本推遲了 GPT-4 的發布,因為擔心會被用于惡意目的,例如生成垃圾郵件和錯誤信息。但在 2022 年底,該公司推出了 ChatGPT——一種基于 GPT-3.5 的對話式聊天機器人,并可以被任何人免費試用。
ChatGPT 的推出在科技界引發了一場狂潮,谷歌也緊隨其后。
在大模型上,對手們一直在積極回應 OpenAI。幾乎在同一時間,OpenAI 的競爭對手——一家名為 Anthropic 的初創公司推出了一款名為 Claude 的聊天機器人。Anthropic 最近從谷歌籌集了 3 億美元。與 GPT-4 一樣,名為 Claude 的聊天機器人支持廣泛的文本處理。它可以匯總文檔、生成新文本、回答搜索查詢和編寫代碼,以及執行其他任務。Anthropic 表示其已將這款聊天機器人提供給許多早期客戶。同時在視訊生成大模型上,Meta 有 Make-A-Video,谷歌則有 Imagen Video,它們都能根據用戶輸入來制作視訊。而在北京時間 3 月 16 日,百度也將推出文心一言大模型。
隨著 AI 語言模型的日益突出,對其潛在濫用的擔憂也有所增加。批評者認為,OpenAI 等公司正急于利用未經測試、不受監管和不可預測的技術,這些技術可能會欺騙人們、威脅藝術家的作品并造成現實世界的傷害。盡管存在這些擔憂,但 GPT-4 和類似的 AI 模型,確實提供了巨大的經濟潛力。
[圖擷取自網路,如有疑問請私訊]
| 喜歡這篇嗎?快分享吧! |
前一頁
後一頁