Google 推出比 GPT 4 還強大的 AI 模型 Gemini,複合式 AI 未來將搭載於 Bard 及 Pixel 等平台

Google 推出比 GPT 4 還強大的 AI 模型 Gemini,複合式 AI 未來將搭載於 Bard 及 Pixel 等平台

Google 近日推出最新且最具突破性的人工智能模型 Gemini。Gemini 在各方面表現均比現有 GPT-4 AI 模型還要強大,是一款具有複合性能力的 AI,不論是 Coding、圖片、影片或文字的處理上都沒問題,並且共有三種版本:Gemini Ultra、Gemini Pro 和 Gemini Nano。Gemini 將逐步推出到 Google 各種產品和平台上,包括 Bard、Pixel 8 Pro 和其他產品中。此外,從 12 月 13 日起,開發者和企業可以透過 Google AI Studio 或 Google Cloud Vertex AI 存取 Gemini Pro 的 API。

從上方影片可以看到 Gemini 用鏡頭看桌面,Gemini 能夠聽懂人講話、看懂人類的畫、並且和人類與鏡頭互動。當人發問,Gemini 會回應並提供更多意見、想法,成果非常驚人。

Gemini 在許多領先的基準測試中表現出最先進的性能,是迄今為止 Google 最有能力和最通用的 AI 模型。

Google DeepMind 的 CEO 和共同創辦人 Demis Hassabis 強調,Gemini 的推出是他們長期以來構建新一代 AI 模型願景的實現,Gemini 能夠理解和操作文字、Coding、音檔、圖片和影片在內的不同類型的資訊。

Gemini 有三種版本:Ultra、Pro 和 Nano,分別針對不同的應用和需求進行優化。
  • UltraL:是最大型的模型,適用於高度複雜的任務
  • Pro:適用於廣泛的任務
  • Nano:則是最高效的模型,適合在行動裝置上的任務。

Gemini 與 GPT-4 比較

Gemini 在文字和 Coding 等一系列測試中效能皆超越了 GPT-4。

Gemini 功能

與現有的 AI 模型如 GPT-4 相比,Gemini 在多模態理解和處理方面展現了更先進的性能。它在理解和處理複雜數據方面的能力可能超越了 GPT-4,特別是在處理圖片、音檔和影片在內的非文字數據方面。此外,Gemini 還能在移動裝置上運行,這是目前大多數 AI 模型,包括 GPT-4,所無法辦到的。在 MMLU(大規模多任務語言理解)上,它首次超越人類專家的表現。

上方影片清楚的說明 Gemini 在科學、研究領域的實際應用範例:
  1. 科學研究中的問題:科學家常常面臨從成千上萬的科學論文中人工找數據的困難,這是一個耗時且必須的工作。Google DeepMind 的研究人員就明顯遇到了這個問題。
  2. Gemini 的角色:DeepMind 科學家使用 Gemini 提供了對科學的深刻理解,幫助篩選和從科學文獻中高效率提取資料,識別相關的論文並有效率找到關鍵數據。
  3. 案例研究:一個 2022 年研究中的遺傳學數據資料集,最初需要手動審無數的論文。Gemini 被用來處理自 2021 年以來新增的超過 200,000 篇論文,並將篩選到剩下 250 篇相關論文。
  4. 多模態功能:Gemini 的多模態性質使其能夠理解並處理不僅是文字或圖表而已。它還可以產生代碼以更新研究中的圖表,使用更新的數據集來製作更新的圖表,其中包括直到 2023 年的數據。
  5. 更廣泛的應用:Gemini 的功能不僅適用於生物學和科學,還適用於任何依賴大數據資料庫的領域,如法律或金融,顯示了它在各個領域數據蒐集和分析的潛力。

在家庭上,還可以用來解決爸媽協助小朋友的作業上:
  • 作業輔助:Gemini 是一款專為協助家長幫助孩子完成家庭作業而設計的工具,特別是在數學和物理學方面。
  • 多模態學習與問題解決:它具有簡單的界面,利用 Gemini 在數學推理和多模態學習方面的能力。使用者可以上傳手寫答案的照片,Gemini 不僅可以解決這些問題,還能理解和評估所提供的答案。
  • 錯誤辨識與解釋:Gemini 能夠辨識解答中的錯誤,如上方影片示範中的問題 1 和 3。它可以指出具體錯誤,例如使用了正確的公式但計算錯誤,並提供詳細解釋。
  • 客製化解釋:Gemini 提供解決問題的拆解式解答,並且能夠理解細節的資訊,能夠針對複雜主題提供定制化解釋。
  • 個人化練習題:為了增強學習,Gemini 根據使用者答案中辨識出的錯誤,提供個人化練習題,此功能有助於加強對概念的理解和提高解決問題的能力。

在 Coding 方面,從上方影片可以看出 Gabriela Surita 強調 Gemini 具有先進的複合性功能,包含理解、解釋和產生多種程式語言,如:Python、Java、C++ 等。它在首次嘗試解決 Coding 功能時的表現超越了前身 PaLM 2,達到了 75% 的成功率,並且在自我檢查和修正後,成功率可以提高到超過 90%。

Rémi Leblond 介紹了 AlphaCode2,這是 AlphaCode 的增強版本。AlphaCode2 由 Gemini 驅動,其性能明顯超過原始 AlphaCode,解決的問題數量是前者的兩倍,並超過了 85% 人類。AlphaCode2 在與人類合作寫程式時表現更佳,工程師可以為程式碼樣本設定特定屬性。這種協作被視為 Coding 的未來,AI 模型將協助解決問題、設計代碼,甚至參與實際寫程式碼,革命性的 Coding 即將展開!

Gemini

此外,Google 在開發 Gemini 時強調了對負責任和安全的承諾。該模型進行了全面的安全評估,包括對偏見和有害內容的檢測,並與外部專家合作,對潛在風險進行測試。

Gemini 將逐步推出到谷歌的各種產品和平台上,包括在谷歌的 Bard、Pixel 8 Pro 和其他產品中的應用。此外,從 12 月 13 日起,開發者和企業客戶可以通過 Google AI Studio 或 Google Cloud Vertex AI 訪問 Gemini Pro 的 API。

總的來說,Gemini 的推出不僅展示了谷歌在 AI 領域的創新實力,還代表了 AI 技術對社會進步和人類福祉的巨大潛力。隨著 Gemini 的應用日益廣泛,我們可以期待它在創造性、知識擴展、科學進步和全球數十億人的生活和工作方式上帶來的轉變。

傳送門:Gemini 官網

Google 新推出的 AI Gemini AI 模型有什麼功能?比 GPT 4 還強大的複合式 AI 誕生!

Google 新推出的 AI Gemini AI 模型有什麼功能?比 GPT 4 還強大的複合式 AI 誕生! 相關文章


參考內容推薦

AI模型Gemini要來了,傳算力比GPT

The Information 報導,Alphabet(GOOGL-US) 旗下 Google 的對話式人工智慧 (AI) 軟體 Gemini 即將發表,目前已經把初期版本提供給一小群企業測試,正式上線後有望成為市場上最先進、OpenAI 旗下 GPT-4 模型的頭號競爭對手之一。

Google台灣 - 官方部落格

我們已經針對 Gemini 1.0 版本的模型進行了最佳化,並推出共三種不同的規模: Gemini Ultra :規模最大、功能最強大的模型,專為高度複雜的任務而設計。Gemini Pro :最適合擴展、橫跨各種類型的任務。Gemini Nano :處理裝置上的任務最有效率的模型。

Google最強AI又遲到,Gemini傳明年才推出!帶著AlphaGo ...

4 天前 — Google DeepMind負責人哈薩比斯近日透露,研發中的Gemini將是「融合」了AlphaGo血統,比GPT系列更強大的AI模型。

Google壓箱寶AI「Gemini」究竟有多強?30項評分超越GPT

4 小時前 — 文:Chris. 多模態AI模型可同時理解文字、程式碼、聲音、圖片、影片等內容; 32項AI測試中有30項評分超越GPT-4V; 分Ultra、Pro、Nano大中小三個 ...

Google 推出Gemini 模型來挑戰GPT

2 天前 — 據稱它熟悉Python、Java、C++ 和Go 等語言,Google 甚至還使用了一個「特別版」 的Gemini,來打造新一代的程式產生AI「AlphaCode 2」。 ... Google 對話式AI ...

Google Gemini 不只衝 OpenAI 而來,而是左打 NVIDIA 右踢 Meta ...

Google 今天終於發表研發已久的新世代大型語言模型「Gemini」,其中最大型、最完整的版本 Gemini Ultra 技壓群雄,在32 項 AI 測試中,有 30 項的評分超越了 OpenAI 的 GPT-4V,同時也是在所謂 MMLU(大規模多任務語言理解,包括數學、物理、歷史、法律、醫學和倫理學等 57 項科目)測試中,第一個達到 90% ...

Google 壓箱寶 AI 模型「Gemini」降臨!30 項評分直接超越 ...

就如外界預期,Google 嘔心瀝血推出的 Gemini 是「原生」多模態 AI 模型,可以同時無縫理解、操作包括文字、程式碼、聲音、圖片、影片等多元形式的內容,像是理解圖片方面,Google 宣稱 Gemini Ultra 可以直接跳過從圖片中使用 OCR 理解文字的步驟,就能直接圖片內容。 理解能力到底有強? Google 就用了一個圖中很簡單的例子, 拿了兩張非常簡單的手繪汽車圖問 Gemini 哪台比較快,Gemini 回「右邊比較快,因為它比較符合空氣力學」。

Google 推出強大AI 模型Gemini!讓手機首度直接運作生成式AI

1 天前 — Google推出一套新的生成式AI模型「Gemini」,將首度可直接在手機上運作,這是該公司要和ChatGPT開發業者OpenAI等同業競賽所取得的最新突破。

Gemini

【天】雙子星座;雙子宮;雙子座. Dr.eye 譯典通 · Gemini · 查看更多. IPA[ˈdʒemɪnaɪ]. n. 雙子(星)座;雙子宮. 牛津中文字典. Gemini. 雙子星座. PyDict.