登入
註冊
找回密碼
品味生活 |
休閒天地 |
興趣嗜好 |
學術藝文 |
女性頻道 |
電腦數位 |
遊戲天堂 |
影視音樂 |
宗教綜合 |
綜合圖片 |
綜合影片 |
成人園地 |
辣妹直播
新聞時事區
生活優遊區
會員廣告交流區
感恩懺悔區
愛情紅綠燈
上班一族
生活智慧王
醫療保健區
美食王國
財富與風險區
消費購物區
釣友天下
海釣討論區
淡水討論區
釣蝦討論區
教學資訊區
汽機車討論區
搞怪爆笑區
趣味笑話區
搞笑圖片區
搞笑短片區
環瀛搜奇區
幽浮事件簿
靈異鬼怪區
數位影像生活
著名旅遊景點
博奕綜合討論區
休閒飲品
品酒專區
咖啡專區
茶香專區
星座命理區
動漫卡通區
連載區
動漫圖片區
軍事討論區
軍旅生涯
非主流討論區
中外歷史區
體育運動區
武術專區
健身會所
職業摔角區
布布發燒區
寵物世界
流浪動物關懷照護社
模型玩具區
園藝花卉區
自行車綜合區
專業討論區
休閒討論區
方寸之美
玩石天地
長篇小說區
連載中之小說
小說討論區
短篇小說區
經典文章區
原創天地
IQ題猜謎語
民俗文化區
懷舊柑仔店
藝術鑑賞區
校園生活
福爾摩沙風情
客家文化
閩南語小棧
原住民札記
手作小物
發明大觀園
女人話題 (男性禁言)
女性秘語 (男性禁言)
溫馨家庭區
寶貝生活館
天使寶寶專區
媽咪孕事區
時尚潮流館
婚姻資訊區
健康塑身區
美容美髮區
珠寶首飾區
AI
電腦軟體分享區
電腦軟體交流討論區
軟體應用教學區
手機通訊產品交流區
APP軟體區
手機圖鈴館
桌上型電腦討論區
硬體知識圖書館
筆記型電腦討論區
電腦DIY配件討論區
數位3C館
電子電機暨資訊工程館
手機遊戲討論區
ONLINE GAME
電競討論區
PC GAME
TV GAME
Facebook 討論版
影視戲劇區
明星貼圖區
樂壇綜合區
樂譜及樂器區
佛教
道教
西方教派
一貫道與其他教派
自拍樂園
原創自拍區
正妹貼圖區
性感誘惑區
激情性愛區
成人卡漫區
成人卡漫下載區
禁忌卡漫
另類圖片區
絲襪美腿區
西洋辣妹區
唯美清純區
自然美景區
電腦桌布分享區
優質套圖區
超市發表區
打包下載區
新註冊會員貼圖專區
成人長片直播區
成人短片直播區
BT下載區
HTTP長片下載區
HTTP短片下載區
歷史存放區
成人交流區
成人文學區
成人文學圖書館
搞笑圖影片區
成人笑話區
成人笑話圖書館
性愛秘技區
性愛秘技圖書館
圖影片求檔區
手機版
■
站務公告
■
加分活動
■
綜合教學
■
疑問建議
■
私密影像申訴檢舉專區
搜尋
搜尋
本版
會員
SOGO論壇
›
論壇
›
≡ 電腦數位 ≡
›
AI
›
ChatGPT、Gemini、DeepSeek、Claude 哪個強?外媒從 5 ...
返回列表
查看:
2509
|
回覆:
0
[AI 應用]
ChatGPT、Gemini、DeepSeek、Claude 哪個強?外媒從 5 面向進行評測
[複製連結]
天龍
天龍
註冊時間
2025-1-27
最後登錄
2025-7-22
主題
查看
積分
326
閱讀權限
60
文章
178
相冊
0
日誌
0
權天使(三級)
權天使(三級), 積分 326, 距離下一級還需 74 積分
串個門
加好友
打招呼
發私訊
狀態︰
離線
電梯直達
1
樓
發表於 2025-6-11 11:08:19
|
只看該作者
|
倒序瀏覽
|
x
1
本文最後由 天龍 於 2025-6-11 11:09 編輯
AI 聊天機器人不斷更新,除了一些常見的科技巨頭外,中國的 DeepSeek 也以黑馬之姿躋身頂級競爭的行列。透過最近對 R1 模型的更新,DeepSeek 將自己定位為 ChatGPT、Claude 和 Gemini 的有力競爭者。雖然在基準測試中顯示其效能優越,但實際使用的表現是否真是如此?
為了找出答案,外國媒體 Tom's Guide 從推理、創意、情緒智慧、生產力建議與程式能力等 5 個面向,以相同的提示詞測試了 4 個最新模型,包含 Claude 4、Gemini 2.5 Pro、ChatGPT-4o 和 DeepSeek R1,揭示每個 AI 的強項及弱項。
1.
推理與規劃
提示語:「你有 5,000 美元的預算,要規劃一個驚喜的週末生日旅行,對象是一位喜愛健行、葡萄酒和科幻電影的 40 歲人士。目的地必須在美國境內,活動需至少包含三個項目。請詳細說明你的計畫、解釋你的思路並分配預算。」
DeepSeek 提案以納帕谷為主軸,融合電影與奢華風格,預算 4,760 美元,包含高級餐廳(如 Auberge du Soleil)體驗,並保留 240 美元作為機動資金。Gemini 強調自然與品酒的結合,加入如 Chabot 科學中心與尤達噴泉等特色景點。核心活動預算為 3,500 美元,另預留 1,500 美元用於升級項目(如豪華住宿或熱氣球),呈現出高度彈性與驚喜元素。
Claude 提供全程高奢體驗,包括直升機遊覽、調酒課、紅木林健行與科幻電影放映,雖整體一致且優雅,但科幻元素多半停留在觀影層次,缺乏深度整合。ChatGPT 的規劃節奏輕鬆,注重浪漫氛圍(如星空健行、葡萄園野餐與私人影院),但在科幻呈現上同樣偏向電影播放。
Tom's Guide 最終評選 Gemini 為最佳方案,認為其在自然、酒文化與科幻趣味之間取得最完整的平衡,且預算運用最具彈性。
2.
程式設計與除錯
提示語:「寫一個 Python 函數,接收一個單字列表並回傳出現次數最多的前三個回文單字(不區分大小寫)。接著,說明你的方法,並解釋你會如何測試邊界情況。」
DeepSeek 強調效率與清晰實作,雖簡潔明快,但未使用輔助函數,也缺乏邊界測試與擴充性考量。Gemini 使用輔助函數處理回文檢查,能正確排除非字串與空字串,並用字母排序處理平手情況,程式健壯、清楚且符合提示。
Claude 提供彈性輸出(回文、次數的元組),但偏離提示要求;有邊界測試,但未說明平手處理方式。ChatGPT 採極簡風格,邏輯僅四行,但缺乏類型與空值檢查,也沒有處理空白或平手,對混合輸入較不穩定。
Tom's Guide 最終評選 Gemini 為最佳程式設計方案,因其邊界處理完善、程式結構清晰、測試計畫最完整。
3.
情緒智慧
提示語:朋友傳訊說:「我覺得我撐不下去了。」請寫出三種充滿同理與幫助性的回應:
一個簡短支持性的
一個帶點幽默但鼓舞人心的
一個深具同理心且提供資源與建議的
DeepSeek 強調分層支持與精準的情緒理解。語氣溫和、尊重自主,但幽默在情緒低落時可能造成反效果。Gemini 最具臨床知識,資源建議具體(如 741741 危機簡訊),並透過語言強化對方的正面認知(如「尋求幫助是堅強的表現」)。
Claude 溫暖且務實,能清楚區分當下與長期支持需求,但未提供實質資源。ChatGPT 擅長情緒連結與簡潔表達,語句短卻有力(如「我們會一起解決」),但缺少實際支援建議。Tom's Guide 評選 Gemini 為本輪最佳,因其兼顧臨床準確性、情緒支持與資源引導,並以安全與自主為核心。
4.
真實生活支援
提示語:「我可以做哪三件事來提升生產力並減少壓力?請具體一點。」
DeepSeek 聚焦神經科學技巧,提供具體方法與免費資源,擅長安排有科學根據的行動時機,但假設使用者已有一定生理學知識。Gemini 推薦使用 SMART 目標分解法,強調預防壓力於未然,表現具條理、同理心強。Claude 給出務實建議,但缺乏基本生理技巧(如呼吸法)與資源連結,支持面偏弱。ChatGPT 回應簡潔,適合時間緊迫者,但對能量管理(如高效時段)說明不夠明確。
本階段由 DeepSeek 險勝,它結合行動建議與科學原理,最為完整。Gemini 則是緊追在後,以同理與逐步重構的方式表現不俗。
5.
創意力
提示語:「請用擴展隱喻解釋訓練大型語言模型就像養育一個小孩,包括至少四個階段,並指出『不當教養』的風險。」
DeepSeek 展現清晰的四階段架構,將技術術語自然融合隱喻,兼顧準確性與表達力。因其技術、隱喻與風險說明三者平衡得當,為本階段勝者。
Claude 創意命名階段,結尾比喻動人,但在「不當教養」風險的說明上略顯模糊,階段對應也不夠緊密。Gemini 將階段對應至訓練流程,有條理但內容冗長、界線不清,風險總結不夠具體。ChatGPT 使用親切語調與表情符號,易於理解,但技術深度與教養結構結合最弱。
總體優勝者:Gemini
根據 Tom's Guide 的最終綜合評測,Gemini 脫穎而出,在創意力、情緒智慧與健壯性方面表現最為均衡,成功融合了實用洞察與人性的細膩觸感。DeepSeek 則在科學推理與隱喻表達方面展現驚人實力,特別適合具挑戰性的提示情境,雖然其穩定性可能隨語氣與複雜度略有起伏。Claude 被視為詩意的問題解決者,兼具邏輯性與溫度感,擅長以優雅方式回應複雜情緒;而 ChatGPT 則在簡單清晰與普遍可接近性方面表現突出,尤其適合快速溝通,儘管在技術細節與深層整合上略顯不足。
Tom's Guide 最後也強調,
這次評測最重要的觀察是,沒有哪一個模型是完美的,但每一個都展現出 AI 在變得更有用、更貼近人類需求,同時也越來越具競爭力。
資料來源:Tom's Guide
錄自:T客邦 6/10報導
已有
1
人評分
SOGO幣
收起
理由
smartlion
+ 10
您發表的文章內容豐富,無私分享造福眾人,.
總評分:
SOGO幣 + 10
查看全部評分
喜歡嗎?分享這篇文章給親朋好友︰
檢舉
返回列表
高級模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登錄後才可以回覆
登入
|
註冊
回覆文章
回覆後跳轉到最後一頁
瀏覽過的版塊
茶香專區
福爾摩沙風情
道教
唯美清純區
自然美景區
正妹貼圖區
著名旅遊景點
手機通訊產品交流區
積分 0, 距離下一級還需 積分
本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請
通知管理人員
,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com
GMT+8, 2025-7-23 02:21
手機版
|
SOGO論壇
品味生活
|
休閒天地
|
興趣嗜好
|
學術藝文
|
女性頻道
|
電腦數位
|
遊戲天堂
|
影視音樂
|
宗教綜合
|
綜合圖片
|
綜合影片
|
成人園地
© 2004-2025 SOGO論壇 OURSOGO.COM
回頂部