- 註冊時間
- 2012-4-23
- 最後登錄
- 2025-12-12
- 主題
- 查看
- 積分
- 1213
- 閱讀權限
- 110
- 文章
- 593
- 相冊
- 4
- 日誌
- 1
   
狀態︰
離線
|
在舊金山,一家名為 Conduit 的新創公司最近完成了一項引人注目的資料收集計畫,該計畫在六個月內從數千名參與者那裡收集了約 1 萬小時的非侵入性腦部掃描資料。該資料集被認為是迄今為止最大的神經語言資料集,旨在訓練思維轉文本的人工智慧模型,直接解碼人類在說話或打字前幾秒鐘的腦信號。
參與者在小型隔間中進行兩小時的會話,以語音或簡化鍵盤與大型語言模型(LLM)自由交流。最初的測試依賴於結構化任務,但Conduit發現自然對話能顯著提高資料品質,因此轉向了更具個性化的交流方式。在過程中,Conduit面臨著來自腦電圖(EEG)記錄的電氣干擾挑戰,最初透過包裹設備和使用電池供電來消除噪音,但隨著專案擴大,模型的改進減少了對激進噪音減少的需求。
Conduit的營運策略包括即時監控資料完整性,並透過動態預訂和超額預訂來改善營運效率,這使得實驗室能夠在20小時的日程中同時運行多個隔間。這些調整使得每小時可用資料的邊際成本在五個月內降低了約40%,實現了收集這個前所未有的腦語言資料的可擴展和成本效益的方法。
此資料集的意義在於,它有潛力改善人工智慧模型解讀自然人類思想轉化為文本的能力,推進腦機介面和神經技術的應用。
錄自:科技新報
|
-
總評分: SOGO幣 + 10
查看全部評分
|