首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

陳天橋創(chuàng)立的AI公司MiroMind成為全球頂尖預(yù)測型大模型,性能領(lǐng)先行業(yè)基準(zhǔn)

2025年9月22日 14:36  CCTIME飛象網(wǎng)  

科技的走向、股市的漲跌、比賽的勝負、選舉的結(jié)果……在AI時代,未來還會像過去那樣不可知嗎?全球首個動態(tài)實時LLM智能體未來預(yù)測基準(zhǔn)FutureX推出,被馬斯克稱為衡量智能的最佳標(biāo)準(zhǔn)。9月18日,全球創(chuàng)新企業(yè)家、慈善家陳天橋旗下的MiroMind團隊在這一AI未來大考中,連續(xù)第二周蟬聯(lián)冠軍。與專注文本輸出的生成式模型不同,MiroMind 采用記憶驅(qū)動機制,專為預(yù)測與決策設(shè)計,旨在打造全球最好的預(yù)測大模型。

科幻電影早已為我們描繪過可能性:《少數(shù)派報告》AI預(yù)測犯罪,讓“未發(fā)生的事件”變得可防可控;《Her》智能系統(tǒng)能夠預(yù)測人類行為和選擇。今天,這些幻想正逐步照進現(xiàn)實。長期以來,AI評估大多停留在答案已知的靜態(tài)問題上,如同學(xué)生反復(fù)練習(xí)往年高考試卷。然而,真正有價值的能力是對未知未來的準(zhǔn)確預(yù)測。投資和規(guī)劃將不再依賴盲目試錯,可以提前洞察趨勢,把握機遇,有效規(guī)避風(fēng)險,真正掌握主動權(quán)。畢竟,誰不曾幻想過回到過去,提前買入Nvidia或Tesla呢?

正如伊隆·馬斯克所說:“預(yù)測未來的能力是衡量智能的最佳標(biāo)準(zhǔn)。”讓AI具備像人類一樣在不確定環(huán)境下的決策能力,這正是通向AGI的重要一步。

 

首次參與打榜,Grok取得第一名,MiroMind為開源模型的第一。馬斯克為此興奮發(fā)文,稱之為最好的benchmark

FutureX與Prophet Arena:AI智能體未來預(yù)測基準(zhǔn)的誕生

不久前,字節(jié)跳動 SEED 團隊聯(lián)合斯坦福大學(xué)、復(fù)旦大學(xué)、普林斯頓大學(xué)共同推出Future X,是全球首個動態(tài)實時 LLM 智能體未來預(yù)測基準(zhǔn)。它從全球200多個高質(zhì)量網(wǎng)站精選只有下周才會有明確結(jié)果的問題,讓AI直面正的未來事件:股票價格的漲跌、體育比賽的勝負、政治選舉的結(jié)果、科技公司的戰(zhàn)略走向等。

這種評估方式的核心優(yōu)勢非常顯著。AI 必須像人類分析師一樣,基于當(dāng)前可獲得的信息,運用邏輯推理、趨勢分析和概率計算來做出預(yù)測。這一機制極大地推動了 AI 智能體在真實世界復(fù)雜場景中的實用能力提升,也成為衡量智能體系統(tǒng)核心智能水平的重要標(biāo)桿。

Prophet Arena則是另一個AI預(yù)測能力評估平臺,通過實時收集和分析真實世界事件,考察AI模型在不確定性推理、信息整合和概率預(yù)測等方面的表現(xiàn)。

MiroMind如何成功預(yù)測未來

MiroMind 在 FutureX 榜單上表現(xiàn)驚艷。8 月第 3 周,首次參與即獲得第六名的成績。而在 9 月的提交中,更實現(xiàn)了雙重突破:搭載 GPT-5 的 MiroFlow 智能體框架在第 1 周和第 2 周連續(xù)奪得榜首,同時搭載自研模型 MiroThinker 的 MiroFlow 均位列前五,力壓眾多國際頂尖機構(gòu)和閉源商業(yè)模型。

  

在測試中,MiroMind 成功預(yù)測了 2025 年 9 月 9 日ATP 男子單打排名第 4-6 位的選手,其難點在于網(wǎng)球排名系統(tǒng)極為復(fù)雜,涉及積分計算、比賽結(jié)果、時間窗口等多個變量。

MiroMind 的模型在預(yù)測中制定了五步策略:

1. 制定詳細預(yù)測計劃:模型首先展現(xiàn)了戰(zhàn)略規(guī)劃能力,制定了系統(tǒng)性的預(yù)測方案。

2. 獲取基礎(chǔ)數(shù)據(jù):通過網(wǎng)絡(luò)檢索獲取 9 月 1 日的男子網(wǎng)球 TOP 10 排名數(shù)據(jù),建立預(yù)測基準(zhǔn)線。

3. 理解積分規(guī)則:深入研究比賽排名與積分的對應(yīng)關(guān)系,特別對比了 2024 年與 2025 年的 dropping 規(guī)則,確保計算一致性。

4. 動態(tài)信息更新:搜索 9 月 1 日之后的比賽成績,并分類處理:對已有結(jié)果的比賽,直接更新對應(yīng)選手排名;對尚未結(jié)束的比賽,識別其可能影響。

5. 概率分析與綜合判斷:多情景分析,針對尚未出結(jié)果的比賽,模型分析了6種可能情況;引入博彩網(wǎng)站概率數(shù)據(jù),作為外部驗證基準(zhǔn);最終基于 outcome 和 probability 加權(quán)計算,得出最可能排名結(jié)果。

MiroMind 還成功預(yù)測了 2025 年 9 月 11 日 數(shù)字加密貨幣 Solana 將突破的一系列關(guān)鍵價格檔位,體現(xiàn)了模型在處理價格波動類問題上的系統(tǒng)建模能力與風(fēng)險控制水平。這輪預(yù)測中,MiroMind 則是制定了六步策略:

1. 構(gòu)建市場基準(zhǔn)線:聚合 CoinGecko、Coinbase、Binance、Kraken 等多平臺實時數(shù)據(jù),明確 Solana 當(dāng)前價格區(qū)間及近期價格走勢,建立精準(zhǔn)預(yù)測起點;

2. 量化短期波動空間:基于歷史數(shù)據(jù)計算年化波動率、平均日內(nèi)振幅等關(guān)鍵指標(biāo),評估 Solana 在一天內(nèi)可能達到的價格區(qū)間,判斷各檔位的突破概率;

3. 梳理外部影響因素:系統(tǒng)檢索 9 月 10 日的宏觀經(jīng)濟事件(如美國 PPI 發(fā)布)、Solana 鏈上動態(tài)和潛在生態(tài)活動,評估是否存在可能引發(fā)劇烈波動的催化因素;

4. 分析市場情緒信號:提取 OKX、Kraken 等平臺的永續(xù)合約資金費率與基差數(shù)據(jù),判斷市場是否存在明顯的多空傾斜,作為重要情緒指標(biāo)參考;

5. 挑選穩(wěn)健價格檔位:結(jié)合價格分布、風(fēng)險容差與市場結(jié)構(gòu),挑選那些在大多數(shù)行情路徑下都有可能成立的價格檔位,避開臨界邊緣值,確保預(yù)測結(jié)果穩(wěn)健可靠;

6. 交叉驗證與最終判斷:對比統(tǒng)計結(jié)果、衍生品信號與第三方市場預(yù)期,最終確定最優(yōu)預(yù)測選項,兼顧穩(wěn)健性與覆蓋率。

MiroMind 的登頂并非偶然,而是基于AI預(yù)測未來的幾項核心能力:

· 信息洞察力:能快速抓取、理解和整合海量數(shù)據(jù)——從股市行情到新聞動態(tài),再到社交輿情。沒有全面信息,預(yù)測就是空想。

· 邏輯推理與趨勢感知:能發(fā)現(xiàn)模式、識別因果、判斷趨勢。未來不是憑直覺,而是建立在嚴密邏輯和數(shù)據(jù)分析之上。

· 概率與不確定性管理:能量化可能性、權(quán)衡風(fēng)險,在不確定環(huán)境下做出最優(yōu)判斷。未來充滿變數(shù),聰明的預(yù)測是概率化的決策。

· 跨領(lǐng)域整合能力:能把金融、政治、科技、社會等多領(lǐng)域信息融會貫通。未來事件往往是多因素交織,單一視角難以洞察全局。

建設(shè)最好預(yù)測大模型和創(chuàng)新者平臺

MiroFlow 框架在 GAIA-Validation 上也取得了 82.4% 的優(yōu)異成績,并在 HLE、BrowseComp 以及 xBench-DeepSearch 等基準(zhǔn)測試中領(lǐng)先眾多國際對手。更值得關(guān)注的是,MiroFlow 提供了完全開源、可復(fù)現(xiàn)的框架和配置,致力于建設(shè)一個創(chuàng)新者平臺。這個平臺為研究者和開發(fā)者提供從基礎(chǔ)框架、模型到工具鏈的完整支持,使大家能夠自由實驗、快速迭代,并在多 Agent 協(xié)作、多模態(tài)理解等前沿領(lǐng)域進行探索。

 

MiroFlow 框架之外,MiroMind 團隊推出的自研旗艦基礎(chǔ)智能體模型(Agent Foundation Model)——MiroThinker,不僅具備強大的推理、決策和多模態(tài)理解能力,還能在多 Agent 協(xié)作中發(fā)揮核心作用,在各類榜單中已成為開源模型的引領(lǐng)者,并不斷縮小與閉源商業(yè)模型的差距。MiroThinker 很快將以完全開源的形式向全球開發(fā)者和研究者開放,提供可復(fù)現(xiàn)的模型和實驗環(huán)境。

陳天橋:持續(xù)投入,誠邀全球AI人才

從盛大,到天橋腦科學(xué)研究院,再到All in AI,陳天橋四分之一個世紀(jì)以來持續(xù)探索人類未來科技的邊界:

· 虛擬世界的創(chuàng)造者,1999年創(chuàng)辦盛大,開創(chuàng)了中國網(wǎng)絡(luò)游戲與網(wǎng)絡(luò)文學(xué)行業(yè)。

· 人類大腦的探索者,2016年創(chuàng)辦全球最大的私人腦科學(xué)機構(gòu)天橋腦科學(xué)研究院,在腦機接口等基礎(chǔ)、前沿研究領(lǐng)域碩果累累。

· 未來世界的塑造者,開展AI+長期記憶、AI預(yù)測未來等全新前沿探索。目前MiroMind 正在探索將長期記憶模塊深度嵌入模型,在復(fù)雜、多變的環(huán)境中做出更精準(zhǔn)可靠的預(yù)測,實現(xiàn)真正的時間維度智能。

陳天橋說:“我們正在全力打造一個全球最好的預(yù)測大模型,讓AI記住過去,洞察未來。我們持續(xù)歡迎全球志同道合的AI優(yōu)秀人才加入,共同創(chuàng)造未來!

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
中國移動黃宇紅:量通智融合創(chuàng)新的探索、實踐與思考
精彩視頻
2025年國家網(wǎng)絡(luò)安全周:筑牢數(shù)字安全根基,共繪高質(zhì)量發(fā)展未來
移起向青 智繪高原 青海數(shù)智化主題探訪活動
記者探館光博會:尋找隱藏在生活中的“科技之光”
既熟悉又陌生的光博會,光學(xué)映射下的科技進化浪潮
精彩專題
第26屆中國國際光電博覽會
2025中國算力大會
ICT產(chǎn)業(yè)2025年中業(yè)績盤點
2025世界人工智能大會暨人工智能全球治理高級別會議
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像