新浪科技訊 9月22日下午消息,陳天超據(jù)動(dòng)態(tài)實(shí)時(shí)LLM智能體未來預(yù)測(cè)基準(zhǔn)FutureX最新評(píng)測(cè)結(jié)果,隊(duì)連頂F大模慈善家陳天橋創(chuàng)立的續(xù)登型AI公司MiroMind團(tuán)隊(duì)搭載GPT-5的MiroFlow智能體框架,已在9月第1周和第2周連續(xù)奪得榜首,國際超越眾多國際頂尖機(jī)構(gòu)和閉源商業(yè)模型。領(lǐng)先
據(jù)悉,預(yù)測(cè)與專注文本輸出的陳天超生成式模型不同,MiroMind采用記憶驅(qū)動(dòng)機(jī)制,隊(duì)連頂F大模專為預(yù)測(cè)與決策設(shè)計(jì),續(xù)登型旨在打造全球最好的國際預(yù)測(cè)大模型。在測(cè)試中,領(lǐng)先MiroMind成功預(yù)測(cè)了2025年9月9日ATP男子單打排名第4-6位的預(yù)測(cè)選手,同時(shí)還成功預(yù)測(cè)了2025年9月11日數(shù)字加密貨幣Solana將突破的陳天超一系列關(guān)鍵價(jià)格檔位,體現(xiàn)了模型在處理價(jià)格波動(dòng)類問題上的隊(duì)連頂F大模系統(tǒng)建模能力與風(fēng)險(xiǎn)控制水平。
MiroMind的續(xù)登型登頂并非偶然,而是基于AI預(yù)測(cè)未來的幾項(xiàng)核心能力:第一,信息洞察力:能快速抓取、理解和整合海量數(shù)據(jù);第二,邏輯推理與趨勢(shì)感知:能發(fā)現(xiàn)模式、識(shí)別因果、判斷趨勢(shì)。第三,概率與不確定性管理:能量化可能性、權(quán)衡風(fēng)險(xiǎn),在不確定環(huán)境下做出最優(yōu)判斷。第四,跨領(lǐng)域整合能力:能把金融、政治、科技、社會(huì)等多領(lǐng)域信息融會(huì)貫通。
在GAIA-Validation上,MiroFlow框架也取得了82.4%的出色成績,并在HLE、BrowseComp以及xBench-DeepSearch等基準(zhǔn)測(cè)試中領(lǐng)先眾多國際對(duì)手。目前,MiroFlow已對(duì)外提供了完全開源、可復(fù)現(xiàn)的框架和配置。
Future X由字節(jié)跳動(dòng)SEED團(tuán)隊(duì)聯(lián)合斯坦福大學(xué)、復(fù)旦大學(xué)等推出,是全球首個(gè)動(dòng)態(tài)實(shí)時(shí)LLM智能體未來預(yù)測(cè)基準(zhǔn)。它從全球200多個(gè)高質(zhì)量網(wǎng)站精選只有下周才會(huì)有明確結(jié)果的問題,讓AI直面真正的未來事件:股票價(jià)格的漲跌、體育比賽的勝負(fù)、政治選舉的結(jié)果、科技公司的戰(zhàn)略走向等。(文猛)
責(zé)任編輯:何俊熹