国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

人形機(jī)器人有了“真大腦”? Taalas把大模型直接寫進(jìn)芯片里

0
分享至


近日,加拿大初創(chuàng)公司Taalas 推出了一款 AI 推理芯片 HC1,這家成立尚不足三年的企業(yè),憑借將 8B 輕量化大模型直接 “刻” 在芯片上的創(chuàng)新設(shè)計(jì),讓 HC1 的運(yùn)行速度在行業(yè)中脫穎而出,在輸出速度和極致的成本和功耗控制上直接甩開了英偉達(dá)的GPU產(chǎn)品。


很多人對(duì)Taalas 或許并不熟悉,這家公司成立于 2023 年,創(chuàng)始人 Ljubisa Bajic 同時(shí)也是加拿大知名AI芯片公司 Tenstorrent 的創(chuàng)始人,他曾先后在英偉達(dá)、AMD 擔(dān)任高級(jí)架構(gòu)師,一手打造過 CPU-GPU 混合芯片。

而Taalas的核心團(tuán)隊(duì)更是堪稱芯片圈的 “夢(mèng)之隊(duì)”,25 名員工大多來自 AMD、蘋果、谷歌等科技大廠,擁有從芯片設(shè)計(jì)到系統(tǒng)落地的全流程實(shí)戰(zhàn)經(jīng)驗(yàn)。背靠這樣的技術(shù)團(tuán)隊(duì),Taalas 僅投入 3000 萬美元研發(fā)成本,耗時(shí) 60 天就完成了 HC1 的生產(chǎn)落地,推出了這款足以挑戰(zhàn)行業(yè)現(xiàn)有規(guī)則的產(chǎn)品。

截至目前,Taalas 累計(jì)融資已超 2 億美元,賬上仍有 1.7 億美元現(xiàn)金儲(chǔ)備,為后續(xù)發(fā)展奠定了充足的資金基礎(chǔ)

最快AI芯片?

HC1 最令人驚嘆的,莫過于其極致的推理速度。

這款采用臺(tái)積電6nm 工藝的芯片,在單用戶場(chǎng)景下推理速度高達(dá) 17000 token/秒。作為對(duì)比,英偉達(dá) H200 芯片推理速度為 230 token/秒,其最新 Blackwell 架構(gòu)的 B200 也不過 2000 token/秒。有測(cè)試者在 Taalas 的體驗(yàn)網(wǎng)站 chatjimmy.ai 實(shí)際操作后表示,該模型的回復(fù)速度極快,基本在敲下回車的瞬間,答案就能出現(xiàn)在對(duì)話框中。


HC1 能實(shí)現(xiàn)如此快的推理反應(yīng),核心源于 Taalas 獨(dú)樹一幟的技術(shù)思路。

研發(fā)團(tuán)隊(duì)拋棄了傳統(tǒng) GPU “計(jì)算與存儲(chǔ)分離” 的經(jīng)典架構(gòu),采用了存算一體式的設(shè)計(jì)方案,通過 Mask ROM 工藝將 Llama 3.1 8B 的模型權(quán)重直接編碼在芯片的金屬互連層中,讓模型權(quán)重與計(jì)算邏輯共存于同一塊硅片。這種設(shè)計(jì)徹底消除了數(shù)據(jù)搬運(yùn)過程中的延遲與能耗損耗,芯片也無需搭配外部 DRAM 或 HBM,僅保留一小塊 SRAM 以提供最基礎(chǔ)的靈活性。

傳統(tǒng)GPU 進(jìn)行運(yùn)算時(shí),需要從 HBM 顯存中反復(fù)搬運(yùn)數(shù)據(jù),這一過程會(huì)消耗大量能耗和時(shí)間,也是行業(yè)普遍面臨的 “內(nèi)存墻” 問題;而 HC1 無需數(shù)據(jù)搬運(yùn),只需讓數(shù)據(jù)流過電路就能完成推理,運(yùn)算效率自然實(shí)現(xiàn)了質(zhì)的飛躍。

為了實(shí)現(xiàn)芯片的快速定制,Taalas 還借鑒了 2000 年代結(jié)構(gòu)化 ASIC 的設(shè)計(jì)思路,將芯片定制周期從原本的六個(gè)月壓縮至兩個(gè)月。

在針對(duì)新模型進(jìn)行芯片定制時(shí),僅需更換兩層掩模,從拿到新模型到生成描述文件僅需一周的工程工作量,這種高效的定制能力,是Taalas 未來更新節(jié)奏的核心支撐。

除了速度優(yōu)勢(shì),HC1 的成本和功耗表現(xiàn)同樣亮眼:?jiǎn)纹酒闹圃斐杀緝H 300-400 美元,量產(chǎn)后的零售價(jià)預(yù)估在 600-700 美元,采用該芯片的推理綜合成本僅為傳統(tǒng) GPU 方案的 1/20;芯片功耗僅 2.5 千瓦,十顆芯片組成的服務(wù)器僅需普通風(fēng)冷就能實(shí)現(xiàn)散熱,無需搭建復(fù)雜的液冷系統(tǒng),相較 GPU 方案功耗降低了 90%,而未來的量產(chǎn)款芯片,速度還將進(jìn)一步提升。

發(fā)布即落后?

為了追求極致效率放棄了硬件通用性,HC1的設(shè)計(jì)也帶來了致命缺陷:一顆 HC1 芯片只能運(yùn)行一個(gè)特定模型,若要更換模型,就必須重新設(shè)計(jì)并制造芯片。在 AI 模型以月為單位快速迭代的當(dāng)下,這種 “專芯專?!?的模式面臨著極高的技術(shù)過時(shí)風(fēng)險(xiǎn)。

值得注意的是,HC1 正式公布時(shí),Llama 3.1 模型已經(jīng)發(fā)布了近兩年,而同期 OpenAI、Anthropic 等頭部企業(yè)的大模型已迭代至 GPT-5.2、Claude 4.6 版本。盡管 Taalas 承諾從拿到新模型到完成芯片定制僅需兩個(gè)月周期,但市場(chǎng)仍對(duì)其提出質(zhì)疑,為何不選擇更前沿的 DeepSeek R1 模型進(jìn)行產(chǎn)品演示。

除了難以跟上大模型的更新速度,HC1 自身還存在諸多局限性。為了將 8B 參數(shù)的模型完整塞進(jìn)單顆芯片,HC1 采用了自定義的 3-bit 基礎(chǔ)數(shù)據(jù)類型,并結(jié)合 3-bit 和 6-bit 的混合精度量化技術(shù)。

Taalas 官方也承認(rèn),這種技術(shù)方案會(huì)導(dǎo)致模型在質(zhì)量基準(zhǔn)測(cè)試中出現(xiàn)性能退化,在復(fù)雜數(shù)學(xué)運(yùn)算、專業(yè)論文解讀等需要深層邏輯推理的場(chǎng)景中,HC1 的表現(xiàn)明顯遜于英偉達(dá) GPU。

盡管公司已計(jì)劃在第二代產(chǎn)品 HC2 中,改用標(biāo)準(zhǔn) 4-bit 浮點(diǎn)格式來改善這一問題,但第一代 HC1 在推理正確率上的短板已是既定事實(shí)。

不少用戶在測(cè)試時(shí)發(fā)現(xiàn),這款芯片不僅連簡(jiǎn)單的運(yùn)算都會(huì)出現(xiàn)錯(cuò)誤,面對(duì)一些復(fù)雜問題時(shí),更是會(huì)出現(xiàn)胡編亂造的情況。

此外,受硅片面積的限制,單顆HC1 能容納的模型參數(shù)規(guī)模有限,面對(duì)萬億參數(shù)級(jí)的前沿大模型,必須采用多芯片協(xié)同的方案才能運(yùn)行。

以DeepSeek R1 671B 模型為例,想要實(shí)現(xiàn)其推理運(yùn)算,需要 30 顆 HC1 協(xié)同工作,這不僅會(huì)帶來一系列互聯(lián)上的設(shè)計(jì)難題,流片的成本和時(shí)間也會(huì)同時(shí)增加。對(duì)于追求技術(shù)快速迭代的互聯(lián)網(wǎng)企業(yè)和 AI 創(chuàng)業(yè)公司而言,這樣的效率反倒不如多加一塊 GPU來得靠譜。

最后就是Taalas的商業(yè)模式的不確定性,目前 Taalas 探索了三種商業(yè)落地路徑,分別是“自建 API”、“直接出售芯片”、“與模型開發(fā)者合作定制芯片”,但這三種路徑均依賴于客戶對(duì)特定模型的需求。

而在當(dāng)前快速變化的AI 市場(chǎng)中,即便是科技大廠,也不敢輕易做出這樣的長期承諾。歷史上比特幣挖礦 ASIC 的軍備競(jìng)賽早已證明,在技術(shù)快速迭代的領(lǐng)域,專用硬件極易陷入 “發(fā)布即過時(shí)” 的發(fā)展困境。

結(jié)語

從行業(yè)發(fā)展格局來看,HC1 的出現(xiàn)并非為了取代 GPU,而是填補(bǔ)了通用算力與極致效率之間的市場(chǎng)空白,也為大模型的落地提供一個(gè)全新思路。

Taalas 產(chǎn)品副總裁 Paresh Kharya 曾明確表示:“為模型定制的最優(yōu)硅片不會(huì)取代滿是 GPU 的大型數(shù)據(jù)中心,但它會(huì)適配特定的應(yīng)用場(chǎng)景?!?在智能客服、人形機(jī)器人等對(duì)響應(yīng)延遲敏感、模型版本相對(duì)穩(wěn)定的場(chǎng)景中,HC1 的性能與成本優(yōu)勢(shì)就會(huì)體現(xiàn)出來。

目前,Taalas 已制定了明確的產(chǎn)品規(guī)劃,計(jì)劃在 2026 年推出支持 70B 大模型的芯片,同時(shí)還在探索通過 LoRA 微調(diào)技術(shù)優(yōu)化固化在芯片中的模型。

若能在后續(xù)發(fā)展中突破現(xiàn)有架構(gòu)的限制,Taalas 或許真的能推動(dòng)行業(yè)進(jìn)入新的發(fā)展階段。

記得星標(biāo)微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
彩票銷量“斷崖式”下跌,2元中500萬夢(mèng),為何如今沒人愿意信了?

彩票銷量“斷崖式”下跌,2元中500萬夢(mèng),為何如今沒人愿意信了?

復(fù)轉(zhuǎn)這些年
2026-03-28 11:52:28
牢A的新賽道?

牢A的新賽道?

關(guān)爾東
2026-03-28 20:20:30
再次勸你:要在大城市留一套房,不止是升值,這三點(diǎn)更重要

再次勸你:要在大城市留一套房,不止是升值,這三點(diǎn)更重要

愛看劇的阿峰
2026-03-29 14:17:24
人有沒有冠心病看晨起就知道?冠心病患者:晨起一般會(huì)有這些表現(xiàn)

人有沒有冠心病看晨起就知道?冠心病患者:晨起一般會(huì)有這些表現(xiàn)

普陀動(dòng)物世界
2026-03-29 14:32:07
美媒:對(duì)不起殲-20和殲-35,“新款”F-22戰(zhàn)斗機(jī)已經(jīng)揭開神秘面紗

美媒:對(duì)不起殲-20和殲-35,“新款”F-22戰(zhàn)斗機(jī)已經(jīng)揭開神秘面紗

零度Military
2026-03-26 22:20:35
印媒驚呼:中國正在重塑全球一切!美專家承認(rèn)美已失去競(jìng)爭(zhēng)資格

印媒驚呼:中國正在重塑全球一切!美專家承認(rèn)美已失去競(jìng)爭(zhēng)資格

樂趣紀(jì)史
2026-03-29 18:31:16
張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

娛樂圈圈圓
2026-03-26 21:47:07
范元甄:與江青齊名的延安四美之一,嫁主席秘書,卻輸?shù)袅艘簧?>
    </a>
        <h3>
      <a href=干史人
2026-03-05 21:06:35
伊朗打爆美軍隱身戰(zhàn)機(jī),中國這套裝備,才是真正的殺手锏

伊朗打爆美軍隱身戰(zhàn)機(jī),中國這套裝備,才是真正的殺手锏

喜歡歷史的阿繁
2026-03-29 18:18:23
0罰球砍31分,杰倫格林創(chuàng)聯(lián)盟第一!太陽一戰(zhàn)迎4大喜訊猛追火箭隊(duì)

0罰球砍31分,杰倫格林創(chuàng)聯(lián)盟第一!太陽一戰(zhàn)迎4大喜訊猛追火箭隊(duì)

鍋?zhàn)踊@球
2026-03-29 14:08:23
今日油價(jià)|3月29日調(diào)價(jià)后92,95汽油價(jià)格,今天油價(jià)“明跌暗漲”了

今日油價(jià)|3月29日調(diào)價(jià)后92,95汽油價(jià)格,今天油價(jià)“明跌暗漲”了

豬友巴巴
2026-03-29 17:04:10
2026,中美最終國運(yùn)之戰(zhàn)已經(jīng)開始!我們每個(gè)人都已參與其中!

2026,中美最終國運(yùn)之戰(zhàn)已經(jīng)開始!我們每個(gè)人都已參與其中!

愛吃醋的貓咪
2026-03-27 22:02:25
陳牧馳陳冰官宣結(jié)婚生子,曾被法院判無戀情,如今打臉全網(wǎng)

陳牧馳陳冰官宣結(jié)婚生子,曾被法院判無戀情,如今打臉全網(wǎng)

草莓解說體育
2026-03-29 10:28:04
厲害了我的國!終于開始戰(zhàn)略反攻了!

厲害了我的國!終于開始戰(zhàn)略反攻了!

達(dá)文西看世界
2026-03-28 12:01:24
韋世豪:喀麥隆也是非常強(qiáng)的球隊(duì),要做好應(yīng)對(duì)困難的準(zhǔn)備

韋世豪:喀麥隆也是非常強(qiáng)的球隊(duì),要做好應(yīng)對(duì)困難的準(zhǔn)備

懂球帝
2026-03-29 17:01:10
伊朗越戰(zhàn)越勇,美軍出現(xiàn)最大戰(zhàn)損,戰(zhàn)略軍機(jī)被毀,大批美軍被抬走

伊朗越戰(zhàn)越勇,美軍出現(xiàn)最大戰(zhàn)損,戰(zhàn)略軍機(jī)被毀,大批美軍被抬走

薦史
2026-03-29 18:19:06
2026年4大行業(yè)批量裁員,有人裸辭無工可找,普通人必看

2026年4大行業(yè)批量裁員,有人裸辭無工可找,普通人必看

老特有話說
2026-03-24 15:16:29
中大一專業(yè)學(xué)費(fèi)大調(diào)整!從6850元漲至4.5萬,2028級(jí)更高達(dá)6.5萬

中大一專業(yè)學(xué)費(fèi)大調(diào)整!從6850元漲至4.5萬,2028級(jí)更高達(dá)6.5萬

Delete丨CC
2026-03-26 19:53:51
隨著U23國足1-1絕平朝鮮,越南0-1,西安4國賽最新積分:榜首易主

隨著U23國足1-1絕平朝鮮,越南0-1,西安4國賽最新積分:榜首易主

球場(chǎng)沒跑道
2026-03-28 21:37:15
翻到張雪峰2016年婚紗照,瞬間看哭了!

翻到張雪峰2016年婚紗照,瞬間看哭了!

魔都姐姐雜談
2026-03-26 22:06:50
2026-03-29 19:31:00
鎂客網(wǎng) incentive-icons
鎂客網(wǎng)
硬科技第一產(chǎn)業(yè)媒體,提供最有價(jià)值的行業(yè)觀察。
5931文章數(shù) 9355關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

美軍地面戰(zhàn)"數(shù)周速?zèng)Q"方案披露 欲復(fù)刻"42天滅伊"神話

頭條要聞

美軍地面戰(zhàn)"數(shù)周速?zèng)Q"方案披露 欲復(fù)刻"42天滅伊"神話

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂要聞

張凌赫事件持續(xù)升級(jí)!官方點(diǎn)名怒批

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

家居
時(shí)尚
健康
手機(jī)
公開課

家居要聞

曲線華爾茲 現(xiàn)代簡(jiǎn)約

今年春天最火的疊穿法則,照著搭時(shí)髦又減齡!

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

手機(jī)要聞

雷軍稱小米MiMo-V2-Pro備受好評(píng):首周限免活動(dòng)延長至4月2日

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版