国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

華為開源7B多模態(tài)模型,視覺定位和OCR能力出色,昇騰端側(cè)新甜點(diǎn)

0
分享至

允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

7B量級(jí)模型,向來是端側(cè)部署與個(gè)人開發(fā)者的心頭好。

輕量化特性讓它能靈活適配各類終端場(chǎng)景,而強(qiáng)勁性能又能覆蓋圖像信息抽取、文檔理解、視頻解析、物體定位等高頻需求。

剛剛,華為重磅推出開源新玩家openPangu-VL-7B,直接瞄準(zhǔn)這一核心場(chǎng)景精準(zhǔn)發(fā)力。

昇騰原生的模型結(jié)構(gòu),讓openPangu-VL-7B的推理性能極具性價(jià)比:

720P圖像在單張Ascend Atlas 800T A2卡上首字模型推理時(shí)延(ViT與LLM模型時(shí)延和)僅160毫秒,能夠進(jìn)行5FPS的實(shí)時(shí)推理;訓(xùn)練階段的MFU更是達(dá)到42.5%。

更值得關(guān)注的是,模型在預(yù)訓(xùn)練階段完成了3T+tokens的無突刺集群長(zhǎng)穩(wěn)訓(xùn)練,為開發(fā)者使用昇騰集群提供了極具價(jià)值的實(shí)踐參考。



openPangu-VL-7B在通用視覺問答、文檔圖表理解&OCR、視覺定位、短視頻理解等核心任務(wù)上表現(xiàn)突出,在開源榜單中力壓同量級(jí)模型,展現(xiàn)出強(qiáng)悍的綜合實(shí)力。



官方提供的cookbook也展現(xiàn)了模型在這些領(lǐng)域的優(yōu)異能力。

比如我們給模型一張菜品圖,讓模型找到一共有多少個(gè)櫻桃番茄,模型能夠點(diǎn)出所有的位置并正確計(jì)數(shù)。



給模型一張年報(bào)截圖,模型也能將其轉(zhuǎn)變?yōu)閙arkdown格式,省去了人工摘錄的痛苦。



除了亮眼的榜單成績(jī)和針對(duì)昇騰的訓(xùn)推優(yōu)化,技術(shù)報(bào)告中還披露了若干核心技術(shù)細(xì)節(jié),揭秘模型高性能背后的設(shè)計(jì)巧思:

1)適配昇騰的高性能視覺編碼器



業(yè)界傳統(tǒng)視覺編碼器多針對(duì)GPU架構(gòu)設(shè)計(jì),沒有充分發(fā)揮昇騰硬件優(yōu)勢(shì)。

團(tuán)隊(duì)通過大量先導(dǎo)實(shí)驗(yàn)與性能分析,找到模型結(jié)構(gòu)的最優(yōu)平衡點(diǎn)——相同參數(shù)量下,該視覺編碼器在昇騰芯片上的吞吐較使用窗注意力的ViT-H系列編碼器提升15%。

同時(shí),采用多標(biāo)簽對(duì)比學(xué)習(xí)框架,讓模型具備更優(yōu)的細(xì)粒度理解能力,為后續(xù)VLM訓(xùn)練中的視覺定位數(shù)據(jù)學(xué)習(xí)筑牢基礎(chǔ)。

2)樣本均衡的損失設(shè)計(jì)

為解決不同長(zhǎng)度訓(xùn)練樣本的學(xué)習(xí)均衡問題,openPangu-VL-7B創(chuàng)新采用 “加權(quán)逐樣本損失+逐令牌損失” 的混合訓(xùn)練方案,加權(quán)系數(shù)由令牌位置和樣本重要性動(dòng)態(tài)決定。



這一設(shè)計(jì)讓模型在訓(xùn)練中既能吃透長(zhǎng)回復(fù)數(shù)據(jù),也不忽視短回復(fù)信息,避免 “顧此失彼”,消融實(shí)驗(yàn)已充分驗(yàn)證其有效性。



3)帶填充的定位數(shù)據(jù)格式

區(qū)別于業(yè)界主流的0-999定位方案,openPangu-VL-7B采用000-999千分位帶填充相對(duì)坐標(biāo)完成視覺定位。

整齊的三個(gè)token進(jìn)行位置回歸,不僅降低了模型學(xué)習(xí)難度,更顯著提升了格式遵從性,讓定位任務(wù)的精度和效率同步提升。



此外,技術(shù)報(bào)告還深入探索了預(yù)訓(xùn)練數(shù)據(jù)配比、位置編碼、模型融合等關(guān)鍵策略,為開發(fā)者提供了全面的技術(shù)細(xì)節(jié)參考

對(duì)于昇騰使用者而言,openPangu-VL-7B 的開源無疑是一大利好。

這款兼具輕量化、高性能與強(qiáng)通用性的多模態(tài)模型,既為端側(cè)開發(fā)和個(gè)人使用提供了新選擇,也將進(jìn)一步豐富昇騰生態(tài)的應(yīng)用場(chǎng)景,為創(chuàng)新注入新動(dòng)力。

模型鏈接:
https://ai.gitcode.com/ascend-tribe/openPangu-VL-7B
技術(shù)報(bào)告:
https://ai.gitcode.com/ascend-tribe/openPangu-VL-7B/blob/main/doc/technical_report.pdf

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
12生肖小人拼命想遠(yuǎn)離的3個(gè)生肖,財(cái)運(yùn)事業(yè)雙旺,惹不起

12生肖小人拼命想遠(yuǎn)離的3個(gè)生肖,財(cái)運(yùn)事業(yè)雙旺,惹不起

毅談生肖
2026-01-05 17:17:56
真是太雞肋了!火箭甚至都不敢讓第三中鋒多打一會(huì)兒?

真是太雞肋了!火箭甚至都不敢讓第三中鋒多打一會(huì)兒?

稻谷與小麥
2026-01-06 19:00:41
馬杜羅被綁后,中國牽頭金磚干大事,多國艦隊(duì)集結(jié),要?jiǎng)诱娓窳耍?>
    </a>
        <h3>
      <a href=愛吃醋的貓咪
2026-01-06 20:38:12
傅作義原本擬授上將,毛主席沒點(diǎn)頭,最終周總理親自找傅說明原因

傅作義原本擬授上將,毛主席沒點(diǎn)頭,最終周總理親自找傅說明原因

歷史龍?jiān)w
2026-01-05 08:55:07
破案!遭神仙球絕殺,杜鋒卻暴怒質(zhì)問裁判原因找到,球迷說出實(shí)情

破案!遭神仙球絕殺,杜鋒卻暴怒質(zhì)問裁判原因找到,球迷說出實(shí)情

后仰大風(fēng)車
2026-01-05 23:18:43
美國衰落,就是一個(gè)巨大的謊言

美國衰落,就是一個(gè)巨大的謊言

楓冷慕詩
2026-01-06 12:28:30
云盡孝8年后:她被加拿大市長(zhǎng)拋棄,樣貌大變,遇到國人慌忙躲避

云盡孝8年后:她被加拿大市長(zhǎng)拋棄,樣貌大變,遇到國人慌忙躲避

歸客歷史
2025-12-29 09:03:35
美國下個(gè)目標(biāo)公開,不是伊朗或古巴,盟友聽后感覺天塌了

美國下個(gè)目標(biāo)公開,不是伊朗或古巴,盟友聽后感覺天塌了

歷史有些冷
2026-01-05 21:00:07
國羽4勝1負(fù)!世界第1收退賽禮,混雙00后逆轉(zhuǎn),男雙組合1輪游!

國羽4勝1負(fù)!世界第1收退賽禮,混雙00后逆轉(zhuǎn),男雙組合1輪游!

劉姚堯的文字城堡
2026-01-06 14:40:28
羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

瓜汁橘長(zhǎng)Dr
2025-12-29 11:29:56
高市新年首次喊中國對(duì)話,不到24小時(shí),中方用對(duì)日反制作出回應(yīng)

高市新年首次喊中國對(duì)話,不到24小時(shí),中方用對(duì)日反制作出回應(yīng)

時(shí)時(shí)有聊
2026-01-06 20:52:09
房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費(fèi),80塊錢就能搞定

房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費(fèi),80塊錢就能搞定

室內(nèi)設(shè)計(jì)師有料兒
2025-12-07 16:05:28
李小孩的“小綠瓶”,在國博很沒存在感,為何永久禁止出境?

李小孩的“小綠瓶”,在國博很沒存在感,為何永久禁止出境?

收藏大視界
2026-01-04 17:32:26
在美國的馬杜羅沒想到,副總統(tǒng)只扛了一天,就帶領(lǐng)全國人民投降了

在美國的馬杜羅沒想到,副總統(tǒng)只扛了一天,就帶領(lǐng)全國人民投降了

瞳哥視界
2026-01-05 21:45:48
70歲成龍談母親離世:用盡辦法難阻求死

70歲成龍談母親離世:用盡辦法難阻求死

楓塵余往逝
2026-01-06 07:12:22
中國海警亮出最新海報(bào),登船扣押海馬斯?賴清德喊出兩個(gè)“不”

中國海警亮出最新海報(bào),登船扣押海馬斯?賴清德喊出兩個(gè)“不”

趣生活
2026-01-06 20:55:32
余承東親臨廣汽番禺總部,與廣汽簽署華為終端全面合作

余承東親臨廣汽番禺總部,與廣汽簽署華為終端全面合作

汽車說刊
2026-01-05 21:36:03
美國破防也沒轍,抓捕馬杜羅不到24小時(shí),中國牽頭辦金磚聯(lián)合軍演

美國破防也沒轍,抓捕馬杜羅不到24小時(shí),中國牽頭辦金磚聯(lián)合軍演

說歷史的老牢
2026-01-05 11:06:35
【荷蘭】荷蘭電網(wǎng)運(yùn)營商:對(duì)智能電表中的中國部件無需過度擔(dān)憂

【荷蘭】荷蘭電網(wǎng)運(yùn)營商:對(duì)智能電表中的中國部件無需過度擔(dān)憂

一網(wǎng)荷蘭
2026-01-06 02:07:41
誰會(huì)是下一個(gè)委內(nèi)瑞拉?起底美國軍事干涉顛覆的黑手

誰會(huì)是下一個(gè)委內(nèi)瑞拉?起底美國軍事干涉顛覆的黑手

澎湃新聞
2026-01-06 15:14:12
2026-01-06 21:52:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11977文章數(shù) 176356關(guān)注度
往期回顧 全部

科技要聞

速看!黃仁勛萬字實(shí)錄:甩出"物理AI"王牌

頭條要聞

媒體:美軍跨國突擊委 與4年前俄軍行動(dòng)形成鮮明對(duì)比

頭條要聞

媒體:美軍跨國突擊委 與4年前俄軍行動(dòng)形成鮮明對(duì)比

體育要聞

從NBA最菜首發(fā)控衛(wèi),到NBA最強(qiáng)喬治

娛樂要聞

2026年央視春晚彩排照曝光!

財(cái)經(jīng)要聞

價(jià)格跳水、轉(zhuǎn)型不易 陳華也難救茅臺(tái)?

汽車要聞

摩登出街潮品 實(shí)拍奇瑞QQ冰淇淋女王版

態(tài)度原創(chuàng)

親子
家居
本地
數(shù)碼
旅游

親子要聞

孩子叫你“媽媽”和“媽”,是何感受?

家居要聞

引光之宅 地下室也有生機(jī)

本地新聞

云游內(nèi)蒙|初見呼和浩特,古今交融的北疆都會(huì)

數(shù)碼要聞

199元:華碩推出ProArt創(chuàng)夢(mèng)120機(jī)箱風(fēng)扇,支持菊花鏈串聯(lián)

旅游要聞

新年伊始 入境游持續(xù)火熱

無障礙瀏覽 進(jìn)入關(guān)懷版