国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

在 Mac 上微調(diào)一切大模型

0
分享至

聊個讓我非常興奮的項(xiàng)目——mlx-tune

一句話概括:在你的 Mac 上,用 Unsloth 的 API 微調(diào)一切

LLM、視覺模型、TTS、STT、OCR、Embedding,全都能在 Apple Silicon 上本地微調(diào)

Mac 用戶的微調(diào)困境

做大模型微調(diào)的同學(xué)應(yīng)該都有過這種體驗(yàn):想在本地跑個小實(shí)驗(yàn)驗(yàn)證下 idea,結(jié)果發(fā)現(xiàn) Unsloth 依賴 Triton,而 Triton 不支持 Mac

于是你只剩兩條路:

  1. 1. 花錢開云 GPU —— 就跑個 100 條數(shù)據(jù)的實(shí)驗(yàn),有必要嗎?

  2. 2. 用 mlx-lm 原生 API —— 但代碼和 完全不兼容,到了云上還得重寫一遍

mlx-tune(github.com/ARahim3/mlx-tune)的作者也遇到了一模一樣的問題

他的解決思路非常簡單粗暴:把 MLX 包裝成 Unsloth 的 API

你在 Mac 上寫的訓(xùn)練腳本,換個 import 就能直接在 CUDA 集群跑

# Unsloth (CUDA)                        # MLX-Tune (Apple Silicon)
from unsloth import FastLanguageModel from mlx_tune import FastLanguageModel
from trl import SFTTrainer from mlx_tune import SFTTrainer


# 后面的代碼一模一樣!

這才是真正解決問題的設(shè)計(jì)

下面這張圖清楚展示了 mlx-tune 的工作流——本地原型驗(yàn)證,改個 import 就能上云訓(xùn)練:


功能有多全?看完嚇一跳

它支持的訓(xùn)練方法比很多正經(jīng)公司的內(nèi)部工具都全:

語言模型訓(xùn)練:

  • ? SFT :基礎(chǔ)指令微調(diào),這是最常用的

  • ? DPO / ORPO / KTO / SimPO :各種偏好學(xué)習(xí)方法全覆蓋

  • ? GRPO :DeepSeek R1 風(fēng)格的多生成 + 獎勵訓(xùn)練

  • ? CPT :持續(xù)預(yù)訓(xùn)練,支持解耦學(xué)習(xí)率

多模態(tài)訓(xùn)練:

  • ? Vision :支持 Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 等 VLM 微調(diào)

  • ? TTS :Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 五個 TTS 模型

  • ? STT :Whisper、Moonshine、Qwen3-ASR、NVIDIA Canary、Voxtral 五個 STT 模型

  • ? Embedding :BERT、ModernBERT、Qwen3-Embedding、Harrier,支持對比學(xué)習(xí)

  • ? OCR :DeepSeek-OCR、GLM-OCR、olmOCR、Qwen-VL,內(nèi)置 CER/WER 指標(biāo)

進(jìn)階能力:

  • ? MoE 微調(diào) :支持 39+ 種 MoE 架構(gòu),包括 Qwen3.5-35B、Mixtral、DeepSeek 系列

  • ? Gemma 4 Audio :12 層 Conformer 音頻塔,原生處理 16kHz 音頻

  • ? LFM2 :Liquid AI 的混合卷積+GQA 架構(gòu)

說真的,一個社區(qū)項(xiàng)目做到這個程度,相當(dāng)離譜

全景架構(gòu)一覽——從 API 到硬件的五層設(shè)計(jì):


快速上手

安裝很簡單,推薦用 uv:

# 標(biāo)準(zhǔn)安裝
uv pip install mlx-tune


# 帶音頻支持
uv pip install 'mlx-tune[audio]'
brew install ffmpeg

來個最基礎(chǔ)的 SFT 微調(diào)示例:

from mlx_tune import FastLanguageModel, SFTTrainer, SFTConfig
from datasets import load_dataset

# 加載模型(4bit 量化,省顯存)
model, tokenizer = FastLanguageModel.from_pretrained(
model_name="mlx-community/Llama-3.2-1B-Instruct-4bit",
max_seq_length=2048,
load_in_4bit=True,
)

# 加 LoRA
model = FastLanguageModel.get_peft_model(
model,
r=16,
target_modules=["q_proj", "k_proj", "v_proj", "o_proj"],
lora_alpha=16,
)

# 加載數(shù)據(jù)集
dataset = load_dataset("yahma/alpaca-cleaned", split="train[:100]")

# 訓(xùn)練
trainer = SFTTrainer(
model=model,
train_dataset=dataset,
tokenizer=tokenizer,
args=SFTConfig(
output_dir="outputs",
per_device_train_batch_size=2,
learning_rate=2e-4,
max_steps=50,
),
)
trainer.train()

# 保存:三種格式隨你選
model.save_pretrained("lora_model") # LoRA 適配器
model.save_pretrained_merged("merged", tokenizer) # 合并后的完整模型
model.save_pretrained_gguf("model", tokenizer) # GGUF 格式,直接給 Ollama 用

如果你用過 Unsloth,這代碼看著是不是特別眼熟?對,就是同一套 API

視覺模型微調(diào)

VLM 微調(diào)也是同樣簡潔的體驗(yàn):

from mlx_tune import FastVisionModel, UnslothVisionDataCollator, VLMSFTTrainer
from mlx_tune.vlm import VLMSFTConfig

model, processor = FastVisionModel.from_pretrained(
"mlx-community/Qwen3.5-0.8B-bf16",
)

model = FastVisionModel.get_peft_model(
model,
finetune_vision_layers=True, # 視覺層也微調(diào)
finetune_language_layers=True,
r=16, lora_alpha=16,
)

# 訓(xùn)練(數(shù)據(jù)集格式和 Unsloth 一致)
FastVisionModel.for_training(model)
trainer = VLMSFTTrainer(
model=model,
tokenizer=processor,
data_collator=UnslothVisionDataCollator(model, processor),
train_dataset=dataset,
args=VLMSFTConfig(max_steps=30, learning_rate=2e-4),
)
trainer.train()

Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 都支持

你甚至可以用 Vision GRPO 來訓(xùn)練視覺推理能力

TTS 微調(diào):在 Mac 上克隆聲音

這個功能我覺得特別有意思——在 Mac 上本地微調(diào) TTS 模型:

from mlx_tune import FastTTSModel, TTSSFTTrainer, TTSSFTConfig, TTSDataCollator
from datasets import load_dataset, Audio

# 自動檢測模型類型、編碼器和 token 格式
model, tokenizer = FastTTSModel.from_pretrained(
"mlx-community/orpheus-3b-0.1-ft-bf16"
)
model = FastTTSModel.get_peft_model(model, r=16, lora_alpha=16)

dataset = load_dataset("MrDragonFox/Elise", split="train[:100]")
dataset = dataset.cast_column("audio", Audio(sampling_rate=24000))

trainer = TTSSFTTrainer(
model=model, tokenizer=tokenizer,
data_collator=TTSDataCollator(model, tokenizer),
train_dataset=dataset,
args=TTSSFTConfig(output_dir="./tts_output", max_steps=60),
)
trainer.train()

Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 都支持

想做聲音克隆或者風(fēng)格化 TTS,再也不用租 GPU 了

工作流全景

mlx-tune 的定位非常清晰:本地原型 → 云端量產(chǎn)。

本地 Mac (mlx-tune)              云端 GPU (Unsloth)
├── 快速實(shí)驗(yàn) ├── 大規(guī)模訓(xùn)練
├── 小數(shù)據(jù)集驗(yàn)證 ├── 完整數(shù)據(jù)集
├── 秒級迭代 ├── 生產(chǎn)級優(yōu)化
└── 同一套代碼 ─────────────────── └── 同一套代碼

訓(xùn)練完還能直接導(dǎo)出:

  • ? HuggingFace 格式 :標(biāo)準(zhǔn)保存

  • ? GGUF :直接丟給 Ollama / llama.cpp

  • ? push_to_hub :一鍵推到 HuggingFace Hub

它適合誰?

我覺得 mlx-tune 最適合這幾類人:

  1. 1. Mac 用戶 + 微調(diào)需求 :你有 M1/M2/M3/M4/M5,想在本地跑微調(diào)實(shí)驗(yàn),這是最佳選擇

  2. 2. 混合工作流用戶 :本地調(diào)試、云端訓(xùn)練,代碼無縫遷移

  3. 3. 多模態(tài)探索者 :想同時玩 LLM、Vision、TTS、STT、OCR 微調(diào)的人

  4. 4. 學(xué)習(xí)者 :想理解微調(diào)原理,在本地快速迭代比去 Colab 排隊(duì)強(qiáng)太多

局限性也得說清楚:

  • ? 訓(xùn)練速度肯定比不上 A100 + Unsloth,這是物理定律決定的

  • ? GGUF 導(dǎo)出對量化模型有限制,建議用非量化基座模型

  • ? 內(nèi)存受限于 Mac 的統(tǒng)一內(nèi)存(不過 Mac Studio 最高 512GB,夠用了)

如果你是 Mac 用戶,又對微調(diào)大模型感興趣,強(qiáng)烈建議試試

制作不易,如果這篇文章覺得對你有用,可否點(diǎn)個關(guān)注。給我個三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
被志愿軍生生嚇跑的歐洲強(qiáng)國,離勝利僅剩30米,突然全軍撤退逃離

被志愿軍生生嚇跑的歐洲強(qiáng)國,離勝利僅剩30米,突然全軍撤退逃離

浩渺青史
2026-04-20 18:21:45
一個收入不高的人,可以偽精致到什么程度?網(wǎng)友:天天為賬單發(fā)愁

一個收入不高的人,可以偽精致到什么程度?網(wǎng)友:天天為賬單發(fā)愁

另子維愛讀史
2026-04-20 09:36:56
車窗告別貼膜時代!京東方光幕技術(shù)上車小鵬、蔚來:0.16秒從透明變黑墻

車窗告別貼膜時代!京東方光幕技術(shù)上車小鵬、蔚來:0.16秒從透明變黑墻

快科技
2026-04-20 19:39:18
1940年陳嘉庚到延安考察,悄悄問店主:這里有共產(chǎn)黨大官的產(chǎn)業(yè)嗎

1940年陳嘉庚到延安考察,悄悄問店主:這里有共產(chǎn)黨大官的產(chǎn)業(yè)嗎

老謝談史
2026-04-18 16:11:37
不知道張凌赫好看在哪?看看路人拍的沒有濾鏡的生圖你就知道了!

不知道張凌赫好看在哪?看看路人拍的沒有濾鏡的生圖你就知道了!

草莓解說體育
2026-04-20 18:48:02
不是齊達(dá)內(nèi)!姆巴佩反對克洛普上任,力薦阿根廷名帥執(zhí)掌皇馬!

不是齊達(dá)內(nèi)!姆巴佩反對克洛普上任,力薦阿根廷名帥執(zhí)掌皇馬!

瀾歸序
2026-04-21 05:37:29
曼聯(lián)6000萬可簽利馬阿根廷搭檔!兩確定存疑,賽季報銷可踢世界杯

曼聯(lián)6000萬可簽利馬阿根廷搭檔!兩確定存疑,賽季報銷可踢世界杯

羅米的曼聯(lián)博客
2026-04-21 07:07:19
連續(xù)兩個月從中國進(jìn)口鎵鍺為零后,日本宣布:無人機(jī)要做世界第一

連續(xù)兩個月從中國進(jìn)口鎵鍺為零后,日本宣布:無人機(jī)要做世界第一

丁丁鯉史紀(jì)
2026-04-20 16:54:16
祥鵬航空回應(yīng)“旅客與地服起沖突”:其行李超規(guī),正配合調(diào)查

祥鵬航空回應(yīng)“旅客與地服起沖突”:其行李超規(guī),正配合調(diào)查

南方都市報
2026-04-20 17:16:09
無牌老頭樂路上狂飆,車窗貼有“急救送血車”字樣!天津血液中心:非中心車輛,在找車

無牌老頭樂路上狂飆,車窗貼有“急救送血車”字樣!天津血液中心:非中心車輛,在找車

瀟湘晨報
2026-04-20 11:23:12
同事借我車去青海,我提前把ETC卡拔了,2小時后他從收費(fèi)站來電了

同事借我車去青海,我提前把ETC卡拔了,2小時后他從收費(fèi)站來電了

張道陵秘話
2026-04-11 16:37:21
美國的陰謀藏不住了!臺海南海就是幌子,真正目標(biāo)是中國最大王牌

美國的陰謀藏不住了!臺海南海就是幌子,真正目標(biāo)是中國最大王牌

古事尋蹤記
2026-04-21 07:21:56
12輛房車組隊(duì)穿越歐亞30個國家,組織者:已經(jīng)是第8次了,全程4萬多公里全靠自駕,準(zhǔn)備9月返回

12輛房車組隊(duì)穿越歐亞30個國家,組織者:已經(jīng)是第8次了,全程4萬多公里全靠自駕,準(zhǔn)備9月返回

極目新聞
2026-04-20 21:05:29
鹿晗生日傳好消息,眾星發(fā)聲,關(guān)曉彤態(tài)度變了,懸著的心終于放下

鹿晗生日傳好消息,眾星發(fā)聲,關(guān)曉彤態(tài)度變了,懸著的心終于放下

手工制作阿殲
2026-04-20 18:17:06
4.21股市早8點(diǎn)丨春夏之交必再創(chuàng)11年新高

4.21股市早8點(diǎn)丨春夏之交必再創(chuàng)11年新高

沙黽農(nóng)
2026-04-21 06:26:29
馬伊琍官宣喜訊!文章開面館求團(tuán)圓,真實(shí)目的曝光,姚笛成贏家

馬伊琍官宣喜訊!文章開面館求團(tuán)圓,真實(shí)目的曝光,姚笛成贏家

橙星文娛
2026-04-19 14:47:43
女生主動起來有多黏人?網(wǎng)友:這些女的太開放了

女生主動起來有多黏人?網(wǎng)友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
長沙火了!全球最大零食店開業(yè)3天就被擠停售,背后真相曝光

長沙火了!全球最大零食店開業(yè)3天就被擠停售,背后真相曝光

西昆侖Bruce
2026-04-19 19:52:58
查到問題根源上 改到群眾心坎里(樹立和踐行正確政績觀)

查到問題根源上 改到群眾心坎里(樹立和踐行正確政績觀)

人民網(wǎng)
2026-04-20 08:45:09
十大起義總指揮都是誰

十大起義總指揮都是誰

祁州校尉
2026-04-17 11:00:28
2026-04-21 08:03:00
Ai學(xué)習(xí)的老章 incentive-icons
Ai學(xué)習(xí)的老章
Ai學(xué)習(xí)的老章
3339文章數(shù) 11138關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

特朗普兩天三次反轉(zhuǎn) 伊朗學(xué)習(xí)特朗普玩起"極限施壓"

頭條要聞

特朗普兩天三次反轉(zhuǎn) 伊朗學(xué)習(xí)特朗普玩起"極限施壓"

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

本地
手機(jī)
親子
健康
公開課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

手機(jī)要聞

蘋果被曝下調(diào) iPhone 18 規(guī)格以壓縮成本

親子要聞

大體重孩子家長要關(guān)注孩子運(yùn)動足部壓力是否正常

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版