社区最爱：下载量 Top 的本地 LLM 都跑在什么硬件上

HuggingFace 上下载量最高的模型已突破 1,641 万，点赞数最高达到 6,065。但高下载量是否意味着好体验？我们结合 whichllm 跑分数据，看看社区用真金白银投票的结果——哪些模型真正值得跑，以及用什么显卡跑最划算。

下载量 Top 模型一览

模型	下载量	点赞	参数量	许可
google/gemma-4-31B-it	9,858,026	2,972	32.7B	Apache-2.0
Qwen/Qwen3.6-27B	3,901,493	1,682	27.8B	Apache-2.0

冠军组合：H100 + Qwen3.6-27B

Qwen3.6-27B 是目前兼容性最好的模型——它在绝大多数 GPU 的通用对话排行榜上都占据 rank 1 位置。与 H100 搭配时，综合评分达到 94.4，是目前的"冠军组合"。即便在消费级旗舰 RTX 4090 上，评分也高达 92.4，说明这个模型对硬件并不挑剔。

下载量王者：Gemma-4-31B-it

Google 的 Gemma-4-31B-it 下载量接近 千万级（985 万），点赞近 3,000，社区热度极高。在 H100 上评分 91.9，性能表现与下载量相匹配。如果你的预算充足，这是一个非常稳妥的选择。

选择建议

追求极致性能：选 H100 + Qwen3.6-27B，评分 94.4 无可争议
消费级性价比：RTX 4090 + Qwen3.6-27B，评分 92.4，接近天花板
社区验证之选：Gemma-4-31B-it，千万下载量背书，H100 评分 91.9

数据来源：HuggingFace 模型下载统计 & whichllm 硬件-模型适配评分。