2026年6月个人开发者霸榜抱抱脸Top2,推荐必看

  • 时间:
  • 浏览:108
  • 来源:南宁市武鸣区陆酷巴网络科技工作室

个人开发者凭什么挤进Top榜单

2026年6月, 抱抱脸模型排行榜上出现了反常状况, 在智谱GLM - 5.2、百度、NVIDIA等众多大厂机构的模型当中, 一个个人开发者账号“逯雨鑫”的模型显著地跻身前排, 其下载量居高不下, 甚至有一段时间还胜过GLM - 5.2占据榜首。智谱AI负责人在X(原Twitter)上公开推荐了这个模型, 进而引发社区热烈讨论。

这位处于当下在美国某所高校钻研AI方向硕士学位的开发者, 依靠其自身的力量, 于仅仅一周的时间以内, 使得自身的模型在抱抱脸占据榜首位置, 下载数量总计超过70万次。他向量子位表明,这并非借助运气, 而是依据一套严密的技术方法论以及大量的数据处理工作。

Fable 5与Gemma 4的巧妙融合

逯雨鑫这次发布了两个新模型。其核心思路是把Fable 5的编程推理能力“蒸馏”进一个能够在本地运行的Gemma 4 - 12B小模型里。教师数据主要源自Cursor的Composer 2.5, 还辅以Fable 5。Composer 2.5做错的题目, 会交给Fable 5再次进行推理, 从而生成新的思维链跟正确代码。

模型卡呈现出这样的情况, 训练数据有着被称作“可验证”的代码推理形式, 具体表现为, 跟每条思维链相对应的代码, 都一定要在真实的环境里实现跑过测试这一行为, 并且在真正经过测试、得以通过之后方能够保留下来。就是因为存在这种对数据质量进行严格把控的情况, 才确保了哪怕是小模型依然能够输出可靠的推理结果。

V2版本来临:本地Agent的突破

V2版本将agentic能力予以引入, 增添了多步工具调用功能。用户能够把它当作本地Agent来使用, 自行达成“阅读-推理-动手-验证”的闭环操作。在tau2-bench的telecom子集中, 基座Gemma-4-12B的得分仅仅是15%, 但V2版模型的得分却高达55%, 性能提高了约3.5倍。

只不过作者也承认, 这是在本地自行测试、于单一领域之内、针对20个任务运行而得出的相对数值, 是不能够直接同官方榜单开展比较的东西, 并且和前沿的大模型之间仍然存在着不小的差距情况。然而这样的一个结果已然致使不少的开发者察觉到了在本地运行具有强大能力的Agent的可能性所在。

数据处理:最耗时的核心工程

逯雨鑫讲道, 整个进程最为耗费时间的并不是训练, 而是数据处理, 特别是agentic数据, 真实的对话常常甚长, 一个任务也许会有十几步, 关联到几千乃至上万个token, 他运用类似“滑动窗口”的办法, 把最近一次用户的消息当作锚点, 将上下文裁剪至预算范围之内。

他又提及, Fable 5随后被下线了, 仅他自身的数据集留存了Fable 5最初的推理过程。社区贡献数据里缺失的部分推理, 被他用Claude Opus 4.8(xhigh)重新去生成, 一条条给补上了。尽管重建的轨迹或许和原版存在差异, 但这是那时唯一可行的办法。

本地运行:推动实际应用的关键

llama.cpp生态里常见的本地模型格式是GGUF格式, llama.cpp、Ollama、LM Studio、Jan等工具能直接加载此格式, 这一具备能够直接加载的特性, 对于那些和涉及私有项目以及处在本地环境当中的关于编程、代码审查、命令执行与调试那样的各种场景而言, 极具极大的吸引力。

有个叫逯雨鑫也算过这样的情况, 要是把模型量化到大概3bit左右的程度, 那么好多配置8GB统一内存的Mac用户是能够运行该模型的, 并且还能够留出一定的上下文窗口。他又觉得好多人也就是仅仅想要利用AI来整理文件, 还有进行处理各种数据, 以及去制作PPT, 或者是体验一下agent, 并非必定愿意每个月为Claude、GPT来支付费用。

未来方向与个人开发者的机遇

被称作逯雨鑫的这个人表明, 他自己未曾料想到此次之后训练所获得的提升幅度会如此之大, 后续将会持续予以推进。那V2这一版本在tau2-bench telecom方面呈现出一种“过度进行尝试、反复实施retry”的状况, 而V3则打算凭借更多的训练去加以改进。他总计在HF上公布了9个公开的模型,除开两个成为爆款的之外, 还曾做过“直接去蒸Claude”的模型。

就个人开发者来讲, 那人的经历表明: 那大厂虽有着更多研究者以及更强的算力, 可个人开发者没有那些包袱, 反倒能够更专心地去解决一个特定痛点。逯雨鑫觉得, 这恰是开源作者的机会所在之处: 不用去做全能模型, 而是把一个足够特定的问题做得好用。要是你也想体验这款本地模型, 能够访问 www.fc-bowuguan.cn 获取更多信息。

你是否愿意放弃每月订阅费,改用本地模型处理编程和Agent任务?欢迎在评论区分享你的看法。

猜你喜欢

2026年6月,中国关键金属进出口情况分析

日媒《日经亚洲》6月27日报道,中国在维持关键金属出口管制的同时,正加大对各类关键金属的进口力度。日经新闻分析了中国进口的22种关键金属,它们均被纳入出口管制范围。据报道,今年1月至5月,中国此类金属进口总量达35万吨,同比增长60%。仅3月份单月进口量就超过9万吨,创下七年多来的最高纪录。

2026-06-29

2026年6月,深圳大沙河如何完成蜕变?

一条穿城而过的河流,怎样完成的蜕变?如果说大沙河是“向水岸要活力”,那么深业上城则是“向空中要效益”。记者从深业上城商管部门了解到,2024年深业上城商圈销售额突破60亿元,实现城市空间价值、生态价值与经济价值的跃升。深圳的集约探索,也延伸到了高密度城区的校园里。

2026-06-29

2026年6月22日-26日,ETF市场有哪些变化?

ETF在近一周里又发生了哪些变化?自2024年“924”行情以来,至少有9只ETF触摸过千亿元规模门槛。尽管“巨无霸”数量缩水,但是百亿元级ETF数量没有明显减少,当前有119只ETF规模超百亿元。站在年中,如何布局下半年?

2026-06-29

6月热议!新一代煤电产业链现存问题及解决办法

当前,新一代煤电升级专项行动正加快推进。如何推动产业链融通发展、助力新型电力系统建设,已成为业界关注的热点。6月27日

2026-06-29

2026年6月科技服务业Top3痛点:标准、流通、风险如何破局?

科技服务业在赋能产业协同发展中,如何进一步解决服务标准体系碎片化、创新要素流通堵点、风险防控等问题?知识产权服务是科技服务业重点领域之一。服务业和实体经济的融合,基于“科技—产业—金融”的循环。科创服务要服务整条产业链,而非单一企业。

2026-06-29