奔腾2 CPU+128MB内存成功运行Llama大模型：速度还挺快

综合 2025-01-05 11:53:04 73

12月30日消息，奔腾据媒体报道，存成EXO Labs最近发布了一段视频，功运展示了在一台26年历史的行L型速Windows 98奔腾2 PC上运行大模型（LLM）。

这台主频350MHz电脑成功启动进入Windows 98系统，大模度还随后EXO启动了基于Andrej Karpathy的挺快Llama2.c定制的纯C推理引擎，并要求LLM生成关于“Sleepy Joe”的奔腾故事，令人惊讶的存成是生成速度相当可观。

EXO Labs的功运这一壮举并非偶然，该组织自称为“民主化AI”而生，行L型速由牛津大学的大模度还研究人员和工程师组成，他们认为，挺快少数大型企业控制AI对文化、奔腾真理和社会的存成其他基本方面是不利的。

因此，功运EXO希望建立开放的基础设施，训练前沿模型，并使任何人在任何地方都能运行它们，这项在Windows 98上的AI演示，展示了即使在资源极其有限的情况下也能完成的事情。

EXO Labs在文章中详细描述了在Windows 98上运行Llama的过程，他们购买一台旧的Windows 98 PC作为项目基础，但面临了许多挑战。

将数据传输到老设备上就是一个不小的挑战，他们不得不使用“老式的FTP”通过古老机器的以太网端口进行文件传输。

编译现代代码以适应Windows 98可能是一个更大的挑战，EXO找到了Andrej Karpathy的llama2.c，可以总结为“700行纯C代码，可以运行Llama 2架构模型的推理”，Karpathy曾是特斯拉的AI主管，也是OpenAI的创始团队成员。

利用这个资源和旧的Borland C++ 5.02 IDE和编译器（以及一些轻微的调整），代码可以被制作成Windows 98兼容的可执行文件并运行，GitHub上有完成代码的链接。

使用260K LLM和Llama架构在Windows 98上实现了“35.9 tok/s”的速度，根据EXO的博客，升级到15M LLM后，生成速度略高于1 tok/s，Llama 3.2 1B的速度则慢得多，为0.0093 tok/s。

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

西蒙尼抱怨赛程密集：连续一周双赛，没人在乎我们的感受

[流言板]杰伦：沃尔什抢到了关键的进攻篮板，他今天做出了杰出贡献

曼晚：加纳乔回归曼联名单，拉什福德仍缺阵、周一称自己身体不适

进不去日本国家队❗25岁町野修斗德甲单场独造4球，16场7球1助❗

准心差点！约基奇上半场15中6得到16分10板5助1断三分4中1

大场面先生！姆巴佩皇马生涯前2场决赛都有进球，队史近10年第3人

《GTA6》B站预告对比油管：细节明显更清晰

韩媒：全北现代接近引进韩国国门宋范根，球员渴望重返K联赛效力