缘起:从代码初心到算力革命
在硅谷工程师为云端 AI 算力账单焦头烂额时,上海的一位设计师已通过端脑云,用附近网吧的闲置显卡完成了几百张高清画面的实时渲染。这个连接全球分散 PC 的算力网络,正以 “蚂蚁雄兵” 的方式,向中心化算力发起挑战。
从技术理念到商业模式,这家深圳公司都散发着学术底蕴与产业洞察相结合的独特气质。端脑科技核心创始人兼 CEO 丁烨博士毕业于香港科技大学,是深圳市海外高层次人才,并担任国家自然科学基金项目评审专家。
2023 年 5 月公司于南山区成立第一天,他就在内部立下目标,端脑科技将用学术的深度和产业的广度,让算力像电力一样,随处可得,人人可用。
这样的愿景在算力被寡头垄断的今天,听起来像是不切实际的理想主义。不止一位投资人表达过类似的看法:一个算力创业公司在 2024 年,如果不依附于某个云巨头,反而想用分布式模式去颠覆它,那简直是天方夜谭。
但在全球算力焦虑蔓延的当下,这种 “以下克上” 的创造力更显珍贵,与 Think·志同道合的理念不谋而合。ThinkPad 始终是同行者的忠实伙伴,真正的创造力从不屈服于配置的桎梏,而在思考的深度。
2024 年 8 月,端脑 AI 更新!全面支持 FLUX 模型。
破局:用分布式架构挑战算力垄断
2022 年,当 ChatGPT 横空出世,引爆全球 AI 军备竞赛时,《经济学人》曾忧心忡忡地评论道,AI 的未来,正被禁锢在少数几家公司的数据中心里。赞誉背后的现实是,以云计算普及为标志的数字化浪潮十几年后,全球算力总量虽飞速增长,但其分配方式却日益集中——顶尖大模型的训练成本突破千万美元,且以每年翻倍的速度持续增长,无数中小开发者和研究机构被无情地挡在门外。
端脑科技提出的 “共享算力” 构想,正是对这一现状的回应。但要将理想变为现实,需要可靠的技术支撑。
“创业初期,端脑科技经历过一次产品上线前的致命 Bug 危机。” 丁烨回忆道,“那是 2023 年底的一个深夜,端脑科技的调度系统出现了一个难以复现的偶发故障。正是 ThinkPad P 系列的强悍性能,支撑我连续工作 36 小时,最终在最后一刻定位并修复了问题,帮团队闯过生死关。”
这份在关键时刻展现的可靠性,让 ThinkPad 从 “办公伙伴” 升级为端脑云分布式网络中的核心节点。在端脑科技的办公室里,几十台 ThinkPad P 系列移动工作站在特制机架上 7x24 小时不间断运行,成为这支 “算力民兵” 的技术基石。
很长一段时间中,分布式计算领域由 Folding@home 等公益项目主导。这些项目依靠全球志愿者的爱心贡献,缺乏稳定、可持续的商业模型。但丁烨清楚传统模式的局限,纯粹依赖奉献精神的模式,无法支撑起一个稳定可靠的商业算力网络。端脑科技必须用经济模型和技术创新,让分享算力变得有利可图且简单可靠。
2023 年 10 月,端脑云 Cephalon.cloud V1.2 版本上线。
技术基石:ThinkPad 与英特尔的硬核支撑
丁烨特别强调 ThinkPad P 系列的技术优势:“在分布式算力网络中,每个节点都需要具备企业级的可靠性和稳定性。ThinkPad P 系列不仅提供了强大的本地算力,其军工级的稳定性和 ECC 内存纠错能力,更是确保了节点在长时间高负载运行下的可靠性。”
丁烨进一步解释,端脑科技的测试数据显示,ThinkPad P 系列在连续运行 30 天后,其性能衰减率不超过 3%。这种稳定性对于构建可靠的算力网络至关重要。
在硬件架构层面,ThinkPad P 系列搭载的英特尔®酷睿™ Ultra 处理器的混合架构设计,恰恰契合了分布式算力的核心理念。其 NPU、GPU 和 CPU 的协同计算能力,让单个节点能够在不同场景下发挥最大效能。在实际测试中,这种异构计算架构让我们的节点效率提升了 40% 以上。
这种架构层面的创新,为构建弹性算力网络提供了坚实的硬件基础。2023 年 10 月,端脑云 Cephalon.cloud V1.2 版本上线,标志着这一技术架构的初步成熟。
实践验证:从理想走向现实
2024 年中,端脑云发布了新一代调度引擎。测试数据显示,相对 Kubernetes+Ray 的速度提升了 75%,大幅降低 50% 的算力成本。这一技术突破,让端脑云在 2024 年下半年获得了第一批企业客户,收入从零突破百万元。
实际应用案例更是令人振奋。设计工作室客户面临 “48 小时渲染数百张高精度图纸” 的紧急需求,本地设备频繁崩溃,项目濒临中断。最终,端脑云调度 ThinkPad P 系列算力集群,仅用 36 小时就完成交付,成本仅为传统云服务的三分之一。