摘要
一个纯Python写的开源项目,竟击溃了OpenAI王牌! 今天,全网都被Hermes Agent的硬核实力狠狠刷屏了: 在针对真实世界CLI任务的11项基准测试中,它以6:5的战绩,直接把Codex按在地上摩擦。 在这场备受瞩目的对决中,Hermes Agent展现出了惊人的底层优化能力。 通过一连串的硬核操作,成功把系统的启动时间,从701ms缩短至258ms。 更让人震撼的是,Hermes完全由Python编写,而Codex是用Rust写的。 这一仗,Python打赢了Rust! 这在编程界,属是「逆天改命」了。 三大狠招,砍掉63%启动时间 就在这次优化之前,Hermes还是5-6落后的那个。 这次逆转不是靠换模型、不是靠堆算力,而是靠三个纯工程优化,刀刀见血。 那么,它是具体如何做到的? 第一刀:Bitwarden磁盘缓存 原来Hermes每次启动都会调用Bitwarden Secrets Manager的API去拉取凭据,一次就是380毫秒。 问题在于,之前的缓存是「纯进程内」,连续执行两次hermes chat -q,第二次还是要重新拉。 解决方案是,加了一个L2磁盘缓存。 缓存文件权限锁死0600,存放在<hermes_home>/cache/bws_cache.json,默认TTL 300秒。 另外,访问token本身绝不落盘,默认300秒TTL,过期才重新拉取。 一刀砍掉380ms。 第二刀:模型目录延迟加载 hermes_cli.models._PROVIDER_MODELS,一个包含所有AI供应商模型信息的巨型字典。 之前在模块加载时就急切导入,吃掉约55ms。 实际上只有model_flow相关的处理函数才需要它。 团队用PEP 562的模块级getattr实现了懒加载,只在真正访问模型目录时才付出这笔开销。。 这一步,又省了55毫秒。 第三刀:配置文件去重 main.py顶部原本读了两次config.yaml。 一次yaml.safe_load用于密钥脱敏桥接,一次完整的load_config()(含深度合并)只为检查一个布尔值。 合并成一次原始加载,省下17ms。