v1965
reasonning可配置
日志对齐输出 requestid
兼容 streaming response分隔符
2025/3/20
已发布
v1964
支持chunk-wise prefill,prefill tps 提升 30%
支持 prefix cache 能力
修复低流量 crash 问题
2025/3/04