Changelog

更新日志

每个版本改了什么,一目了然。格式遵循 Keep a Changelog

v0.3.0 2026-04-15 latest

这个版本加了情感分析引擎和 A 股数据源支持。分析准确度比 v0.2 提升了大约 15%(在我们的测试集上)。

新增

  • 情感分析引擎 sentiment_v2,基于 fine-tuned BERT,在 A 股新闻语料上训练
  • A 股数据源:cninfo(巨潮资讯)、sse_announce(上交所公告)、szse_announce(深交所公告)
  • 分析管道新增 CrossValidator Stage,多源信息交叉验证
  • API 新增 /api/status 端点,查看系统状态和任务进度
  • 配置文件支持环境变量覆盖,格式 MUYUAN_SECTION_KEY
  • Docker Compose 一键部署,包含 PostgreSQL 和 Redis

改进

  • Collector 限速器从固定间隔改为令牌桶算法,吞吐量提升约 40%
  • Analyzer 支持并行处理多个 Stage(之前是串行的)
  • 建议生成的文本质量改善,加了 LLM 辅助生成解释性文字
  • 日志格式统一为 JSON,方便接入 ELK 或 Loki

修复

  • 修复东方财富数据源在周末返回空数据的问题
  • 修复 Redis 连接池在高并发下偶发的连接泄漏
  • 修复 Advisor.generate() 在没有有效 insight 时抛异常(现在返回空建议列表)

Breaking Change:Analyzer.run() 的返回类型从 list[dict] 改为 AnalysisResult 对象。如果你直接用了返回值的字典访问方式,需要改成属性访问。迁移方法见 MIGRATION.md

v0.2.0 2026-02-20

重构了分析管道,引入了 Stage 概念。加了 Redis 缓存层,重复查询的响应时间从秒级降到毫秒级。

新增

  • 分析管道重构为 Stage 架构,支持自定义 Stage 插入
  • Redis 缓存层,缓存命中率约 73%(生产环境实测)
  • 插件系统:自定义 Collector 和 Analyzer Stage
  • REST API(FastAPI),支持异步任务
  • 数据库迁移工具(Alembic),不再需要手动建表
  • 新增 tushareakshare 行情数据源

改进

  • Collector 的去重逻辑从内存 set 改为 PostgreSQL 唯一索引,重启后不丢状态
  • 配置文件从 JSON 迁移到 YAML,可读性好很多
  • 错误处理统一,所有异常都有对应的错误码
  • 测试覆盖率从 42% 提升到 78%

修复

  • 修复新浪新闻抓取器在文章被删除时的 404 处理
  • 修复时区问题——所有时间戳统一为 UTC

Breaking Change:配置文件格式从 JSON 改为 YAML。运行 muyuan migrate-config 可以自动转换。

v0.1.0 2025-12-01

首次公开发布。能跑,但很粗糙。支持新闻抓取和基础趋势分析,建议生成还比较机械。

功能

  • 新闻抓取:sina_newseastmoneyxueqiu 三个数据源
  • 基础趋势分析:基于关键词频率和简单的情感词典
  • 投资建议生成:模板化输出,格式固定
  • CLI 工具:muyuan collectmuyuan analyzemuyuan advise
  • SQLite 本地存储(不需要额外数据库)
  • 配置文件(JSON 格式)
  • 基础文档和 README

已知问题

  • 分析管道是串行的,处理 500 篇文章需要约 3 分钟
  • 没有缓存,重复查询每次都要重新计算
  • 情感分析用的是词典方法,准确度一般(F1 约 0.62)
  • 不支持 A 股公告类数据源
  • 没有 API,只能通过 CLI 使用