newsreport_agent_for_traffic/UNIFIED_REPORT_GUIDE.md

2.6 KiB

报告生成功能指南

当前报告能力

项目当前有三种报告入口:

  1. main.py
  2. generate_report_from_db.py
  3. auto_report_and_email.py

底层统一使用:

  • rag/rag_processor.py
  • report/report_generator.py

当前支持的报告类型

综合报告

  • 使用向量库中已有数据
  • 输出整体行业分析
  • 典型文件:report_summary_*.txtreport_comprehensive_*.txt

主题报告

  • 围绕某个关键词检索向量库
  • 输出专项分析
  • 典型文件:report_topic_关键词_*.txt

分数据源报告

  • generate_report_from_db.py 交互式脚本支持
  • 会按来源分别生成报告

当前 Prompt 特征

综合报告 Prompt 当前要求从以下维度分析:

  1. 行业热点话题总结
  2. 技术发展趋势分析
  3. 政策动向解读
  4. 市场机会洞察
  5. 竞品动态分析

其中“竞品动态分析”已强制拆开为两个独立小节:

  • 高德地图动态
  • 百度地图动态

并明确要求:

  • 不要把百度和高德合并叙述
  • 若某一方信息不足,要显式说明“本期相关信息较少”或类似表述

方式一:使用 main.py

综合报告

python main.py --mode report

主题报告

python main.py --mode topic --topic "信控"

抓取后立即生成报告

python main.py --mode full --sources all

方式二:使用交互式脚本

python generate_report_from_db.py

当前交互菜单支持:

  1. 综合分析报表
  2. 主题分析报表
  3. 分数据源专项报表
  4. 全部生成

方式三:生成并发送

python auto_report_and_email.py --mode report
python auto_report_and_email.py --mode full --sources all

输出位置

默认输出目录:

  • data/

当前报告文件格式:

  • .txt

依赖要求

QWEN_API_KEY=你的API密钥
QWEN_MODEL=qwen-max
VECTOR_DB_DIR=./vector_db
DATA_DIR=./data

常见问题

向量库有数据,但报告内容很弱

通常是以下原因之一:

  1. 抓取文本过少
  2. 某些源只有标题没有正文
  3. 主题关键词过窄
  4. 数据源分布不均匀

为什么综合报告和交互式报告文件名前缀不同

因为:

  • main.py --mode report 默认保存为 report_summary_*
  • generate_report_from_db.py 中综合报告保存为 report_comprehensive_*

这是当前代码的真实行为。

已删除的旧说明

以下说法已不再保留:

  • 竞品分析统一合并叙述高德和百度
  • 报告输出默认是 .md
  • 所有报告入口生成的文件命名完全一致