newsreport_agent_for_traffic/UNIFIED_REPORT_GUIDE.md

142 lines
2.6 KiB
Markdown
Raw Normal View History

2026-05-09 10:46:52 +08:00
# 报告生成功能指南
## 当前报告能力
项目当前有三种报告入口:
1. `main.py`
2. `generate_report_from_db.py`
3. `auto_report_and_email.py`
底层统一使用:
- `rag/rag_processor.py`
- `report/report_generator.py`
## 当前支持的报告类型
### 综合报告
- 使用向量库中已有数据
- 输出整体行业分析
- 典型文件:`report_summary_*.txt` 或 `report_comprehensive_*.txt`
### 主题报告
- 围绕某个关键词检索向量库
- 输出专项分析
- 典型文件:`report_topic_关键词_*.txt`
### 分数据源报告
-`generate_report_from_db.py` 交互式脚本支持
- 会按来源分别生成报告
## 当前 Prompt 特征
综合报告 Prompt 当前要求从以下维度分析:
1. 行业热点话题总结
2. 技术发展趋势分析
3. 政策动向解读
4. 市场机会洞察
5. 竞品动态分析
其中“竞品动态分析”已强制拆开为两个独立小节:
- `高德地图动态`
- `百度地图动态`
并明确要求:
- 不要把百度和高德合并叙述
- 若某一方信息不足,要显式说明“本期相关信息较少”或类似表述
## 方式一:使用 main.py
### 综合报告
```bash
python main.py --mode report
```
### 主题报告
```bash
python main.py --mode topic --topic "信控"
```
### 抓取后立即生成报告
```bash
python main.py --mode full --sources all
```
## 方式二:使用交互式脚本
```bash
python generate_report_from_db.py
```
当前交互菜单支持:
1. 综合分析报表
2. 主题分析报表
3. 分数据源专项报表
4. 全部生成
## 方式三:生成并发送
```bash
python auto_report_and_email.py --mode report
python auto_report_and_email.py --mode full --sources all
```
## 输出位置
默认输出目录:
- `data/`
当前报告文件格式:
- `.txt`
## 依赖要求
```env
QWEN_API_KEY=你的API密钥
QWEN_MODEL=qwen-max
VECTOR_DB_DIR=./vector_db
DATA_DIR=./data
```
## 常见问题
### 向量库有数据,但报告内容很弱
通常是以下原因之一:
1. 抓取文本过少
2. 某些源只有标题没有正文
3. 主题关键词过窄
4. 数据源分布不均匀
### 为什么综合报告和交互式报告文件名前缀不同
因为:
- `main.py --mode report` 默认保存为 `report_summary_*`
- `generate_report_from_db.py` 中综合报告保存为 `report_comprehensive_*`
这是当前代码的真实行为。
## 已删除的旧说明
以下说法已不再保留:
- 竞品分析统一合并叙述高德和百度
- 报告输出默认是 `.md`
- 所有报告入口生成的文件命名完全一致