142 lines
2.6 KiB
Markdown
142 lines
2.6 KiB
Markdown
|
|
# 报告生成功能指南
|
||
|
|
|
||
|
|
## 当前报告能力
|
||
|
|
|
||
|
|
项目当前有三种报告入口:
|
||
|
|
|
||
|
|
1. `main.py`
|
||
|
|
2. `generate_report_from_db.py`
|
||
|
|
3. `auto_report_and_email.py`
|
||
|
|
|
||
|
|
底层统一使用:
|
||
|
|
|
||
|
|
- `rag/rag_processor.py`
|
||
|
|
- `report/report_generator.py`
|
||
|
|
|
||
|
|
## 当前支持的报告类型
|
||
|
|
|
||
|
|
### 综合报告
|
||
|
|
|
||
|
|
- 使用向量库中已有数据
|
||
|
|
- 输出整体行业分析
|
||
|
|
- 典型文件:`report_summary_*.txt` 或 `report_comprehensive_*.txt`
|
||
|
|
|
||
|
|
### 主题报告
|
||
|
|
|
||
|
|
- 围绕某个关键词检索向量库
|
||
|
|
- 输出专项分析
|
||
|
|
- 典型文件:`report_topic_关键词_*.txt`
|
||
|
|
|
||
|
|
### 分数据源报告
|
||
|
|
|
||
|
|
- 由 `generate_report_from_db.py` 交互式脚本支持
|
||
|
|
- 会按来源分别生成报告
|
||
|
|
|
||
|
|
## 当前 Prompt 特征
|
||
|
|
|
||
|
|
综合报告 Prompt 当前要求从以下维度分析:
|
||
|
|
|
||
|
|
1. 行业热点话题总结
|
||
|
|
2. 技术发展趋势分析
|
||
|
|
3. 政策动向解读
|
||
|
|
4. 市场机会洞察
|
||
|
|
5. 竞品动态分析
|
||
|
|
|
||
|
|
其中“竞品动态分析”已强制拆开为两个独立小节:
|
||
|
|
|
||
|
|
- `高德地图动态`
|
||
|
|
- `百度地图动态`
|
||
|
|
|
||
|
|
并明确要求:
|
||
|
|
|
||
|
|
- 不要把百度和高德合并叙述
|
||
|
|
- 若某一方信息不足,要显式说明“本期相关信息较少”或类似表述
|
||
|
|
|
||
|
|
## 方式一:使用 main.py
|
||
|
|
|
||
|
|
### 综合报告
|
||
|
|
|
||
|
|
```bash
|
||
|
|
python main.py --mode report
|
||
|
|
```
|
||
|
|
|
||
|
|
### 主题报告
|
||
|
|
|
||
|
|
```bash
|
||
|
|
python main.py --mode topic --topic "信控"
|
||
|
|
```
|
||
|
|
|
||
|
|
### 抓取后立即生成报告
|
||
|
|
|
||
|
|
```bash
|
||
|
|
python main.py --mode full --sources all
|
||
|
|
```
|
||
|
|
|
||
|
|
## 方式二:使用交互式脚本
|
||
|
|
|
||
|
|
```bash
|
||
|
|
python generate_report_from_db.py
|
||
|
|
```
|
||
|
|
|
||
|
|
当前交互菜单支持:
|
||
|
|
|
||
|
|
1. 综合分析报表
|
||
|
|
2. 主题分析报表
|
||
|
|
3. 分数据源专项报表
|
||
|
|
4. 全部生成
|
||
|
|
|
||
|
|
## 方式三:生成并发送
|
||
|
|
|
||
|
|
```bash
|
||
|
|
python auto_report_and_email.py --mode report
|
||
|
|
python auto_report_and_email.py --mode full --sources all
|
||
|
|
```
|
||
|
|
|
||
|
|
## 输出位置
|
||
|
|
|
||
|
|
默认输出目录:
|
||
|
|
|
||
|
|
- `data/`
|
||
|
|
|
||
|
|
当前报告文件格式:
|
||
|
|
|
||
|
|
- `.txt`
|
||
|
|
|
||
|
|
## 依赖要求
|
||
|
|
|
||
|
|
```env
|
||
|
|
QWEN_API_KEY=你的API密钥
|
||
|
|
QWEN_MODEL=qwen-max
|
||
|
|
VECTOR_DB_DIR=./vector_db
|
||
|
|
DATA_DIR=./data
|
||
|
|
```
|
||
|
|
|
||
|
|
## 常见问题
|
||
|
|
|
||
|
|
### 向量库有数据,但报告内容很弱
|
||
|
|
|
||
|
|
通常是以下原因之一:
|
||
|
|
|
||
|
|
1. 抓取文本过少
|
||
|
|
2. 某些源只有标题没有正文
|
||
|
|
3. 主题关键词过窄
|
||
|
|
4. 数据源分布不均匀
|
||
|
|
|
||
|
|
### 为什么综合报告和交互式报告文件名前缀不同
|
||
|
|
|
||
|
|
因为:
|
||
|
|
|
||
|
|
- `main.py --mode report` 默认保存为 `report_summary_*`
|
||
|
|
- `generate_report_from_db.py` 中综合报告保存为 `report_comprehensive_*`
|
||
|
|
|
||
|
|
这是当前代码的真实行为。
|
||
|
|
|
||
|
|
## 已删除的旧说明
|
||
|
|
|
||
|
|
以下说法已不再保留:
|
||
|
|
|
||
|
|
- 竞品分析统一合并叙述高德和百度
|
||
|
|
- 报告输出默认是 `.md`
|
||
|
|
- 所有报告入口生成的文件命名完全一致
|
||
|
|
|