newsreport_agent_for_traffic/UNIFIED_REPORT_GUIDE.md

# 报告生成功能指南

## 当前报告能力

项目当前有三种报告入口：

1. `main.py`
2. `generate_report_from_db.py`
3. `auto_report_and_email.py`

底层统一使用：

- `rag/rag_processor.py`
- `report/report_generator.py`

## 当前支持的报告类型

### 综合报告

- 使用向量库中已有数据
- 输出整体行业分析
- 典型文件：`report_summary_*.txt` 或 `report_comprehensive_*.txt`

### 主题报告

- 围绕某个关键词检索向量库
- 输出专项分析
- 典型文件：`report_topic_关键词_*.txt`

### 分数据源报告

- 由 `generate_report_from_db.py` 交互式脚本支持
- 会按来源分别生成报告

## 当前 Prompt 特征

综合报告 Prompt 当前要求从以下维度分析：

1. 行业热点话题总结
2. 技术发展趋势分析
3. 政策动向解读
4. 市场机会洞察
5. 竞品动态分析

其中“竞品动态分析”已强制拆开为两个独立小节：

- `高德地图动态`
- `百度地图动态`

并明确要求：

- 不要把百度和高德合并叙述
- 若某一方信息不足，要显式说明“本期相关信息较少”或类似表述

## 方式一：使用 main.py

### 综合报告

```bash
python main.py --mode report
```

### 主题报告

```bash
python main.py --mode topic --topic "信控"
```

### 抓取后立即生成报告

```bash
python main.py --mode full --sources all
```

## 方式二：使用交互式脚本

```bash
python generate_report_from_db.py
```

当前交互菜单支持：

1. 综合分析报表
2. 主题分析报表
3. 分数据源专项报表
4. 全部生成

## 方式三：生成并发送

```bash
python auto_report_and_email.py --mode report
python auto_report_and_email.py --mode full --sources all
```

## 输出位置

默认输出目录：

- `data/`

当前报告文件格式：

- `.txt`

## 依赖要求

```env
QWEN_API_KEY=你的API密钥
QWEN_MODEL=qwen-max
VECTOR_DB_DIR=./vector_db
DATA_DIR=./data
```

## 常见问题

### 向量库有数据，但报告内容很弱

通常是以下原因之一：

1. 抓取文本过少
2. 某些源只有标题没有正文
3. 主题关键词过窄
4. 数据源分布不均匀

### 为什么综合报告和交互式报告文件名前缀不同

因为：

- `main.py --mode report` 默认保存为 `report_summary_*`
- `generate_report_from_db.py` 中综合报告保存为 `report_comprehensive_*`

这是当前代码的真实行为。

## 已删除的旧说明

以下说法已不再保留：

- 竞品分析统一合并叙述高德和百度
- 报告输出默认是 `.md`
- 所有报告入口生成的文件命名完全一致
Initial import 2026-05-09 10:46:52 +08:00			`# 报告生成功能指南`

			`## 当前报告能力`

			`项目当前有三种报告入口：`

			1. `main.py`
			2. `generate_report_from_db.py`
			3. `auto_report_and_email.py`

			`底层统一使用：`

			- `rag/rag_processor.py`
			- `report/report_generator.py`

			`## 当前支持的报告类型`

			`### 综合报告`

			`- 使用向量库中已有数据`
			`- 输出整体行业分析`
			- 典型文件：`report_summary_.txt` 或 `report_comprehensive_.txt`

			`### 主题报告`

			`- 围绕某个关键词检索向量库`
			`- 输出专项分析`
			- 典型文件：`report_topic_关键词_*.txt`

			`### 分数据源报告`

			- 由 `generate_report_from_db.py` 交互式脚本支持
			`- 会按来源分别生成报告`

			`## 当前 Prompt 特征`

			`综合报告 Prompt 当前要求从以下维度分析：`

			`1. 行业热点话题总结`
			`2. 技术发展趋势分析`
			`3. 政策动向解读`
			`4. 市场机会洞察`
			`5. 竞品动态分析`

			`其中“竞品动态分析”已强制拆开为两个独立小节：`

			- `高德地图动态`
			- `百度地图动态`

			`并明确要求：`

			`- 不要把百度和高德合并叙述`
			`- 若某一方信息不足，要显式说明“本期相关信息较少”或类似表述`

			`## 方式一：使用 main.py`

			`### 综合报告`

			```bash
			`python main.py --mode report`
			```

			`### 主题报告`

			```bash
			`python main.py --mode topic --topic "信控"`
			```

			`### 抓取后立即生成报告`

			```bash
			`python main.py --mode full --sources all`
			```

			`## 方式二：使用交互式脚本`

			```bash
			`python generate_report_from_db.py`
			```

			`当前交互菜单支持：`

			`1. 综合分析报表`
			`2. 主题分析报表`
			`3. 分数据源专项报表`
			`4. 全部生成`

			`## 方式三：生成并发送`

			```bash
			`python auto_report_and_email.py --mode report`
			`python auto_report_and_email.py --mode full --sources all`
			```

			`## 输出位置`

			`默认输出目录：`

			- `data/`

			`当前报告文件格式：`

			- `.txt`

			`## 依赖要求`

			```env
			`QWEN_API_KEY=你的API密钥`
			`QWEN_MODEL=qwen-max`
			`VECTOR_DB_DIR=./vector_db`
			`DATA_DIR=./data`
			```

			`## 常见问题`

			`### 向量库有数据，但报告内容很弱`

			`通常是以下原因之一：`

			`1. 抓取文本过少`
			`2. 某些源只有标题没有正文`
			`3. 主题关键词过窄`
			`4. 数据源分布不均匀`

			`### 为什么综合报告和交互式报告文件名前缀不同`

			`因为：`

			- `main.py --mode report` 默认保存为 `report_summary_*`
			- `generate_report_from_db.py` 中综合报告保存为 `report_comprehensive_*`

			`这是当前代码的真实行为。`

			`## 已删除的旧说明`

			`以下说法已不再保留：`

			`- 竞品分析统一合并叙述高德和百度`
			- 报告输出默认是 `.md`
			`- 所有报告入口生成的文件命名完全一致`