tests/test_processor.py


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114

#!/usr/bin/env python3
"""
Processor 模块单元测试
"""

import unittest
from conventionalrp.core.processor import Processor


class TestProcessor(unittest.TestCase):
    """Processor 类的单元测试"""
    
    def setUp(self):
        """设置测试环境"""
        self.processor = Processor()
        self.sample_tokens = [
            {
                "type": "metadata",
                "timestamp": "2025-10-24 14:30:01",
                "speaker": "艾莉娅",
                "content": [
                    {"type": "dialogue", "content": "「测试对话」"}
                ]
            },
            {
                "type": "metadata",
                "timestamp": "2025-10-24 14:30:05",
                "speaker": "DM",
                "content": [
                    {"type": "text", "content": "测试文本"}
                ]
            }
        ]
    
    def test_init_without_rules(self):
        """测试无规则初始化"""
        processor = Processor()
        self.assertEqual(processor.rules, {})
    
    def test_init_with_rules(self):
        """测试带规则初始化"""
        rules = {"test_rule": "value"}
        processor = Processor(rules)
        self.assertEqual(processor.rules, rules)
    
    def test_process_tokens(self):
        """测试处理 token 列表"""
        result = self.processor.process_tokens(self.sample_tokens)
        
        self.assertIsInstance(result, list)
        self.assertEqual(len(result), len(self.sample_tokens))
        
        # 检查处理标记
        for token in result:
            if "timestamp" in token:
                self.assertTrue(token.get("processed"))
    
    def test_apply_rules(self):
        """测试应用规则到单个 token"""
        token = self.sample_tokens[0]
        result = self.processor.apply_rules(token)
        
        self.assertIsInstance(result, dict)
        self.assertIn("timestamp", result)
        self.assertTrue(result.get("processed"))
    
    def test_generate_json_output(self):
        """测试生成 JSON 输出"""
        output = self.processor.generate_json_output(self.sample_tokens)
        
        self.assertIsInstance(output, str)
        self.assertIn("timestamp", output)
        self.assertIn("speaker", output)
    
    def test_generate_html_output(self):
        """测试生成 HTML 输出"""
        output = self.processor.generate_html_output(self.sample_tokens)
        
        self.assertIsInstance(output, str)
        self.assertIn("<html>", output)
        self.assertIn("</html>", output)
    
    def test_generate_markdown_output(self):
        """测试生成 Markdown 输出"""
        output = self.processor.generate_markdown_output(self.sample_tokens)
        
        self.assertIsInstance(output, str)
        self.assertIn("-", output)
    
    def test_generate_output_json(self):
        """测试生成输出 - JSON 格式"""
        output = self.processor.generate_output(self.sample_tokens, "json")
        self.assertIsInstance(output, str)
    
    def test_generate_output_html(self):
        """测试生成输出 - HTML 格式"""
        output = self.processor.generate_output(self.sample_tokens, "html")
        self.assertIsInstance(output, str)
    
    def test_generate_output_markdown(self):
        """测试生成输出 - Markdown 格式"""
        output = self.processor.generate_output(self.sample_tokens, "markdown")
        self.assertIsInstance(output, str)
    
    def test_generate_output_unsupported_format(self):
        """测试生成输出 - 不支持的格式"""
        with self.assertRaises(ValueError) as context:
            self.processor.generate_output(self.sample_tokens, "pdf")
        
        self.assertIn("Unsupported format type", str(context.exception))


if __name__ == "__main__":
    unittest.main()