◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
在这篇文章中,我将逐步介绍实施单元测试、处理复杂的配置挑战以及在 readmegenie 中引入强大的代码覆盖率的过程。从最初的测试设计到设置预提交挂钩,这个过程涉及代码质量、可靠性和开发人员工作流程的一系列改进。
首先,我选择unittest作为编写和执行测试的主要框架。 python 内置的unittest 提供了一种用于定义测试用例的结构化方法,并且它与mock 的集成使其非常适合测试复杂的配置和api 调用。
我创建了一个专用的测试运行程序(tests/test_runner.py),用于自动发现和执行tests/目录中的所有测试文件:
# tests/test_runner.py import unittest if __name__ == "__main__": loader = unittest.testloader() suite = loader.discover(start_dir="tests", pattern="test_*.py") runner = unittest.texttestrunner(verbosity=2) runner.run(suite)
此设置可确保运行 python tests/test_runner.py 将自动加载并运行所有测试文件,从而轻松验证项目的整体功能。
readmegenie 项目需要对多个组件进行全面测试:
每个测试文件根据其测试的模块命名(例如,test_parse_arg.py 用于参数解析,test_model.py 用于模型函数),确保结构清晰、可维护。
设置 test_loadconfig.py 是这个项目中最具挑战性的部分。最初,我遇到了与环境变量和文件路径检查相关的持续问题。由于 load_config() 旨在处理各种配置源(例如,环境变量、.env 文件、json 和 toml 文件),因此测试需要大量模拟来准确模拟这些环境。
涉及的主要问题:
环境变量冲突:现有环境变量有时会干扰模拟值。使用 @patch.dict("os.environ", {}, clear=true),我清除了测试范围内的环境变量以确保结果一致。
文件路径检查:由于 load_config() 检查文件是否存在,我使用 os.path.exists 来模拟配置文件存在或不存在的场景。
模拟 open 和 toml.load:这些需要精确的模拟来处理丢失、空或已填充配置文件的情况。在 toml.load 上使用带有 patch 的 mock_open,我有效地模拟了每种情况。
解决这些问题后,test_loadconfig.py 现在涵盖了三个主要场景:
这是 test_loadconfig.py 的最终版本:
import unittest from unittest.mock import mock_open, patch from loadconfig import load_config class testloadconfig(unittest.testcase): @patch.dict("os.environ", {}, clear=true) @patch("loadconfig.os.getenv", side_effect=lambda key, default=none: default) @patch("loadconfig.os.path.exists", return_value=false) @patch("builtins.open", new_callable=mock_open, read_data="{}") @patch("loadconfig.toml.load", return_value={}) def test_load_config_empty_file(self, mock_toml_load, mock_open_file, mock_exists, mock_getenv): config = load_config() self.assertequal(config, {}) @patch.dict("os.environ", {}, clear=true) @patch("loadconfig.os.getenv", side_effect=lambda key, default=none: default) @patch("loadconfig.os.path.exists", return_value=true) @patch("builtins.open", new_callable=mock_open, read_data='{"api_key": "test_key"}') @patch("loadconfig.toml.load", return_value={"api_key": "test_key"}) def test_load_config_with_valid_data(self, mock_toml_load, mock_open_file, mock_exists, mock_getenv): config = load_config() self.assertequal(config.get("api_key"), "test_key") @patch.dict("os.environ", {}, clear=true) @patch("loadconfig.os.getenv", side_effect=lambda key, default=none: default) @patch("loadconfig.os.path.exists", return_value=false) @patch("builtins.open", side_effect=filenotfounderror) @patch("loadconfig.toml.load", return_value={}) def test_load_config_file_not_found(self, mock_toml_load, mock_open_file, mock_exists, mock_getenv): config = load_config() self.assertequal(config, {})
测试到位后,我们专注于使用coverage.py 测量和提高覆盖率。通过设置 80% 的阈值,我们的目标是确保代码的所有关键部分都经过测试。
我在 pyproject.toml 中使用以下设置配置了coverage.py:
[tool.coverage.run] source = [""] branch = true omit = ["tests/*"] [tool.coverage.report] show_missing = true fail_under = 75
此配置包括分支覆盖率、突出显示缺失的行,并强制执行最低 75% 的覆盖率阈值。
为了将其集成到开发工作流程中,我添加了一个预提交挂钩,以确保在每次提交时检查代码覆盖率。如果覆盖率低于 75%,提交将被阻止,提示开发人员在继续之前提高覆盖率:
- repo: local hooks: - id: check-coverage name: check coverage entry: bash -c "coverage run --source=. -m unittest discover -s tests && coverage report -m --fail-under=75" language: system
我们最近的报道报告显示:
Name Stmts Miss Branch BrPart Cover Missing ------------------------------------------------------------------ loadConfig.py 8 0 2 0 100% logging_config.py 19 0 2 0 100% models/__init__.py 0 0 0 0 100% models/cohere_api.py 12 0 0 0 100% models/groq_api.py 12 0 0 0 100% models/model.py 64 13 16 3 78% 25-26, 44-46, 70-74, 84-87 readme_genie.py 37 16 4 1 54% 20-24, 66-86, 90 ------------------------------------------------------------------ TOTAL 152 29 24 4 79%
虽然某些领域的覆盖率很高(例如 loadconfig.py 为 100%),但 models/model.py 和 readme_genie.py 仍有改进的机会。专注于未经测试的分支和边缘情况对于实现我们 85% 或更高总体覆盖率的目标至关重要。
这个项目教会了我很多关于单元测试、模拟和代码覆盖率的知识。设置 test_loadconfig.py 是一次特别有价值的经历,促使我探索更深层次的配置模拟。用于覆盖的预提交挂钩增加了一层质量保证,强制执行一致的测试标准。
展望未来,我的目标是通过添加边缘情况和提高分支覆盖率来进一步完善这些测试。这不仅会让readmegenie更加强大,也为未来的发展打下坚实的基础。
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。