如何解决pytest参数化时出现的Unicode编码问题?

发布时间 2023-09-07 15:03:18作者: 霍格沃兹测试开发学社

前言

Pytest是一个广泛使用的Python测试框架,通过参数化测试(Parameterized Testing)功能,可以轻松地为测试用例提供多组输入数据。然而,当我们尝试在参数化测试中使用中文作为测试用例的IDs时,有时会遇到Unicode编码问题,导致测试报告中显示的是乱码。本文将详细解释这个问题的原因,并提供解决方案,确保测试报告中正确显示中文IDs。

获取更多技术资料,请点击!

问题描述

在Pytest中,我们可以使用@pytest.mark.parametrize装饰器来参数化测试用例,并为每组数据提供一个ID,以便在测试报告中区分不同的输入组合。例如:

import pytest

@pytest.mark.parametrize("input, expected", [
    (1, 2),
    (3, 6),
    (0, 0)
], ids=["结果1", "结果2", "结果3"])
def test_multiply(input, expected):
    assert input * 2 == expected

在pycharm里运行代码之后,我们可以看到测试通过,但是ids的输出出现了异常,如下图:

在这里插入图片描述

我们可以看到 ids 参数用例描述有中文时,显示unicode编码,中文不能正常显示。

问题原因

这个问题的原因是Pytest默认将IDs视为ASCII字符串,并在测试报告中按原样显示。由于中文字符不属于ASCII字符范围,因此Pytest会将其转换为Unicode编码表示。

解决方案

  1. 我们可以在pytest.ini文件中加上如下配置:
disable_test_id_escaping_and_forfeit_all_rights_to_community_support = True

再次运行脚本,结果如下:

在这里插入图片描述

我们可以看到,中文已经正常输出。

  1. conftest.py中利用pytest提供的hook函数pytest_collection_modifyitems解决unicode编码问题,具体方法如下:
def pytest_collection_modifyitems(items):
    """
    测试用例收集完成时,将收集到的item的name和nodeid的中文显示在控制台上
    """
    for item in items:
        item.name = item.name.encode("utf-8").decode("unicode_escape")
        item._nodeid = item.nodeid.encode("utf-8").decode("unicode_escape")

再次运行脚本,结果如下:

在这里插入图片描述

总结

在Pytest的参数化测试中,使用中文作为测试用例的IDs时,可能会遇到Unicode编码问题,导致测试报告中显示的是乱码。为了解决这个问题,我们可以通过在pytest.ini文件中添加配置项或者在conftest.py文件中添加函数来解决问题,这样,我们就能够获得清晰可读的中文IDs,提高测试报告的可理解性和可维护性。

通过以上解决方案,我们可以在Pytest中正确显示中文IDs,并确保测试报告的准确性和可读性。这将有助于团队成员更好地理解和分析测试结果,提高测试效率和质量。

获取更多技术资料,请点击!