如何解决pytest参数化时出现的Unicode编码问题？-526互联

前言

Pytest是一个广泛使用的Python测试框架，通过参数化测试（Parameterized Testing）功能，可以轻松地为测试用例提供多组输入数据。然而，当我们尝试在参数化测试中使用中文作为测试用例的IDs时，有时会遇到Unicode编码问题，导致测试报告中显示的是乱码。本文将详细解释这个问题的原因，并提供解决方案，确保测试报告中正确显示中文IDs。

获取更多技术资料，请点击！

问题描述

在Pytest中，我们可以使用@pytest.mark.parametrize装饰器来参数化测试用例，并为每组数据提供一个ID，以便在测试报告中区分不同的输入组合。例如：

import pytest

@pytest.mark.parametrize("input, expected", [
    (1, 2),
    (3, 6),
    (0, 0)
], ids=["结果1", "结果2", "结果3"])
def test_multiply(input, expected):
    assert input * 2 == expected

在pycharm里运行代码之后，我们可以看到测试通过，但是ids的输出出现了异常，如下图：

在这里插入图片描述

我们可以看到 ids 参数用例描述有中文时，显示unicode编码，中文不能正常显示。

问题原因

这个问题的原因是Pytest默认将IDs视为ASCII字符串，并在测试报告中按原样显示。由于中文字符不属于ASCII字符范围，因此Pytest会将其转换为Unicode编码表示。

解决方案

我们可以在pytest.ini文件中加上如下配置：

disable_test_id_escaping_and_forfeit_all_rights_to_community_support = True

再次运行脚本，结果如下：

在这里插入图片描述

我们可以看到，中文已经正常输出。

在conftest.py中利用pytest提供的hook函数pytest_collection_modifyitems解决unicode编码问题，具体方法如下：

def pytest_collection_modifyitems(items):
    """
    测试用例收集完成时，将收集到的item的name和nodeid的中文显示在控制台上
    """
    for item in items:
        item.name = item.name.encode("utf-8").decode("unicode_escape")
        item._nodeid = item.nodeid.encode("utf-8").decode("unicode_escape")

再次运行脚本，结果如下：

在这里插入图片描述

总结

在Pytest的参数化测试中，使用中文作为测试用例的IDs时，可能会遇到Unicode编码问题，导致测试报告中显示的是乱码。为了解决这个问题，我们可以通过在pytest.ini文件中添加配置项或者在conftest.py文件中添加函数来解决问题，这样，我们就能够获得清晰可读的中文IDs，提高测试报告的可理解性和可维护性。

通过以上解决方案，我们可以在Pytest中正确显示中文IDs，并确保测试报告的准确性和可读性。这将有助于团队成员更好地理解和分析测试结果，提高测试效率和质量。