如何基于文档在云端生成测试数据#
本指南将帮助您学习如何在 Azure AI 上生成测试数据,以便您可以集成创建的流并处理大量数据。
先决条件#
阅读本地测试数据生成指南并准备您的测试数据生成流。
转到 example_gen_test_data 文件夹并运行命令
pip install -r requirements_cloud.txt
以准备本地环境。准备云环境。
在云端准备 Azure AI 资源。
一个 Azure AI ML 工作区 - 创建开始使用 Azure AI 所需的工作区资源。
一个计算目标 - 了解有关计算集群的更多信息。
准备测试数据生成设置。
导航到 example_gen_test_data 文件夹。
通过复制
config.yml.example
来准备config.yml
。按照内联注释说明填写
config.yml
中的配置。
在云端生成测试数据#
为了处理更大的测试数据,您可以利用 PRS 组件在云端运行流。
导航到 example_gen_test_data 文件夹。
配置后,运行以下命令生成测试数据集
python -m generate-test-data.run --cloud
生成的测试数据将是一个数据资产,可以在最后一个节点的输出中找到。您可以注册此数据资产以备将来使用。