大语言模型数据集哪里买呢?
2024-11-21 阅读 87
可以买数据的渠道主要有两类:一是云厂商和数据市场,比如 AWS Data Exchange、Google Cloud/Marketplace、Microsoft Azure Marketplace、Snowflake 或 Databricks 的数据市场,以及 Hugging Face Datasets、Kaggle(很多公开数据也可用);二是商业标注和数据服务商,像 Appen、Scale AI、Labelbox 等可提供定制或成品语料。此外也有开源语料可用如 Common Crawl、The Pile、OpenWebText。购买或使用前务必核查版权、许可和个人隐私合规情况。
更新于 2026年01月03日