<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
	<title>APPEN</title>
	<language>zh_CN</language>
	<generator>PRN Asia</generator>
	<description><![CDATA[we tell your story to the world!]]></description>
		<item>
		<title>澳鹏发布EliteAI专家平台：规模化调用人类顶尖智慧，重塑AI数据生产力</title>
		<author></author>
		<pubDate>2026-01-12 17:17:00</pubDate>
		<description><![CDATA[上海2026年1月12日 /美通社/ -- 随着大模型在医疗、法律等专业领域深入探索，AI产业正面临一个根本性转折：模型能力的瓶颈，已转移至对
稀缺性、高质量专业数据的规模化获取
。当前，碎片化、低效的传统专家协作模式，已成为制约专业大模型实现能力跃迁与商业落地的核心障碍。针对这一挑战，全球领先的AI数据服务商澳鹏正式发布其战略产品——
EliteAI专家平台
。该平台旨在系统性解决"如何工程化、规模化调用全球顶尖人类智慧"的行业难题，标志着AI数据服务从劳动密集型标注，迈入以"智慧供给"为核心驱动力的新时代。

"我们正站在一个临界点：AI要从‘知道'进化为‘精通'，必须系统性地消化人类顶尖专家的深度认知，"澳鹏Appen
全球副总裁、大中华区及北亚区总经理田小鹏博士指出，"EliteAI正是我们为产业构建的下一代‘人类专家智慧云'。其目标是打破专家智慧与AI
训练之间的壁垒，将专业的人类知识，转化为驱动模型从优秀走向卓越的‘高纯度燃料'。"

 <https://mma.prnasia.com/media2/2859212/image_5014143_32169218.html>
澳鹏EliteAI专家平台

不止于人才库：构建一个动态进化的"专家智慧云"

传统模式下，寻找特定领域专家如同大海捞针。澳鹏EliteAI平台从根本上重构了这一模式。它并非静态的人才列表，而是一个持续学习、动态优化的智慧网络
。平台通过深度融合专家学历背景、领域专精、语言矩阵、历史项目表现及实时技能标签，构建了一套多层次、立体化的专家资源能力画像体系
。目前，平台已深度覆盖法律、医疗、代码、金融、美学等10余个核心垂类，汇聚了精通290余种语言的全球专家，累计为超过500个前沿AI模型提供数据服务，支付报酬逾
5亿元人民币。这意味着，客户面对一个复杂的专业数据需求时，EliteAI能够及时、精准、敏捷地调度全球智力资源。

 <https://mma.prnasia.com/media2/2859213/image_5014143_32169281.html>
汇聚来自全球的顶尖专家网络

效率革命：AI面试系统重塑专家筛选范式

EliteAI平台以技术驱动，将智能化贯穿全流程，而专家网络的质量取决于入口。平台通过自研的多模态AI面试系统
，将传统依赖人工、耗时数天的专家初筛与资质验证流程，压缩至30分钟内完成。该系统不仅能支持10余种语言
的实时面试，更能做到利用大模型技术，对候选人的专业知识深度、逻辑表达能力、语言熟练度等进行自动化、可量化的分析与评分
，并生成详细的评估报告。这一技术突破，不仅将人才触达效率提升了一个数量级，更通过标准化评估体系，从根本上保障了接入专家的基准质量与专业可信度。

 <https://mma.prnasia.com/media2/2859214/image_5014143_32169296.html>
将专家智慧转化为高质量数据养料

项目淬炼：自动运转的专家数据生产引擎

EliteAI平台的底层逻辑，源于澳鹏对过往15,000余个复杂项目经验的系统性解构与工程化沉淀。平台将其中涉及
全模态数据标注、高难度推理、复杂知识提取与专家验证等核心任务的方法论，转化为一套可复用的标准作业程序（SOP）、智能任务流与质量评估体系，形成了一个自动运转的"
专家数据生产引擎"，能够将抽象的专家智慧，通过"智能任务拆解-过程引导-多轮质检-反馈迭代"的自动化闭环，稳定、高效地转化为结构化的高质量数据。

 <https://mma.prnasia.com/media2/2859215/image_5014143_32169343.html>
澳鹏EliteAI平台丰富的细分项目

澳鹏EliteAI专家平台的发布，标志着澳鹏对下一代AI数据服务的定义：从提供基础的"数据标注力"，演进为提供体系化的"专家认知力"
——通过平台化、工程化的方式，将人类专家的深度认知转化为可调度、可量化、可高效交付的AI训练资源。在AI向各行各业深水区迈进的关键时期，谁能率先实现人类顶尖智慧的工程化与规模化供给，谁就将为整个产业铺就通往"专业通用智能"的坚实道路。澳鹏正通过EliteAI，将自身定位从数据服务伙伴，升级为客户在攻克复杂AI挑战时，所依赖的关键
"智慧基础设施"与确定性数据能力保障。

 <https://mma.prnasia.com/media2/2859216/image_5014143_32169390.html>
澳鹏正式推出战略级产品——EliteAI专家平台

 

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2026年1月12日</span> /美通社/ -- 随着大模型在医疗、法律等专业领域深入探索，AI产业正面临一个根本性转折：模型能力的瓶颈，已转移至对<b>稀缺性、高质量专业数据的规模化获取</b>。当前，碎片化、低效的传统专家协作模式，已成为制约专业大模型实现能力跃迁与商业落地的核心障碍。针对这一挑战，全球领先的AI数据服务商澳鹏正式发布其战略产品——<b>EliteAI</b><b>专家平台</b>。该平台旨在系统性解决&quot;如何工程化、规模化调用全球顶尖人类智慧&quot;的行业难题，标志着AI数据服务从劳动密集型标注，迈入以&quot;智慧供给&quot;为核心驱动力的新时代。</p> 
<p><b>&quot;</b><b>我们正站在一个临界点：</b><b>AI</b><b>要从</b><b>‘</b><b>知道</b><b>'</b><b>进化为</b><b>‘</b><b>精通</b><b>'</b><b>，必须系统性地消化人类顶尖专家的深度认知，</b><b>&quot;</b><b>澳鹏</b><b>Appen</b><b>全球副总裁、大中华区及北亚区总经理田小鹏博士指出，</b><b>&quot;EliteAI</b><b>正是我们为产业构建的下一代</b><b>‘</b><b>人类专家智慧云</b><b>'</b><b>。其目标是打破专家智慧与</b><b>AI</b><b>训练之间的壁垒，将专业的人类知识，转化为驱动模型从优秀走向卓越的‘高纯度燃料'。</b><b>&quot;</b></p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9134"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2859212/image_5014143_32169218.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2859212/image_5014143_32169218.jpg?p=medium600" title="澳鹏EliteAI专家平台" alt="澳鹏EliteAI专家平台" /></a><br /><span>澳鹏EliteAI专家平台</span></p> 
</div> 
<p><b>不止于人才库：构建一个动态进化的</b><b>&quot;</b><b>专家智慧云</b><b>&quot;</b></p> 
<p>传统模式下，寻找特定领域专家如同大海捞针。澳鹏EliteAI平台从根本上重构了这一模式。它并非静态的人才列表，而是一个<b>持续学习、动态优化的智慧网络</b>。平台通过深度融合专家<b>学历背景、领域专精、语言矩阵、历史项目表现及实时技能标签</b>，构建了一套<b>多层次、立体化的专家资源能力画像体系</b>。目前，平台已深度覆盖法律、医疗、代码、金融、美学等10余个核心垂类，汇聚了<b>精通</b><b>290</b><b>余种语言的全球专家</b>，累计为超过<b>500</b><b>个前沿</b><b>AI</b><b>模型</b>提供数据服务，支付报酬逾<b>5</b><b>亿元人民币</b>。这意味着，客户面对一个复杂的专业数据需求时，EliteAI能够及时、精准、敏捷地调度全球智力资源。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder7536"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2859213/image_5014143_32169281.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2859213/image_5014143_32169281.jpg?p=medium600" title="汇聚来自全球的顶尖专家网络" alt="汇聚来自全球的顶尖专家网络" /></a><br /><span>汇聚来自全球的顶尖专家网络</span></p> 
</div> 
<p><b>效率革命：</b><b>AI</b><b>面试系统重塑专家筛选范式</b></p> 
<p>EliteAI平台以技术驱动，将智能化贯穿全流程，而专家网络的质量取决于入口。平台通过自研的<b>多模态</b><b>AI</b><b>面试系统</b>，将传统依赖人工、耗时数天的专家初筛与资质验证流程，压缩至<b>30</b><b>分钟</b>内完成。该系统不仅能支持<b>10</b><b>余种语言</b>的实时面试，更能做到利用大模型技术，对候选人的专业知识深度、逻辑表达能力、语言熟练度等进行<b>自动化、可量化的分析与评分</b>，并生成详细的评估报告。这一技术突破，不仅将人才触达效率提升了一个数量级，更通过标准化评估体系，从根本上保障了接入专家的基准质量与专业可信度。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder3347"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2859214/image_5014143_32169296.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2859214/image_5014143_32169296.jpg?p=medium600" title="将专家智慧转化为高质量数据养料" alt="将专家智慧转化为高质量数据养料" /></a><br /><span>将专家智慧转化为高质量数据养料</span></p> 
</div> 
<p><b>项目淬炼：自动运转的专家数据生产引擎</b></p> 
<p>EliteAI平台的底层逻辑，源于澳鹏对过往<b>15,000</b><b>余个</b>复杂项目经验的系统性解构与工程化沉淀。平台将其中涉及<b>全模态数据标注、高难度推理、复杂知识提取与专家验证</b>等核心任务的方法论，转化为一套可复用的标准作业程序（SOP）、智能任务流与质量评估体系，形成了一个自动运转的&quot;<b>专家数据生产引擎</b>&quot;，能够将抽象的专家智慧，通过&quot;<b>智能任务拆解</b><b>-</b><b>过程引导</b><b>-</b><b>多轮质检</b><b>-</b><b>反馈迭代</b>&quot;的自动化闭环，稳定、高效地转化为结构化的高质量数据。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6096"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2859215/image_5014143_32169343.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2859215/image_5014143_32169343.jpg?p=medium600" title="澳鹏EliteAI平台丰富的细分项目" alt="澳鹏EliteAI平台丰富的细分项目" /></a><br /><span>澳鹏EliteAI平台丰富的细分项目</span></p> 
</div> 
<p>澳鹏EliteAI专家平台的发布，标志着澳鹏对下一代AI数据服务的定义：<b>从提供基础的&quot;数据标注力&quot;，演进为提供体系化的&quot;专家认知力&quot;</b>——通过平台化、工程化的方式，将人类专家的深度认知转化为可调度、可量化、可高效交付的AI训练资源。在AI向各行各业深水区迈进的关键时期，谁能率先实现人类顶尖智慧的工程化与规模化供给，谁就将为整个产业铺就通往&quot;专业通用智能&quot;的坚实道路。澳鹏正通过EliteAI，将自身定位从数据服务伙伴，升级为客户在攻克复杂AI挑战时，所依赖的关键<b>&quot;智慧基础设施&quot;与确定性数据能力保障。</b></p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6494"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2859216/image_5014143_32169390.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2859216/image_5014143_32169390.jpg?p=medium600" title="澳鹏正式推出战略级产品——EliteAI专家平台" alt="澳鹏正式推出战略级产品——EliteAI专家平台" /></a><br /><span>澳鹏正式推出战略级产品——EliteAI专家平台</span></p> 
</div> 
<p>&nbsp;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏发布RoboGo具身智能数据开发平台，破解AI物理世界交互数据难题</title>
		<author></author>
		<pubDate>2025-10-15 18:03:00</pubDate>
		<description><![CDATA[上海2025年10月15日 /美通社/ -- 
近日，AI数据服务领域的领军企业澳鹏数据正式发布了RoboGo具身智能数据开发平台，这一全栈式解决方案旨在破解具身智能领域高质量训练数据稀缺的核心难题，为AI突破物理世界边界提供坚实的数据支撑。

 <https://mma.prnasia.com/media2/2796906/image_1.html>
澳鹏发布RoboGo具身智能数据开发平台


当前，具身智能作为人工智能与物理世界交互的重要方向，正迎来快速发展阶段。《2025人形机器人与具身智能产业研究报告》指出，今年，人形机器人产业有望从"技术验证期"向"规模化商用期"快速过渡，全球具身智能市场规模预计达195.25亿元，我国市场占比近半。


澳鹏全球高级副总裁、大中国区及北亚区总经理田小鹏博士表示："具身智能要真正实现从‘数字理解'到‘物理执行'的跨越，高质量、多模态的训练数据是不可或缺的基础燃料。RoboGo平台的推出，正是我们基于对行业痛点的深刻洞察，为构建具身智能数据基础设施迈出的关键一步。"

数据瓶颈：制约具身智能发展的核心挑战

在具身智能快速发展的背后，高质量训练数据的稀缺正成为制约行业进步的主要瓶颈。

与传统的AI模型不同，具身智能系统需要理解物理世界的复杂性，包括空间关系、物体属性、物理规律以及动态交互等多个维度。这种复杂性使得数据要求远超传统AI应用。


澳鹏中国产品研发副总裁钱程指出："具身智能数据的特点在于其多模态和场景依赖性。单一类型的数据无法满足智能体在物理环境中交互的需求，我们需要构建涵盖视觉、语言、动作等多种模态的综合性数据解决方案。"

平台创新：三大技术体系构建数据生产力

基于对行业需求的深入理解，澳鹏RoboGo平台通过三大核心技术体系，为具身智能提供全方位的数据支持。

 <https://mma.prnasia.com/media2/2796907/image_2.html>
澳鹏RoboGo平台以三大技术体系构建数据生产力


感知升维体系突破了传统的数据标注限制。平台通过双光融合标注技术，将红外与自然光数据相结合，使智能体能够在复杂环境中精准识别目标。同时，基于深度摄像头与多视角图像的融合标注技术，构建高精度3D点云与语义地图，为智能体提供结构化的空间认知数据。


认知建模系统致力于帮助AI学习世界的"物理常识"。通过视频内容理解标注技术，平台能够对真实世界视频中的空间场景、行为意图及多对象交互关系进行结构化解析。此外，结合重力、摩擦、碰撞等物理因素构建的因果标注案例库，为AI学习真实世界物理因果链提供了坚实基础。


决策优化方案赋予智能体类人的思考与执行能力。多相机协同标注技术能够对物体形变及最佳抓取点进行跨视角时空对齐，攻克手眼协调中的视角盲区难题。思维链标注技术则通过结构化记录智能体的环境状态记忆与动作序列规划，提供可解释的任务分解能力。

应用实践：从技术突破到场景落地


RoboGo平台的技术优势已在多个具体场景中得到验证。澳鹏中国产品研发副总裁钱程表示："我们的目标是构建一个完整的数据生态，不仅提供标注工具，更要为具身智能的每个发展阶段提供数据养分。从基础的空间认知到高级的推理决策，RoboGo都能提供相应的数据解决方案。"


在家居服务领域，平台通过真实场景的行为标注数据，赋能机器人掌握家居整理、物品递送等生活化技能。例如在复杂家庭环境中，帮助机器人准确理解"将水杯从餐桌移到茶几"这类涉及空间认知和物体操作的综合任务。


工业制造是另一个重要应用场景。平台为工业机械臂提供精准的操作标注数据，实现复杂装配、精密抓取等高级技能学习。通过多视角连续帧标注技术，机械臂能够准确预测物体形变，实现毫米级操作精度。


在智能驾驶方面，RoboGo构建的多传感器融合标注体系，显著提升了自动驾驶系统对复杂交通环境的认知与决策能力。从简单的路径规划到复杂的动态避障，平台都能提供相应的训练数据支持。


澳鹏全球高级副总裁、大中国区及北亚区总经理田小鹏博士总结道："我们相信，数据是释放具身智能巨大潜力的关键。随着智能体加速融入生产生活，真实场景数据将呈现指数级增长。澳鹏将持续深耕具身智能数据领域，以创新技术架构和专业服务能力，助力产业伙伴实现从技术突破到规模化商用的跨越。"

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2025年10月15日</span> /美通社/ -- 近日，AI数据服务领域的领军企业澳鹏数据正式发布了RoboGo具身智能数据开发平台，这一全栈式解决方案旨在破解具身智能领域高质量训练数据稀缺的核心难题，为AI突破物理世界边界提供坚实的数据支撑。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder2616"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2796906/image_1.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2796906/image_1.jpg?p=medium600" title="澳鹏发布RoboGo具身智能数据开发平台" alt="澳鹏发布RoboGo具身智能数据开发平台" /></a><br /><span>澳鹏发布RoboGo具身智能数据开发平台</span></p> 
</div> 
<p>当前，具身智能作为人工智能与物理世界交互的重要方向，正迎来快速发展阶段。《2025人形机器人与具身智能产业研究报告》指出，今年，人形机器人产业有望从&quot;技术验证期&quot;向&quot;规模化商用期&quot;快速过渡，全球具身智能市场规模预计达195.25亿元，我国市场占比近半。</p> 
<p>澳鹏全球高级副总裁、大中国区及北亚区总经理田小鹏博士表示：&quot;具身智能要真正实现从‘数字理解'到‘物理执行'的跨越，高质量、多模态的训练数据是不可或缺的基础燃料。RoboGo平台的推出，正是我们基于对行业痛点的深刻洞察，为构建具身智能数据基础设施迈出的关键一步。&quot;</p> 
<p><b>数据瓶颈：制约具身智能发展的核心挑战</b></p> 
<p>在具身智能快速发展的背后，高质量训练数据的稀缺正成为制约行业进步的主要瓶颈。</p> 
<p>与传统的AI模型不同，具身智能系统需要理解物理世界的复杂性，包括空间关系、物体属性、物理规律以及动态交互等多个维度。这种复杂性使得数据要求远超传统AI应用。</p> 
<p>澳鹏中国产品研发副总裁钱程指出：&quot;具身智能数据的特点在于其多模态和场景依赖性。单一类型的数据无法满足智能体在物理环境中交互的需求，我们需要构建涵盖视觉、语言、动作等多种模态的综合性数据解决方案。&quot;</p> 
<p><b>平台创新：三大技术体系构建数据生产力</b></p> 
<p>基于对行业需求的深入理解，澳鹏RoboGo平台通过三大核心技术体系，为具身智能提供全方位的数据支持。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder3964"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2796907/image_2.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2796907/image_2.jpg?p=medium600" title="澳鹏RoboGo平台以三大技术体系构建数据生产力" alt="澳鹏RoboGo平台以三大技术体系构建数据生产力" /></a><br /><span>澳鹏RoboGo平台以三大技术体系构建数据生产力</span></p> 
</div> 
<p>感知升维体系突破了传统的数据标注限制。平台通过双光融合标注技术，将红外与自然光数据相结合，使智能体能够在复杂环境中精准识别目标。同时，基于深度摄像头与多视角图像的融合标注技术，构建高精度3D点云与语义地图，为智能体提供结构化的空间认知数据。</p> 
<p>认知建模系统致力于帮助AI学习世界的&quot;物理常识&quot;。通过视频内容理解标注技术，平台能够对真实世界视频中的空间场景、行为意图及多对象交互关系进行结构化解析。此外，结合重力、摩擦、碰撞等物理因素构建的因果标注案例库，为AI学习真实世界物理因果链提供了坚实基础。</p> 
<p>决策优化方案赋予智能体类人的思考与执行能力。多相机协同标注技术能够对物体形变及最佳抓取点进行跨视角时空对齐，攻克手眼协调中的视角盲区难题。思维链标注技术则通过结构化记录智能体的环境状态记忆与动作序列规划，提供可解释的任务分解能力。</p> 
<p><b>应用实践：从技术突破到场景落地</b></p> 
<p>RoboGo平台的技术优势已在多个具体场景中得到验证。澳鹏中国产品研发副总裁钱程表示：&quot;我们的目标是构建一个完整的数据生态，不仅提供标注工具，更要为具身智能的每个发展阶段提供数据养分。从基础的空间认知到高级的推理决策，RoboGo都能提供相应的数据解决方案。&quot;</p> 
<p>在家居服务领域，平台通过真实场景的行为标注数据，赋能机器人掌握家居整理、物品递送等生活化技能。例如在复杂家庭环境中，帮助机器人准确理解&quot;将水杯从餐桌移到茶几&quot;这类涉及空间认知和物体操作的综合任务。</p> 
<p>工业制造是另一个重要应用场景。平台为工业机械臂提供精准的操作标注数据，实现复杂装配、精密抓取等高级技能学习。通过多视角连续帧标注技术，机械臂能够准确预测物体形变，实现毫米级操作精度。</p> 
<p>在智能驾驶方面，RoboGo构建的多传感器融合标注体系，显著提升了自动驾驶系统对复杂交通环境的认知与决策能力。从简单的路径规划到复杂的动态避障，平台都能提供相应的训练数据支持。</p> 
<p>澳鹏全球高级副总裁、大中国区及北亚区总经理田小鹏博士总结道：&quot;我们相信，数据是释放具身智能巨大潜力的关键。随着智能体加速融入生产生活，真实场景数据将呈现指数级增长。澳鹏将持续深耕具身智能数据领域，以创新技术架构和专业服务能力，助力产业伙伴实现从技术突破到规模化商用的跨越。&quot;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏数据亮相2025世界机器人大会 以数据创新驱动具身智能发展</title>
		<author></author>
		<pubDate>2025-08-20 15:18:00</pubDate>
		<description><![CDATA[北京2025年8月20日 /美通社/ -- 2025年8月8日至12日，以"让机器人更智慧 
让具身体更智能"为主题的2025世界机器人大会在北京隆重举行。本届大会汇聚了220余家国内外领先机器人企业，规模创历史新高。在全球人工智能与机器人技术加速融合的背景下，澳鹏数据作为AI数据服务领域的领军企业，在会上分享了具身智能数据基础设施建设的创新实践与行业洞察。

 <https://mma.prnasia.com/media2/2754322/image_5014143_24234957.html>
澳鹏中国产品研发副总裁钱程在大会圆桌论坛发表重要见解

把握战略机遇 推动产业升级


今年，"具身智能"与"智能机器人"首次被纳入政府工作报告，标志着这一领域已上升至国家战略层面。在这一重要机遇期，AI大模型与机器人技术的深度融合正成为驱动新一轮科技竞争的核心引擎，推动产业从"能动"向"能用"加速转型。


作为大会重要组成部分，"AI大模型赋能机器人与具身智能产业新范式交流活动"于8月8日同期召开。活动以"模型筑基，具身向新"为主题，汇聚产学研各界专家，共同探讨AI大模型与具身智能领域的技术突破与产业应用。澳鹏中国产品研发副总裁钱程在"智聚前沿，技破无界：AI大模型赋能具身智能创新革命"圆桌论坛中发表重要见解。

破解数据瓶颈 构建发展新路径


钱程在论坛中指出："数据是AI大模型与具身智能融合发展的核心基础。澳鹏从语音数据起步，已逐步拓展至自动驾驶、大模型、具身智能等多模态全维度数据服务。目前，我们已针对具身智能领域完成了机械臂、扫地机器人等多样化场景的数据服务实践。"


针对具身智能领域面临的高质量训练数据稀缺问题，钱程分享了专业见解。他指出，当前顶尖大模型需要百万亿token级的训练数据，而具身智能数据量级相对有限。这一差距源于具身智能数据的特殊采集难度——需要构建专门的数据工厂，配备多台机器人、搭建多样化场景，并通过遥控操作等方式生产数据，导致量产效率较低。


"解决之道不在于简单扩大数据工厂规模，"钱程表示，"而应以更开放的心态推动具身智能机器人快速量产与场景落地。"他援引强化学习之父理查德•萨顿提出的"经验数据"概念，强调具身智能非常适合"干中学"的模式。相比自动驾驶等高危场景，具身智能在咖啡制作、家居服务等场景具有更大的容错空间，使机器人能够通过渐进式学习持续提升性能。

创新平台发布 重塑数据生产力


基于对行业痛点的深刻洞察，澳鹏数据推出了RoboGo具身智能数据开发平台。该平台通过三大技术体系重构数据生产力：在感知升维层面，平台通过双光融合标注技术突破光谱限制，结合多视角3D重建，为智能体构建立体环境认知；认知建模模块通过视频理解与物理规律标注，帮助AI掌握动态场景逻辑；决策优化系统凭借多相机协同标注与思维链技术，赋能机器人实现毫米级操作精度与复杂任务自主规划。


钱程表示："随着具身智能机器人加速融入生产生活，真实场景数据将呈现指数级增长。作为产业链上游的数据提供商，澳鹏期待拥抱这一变革，为行业提供更多高质量训练数据支持。"


在AI大模型与具身智能深度融合的新时代，高质量、专业化数据正成为技术突破与产业落地的关键基石。澳鹏数据将继续深耕具身智能等前沿领域，以创新技术架构和全球化服务能力，为产业发展提供坚实数据支撑，助力机器人技术从实验室走向千行百业。

 

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">北京</span><span class="legendSpanClass">2025年8月20日</span> /美通社/ --&nbsp;2025年8月8日至12日，以&quot;让机器人更智慧 让具身体更智能&quot;为主题的2025世界机器人大会在北京隆重举行。本届大会汇聚了220余家国内外领先机器人企业，规模创历史新高。在全球人工智能与机器人技术加速融合的背景下，澳鹏数据作为AI数据服务领域的领军企业，在会上分享了具身智能数据基础设施建设的创新实践与行业洞察。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6594"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2754322/image_5014143_24234957.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2754322/image_5014143_24234957.jpg?p=medium600" title="澳鹏中国产品研发副总裁钱程在大会圆桌论坛发表重要见解" alt="澳鹏中国产品研发副总裁钱程在大会圆桌论坛发表重要见解" /></a><br /><span>澳鹏中国产品研发副总裁钱程在大会圆桌论坛发表重要见解</span></p> 
</div> 
<p><b>把握战略机遇</b>&nbsp;<b>推动产业升级</b></p> 
<p>今年，&quot;具身智能&quot;与&quot;智能机器人&quot;首次被纳入政府工作报告，标志着这一领域已上升至国家战略层面。在这一重要机遇期，AI大模型与机器人技术的深度融合正成为驱动新一轮科技竞争的核心引擎，推动产业从&quot;能动&quot;向&quot;能用&quot;加速转型。</p> 
<p>作为大会重要组成部分，&quot;AI大模型赋能机器人与具身智能产业新范式交流活动&quot;于8月8日同期召开。活动以&quot;模型筑基，具身向新&quot;为主题，汇聚产学研各界专家，共同探讨AI大模型与具身智能领域的技术突破与产业应用。澳鹏中国产品研发副总裁钱程在&quot;智聚前沿，技破无界：AI大模型赋能具身智能创新革命&quot;圆桌论坛中发表重要见解。</p> 
<p><b>破解数据瓶颈</b>&nbsp;<b>构建发展新路径</b></p> 
<p>钱程在论坛中指出：&quot;数据是AI大模型与具身智能融合发展的核心基础。澳鹏从语音数据起步，已逐步拓展至自动驾驶、大模型、具身智能等多模态全维度数据服务。目前，我们已针对具身智能领域完成了机械臂、扫地机器人等多样化场景的数据服务实践。&quot;</p> 
<p>针对具身智能领域面临的高质量训练数据稀缺问题，钱程分享了专业见解。他指出，当前顶尖大模型需要百万亿token级的训练数据，而具身智能数据量级相对有限。这一差距源于具身智能数据的特殊采集难度——需要构建专门的数据工厂，配备多台机器人、搭建多样化场景，并通过遥控操作等方式生产数据，导致量产效率较低。</p> 
<p>&quot;解决之道不在于简单扩大数据工厂规模，&quot;钱程表示，&quot;而应以更开放的心态推动具身智能机器人快速量产与场景落地。&quot;他援引强化学习之父理查德•萨顿提出的&quot;经验数据&quot;概念，强调具身智能非常适合&quot;干中学&quot;的模式。相比自动驾驶等高危场景，具身智能在咖啡制作、家居服务等场景具有更大的容错空间，使机器人能够通过渐进式学习持续提升性能。</p> 
<p><b>创新平台发布</b>&nbsp;<b>重塑数据生产力</b></p> 
<p>基于对行业痛点的深刻洞察，澳鹏数据推出了RoboGo具身智能数据开发平台。该平台通过三大技术体系重构数据生产力：在感知升维层面，平台通过双光融合标注技术突破光谱限制，结合多视角3D重建，为智能体构建立体环境认知；认知建模模块通过视频理解与物理规律标注，帮助AI掌握动态场景逻辑；决策优化系统凭借多相机协同标注与思维链技术，赋能机器人实现毫米级操作精度与复杂任务自主规划。</p> 
<p>钱程表示：&quot;随着具身智能机器人加速融入生产生活，真实场景数据将呈现指数级增长。作为产业链上游的数据提供商，澳鹏期待拥抱这一变革，为行业提供更多高质量训练数据支持。&quot;</p> 
<p>在AI大模型与具身智能深度融合的新时代，高质量、专业化数据正成为技术突破与产业落地的关键基石。澳鹏数据将继续深耕具身智能等前沿领域，以创新技术架构和全球化服务能力，为产业发展提供坚实数据支撑，助力机器人技术从实验室走向千行百业。</p> 
<p>&nbsp;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>WAIC2025：澳鹏发布新一代技术平台矩阵 助力大模型垂直应用落地</title>
		<author></author>
		<pubDate>2025-07-30 17:15:00</pubDate>
		<description><![CDATA[上海2025年7月30日 /美通社/ -- 在刚刚落幕的2025世界人工智能大会（WAIC 
2025）上，全球领先的AI数据服务提供商澳鹏Appen（中国）携全新技术平台矩阵及九大垂类数据服务解决方案精彩亮相，为人工智能产业发展提供坚实的数据基础设施支撑。本届大会以"智能时代 
同球共济"为主题，吸引了来自70多个国家和地区的1500余位顶尖专家共襄盛举。

 <https://mma.prnasia.com/media2/2740970/image_1.html>
WAIC2025展会期间，澳鹏Appen展台吸引众多专业观众驻足交流

全新技术矩阵发布 引领AI数据服务新范式


在大会期间，澳鹏发布了技术驱动的多平台矩阵，全面覆盖具身智能、AI医疗等前沿领域。这一创新性技术矩阵包括四大核心平台：MediGo医疗大模型数据开发平台、RoboGo具身智能数据开发平台、MatrixGo企业级高精度数据标注平台以及AI 
Agent智能数字员工平台。


其中，MediGo医疗大模型数据开发平台凭借对医疗AI数据特性的深刻理解，打造了覆盖八大医疗场景的完整解决方案。该平台通过七维技术矩阵确保医疗数据标注的高精准度，为AI医疗应用提供可靠的数据支撑。RoboGo具身智能数据开发平台则针对机器人、自动驾驶等领域的特殊需求，构建了感知升维、认知建模、决策优化的全栈式解决方案。

MatrixGo企业级高精度数据标注平台作为行业领先解决方案，集成了国内首个AI预标注大模型，具备超10亿点云处理能力，支持全模态数据类型。AI 
Agent智能数字员工平台专注于企业数字化转型需求，提供本地化部署方案，在确保企业数据安全的同时实现业务流程的智能化升级。

九大垂类数据服务 助力行业大模型突破


澳鹏在本次大会上重点展示了覆盖法律、医疗、代码、金融、数理、音乐、多语言、TTS、文学等九大垂直领域的全链路数据服务能力。依托"技术平台+垂类专家+全球化资源"的三重优势，澳鹏为各行业大模型开发提供专业化数据解决方案。


澳鹏组建了由行业顶尖专家领衔的垂类团队。法律团队由执业律师和法学专家组成；医疗团队拥有500余名医学专家，其中15%持有执业医师资格；金融团队70%成员具备从业资格认证；代码团队120余名工程师覆盖主流编程语言；数理团队由全国竞赛获奖者组成；音乐团队拥有500余名兼职音乐人；文学团队则汇聚985/211高校人才。


值得一提的是，澳鹏展现出强大的全球化服务能力。多语言团队覆盖全球200多种语言；TTS团队拥有数十个国家数百小时采集经验。目前，澳鹏垂类团队已成功支持多个行业标杆项目，包括帮助某券商提升模型推理准确率25+%，助力网文平台内容生成效率提升40+%，并为医疗大模型成功交付超过1000万条精准标注数据。

产学研深度对话 共绘AI发展蓝图


大会期间，澳鹏展台主题分享会吸引了众多参会者驻足交流。来自澳鹏产研、商务、采集、交付、资源等团队的专家们分享了包括数据生产能力提升、企业出海实践、九大垂类数据解读等前沿洞见，与观众共同探讨AI数据服务的最新趋势与实践经验。


澳鹏全球高级副总裁、大中华及北亚区总经理田小鹏博士表示："当前AI技术正向垂直领域加速渗透，高质量专业数据已成为大模型发展的核心驱动力。本次大会上澳鹏展示的技术平台与垂类服务，正是我们深耕AI数据领域的创新成果。我们将始终通过构建安全高效的数据基础设施，助力全球客户实现AI应用规模化落地。"

持续创新 铸就AI数据服务标杆

作为人工智能行业的"风向标"，本届WAIC充分彰显了AI产业的蓬勃活力和全球影响力。人工智能之父、诺贝尔奖与图灵奖双料得主Geoffrey 
Hinton作为开场演讲嘉宾，分享了关于AI安全与发展的深刻洞见，呼吁全球协作培育"不会从人类手中夺权的好AI"。


澳鹏Appen（中国）自2019年起已连续7届深度参与这一行业顶级盛会。未来，澳鹏将持续以不断迭代的技术平台矩阵、灵活高效的数据服务以及深厚的垂类细分专业知识，为全球人工智能应用开发和落地提供专业、精准、安全的高质量数据基石，与产学研伙伴共建可持续的AI生态。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2025年7月30日</span> /美通社/ -- 在刚刚落幕的2025世界人工智能大会（WAIC 2025）上，全球领先的AI数据服务提供商澳鹏Appen（中国）携全新技术平台矩阵及九大垂类数据服务解决方案精彩亮相，为人工智能产业发展提供坚实的数据基础设施支撑。本届大会以&quot;智能时代 同球共济&quot;为主题，吸引了来自70多个国家和地区的1500余位顶尖专家共襄盛举。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9490"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2740970/image_1.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2740970/image_1.jpg?p=medium600" title="WAIC2025展会期间，澳鹏Appen展台吸引众多专业观众驻足交流" alt="WAIC2025展会期间，澳鹏Appen展台吸引众多专业观众驻足交流" /></a><br /><span>WAIC2025展会期间，澳鹏Appen展台吸引众多专业观众驻足交流</span></p> 
</div> 
<p><b>全新技术矩阵发布</b>&nbsp;<b>引领</b><b>AI</b><b>数据服务新范式</b></p> 
<p>在大会期间，澳鹏发布了技术驱动的多平台矩阵，全面覆盖具身智能、AI医疗等前沿领域。这一创新性技术矩阵包括四大核心平台：MediGo医疗大模型数据开发平台、RoboGo具身智能数据开发平台、MatrixGo企业级高精度数据标注平台以及AI Agent智能数字员工平台。</p> 
<p>其中，MediGo医疗大模型数据开发平台凭借对医疗AI数据特性的深刻理解，打造了覆盖八大医疗场景的完整解决方案。该平台通过七维技术矩阵确保医疗数据标注的高精准度，为AI医疗应用提供可靠的数据支撑。RoboGo具身智能数据开发平台则针对机器人、自动驾驶等领域的特殊需求，构建了感知升维、认知建模、决策优化的全栈式解决方案。</p> 
<p>MatrixGo企业级高精度数据标注平台作为行业领先解决方案，集成了国内首个AI预标注大模型，具备超10亿点云处理能力，支持全模态数据类型。AI Agent智能数字员工平台专注于企业数字化转型需求，提供本地化部署方案，在确保企业数据安全的同时实现业务流程的智能化升级。</p> 
<p><b>九大垂类数据服务</b>&nbsp;<b>助力行业大模型突破</b></p> 
<p>澳鹏在本次大会上重点展示了覆盖法律、医疗、代码、金融、数理、音乐、多语言、TTS、文学等九大垂直领域的全链路数据服务能力。依托&quot;技术平台+垂类专家+全球化资源&quot;的三重优势，澳鹏为各行业大模型开发提供专业化数据解决方案。</p> 
<p>澳鹏组建了由行业顶尖专家领衔的垂类团队。法律团队由执业律师和法学专家组成；医疗团队拥有500余名医学专家，其中15%持有执业医师资格；金融团队70%成员具备从业资格认证；代码团队120余名工程师覆盖主流编程语言；数理团队由全国竞赛获奖者组成；音乐团队拥有500余名兼职音乐人；文学团队则汇聚985/211高校人才。</p> 
<p>值得一提的是，澳鹏展现出强大的全球化服务能力。多语言团队覆盖全球200多种语言；TTS团队拥有数十个国家数百小时采集经验。目前，澳鹏垂类团队已成功支持多个行业标杆项目，包括帮助某券商提升模型推理准确率25+%，助力网文平台内容生成效率提升40+%，并为医疗大模型成功交付超过1000万条精准标注数据。</p> 
<p><b>产学研深度对话</b>&nbsp;<b>共绘</b><b>AI</b><b>发展蓝图</b></p> 
<p>大会期间，澳鹏展台主题分享会吸引了众多参会者驻足交流。来自澳鹏产研、商务、采集、交付、资源等团队的专家们分享了包括数据生产能力提升、企业出海实践、九大垂类数据解读等前沿洞见，与观众共同探讨AI数据服务的最新趋势与实践经验。</p> 
<p>澳鹏全球高级副总裁、大中华及北亚区总经理田小鹏博士表示：&quot;当前AI技术正向垂直领域加速渗透，高质量专业数据已成为大模型发展的核心驱动力。本次大会上澳鹏展示的技术平台与垂类服务，正是我们深耕AI数据领域的创新成果。我们将始终通过构建安全高效的数据基础设施，助力全球客户实现AI应用规模化落地。&quot;</p> 
<p><b>持续创新</b>&nbsp;<b>铸就</b><b>AI</b><b>数据服务标杆</b></p> 
<p>作为人工智能行业的&quot;风向标&quot;，本届WAIC充分彰显了AI产业的蓬勃活力和全球影响力。人工智能之父、诺贝尔奖与图灵奖双料得主Geoffrey Hinton作为开场演讲嘉宾，分享了关于AI安全与发展的深刻洞见，呼吁全球协作培育&quot;不会从人类手中夺权的好AI&quot;。</p> 
<p>澳鹏Appen（中国）自2019年起已连续7届深度参与这一行业顶级盛会。未来，澳鹏将持续以不断迭代的技术平台矩阵、灵活高效的数据服务以及深厚的垂类细分专业知识，为全球人工智能应用开发和落地提供专业、精准、安全的高质量数据基石，与产学研伙伴共建可持续的AI生态。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏发布MediGo医疗大模型数据开发平台 破解医疗AI数据瓶颈</title>
		<author></author>
		<pubDate>2025-06-23 15:50:00</pubDate>
		<description><![CDATA[上海 2025年6月23日 /美通社/ -- 
全球领先的AI数据服务提供商澳鹏Appen（中国）今日正式发布MediGo医疗大模型数据开发平台，这一创新性平台旨在解决医疗AI领域面临的数据标注精度不足、多模态协同处理效率低下等核心挑战。该平台的推出标志着医疗AI数据服务进入专业化、智能化新阶段，将为医疗AI的临床应用提供强有力的数据支撑。

当前，中国AI健康管理市场正迎来爆发式增长，市场规模
预计将在2027年达到2.59万亿元，年复合增长率超20%。然而，医疗AI的发展正面临算法进步与数据生产力滞后的突出矛盾。澳鹏MediGo平台通过八大应用场景和七维技术矩阵，构建了从数据生产到模型训练的全链路解决方案，有望显著提升医疗AI模型的准确性和可靠性。

 <https://mma.prnasia.com/media2/2716422/image_1.html> 
澳鹏（中国）发布MediGo医疗大模型数据开发平台

八大场景赋能智慧医疗全流程 


在诊疗场景方面，平台基于深度学习的病理图片智能分析系统能够自动标注病灶区域，帮助生成结构化诊断报告，显著提升诊断效率。问诊导诊系统则通过医疗知识图谱驱动，支持多轮问诊场景模拟，为患者提供更精准的诊疗建议。健康科普功能整合了权威医学知识库，能够对患者咨询的保健、用药等问题生成通俗易懂的解答。


平台还特别强化了药品咨询功能，其高精度药品信息OCR识别系统可以准确提取适应症、用法用量等关键字段。针对科研需求，平台的医学论文解读引擎能够智能解析学术文献，提取研究结论、实验方法等核心要素。专业级影像标注工具，支持专业医疗数据逐层标注；多模态报告解读系统支持病理报告、检验报告与影像数据的交叉验证；基于真实世界数据的决策支持系统，可对诊断方案进行多维度评估，为临床决策提供更全面的参考依据。

 <https://mma.prnasia.com/media2/2716423/image_2.html> 
澳鹏MediGo平台赋能八大医疗应用场景

七维技术矩阵定义医疗数据生产力 


澳鹏MediGo平台的技术创新主要体现在七个维度。在智能化标注方面，平台集成了医疗专用NER模型、问答对自动生成系统和自研预标注算法，包含药品信息OCR识别、骨骼/细胞形态预识别等医疗专用模型，大幅提升了标注效率和准确性。多模态工具的统一数据中台支持同时处理PDF、TXT、图片等多种数据格式，实现了跨模态数据的协同处理；内置的医疗专用接口，辅助提升标注效率。


医疗影像工具采用2D/3D协同标注系统，通过智能色块追踪算法确保标注连贯性。平台还提供可视化模板设计器，支持快速创建符合不同研究需求的标注模板。智能工作流引擎能够根据标注难度自动分配任务，并通过实时质量监控看板确保项目进度可控。


在数据安全方面，平台支持医疗级私有化部署方案，兼容企业内网环境，确保敏感医疗数据的安全流转。同时，基于医疗知识图谱的智能检索系统和版本控制系统，为数据管理提供了专业化的解决方案。

 <https://mma.prnasia.com/media2/2716424/image_3.html> 
澳鹏MediGo平台集成医疗专用NER模型、问答对自动生成系统和自研预标注算法


澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示："澳鹏（中国）MediGo医疗大模型数据开发平台的推出，是我们深耕医疗AI数据领域的重要里程碑。未来，我们将继续与医疗机构、科研团队和产业伙伴紧密合作，共同推动智慧医疗时代的到来。"

]]></description>
		<detail><![CDATA[<p> <span class="legendSpanClass">上海</span> <span class="legendSpanClass">2025年6月23日</span> /美通社/ -- 全球领先的AI数据服务提供商澳鹏Appen（中国）今日正式发布MediGo医疗大模型数据开发平台，这一创新性平台旨在解决医疗AI领域面临的数据标注精度不足、多模态协同处理效率低下等核心挑战。该平台的推出标志着医疗AI数据服务进入专业化、智能化新阶段，将为医疗AI的临床应用提供强有力的数据支撑。</p> 
<p>当前，中国AI健康管理市场正迎来爆发式增长，<span id="spanHghlt8e49">市场规模</span>预计将在2027年达到2.59万亿元，年复合增长率超20%。然而，医疗AI的发展正面临算法进步与数据生产力滞后的突出矛盾。澳鹏MediGo平台通过八大应用场景和七维技术矩阵，构建了从数据生产到模型训练的全链路解决方案，有望显著提升医疗AI模型的准确性和可靠性。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder5852"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"> <a href="https://mma.prnasia.com/media2/2716422/image_1.html" target="_blank" rel="nofollow" style="color: #0000FF"> <img src="https://mma.prnasia.com/media2/2716422/image_1.jpg?p=medium600" title="澳鹏（中国）发布MediGo医疗大模型数据开发平台" alt="澳鹏（中国）发布MediGo医疗大模型数据开发平台" /> </a> <br /><span>澳鹏（中国）发布MediGo医疗大模型数据开发平台</span></p> 
</div> 
<p> <b>八大场景赋能智慧医疗全流程</b> </p> 
<p>在诊疗场景方面，平台基于深度学习的病理图片智能分析系统能够自动标注病灶区域，帮助生成结构化诊断报告，显著提升诊断效率。问诊导诊系统则通过医疗知识图谱驱动，支持多轮问诊场景模拟，为患者提供更精准的诊疗建议。健康科普功能整合了权威医学知识库，能够对患者咨询的保健、用药等问题生成通俗易懂的解答。</p> 
<p>平台还特别强化了药品咨询功能，其高精度药品信息OCR识别系统可以准确提取适应症、用法用量等关键字段。针对科研需求，平台的医学论文解读引擎能够智能解析学术文献，提取研究结论、实验方法等核心要素。专业级影像标注工具，支持专业医疗数据逐层标注；多模态报告解读系统支持病理报告、检验报告与影像数据的交叉验证；基于真实世界数据的决策支持系统，可对诊断方案进行多维度评估，为临床决策提供更全面的参考依据。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder4518"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"> <a href="https://mma.prnasia.com/media2/2716423/image_2.html" target="_blank" rel="nofollow" style="color: #0000FF"> <img src="https://mma.prnasia.com/media2/2716423/image_2.jpg?p=medium600" title="澳鹏MediGo平台赋能八大医疗应用场景" alt="澳鹏MediGo平台赋能八大医疗应用场景" /> </a> <br /><span>澳鹏MediGo平台赋能八大医疗应用场景</span></p> 
</div> 
<p> <b>七维技术矩阵定义医疗数据生产力</b> </p> 
<p>澳鹏MediGo平台的技术创新主要体现在七个维度。在智能化标注方面，平台集成了医疗专用NER模型、问答对自动生成系统和自研预标注算法，包含药品信息OCR识别、骨骼/细胞形态预识别等医疗专用模型，大幅提升了标注效率和准确性。多模态工具的统一数据中台支持同时处理PDF、TXT、图片等多种数据格式，实现了跨模态数据的协同处理；内置的医疗专用接口，辅助提升标注效率。</p> 
<p>医疗影像工具采用2D/3D协同标注系统，通过智能色块追踪算法确保标注连贯性。平台还提供可视化模板设计器，支持快速创建符合不同研究需求的标注模板。智能工作流引擎能够根据标注难度自动分配任务，并通过实时质量监控看板确保项目进度可控。</p> 
<p>在数据安全方面，平台支持医疗级私有化部署方案，兼容企业内网环境，确保敏感医疗数据的安全流转。同时，基于医疗知识图谱的智能检索系统和版本控制系统，为数据管理提供了专业化的解决方案。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder3593"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"> <a href="https://mma.prnasia.com/media2/2716424/image_3.html" target="_blank" rel="nofollow" style="color: #0000FF"> <img src="https://mma.prnasia.com/media2/2716424/image_3.jpg?p=medium600" title="澳鹏MediGo平台集成医疗专用NER模型、问答对自动生成系统和自研预标注算法" alt="澳鹏MediGo平台集成医疗专用NER模型、问答对自动生成系统和自研预标注算法" /> </a> <br /><span>澳鹏MediGo平台集成医疗专用NER模型、问答对自动生成系统和自研预标注算法</span></p> 
</div> 
<p>澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示：&quot;澳鹏（中国）MediGo医疗大模型数据开发平台的推出，是我们深耕医疗AI数据领域的重要里程碑。未来，我们将继续与医疗机构、科研团队和产业伙伴紧密合作，共同推动智慧医疗时代的到来。&quot;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"></div> 
<img alt="" src="https://rt.prnewswire.com/rt.gif?NewsItemId=ZH15822&amp;Transmission_Id=202506230350PR_NEWS_ASPR_____ZH15822&amp;DateId=20250623" style="border:0px; width:1px; height:1px;" />]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏中国发布9大垂类数据服务解决方案，助力大模型垂直领域精准落地</title>
		<author></author>
		<pubDate>2025-05-08 16:08:00</pubDate>
		<description><![CDATA[上海 2025年5月8日 /美通社/ 
-- 随着人工智能技术进入深水区，大模型应用正加速从通用场景向垂直领域渗透。在这一进程中，高质量、专业化的垂类数据已成为模型性能提升的关键。近日，全球领先的AI数据服务提供商澳鹏Appen（中国）正式发布其在法律、医疗、代码、金融、数学、音乐、多语言、TTS、文学等9大垂类领域的全链路数据服务能力，为行业提供从数据采集/标注、数据集到模型评估等一站式解决方案。

 <https://mma.prnasia.com/media2/2682471/image_5014143_27669492.html> 


法律垂类：合规与精准并重 


澳鹏法律团队由数十名全职法律专家组成，团队汇聚民商法、刑法、劳动法、婚姻家庭法等领域的执业律师、法学专家及司法系统顾问，确保法律知识的权威性与实践性。团队为众多头部企业提供专业的法律数据服务，覆盖多种大模型业务类型如SFT、RM、NLP等，能够迅速响应客户的个性化需求，包括法律文本优化、场景搭建、审核评估等。尤其是针对劳动纠纷、消费维权、婚姻财产等高频问题，提供"口语化提问-结构化解答"等数据服务，为客户提供精准、高效的法律支持。

医疗垂类：医学专家叠加交付经验 


澳鹏医疗团队由500多名全职医学专家组成，其中20%拥有硕士学位，15%持有执业医师资格证，覆盖临床医学、中西医结合医学、中医学、护理学、药学、医学心理学、健康管理学、营养学等多个学科。团队已成功交付超过1000万条医疗数据，服务于30多个客户、500余个医学项目，支持AI辅助诊断、AI医患对话，电子病历结构化等应用场景
。

代码垂类：技术栈全覆盖 


澳鹏代码团队由120多名全职工程师组成，涵盖Python、Java、C/C++、JavaScript、Go、Rust等主流编程语言。团队拥有多名持有PMP证书的管理人员，具备丰富的项目管理经验，提供多样化服务模式，通过持续建立工具、算法等方面的技术优势，提升高难度任务的交付效率和质量。在代码生成、调试和优化方面，帮助客户显著降低了开发成本和时间。同时，澳鹏持续积累高质量、行业特定的代码数据集，注重数据集的多样性与全面性，确保代码模型在多种编程场景和任务类型上的泛化能力。

金融垂类：风控与决策赋能 


在金融垂类领域，澳鹏团队由数百名全职标注员组成，其中99%拥有金融或经济本科学历，70%持有基金从业资格或证券从业资格认证。以多年服务金融机构的历史经验积累为依托，团队支持高客理财服务、智能投资顾问、投研解读、金融产品管理以及保险内容评测等应用场景，帮助某券商客户将模型推理准确率提升了25%以上。团队目前还持续在金融领域进行前置资源储备，可以迅速响应客户业务的新需求，同时在数据安全合规、质量体系认证等各类资质认证方面也十分完备。

数理垂类：逻辑与算法攻坚 


澳鹏数理团队由数理竞赛获奖者组成，包括全国大学生数学、物理、化学、建模竞赛一/二等奖获得者，擅长高数证明、物理学研究和应用、化学材料学、生物医学等数物化生领域模型评估。团队拥有丰富的项目实战经验，包括：实验室模型解题判断，模型性能评估（数物化生），大学数物化生考题标注等，助力模型提升解题能力，高效解决复杂数理问题；同时，支持个性化学习和自动化猜想生成，快速验证海量猜想，推动数学探索。

音乐垂类：艺术与技术的平衡 


澳鹏音乐团队拥有数十名全职人员及超过500位兼职音乐人，涵盖作曲、声乐、音响工程、声音设计、音乐学、音乐表演等多个专业领域。团队成员具备丰富的音乐项目经验，涵盖编曲、标注、制谱、问答、打轴、评测、检索及音视频匹配等多个方面，能够高质量地完成项目交付。

多语言垂类：全球化交付能力 


澳鹏多语言垂类团队成员来自标注、翻译、贸易、教培、新媒体等专业领域，全职员工支持英语、西班牙语、俄语、日语、韩语、法语、德语、波兰语、阿拉伯语、意大利语、葡萄牙语、泰语、马来西亚语、印尼语、越南语、菲律宾语、土耳其语等20多个语种，大部分成员为双语或多语人才并获得国内外认可的中高/最高等级以上证书；团队同时具备来自世界各地的数百万兼职人员，覆盖全球200多种语言，具备丰富的多语言项目交付经验。澳鹏在国内及海外均设有自营的交付中心，支持高数安项目室配置，可覆盖标注、翻译、审核、客服等全类型多语言数据服务。

TTS 垂类：高保真语音数据 


澳鹏在TTS领域拥有数十个国家、数百小时的采集经验，涵盖中文普通话、方言、东南亚地区、日韩地区、欧美地区的各类语言及歌曲。声优均具备超过5年配音经验，涉及TTS录制、影视剧配音、新闻主持、游戏解说等多个领域。澳鹏录音棚覆盖全国主要城市，均具备NC-20以及RT60＜100ms的声学环境和行业标准的录音设备。

文学垂类：跨模态文化理解 


澳鹏文学团队由来自985/211高校的文学人才组成，涵盖汉语言文学、传播学等专业，团队成员均具备深刻的文学理解与鉴赏能力，支持跨领域多模态融合与创新、情感交互与智能推荐系统等领域大模型的发展，例如，团队帮助某网文平台将内容生成效率提升40%以上。


在大模型技术快速发展的今天，高质量、高专业度的垂类数据已成为推动AI技术从通用领域向垂直领域落地的关键。澳鹏（中国）凭借在9大垂类领域的深厚积累，通过"技术平台+垂类专家+全球化资源"的三重优势，持续为客户提供专业、安全、高精度的数据服务。

]]></description>
		<detail><![CDATA[<p> <span class="legendSpanClass">上海</span> <span class="legendSpanClass">2025年5月8日</span> /美通社/ --&nbsp;随着人工智能技术进入深水区，大模型应用正加速从通用场景向垂直领域渗透。在这一进程中，高质量、专业化的垂类数据已成为模型性能提升的关键。近日，全球领先的AI数据服务提供商澳鹏Appen（中国）正式发布其在法律、医疗、代码、金融、数学、音乐、多语言、TTS、文学等9大垂类领域的全链路数据服务能力，为行业提供从数据采集/标注、数据集到模型评估等一站式解决方案。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9067"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"> <a href="https://mma.prnasia.com/media2/2682471/image_5014143_27669492.html" target="_blank" rel="nofollow" style="color: #0000FF"> <img src="https://mma.prnasia.com/media2/2682471/image_5014143_27669492.jpg?p=medium600" title="" alt="" /> </a> <br /><span></span></p> 
</div> 
<p> <b>法律垂类：合规与精准并重</b> </p> 
<p>澳鹏法律团队由数十名全职法律专家组成，团队汇聚民商法、刑法、劳动法、婚姻家庭法等领域的执业律师、法学专家及司法系统顾问，确保法律知识的权威性与实践性。团队为众多头部企业提供专业的法律数据服务，覆盖多种大模型业务类型如SFT、RM、NLP等，能够迅速响应客户的个性化需求，包括法律文本优化、场景搭建、审核评估等。尤其是针对劳动纠纷、消费维权、婚姻财产等高频问题，提供&quot;口语化提问-结构化解答&quot;等数据服务，为客户提供精准、高效的法律支持。</p> 
<p> <b>医疗垂类：医学专家叠加交付经验</b> </p> 
<p>澳鹏医疗团队由500多名全职医学专家组成，其中20%拥有硕士学位，15%持有执业医师资格证，覆盖临床医学、中西医结合医学、中医学、护理学、药学、医学心理学、健康管理学、营养学等多个学科。团队已成功交付超过1000万条医疗数据，服务于30多个客户、500余个医学项目，支持AI辅助诊断、AI医患对话，电子病历结构化等应用场景<b>。</b></p> 
<p> <b>代码垂类：技术栈全覆盖</b> </p> 
<p>澳鹏代码团队由120多名全职工程师组成，涵盖Python、Java、C/C++、JavaScript、Go、Rust等主流编程语言。团队拥有多名持有PMP证书的管理人员，具备丰富的项目管理经验，提供多样化服务模式，通过持续建立工具、算法等方面的技术优势，提升高难度任务的交付效率和质量。在代码生成、调试和优化方面，帮助客户显著降低了开发成本和时间。同时，澳鹏持续积累高质量、行业特定的代码数据集，注重数据集的多样性与全面性，确保代码模型在多种编程场景和任务类型上的泛化能力。</p> 
<p> <b>金融垂类：风控与决策赋能</b> </p> 
<p>在金融垂类领域，澳鹏团队由数百名全职标注员组成，其中99%拥有金融或经济本科学历，70%持有基金从业资格或证券从业资格认证。以多年服务金融机构的历史经验积累为依托，团队支持高客理财服务、智能投资顾问、投研解读、金融产品管理以及保险内容评测等应用场景，帮助某券商客户将模型推理准确率提升了25%以上。团队目前还持续在金融领域进行前置资源储备，可以迅速响应客户业务的新需求，同时在数据安全合规、质量体系认证等各类资质认证方面也十分完备。</p> 
<p> <b>数理垂类：逻辑与算法攻坚</b> </p> 
<p>澳鹏数理团队由数理竞赛获奖者组成，包括全国大学生数学、物理、化学、建模竞赛一/二等奖获得者，擅长高数证明、物理学研究和应用、化学材料学、生物医学等数物化生领域模型评估。团队拥有丰富的项目实战经验，包括：实验室模型解题判断，模型性能评估（数物化生），大学数物化生考题标注等，助力模型提升解题能力，高效解决复杂数理问题；同时，支持个性化学习和自动化猜想生成，快速验证海量猜想，推动数学探索。</p> 
<p> <b>音乐垂类：艺术与技术的平衡</b> </p> 
<p>澳鹏音乐团队拥有数十名全职人员及超过500位兼职音乐人，涵盖作曲、声乐、音响工程、声音设计、音乐学、音乐表演等多个专业领域。团队成员具备丰富的音乐项目经验，涵盖编曲、标注、制谱、问答、打轴、评测、检索及音视频匹配等多个方面，能够高质量地完成项目交付。</p> 
<p> <b>多语言垂类：全球化交付能力</b> </p> 
<p>澳鹏多语言垂类团队成员来自标注、翻译、贸易、教培、新媒体等专业领域，全职员工支持英语、西班牙语、俄语、日语、韩语、法语、德语、波兰语、阿拉伯语、意大利语、葡萄牙语、泰语、马来西亚语、印尼语、越南语、菲律宾语、土耳其语等20多个语种，大部分成员为双语或多语人才并获得国内外认可的中高/最高等级以上证书；团队同时具备来自世界各地的数百万兼职人员，覆盖全球200多种语言，具备丰富的多语言项目交付经验。澳鹏在国内及海外均设有自营的交付中心，支持高数安项目室配置，可覆盖标注、翻译、审核、客服等全类型多语言数据服务。</p> 
<p> <b>TTS</b> <b>垂类：高保真语音数据</b> </p> 
<p>澳鹏在TTS领域拥有数十个国家、数百小时的采集经验，涵盖中文普通话、方言、东南亚地区、日韩地区、欧美地区的各类语言及歌曲。声优均具备超过5年配音经验，涉及TTS录制、影视剧配音、新闻主持、游戏解说等多个领域。澳鹏录音棚覆盖全国主要城市，均具备NC-20以及RT60＜100ms的声学环境和行业标准的录音设备。</p> 
<p> <b>文学垂类：跨模态文化理解</b> </p> 
<p>澳鹏文学团队由来自985/211高校的文学人才组成，涵盖汉语言文学、传播学等专业，团队成员均具备深刻的文学理解与鉴赏能力，支持跨领域多模态融合与创新、情感交互与智能推荐系统等领域大模型的发展，例如，团队帮助某网文平台将内容生成效率提升40%以上。</p> 
<p>在大模型技术快速发展的今天，高质量、高专业度的垂类数据已成为推动AI技术从通用领域向垂直领域落地的关键。澳鹏（中国）凭借在9大垂类领域的深厚积累，通过&quot;技术平台+垂类专家+全球化资源&quot;的三重优势，持续为客户提供专业、安全、高精度的数据服务。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"></div> 
<img alt="" src="https://rt.prnewswire.com/rt.gif?NewsItemId=ZH83257&amp;Transmission_Id=202505080408PR_NEWS_ASPR_____ZH83257&amp;DateId=20250508" style="border:0px; width:1px; height:1px;" />]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏亮相2025中国生成式AI大会，以数据赋能大模型垂类应用新纪元</title>
		<author></author>
		<pubDate>2025-04-10 19:55:00</pubDate>
		<description><![CDATA[上海2025年4月10日 /美通社/ 
-- 4月1日-2日，2025中国生成式AI大会在北京圆满举行，汇聚超过50位产学研界重量级嘉宾，深度解构DeepSeek引发的变革狂潮，全面展示深度推理模型、多模态模型、智能体及具身智能等前沿领域的最新进展。大会以"大拐点 
新征程"为主题，吸引了1500余名现场观众，线上观看人次更是突破百万，成为国内AI领域最具影响力的产业峰会之一。澳鹏Appen作为AI数据服务行业的领军企业重磅亮相，分享了大模型时代数据服务的前沿洞察与实践经验。

澳鹏重磅亮相 展示数据硬实力


2025中国生成式AI大会由智猩猩、智东西共同发起。澳鹏Appen携全面的大模型数据解决方案亮相大会，展示了如何以专业、精准、安全的高质量训练数据赋能大模型开发，特别是在垂直领域的深度应用。澳鹏展位吸引了众多参会者驻足交流，尤其是来自金融、医疗、法律等垂直行业的专业人士。

 <https://mma.prnasia.com/media2/2661942/image_5014143_40876502.html>
澳鹏展位吸引众多参会者驻足交流

澳鹏Appen 
2024年年报显示：中国业务营收突破4.2亿，年增长达到71%，其中大模型/AIGC业务增长了526%，几乎所有行业龙头，特别是大模型AI企业都成为了澳鹏的客户。展会期间，澳鹏团队与与会者共同探讨高质量训练数据如何赋能大模型在垂直领域的精准应用，为金融风控、医疗诊断、法律检索等专业场景提供更智能、更可靠的解决方案。

澳鹏副总裁董成发表精彩演讲


在大模型峰会上，澳鹏Appen中国及韩国区副总裁董成发表了题为《大模型时代的AI数据服务》的主题演讲，通过澳鹏在各领域大模型部署中的数据训练最佳实践，分享了对大模型应用趋势的深刻观察。

董成指出，以AI 
Agent为代表，未来大模型必定会深度应用到金融、医疗、代码、音乐、文学等具体垂直领域中。这一趋势对数据的高质量、专业度和多垂类覆盖提出了越来越高的要求。面对这一挑战，澳鹏提供了多种AI辅助的前沿数据采标工具和方案，包括文本对话、多模态交互、思维链推理工具等，以满足不同垂直领域的专业化需求。

 <https://mma.prnasia.com/media2/2661943/image_5014143_40876518.html>
澳鹏副总裁董成发表精彩演讲


"大模型愈往垂类应用端发力，对数据质量要求愈高，"董成强调，"在通用语言任务上，第一梯队模型的性能已经趋于一致，开源模型如Llama和DeepSeek的性能已经赶上甚至超过部分闭源模型。但在更复杂的垂直领域任务中，高质量的专业数据将成为决定模型性能的关键因素。"

澳鹏全面大模型数据解决方案

在演讲中，董成系统介绍了澳鹏全面的大模型数据解决方案，覆盖从通用能力到垂直领域的全链条数据需求，包括：


全面的大模型数据生产工具链：澳鹏开发了覆盖文本对话、图像/视频描述、多模态融合、思维链和工具调用等场景的专业数据生产工具，满足大模型训练对多样化数据类型的需求。

智能体训练数据生产：针对快速发展的AI智能体领域，澳鹏专门开发了针对GUI Agent的数据解决方案，支持智能体在多步骤任务中的数据训练需求。

 <https://mma.prnasia.com/media2/2661944/image_5014143_40876549.html>
澳鹏GUI Tracker采集工具


自动化数据标注回环：澳鹏采用"以AI赋能AI"的开发策略，通过自研的预标注大模型与不同领域项目实践相结合，构建了自动化数据标注回环系统，大幅提升数据生产效率。


高质量成品数据集：澳鹏提供大规模、高质量、多模态的成品数据集，包括多模态多步骤思维链数据集、千万级多语种平行语料数据集、千万级知识百科和垂类问答数据集、千万级代码数据集、亿级高质量学科题目数据集以及百万级图像文本多模态数据集等。这些数据集为大模型的快速迭代提供了丰富的数据养料。


澳鹏Appen中国及韩国区副总裁董成表示："澳鹏已在金融、医疗、法律、代码、音乐等9大垂直领域建立了专业团队，确保我们能够为各垂直领域的大模型训练提供高度专业化的数据支持，帮助客户在特定领域实现模型性能的突破。"


2025中国生成式AI大会的成功举办，彰显了高质量数据作为大模型发展核心引擎的重要价值。作为AI数据服务领域的领军者，澳鹏Appen始终以专业、精准、安全的高质量训练数据为全球AI部署提供强劲动力。站在大模型技术爆发与垂类应用落地的关键节点，澳鹏Appen将持续致力于为AI应用开发和落地打造坚实的数据基石，助力中国大模型产业在通用与垂直领域实现协同突破。

 

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2025年4月10日</span> /美通社/ --&nbsp;4月1日-2日，2025中国生成式AI大会在北京圆满举行，汇聚超过50位产学研界重量级嘉宾，深度解构DeepSeek引发的变革狂潮，全面展示深度推理模型、多模态模型、智能体及具身智能等前沿领域的最新进展。大会以&quot;大拐点 新征程&quot;为主题，吸引了1500余名现场观众，线上观看人次更是突破百万，成为国内AI领域最具影响力的产业峰会之一。澳鹏Appen作为AI数据服务行业的领军企业重磅亮相，分享了大模型时代数据服务的前沿洞察与实践经验。</p> 
<p><b>澳鹏重磅亮相</b>&nbsp;<b>展示数据硬实力</b></p> 
<p>2025中国生成式AI大会由智猩猩、智东西共同发起。澳鹏Appen携全面的大模型数据解决方案亮相大会，展示了如何以专业、精准、安全的高质量训练数据赋能大模型开发，特别是在垂直领域的深度应用。澳鹏展位吸引了众多参会者驻足交流，尤其是来自金融、医疗、法律等垂直行业的专业人士。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9410"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2661942/image_5014143_40876502.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2661942/image_5014143_40876502.jpg?p=medium600" title="澳鹏展位吸引众多参会者驻足交流" alt="澳鹏展位吸引众多参会者驻足交流" /></a><br /><span>澳鹏展位吸引众多参会者驻足交流</span></p> 
</div> 
<p>澳鹏Appen 2024年年报显示：中国业务营收突破4.2亿，年增长达到71%，其中大模型/AIGC业务增长了526%，几乎所有行业龙头，特别是大模型AI企业都成为了澳鹏的客户。展会期间，澳鹏团队与与会者共同探讨高质量训练数据如何赋能大模型在垂直领域的精准应用，为金融风控、医疗诊断、法律检索等专业场景提供更智能、更可靠的解决方案。</p> 
<p><b>澳鹏副总裁董成发表精彩演讲</b></p> 
<p>在大模型峰会上，澳鹏Appen中国及韩国区副总裁董成发表了题为《大模型时代的AI数据服务》的主题演讲，通过澳鹏在各领域大模型部署中的数据训练最佳实践，分享了对大模型应用趋势的深刻观察。</p> 
<p>董成指出，以AI Agent为代表，未来大模型必定会深度应用到金融、医疗、代码、音乐、文学等具体垂直领域中。这一趋势对数据的高质量、专业度和多垂类覆盖提出了越来越高的要求。面对这一挑战，澳鹏提供了多种AI辅助的前沿数据采标工具和方案，包括文本对话、多模态交互、思维链推理工具等，以满足不同垂直领域的专业化需求。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder4661"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2661943/image_5014143_40876518.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2661943/image_5014143_40876518.jpg?p=medium600" title="澳鹏副总裁董成发表精彩演讲" alt="澳鹏副总裁董成发表精彩演讲" /></a><br /><span>澳鹏副总裁董成发表精彩演讲</span></p> 
</div> 
<p>&quot;大模型愈往垂类应用端发力，对数据质量要求愈高，&quot;董成强调，&quot;在通用语言任务上，第一梯队模型的性能已经趋于一致，开源模型如Llama和DeepSeek的性能已经赶上甚至超过部分闭源模型。但在更复杂的垂直领域任务中，高质量的专业数据将成为决定模型性能的关键因素。&quot;</p> 
<p><b>澳鹏全面大模型数据解决方案</b></p> 
<p>在演讲中，董成系统介绍了澳鹏全面的大模型数据解决方案，覆盖从通用能力到垂直领域的全链条数据需求，包括：</p> 
<p>全面的大模型数据生产工具链：澳鹏开发了覆盖文本对话、图像/视频描述、多模态融合、思维链和工具调用等场景的专业数据生产工具，满足大模型训练对多样化数据类型的需求。</p> 
<p>智能体训练数据生产：针对快速发展的AI智能体领域，澳鹏专门开发了针对GUI Agent的数据解决方案，支持智能体在多步骤任务中的数据训练需求。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6733"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2661944/image_5014143_40876549.html" target="_blank" rel="nofollow" style="color: #0000FF"><img src="https://mma.prnasia.com/media2/2661944/image_5014143_40876549.jpg?p=medium600" title="澳鹏GUI Tracker采集工具" alt="澳鹏GUI Tracker采集工具" /></a><br /><span>澳鹏GUI Tracker采集工具</span></p> 
</div> 
<p>自动化数据标注回环：澳鹏采用&quot;以AI赋能AI&quot;的开发策略，通过自研的预标注大模型与不同领域项目实践相结合，构建了自动化数据标注回环系统，大幅提升数据生产效率。</p> 
<p>高质量成品数据集：澳鹏提供大规模、高质量、多模态的成品数据集，包括多模态多步骤思维链数据集、千万级多语种平行语料数据集、千万级知识百科和垂类问答数据集、千万级代码数据集、亿级高质量学科题目数据集以及百万级图像文本多模态数据集等。这些数据集为大模型的快速迭代提供了丰富的数据养料。</p> 
<p>澳鹏Appen中国及韩国区副总裁董成表示：&quot;澳鹏已在金融、医疗、法律、代码、音乐等9大垂直领域建立了专业团队，确保我们能够为各垂直领域的大模型训练提供高度专业化的数据支持，帮助客户在特定领域实现模型性能的突破。&quot;</p> 
<p>2025中国生成式AI大会的成功举办，彰显了高质量数据作为大模型发展核心引擎的重要价值。作为AI数据服务领域的领军者，澳鹏Appen始终以专业、精准、安全的高质量训练数据为全球AI部署提供强劲动力。站在大模型技术爆发与垂类应用落地的关键节点，澳鹏Appen将持续致力于为AI应用开发和落地打造坚实的数据基石，助力中国大模型产业在通用与垂直领域实现协同突破。</p> 
<p>&nbsp;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>超级周期启动！澳鹏中国全年营收破4亿，超前布局大模型平台与垂类知识</title>
		<author></author>
		<pubDate>2025-03-11 17:55:00</pubDate>
		<description><![CDATA[上海2025年3月11日 /美通社/ -- 
2025年初，开源大模型DeepSeek迅速从科技界扩展到所有经济领域，成为提升经济效率和增长的新基石。麦肯锡报告指出，大模型和生成式AI可推动全球生产力每年提升0.1%-0.6%。高盛今年3月预测，DeepSeek-R1的普及有望在未来十年内推动中国上市企业股票整体盈利每年提高2.5%。


大模型与生成式AI无疑已经成为实实在在的效率和增长引擎，而DeepSeek的问世则证明了算力和算法对于大模型普及的制约正在迅速降低，规模化的高质量标注数据特别是行业垂直领域（垂类）数据，正在成为大模型普及的下一个战场。
2025年2月底澳鹏发布的年报显示：2024年公司中国业务营收突破4.2亿，年增长达到71% ，其中的大模型/AIGC业务增长了526%，几乎所有AI
龙头，特别是大模型 AI企业都成为了澳鹏的客户。

 <https://mma.prnasia.com/media2/2637687/image_5014143_32507724.html>
图片来源：Appen公司2024年财报，单位：百万美元


澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，在大模型启动AI数据服务超级周期的大门时，全球"知识"资源+高速技术迭代+高安全合规正在重新定义AI数据服务行业，所有的供应商都被重新洗牌，传统人力资源型服务商正被迅速边缘化，全力投入高质量技术研发和产品、实现供给全球"知识"资源、确保国内外数据合规和安全的AI数据服务商才能真正接住超级周期的大盘。澳鹏中国将持之以恒地全力投入技术研发、垂直领域、全球资源布局和数据合规与安全等方向，与AI龙头企业一起夯实新十年的增长路径。

超级周期正式启动


2022年底，ChatGPT横扫全球，开启了全球AI超级周期的序幕。高盛2025年2月的研究显示，自2022年11月ChatGPT面市以来，美国股市飙升50%，科技股市值增加13万亿美元，催生了美国历史上最强劲的牛市之一。而开源大模型DeepSeek引领的第二波浪潮，以更低成本实现接近GPT-4和Claude的高性能，加速了全社会对大模型的采用。到2025年2月，全球已有超过200家公司接入DeepSeek，涵盖互联网巨头、电信运营商、金融科技企业、车企及政府部门。


澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，与全球大模型更侧重通用性和多语言多语种模型泛化的模式不同，中国大模型更侧重"通用+垂直领域"，这意味着中国大模型在未来行业应用场景、特定垂直领域创新方面独树一帜，也更在"局部领域"更容易实现 
AI 垂类实践的突破，对特定行业和社会生产力的大幅快速提升。

在通用领域，中国大模型取得了显著突破。根据智源研究院2024年底的"百模"评测，豆包文生图模型和视频生成模型分别位列全球第二，腾讯Hunyuan 
Image文生图、快手可灵1.5文生视频、阿里巴巴Qwen2-Audio语音语言水平均位居全球第一。在垂直领域，以DeepSeek为代表的中国大模型正深入传统行业，如多地12345热线接入后效率大幅提升，镇江超级大脑单日数据处理量相当于全市公务员10年工作量，天津地铁接入后故障发生率降低50%等等。

在DeepSeek等一系列 AI 
大模型创新影响下，技术进步、应用生态、生产关系和生产力变革这三者正在形成闭环共振，形成从技术进步到生产力提升的"超级周期"，其中包括了超级AI周期、超级经济周期以及激活的超级AI数据服务周期。Gartner在2025年2月发布预测，认为到2028年，中国企业对人工智能就绪型数据（特别是非结构化数据）的投资将达到2024年的20倍！

AI数据服务市场洗牌，行业龙头浮出水面


在ChatGPT阶段，大模型的瓶颈已经从算力和算法推进到了数据；在DeepSeek阶段，高质量数据进一步成为大模型的"燃料"。2024年底，就在DeepSeek即将横扫全球前夕，中国国家发改委等部门发布了《关于促进数据标注产业高质量发展的实施意见》，引发了全社会对于数据标注的关注，迅速引爆了数据标注行业的热度，市场认为数据标注行业井喷在即。


作为AI数据服务行业龙头企业，澳鹏Appen公司的2024年全年报显示，经调整后的公司年增长16%、2024年下半年大模型收入占28%。在澳鹏中国，大模型及大模型相关业务已经占据了营收的40%。澳鹏自2023年中旬推出大模型相关产品和服务，仅仅一年多的时间发展成为了第一大业务，用"爆发"形容并不为过。2024年，澳鹏中国全年实现了4.2亿人民币营收，其中大模型及大模型相关业务营收达到1亿人民币。

 <https://mma.prnasia.com/media2/2637688/image_5014143_32507756.html>



在被大模型"泼天富贵"砸中的同时，澳鹏清醒地看到了整个AI数据服务行业的洗牌。过去AI数据标注行业是手工作坊模式，国内有上千家服务商，主要是人力资源密集型，技术含量低，市场竞争激烈。


澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，"大模型对于AI数据服务的综合能力的要求比过去上了几个台阶，亿量级别数据（知识）的采集标注、数据高质量的精细化管理、数据复杂度和多样性与模型泛化的矛盾、国内外数据安全与合规风险的升级、海外标注交付能力等等，都要求服务商具备更强的技术能力、平台与产品，‘全球+技术+管理+垂类知识'的多维AI数据服务模式将逐步淘汰过去的单纯的低端人力资源、单一区域密集型模式。"

"出海"和全球化是中国AI客户的战略布局之一。澳鹏中国目前在全球有9大高信安交付基地， 
布局北美、欧洲、东南亚、中国等，同时更有覆盖170+国家，290+种语言的超百万的众包资源，已经是中国头部的AI客户在海外市场的"攻城略地"的长期和信任AI数据合作伙伴。田小鹏博士认为："真正的AI市场，不仅在国内，更在广阔的全球。"


澳鹏是少数最早投资技术和技术平台的AI数据标注服务商之一，澳鹏中国自2019年成立以来十分坚定投资技术，成立5年来向技术研发投资了1.1亿人民币，先后开发了MatrixGo企业级高精度数据标注平台以及大模型智能开发平台，通过双技术平台的建设，实现了效率、质量和安全性方面的显著优势，抢得了市场先机。


大模型对于标注数据的范围、量级和复杂性要求，远远超过了之前的AI小模型。田小鹏博士认为：原先的AI小模型都是项目制，而大模型是一个世界通用模型，要解决所有人类的问题甚至是对未来的思考，涉及范围"匪夷所思"、远超想象；大模型对于标注数据量级要求则是上亿条甚至是几十亿条的海量级，远超之前AI小模型的几百、几千条；而基础大模型的学习速度非常快，一两年内就能消耗完所有的公开信息，接下来的难点在于专业和私域数据。


正是由于大模型对于标注数据的要求直接从TB级跃升到PB级、从单一模态和简单标注跨越到多模态数据（文本、图像、语音等）和复杂的标注任务（如多轮对话、思维链标注等），急需金融、法律、医疗、音乐、文学、数理、代码、美学艺术等垂直领域的更高水平的专业知识等，这些都要求数据标注服务商具有强大的技术平台和研发能力，通过智能化的标注平台承载大模型"匪夷所思"的需求。除了开发智能标注工具和平台外，澳鹏对技术的投资还包括构建多模态数据湖，统一管理文本、图像、音频等异构数据，支持灵活的数据组合与实验，以及强化伦理与合规框架等。


自2023年率先在AI数据服务行业中推出大模型智能开发平台以来，几乎所有的互联网、科技、AI和大模型头部客户都找到了澳鹏，与澳鹏团队捆绑式紧密合作，共同应对大模型的数据洪流。例如，基于澳鹏大模型平台多模态数据处理能力，澳鹏为某AI科技厂商提供图像文本描述数据服务工作，提供高质量图文对超过50亿对，充分满足了图文大模型的数据需求。正是"笨鸟先飞"，提前"押注"投资技术和研发，让澳鹏在行业洗牌中脱颖而出，跃升为行业龙头。

战略投资两大方向，布局新十年超级周期


虽然公司在2024年取得了跨越式发展，但澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士认为，以DeepSeek等大模型为代表的大模型红利才刚刚开始，AI数据服务行业将进入10-20年的景气周期，澳鹏中国将在技术、交付、安全和渠道等方向持续布局，其中的战略重点是技术和交付。而澳鹏作为AI数据服务行业的龙头，其面向未来十年超级周期的布局，也将影响整个行业的发展方向。

 <https://mma.prnasia.com/media2/2637689/image_5014143_32507788.html>
澳鹏（中国）在2024世界人工智能大会（WAIC2024）


技术和研发是澳鹏中国持续性战略投资的重要方向。田小鹏博士表示，技术是绝对生产力，未来5年，澳鹏中国将向研发再投入2-3亿元人民币，以确保公司在大模型超级周期中的持续竞争力，公司也将持续转型为算法辅助型、深化垂直领域的数据服务能力，同时通过人机协同模式提升数据标注的专业性和准确性。


澳鹏中国研发负责人、产品和工程副总裁钱程介绍，公司目前80%以上的研发人员都参与了大模型相关的研发任务，主要研发方向包括面向大模型的数据服务平台、面向大模型的数据标注工具以及大模型相算法的研发和应用等。2025年，澳鹏中国将投入研发资源打造智能化成品数据集生产管理平台，通过自动化的数据标注、清洗挖掘和质量评估快速构建大规模高质量成品数据集，为大模型的模型训练提供高质量数据养料。


此外，随着大模型应用向垂直领域的不断深入，澳鹏中国将结合自身在大模型和各垂直领域数据服务中积累的丰富经验，研发高精尖垂类数据标注平台，澳鹏中国计划在2025年上半年推出专业的大模型医疗数据标注平台和具身智能数据标注平台，进一步赋能垂直领域客户构建高质量模型训练数据。


当前正处于超级周期的启动阶段，大模型发展迅猛且竞争激烈。许多AI数据标注项目具有实验性质，澳鹏需要迅速调整相关的平台和资源以适应不同的数据需求。钱程指出，大模型的发展，尤其在后训练阶段非常迅速，客户不断尝试新方法以优化效果。澳鹏团队与客户紧密合作，支持模型训练的数据需求，助力模型能力的不断提升。


对于尝试性实验项目，澳鹏需要迅速构建数据处理工具和工作流程，采集和标注数据，并进行结果训练和验证。这需要一个灵活的平台工作流、自定义标注模板和敏捷的项目管理。澳鹏的大模型智能开发平台通过自定义模板引擎，能够在几分钟内快速配置数据标注模板，而定制化小型工具的开发则可在几天到一周内完成。


钱程指出，客户需求快速迭代，创意层出不穷，澳鹏的产品研发团队为深度参与在这一快速发展的赛道而感到兴奋。一方面，他们积极跟进国内外大模型训练的技术变化；另一方面，与客户实时交流前沿发展趋势，共同探讨数据服务的构建方法。


"以AI赋能AI"是澳鹏产品研发团队不断提升数据服务效率的宗旨，为了提升团队的生产力和效率，澳鹏在数据处理和生产管理中广泛应用大模型，替代传统算法。这不仅大幅提高了技术和工程团队的代码编写效率，还帮助数据交付部门提升了数据服务和项目管理的智能化水平。


在大模型时代，尽管之前有不少科技企业都有自己的数据标注工具或平台，但随着大模型和生成式AI需求的激增，企业越来越依赖澳鹏这样的外部专业数据平台和服务商，既能满足不断变化的工具和平台开发需求，又能结合垂直领域专业标注人员的RHLF强化学习，一体化满足大模型和生成式AI的持续迭代要求。

面向垂直领域的交付能力也是澳鹏的战略投资方向。继通用知识后，专业知识是大模型下一步的重点发展领域。澳鹏在已有垂直领域能力的基础上， 
2024年开辟了金融、法律、音乐、多语种、文学、TTS、数学、医疗、代码等九个大模型垂直领域团队，专门负责开发和培养这些垂直领域的复合型人才，以及承担相应的数据服务项目。


什么是面向垂直领域的复合型人才？简单理解就是对传统垂直领域的人才进行培养，例如金融、法律、医疗、音乐等，让专业领域人才理解AI与大模型、AI数据与AI数据项目交付等技术和项目管理实践，将专业领域知识与AI和数据项目交付结合起来，从而更好地服务客户大模型对于多种垂直领域数据的需求。这些专业人才不仅能够完成更高质量、更专业的数据标注，更能从专业逻辑上满足大模型推理的连贯性要求。


澳鹏中国在医疗AI领域布局近5年，为国内最早在医疗AI领域大规模投入的公司，拥有500+全职医疗专业人员和1000+众包团队，覆盖临床医学、中医、中西医、护理、药学、心理、营养学等多个学科，已为国内30多个客户交付500+医学项目、超1000万条数据。


自2023年下半年起，澳鹏组建了400+金融背景全职团队，其中拥有金融、经济或财会学本科及以上学历占比99%，70%持有基金或证券从业资格，支持风险管控、数据分析等金融应用开发，并具备完善的数据安全合规体系。


2024年，澳鹏在代码大模型领域取得显著增长，拥有120+全职技术人员覆盖主流编程语言，提供代码生成、调试等服务，业务扩展至能力评估、运维、测试等场景，团队规模翻倍，并持续积累高质量代码数据集，确保代码模型在多种编程场景和任务类型上的泛化能力。


此外，澳鹏在大模型各垂类领域都拥有丰富的专业人才资源：在法律领域，拥有专业的法律人才，涵盖法律检索、庭审、风控体系建设等核心能力；多语言领域，团队覆盖200+语种，具备丰富的多语言项目交付经验；音乐领域，拥有500+兼职音乐专业人员支持编曲、标注、制谱等任务；TTS领域，拥有数十个国家TTS采集经验，录音棚覆盖全国主要城市；文学领域，团队成员均具备深刻的文学理解与鉴赏能力，支持跨领域多模态融合与创新、情感交互与智能推荐系统等领域大模型的发展……澳鹏凭借强大的专业团队和丰富经验，持续为大模型提供高质量数据支持。


值得一提的是，在专业人才招聘方面，澳鹏面向各个垂直领域，不仅有强大的全职招聘团队，在中国无锡、大连、重庆，在海外菲律宾、越南、印度、马来、英国、美国等部署高信安基地，还有独有海内外的众包资源和 
2000+家供应商合作伙伴渠道，也与数百家学校展开深入合作，部署垂直领域人才的前置实训培养，从而更好地储备人才。

数据安全和合规一直是澳鹏的强项，特别是 2024 年澳鹏中国取得了中国 AI 数据行业首家 ISO 37301合规管理体系认证，覆盖 AI 
数据采集、数据标注和劳动合规等领域，这是继澳鹏中国在 ISO 27001安全合规、ISO 27701个人和隐私安全合规、ISO45001 
职业健康安全等进一步夯实和固守合规底线。澳鹏不断地强化安全合规举措，为所有客户提供安全、可持续的数据服务，田小鹏博士表示，2024 年澳鹏各个基地顺利通过了 
50+多次的客户"飞检"和现场审计，为客户的大模型高数安要求保驾护航。

 <https://mma.prnasia.com/media2/2637690/image_5014143_32507819.html>
澳鹏获全国数据交易联盟“年度优秀数据要素创新企业奖”

总结而言
：随着以DeepSeek开源大模型为代表的大模型第二波浪潮刚刚开始，一个真正的技术、经济和数据的超级周期才正式启动。在大模型第一波浪潮中，启动的主要是AI和科技公司；而在大模型第二波浪潮中，启动的将是所有行业领域的公司和政府机构，并将从中国聚焦到全球拓展，形成了从技术进步到生产力提升再到营收增长以及更多技术投资的正向循环。


在超级周期的正向循环中，数据真正成为了经济增长的"燃料"，一个AI数据服务的多年期蓝海正在形成。田小鹏博士表示，"到2030 年，澳鹏中国制定了非常远大的营收目标——20+ 亿人民币，更重要的是澳鹏中国将不遗余力地成就我们中国 AI 客户，通过持续创新让中国的 AI 的产品和服务能领先于世界！"

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2025年3月11日</span> /美通社/ -- 2025年初，开源大模型DeepSeek迅速从科技界扩展到所有经济领域，成为提升经济效率和增长的新基石。麦肯锡报告指出，大模型和生成式AI可推动全球生产力每年提升0.1%-0.6%。高盛今年3月预测，DeepSeek-R1的普及有望在未来十年内推动中国上市企业股票整体盈利每年提高2.5%。</p> 
<p>大模型与生成式AI无疑已经成为实实在在的效率和增长引擎，而DeepSeek的问世则证明了算力和算法对于大模型普及的制约正在迅速降低，规模化的高质量标注数据特别是行业垂直领域（垂类）数据，正在成为大模型普及的下一个战场。<b>2025</b><b>年</b><b>2</b><b>月底澳鹏发布的年报显示：</b><b>2024</b><b>年公司中国业务营收突破</b><b>4.2</b><b>亿，年增长达到</b><b>71% </b><b>，其中的大模型</b><b>/AIGC</b><b>业务增长了</b><b>526%</b><b>，几乎所有</b><b>AI</b><b>龙头，特别是大模型</b><b> AI</b><b>企业都成为了澳鹏的客户。</b></p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder1550"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2637687/image_5014143_32507724.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2637687/image_5014143_32507724.jpg?p=medium600" title="图片来源：Appen公司2024年财报，单位：百万美元" alt="图片来源：Appen公司2024年财报，单位：百万美元" /></a><br /><span>图片来源：Appen公司2024年财报，单位：百万美元</span></p> 
</div> 
<p>澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，在大模型启动AI数据服务超级周期的大门时，全球&quot;知识&quot;资源+高速技术迭代+高安全合规正在重新定义AI数据服务行业，所有的供应商都被重新洗牌，传统人力资源型服务商正被迅速边缘化，全力投入高质量技术研发和产品、实现供给全球&quot;知识&quot;资源、确保国内外数据合规和安全的AI数据服务商才能真正接住超级周期的大盘。澳鹏中国将持之以恒地全力投入技术研发、垂直领域、全球资源布局和数据合规与安全等方向，与AI龙头企业一起夯实新十年的增长路径。</p> 
<p><b>超级周期正式启动</b></p> 
<p>2022年底，ChatGPT横扫全球，开启了全球AI超级周期的序幕。高盛2025年2月的研究显示，自2022年11月ChatGPT面市以来，美国股市飙升50%，科技股市值增加13万亿美元，催生了美国历史上最强劲的牛市之一。而开源大模型DeepSeek引领的第二波浪潮，以更低成本实现接近GPT-4和Claude的高性能，加速了全社会对大模型的采用。到2025年2月，全球已有超过200家公司接入DeepSeek，涵盖互联网巨头、电信运营商、金融科技企业、车企及政府部门。</p> 
<p>澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，与全球大模型更侧重通用性和多语言多语种模型泛化的模式不同，中国大模型更侧重&quot;通用+垂直领域&quot;，这意味着中国大模型在未来行业应用场景、特定垂直领域创新方面独树一帜，也更在&quot;局部领域&quot;更容易实现 AI 垂类实践的突破，对特定行业和社会生产力的大幅快速提升。</p> 
<p>在通用领域，中国大模型取得了显著突破。根据智源研究院2024年底的&quot;百模&quot;评测，豆包文生图模型和视频生成模型分别位列全球第二，腾讯Hunyuan Image文生图、快手可灵1.5文生视频、阿里巴巴Qwen2-Audio语音语言水平均位居全球第一。在垂直领域，以DeepSeek为代表的中国大模型正深入传统行业，如多地12345热线接入后效率大幅提升，镇江超级大脑单日数据处理量相当于全市公务员10年工作量，天津地铁接入后故障发生率降低50%等等。</p> 
<p>在DeepSeek等一系列 AI 大模型创新影响下，技术进步、应用生态、生产关系和生产力变革这三者正在形成闭环共振，形成从技术进步到生产力提升的&quot;超级周期&quot;，其中包括了超级AI周期、超级经济周期以及激活的超级AI数据服务周期。Gartner在2025年2月发布预测，认为到2028年，中国企业对人工智能就绪型数据（特别是非结构化数据）的投资将达到2024年的20倍！</p> 
<p><b>AI</b><b>数据服务市场洗牌，行业龙头浮出水面</b></p> 
<p>在ChatGPT阶段，大模型的瓶颈已经从算力和算法推进到了数据；在DeepSeek阶段，高质量数据进一步成为大模型的&quot;燃料&quot;。2024年底，就在DeepSeek即将横扫全球前夕，中国国家发改委等部门发布了《关于促进数据标注产业高质量发展的实施意见》，引发了全社会对于数据标注的关注，迅速引爆了数据标注行业的热度，市场认为数据标注行业井喷在即。</p> 
<p>作为AI数据服务行业龙头企业，澳鹏Appen公司的2024年全年报显示，经调整后的公司年增长16%、2024年下半年大模型收入占28%。在澳鹏中国，大模型及大模型相关业务已经占据了营收的40%。澳鹏自2023年中旬推出大模型相关产品和服务，仅仅一年多的时间发展成为了第一大业务，用&quot;爆发&quot;形容并不为过。2024年，澳鹏中国全年实现了4.2亿人民币营收，其中大模型及大模型相关业务营收达到1亿人民币。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9034"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2637688/image_5014143_32507756.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2637688/image_5014143_32507756.jpg?p=medium600" title="" alt="" /></a><br /><span></span></p> 
</div> 
<p>在被大模型&quot;泼天富贵&quot;砸中的同时，澳鹏清醒地看到了整个AI数据服务行业的洗牌。过去AI数据标注行业是手工作坊模式，国内有上千家服务商，主要是人力资源密集型，技术含量低，市场竞争激烈。</p> 
<p>澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，&quot;大模型对于AI数据服务的综合能力的要求比过去上了几个台阶，亿量级别数据（知识）的采集标注、数据高质量的精细化管理、数据复杂度和多样性与模型泛化的矛盾、国内外数据安全与合规风险的升级、海外标注交付能力等等，都要求服务商具备更强的技术能力、平台与产品，‘全球+技术+管理+垂类知识'的多维AI数据服务模式将逐步淘汰过去的单纯的低端人力资源、单一区域密集型模式。&quot;</p> 
<p>&quot;出海&quot;和全球化是中国AI客户的战略布局之一。澳鹏中国目前在全球有9大高信安交付基地， 布局北美、欧洲、东南亚、中国等，同时更有覆盖170+国家，290+种语言的超百万的众包资源，已经是中国头部的AI客户在海外市场的&quot;攻城略地&quot;的长期和信任AI数据合作伙伴。田小鹏博士认为：&quot;真正的AI市场，不仅在国内，更在广阔的全球。&quot;</p> 
<p>澳鹏是少数最早投资技术和技术平台的AI数据标注服务商之一，澳鹏中国自2019年成立以来十分坚定投资技术，成立5年来向技术研发投资了1.1亿人民币，先后开发了MatrixGo企业级高精度数据标注平台以及大模型智能开发平台，通过双技术平台的建设，实现了效率、质量和安全性方面的显著优势，抢得了市场先机。</p> 
<p>大模型对于标注数据的范围、量级和复杂性要求，远远超过了之前的AI小模型。田小鹏博士认为：原先的AI小模型都是项目制，而大模型是一个世界通用模型，要解决所有人类的问题甚至是对未来的思考，涉及范围&quot;匪夷所思&quot;、远超想象；大模型对于标注数据量级要求则是上亿条甚至是几十亿条的海量级，远超之前AI小模型的几百、几千条；而基础大模型的学习速度非常快，一两年内就能消耗完所有的公开信息，接下来的难点在于专业和私域数据。</p> 
<p>正是由于大模型对于标注数据的要求直接从TB级跃升到PB级、从单一模态和简单标注跨越到多模态数据（文本、图像、语音等）和复杂的标注任务（如多轮对话、思维链标注等），急需金融、法律、医疗、音乐、文学、数理、代码、美学艺术等垂直领域的更高水平的专业知识等，这些都要求数据标注服务商具有强大的技术平台和研发能力，通过智能化的标注平台承载大模型&quot;匪夷所思&quot;的需求。除了开发智能标注工具和平台外，澳鹏对技术的投资还包括构建多模态数据湖，统一管理文本、图像、音频等异构数据，支持灵活的数据组合与实验，以及强化伦理与合规框架等。</p> 
<p>自2023年率先在AI数据服务行业中推出大模型智能开发平台以来，几乎所有的互联网、科技、AI和大模型头部客户都找到了澳鹏，与澳鹏团队捆绑式紧密合作，共同应对大模型的数据洪流。例如，基于澳鹏大模型平台多模态数据处理能力，澳鹏为某AI科技厂商提供图像文本描述数据服务工作，提供高质量图文对超过50亿对，充分满足了图文大模型的数据需求。正是&quot;笨鸟先飞&quot;，提前&quot;押注&quot;投资技术和研发，让澳鹏在行业洗牌中脱颖而出，跃升为行业龙头。</p> 
<p><b>战略投资两大方向，布局新十年超级周期</b></p> 
<p>虽然公司在2024年取得了跨越式发展，但澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士认为，以DeepSeek等大模型为代表的大模型红利才刚刚开始，AI数据服务行业将进入10-20年的景气周期，澳鹏中国将在技术、交付、安全和渠道等方向持续布局，其中的战略重点是技术和交付。而澳鹏作为AI数据服务行业的龙头，其面向未来十年超级周期的布局，也将影响整个行业的发展方向。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder3507"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2637689/image_5014143_32507788.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2637689/image_5014143_32507788.jpg?p=medium600" title="澳鹏（中国）在2024世界人工智能大会（WAIC2024）" alt="澳鹏（中国）在2024世界人工智能大会（WAIC2024）" /></a><br /><span>澳鹏（中国）在2024世界人工智能大会（WAIC2024）</span></p> 
</div> 
<p>技术和研发是澳鹏中国持续性战略投资的重要方向。田小鹏博士表示，技术是绝对生产力，未来5年，澳鹏中国将向研发再投入2-3亿元人民币，以确保公司在大模型超级周期中的持续竞争力，公司也将持续转型为算法辅助型、深化垂直领域的数据服务能力，同时通过人机协同模式提升数据标注的专业性和准确性。</p> 
<p>澳鹏中国研发负责人、产品和工程副总裁钱程介绍，公司目前80%以上的研发人员都参与了大模型相关的研发任务，主要研发方向包括面向大模型的数据服务平台、面向大模型的数据标注工具以及大模型相算法的研发和应用等。2025年，澳鹏中国将投入研发资源打造智能化成品数据集生产管理平台，通过自动化的数据标注、清洗挖掘和质量评估快速构建大规模高质量成品数据集，为大模型的模型训练提供高质量数据养料。</p> 
<p>此外，随着大模型应用向垂直领域的不断深入，澳鹏中国将结合自身在大模型和各垂直领域数据服务中积累的丰富经验，研发高精尖垂类数据标注平台，澳鹏中国计划在2025年上半年推出专业的大模型医疗数据标注平台和具身智能数据标注平台，进一步赋能垂直领域客户构建高质量模型训练数据。</p> 
<p>当前正处于超级周期的启动阶段，大模型发展迅猛且竞争激烈。许多AI数据标注项目具有实验性质，澳鹏需要迅速调整相关的平台和资源以适应不同的数据需求。钱程指出，大模型的发展，尤其在后训练阶段非常迅速，客户不断尝试新方法以优化效果。澳鹏团队与客户紧密合作，支持模型训练的数据需求，助力模型能力的不断提升。</p> 
<p>对于尝试性实验项目，澳鹏需要迅速构建数据处理工具和工作流程，采集和标注数据，并进行结果训练和验证。这需要一个灵活的平台工作流、自定义标注模板和敏捷的项目管理。澳鹏的大模型智能开发平台通过自定义模板引擎，能够在几分钟内快速配置数据标注模板，而定制化小型工具的开发则可在几天到一周内完成。</p> 
<p>钱程指出，客户需求快速迭代，创意层出不穷，澳鹏的产品研发团队为深度参与在这一快速发展的赛道而感到兴奋。一方面，他们积极跟进国内外大模型训练的技术变化；另一方面，与客户实时交流前沿发展趋势，共同探讨数据服务的构建方法。</p> 
<p>&quot;以AI赋能AI&quot;是澳鹏产品研发团队不断提升数据服务效率的宗旨，为了提升团队的生产力和效率，澳鹏在数据处理和生产管理中广泛应用大模型，替代传统算法。这不仅大幅提高了技术和工程团队的代码编写效率，还帮助数据交付部门提升了数据服务和项目管理的智能化水平。</p> 
<p>在大模型时代，尽管之前有不少科技企业都有自己的数据标注工具或平台，但随着大模型和生成式AI需求的激增，企业越来越依赖澳鹏这样的外部专业数据平台和服务商，既能满足不断变化的工具和平台开发需求，又能结合垂直领域专业标注人员的RHLF强化学习，一体化满足大模型和生成式AI的持续迭代要求。</p> 
<p>面向垂直领域的交付能力也是澳鹏的战略投资方向。继通用知识后，专业知识是大模型下一步的重点发展领域。澳鹏在已有垂直领域能力的基础上， 2024年开辟了金融、法律、音乐、多语种、文学、TTS、数学、医疗、代码等九个大模型垂直领域团队，专门负责开发和培养这些垂直领域的复合型人才，以及承担相应的数据服务项目。</p> 
<p>什么是面向垂直领域的复合型人才？简单理解就是对传统垂直领域的人才进行培养，例如金融、法律、医疗、音乐等，让专业领域人才理解AI与大模型、AI数据与AI数据项目交付等技术和项目管理实践，将专业领域知识与AI和数据项目交付结合起来，从而更好地服务客户大模型对于多种垂直领域数据的需求。这些专业人才不仅能够完成更高质量、更专业的数据标注，更能从专业逻辑上满足大模型推理的连贯性要求。</p> 
<p>澳鹏中国在医疗AI领域布局近5年，为国内最早在医疗AI领域大规模投入的公司，拥有500+全职医疗专业人员和1000+众包团队，覆盖临床医学、中医、中西医、护理、药学、心理、营养学等多个学科，已为国内30多个客户交付500+医学项目、超1000万条数据。</p> 
<p>自2023年下半年起，澳鹏组建了400+金融背景全职团队，其中拥有金融、经济或财会学本科及以上学历占比99%，70%持有基金或证券从业资格，支持风险管控、数据分析等金融应用开发，并具备完善的数据安全合规体系。</p> 
<p>2024年，澳鹏在代码大模型领域取得显著增长，拥有120+全职技术人员覆盖主流编程语言，提供代码生成、调试等服务，业务扩展至能力评估、运维、测试等场景，团队规模翻倍，并持续积累高质量代码数据集，确保代码模型在多种编程场景和任务类型上的泛化能力。</p> 
<p>此外，澳鹏在大模型各垂类领域都拥有丰富的专业人才资源：在法律领域，拥有专业的法律人才，涵盖法律检索、庭审、风控体系建设等核心能力；多语言领域，团队覆盖200+语种，具备丰富的多语言项目交付经验；音乐领域，拥有500+兼职音乐专业人员支持编曲、标注、制谱等任务；TTS领域，拥有数十个国家TTS采集经验，录音棚覆盖全国主要城市；文学领域，团队成员均具备深刻的文学理解与鉴赏能力，支持跨领域多模态融合与创新、情感交互与智能推荐系统等领域大模型的发展……澳鹏凭借强大的专业团队和丰富经验，持续为大模型提供高质量数据支持。</p> 
<p>值得一提的是，在专业人才招聘方面，澳鹏面向各个垂直领域，不仅有强大的全职招聘团队，在中国无锡、大连、重庆，在海外菲律宾、越南、印度、马来、英国、美国等部署高信安基地，还有独有海内外的众包资源和 2000+家供应商合作伙伴渠道，也与数百家学校展开深入合作，部署垂直领域人才的前置实训培养，从而更好地储备人才。</p> 
<p>数据安全和合规一直是澳鹏的强项，特别是 2024 年澳鹏中国取得了中国 AI 数据行业首家 ISO 37301合规管理体系认证，覆盖 AI 数据采集、数据标注和劳动合规等领域，这是继澳鹏中国在 ISO 27001安全合规、ISO 27701个人和隐私安全合规、ISO45001 职业健康安全等进一步夯实和固守合规底线。澳鹏不断地强化安全合规举措，为所有客户提供安全、可持续的数据服务，田小鹏博士表示，2024 年澳鹏各个基地顺利通过了 50+多次的客户&quot;飞检&quot;和现场审计，为客户的大模型高数安要求保驾护航。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder5397"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2637690/image_5014143_32507819.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2637690/image_5014143_32507819.jpg?p=medium600" title="澳鹏获全国数据交易联盟“年度优秀数据要素创新企业奖”" alt="澳鹏获全国数据交易联盟“年度优秀数据要素创新企业奖”" /></a><br /><span>澳鹏获全国数据交易联盟“年度优秀数据要素创新企业奖”</span></p> 
</div> 
<p><b>总结而言</b>：随着以DeepSeek开源大模型为代表的大模型第二波浪潮刚刚开始，一个真正的技术、经济和数据的超级周期才正式启动。在大模型第一波浪潮中，启动的主要是AI和科技公司；而在大模型第二波浪潮中，启动的将是所有行业领域的公司和政府机构，并将从中国聚焦到全球拓展，形成了从技术进步到生产力提升再到营收增长以及更多技术投资的正向循环。</p> 
<p>在超级周期的正向循环中，数据真正成为了经济增长的&quot;燃料&quot;，一个AI数据服务的多年期蓝海正在形成。田小鹏博士表示，&quot;到2030&nbsp;年，澳鹏中国制定了非常远大的营收目标——20+&nbsp;亿人民币，更重要的是澳鹏中国将不遗余力地成就我们中国&nbsp;AI&nbsp;客户，通过持续创新让中国的&nbsp;AI&nbsp;的产品和服务能领先于世界！&quot;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏全新发布《2024年AI全景报告》，揭示日趋加剧的数据挑战</title>
		<author></author>
		<pubDate>2024-11-06 19:52:00</pubDate>
		<description><![CDATA[上海2024年11月6日 /美通社/ -- 近日，澳鹏Appen连续第6年推出系列白皮书——《澳鹏AI全景报告（2024）》（Appen's 2024 
State of AI 
Report），通过调研各行各业的500多位IT决策者（包括企业领导者、数据科学家、数据工程师和开发人员等），深刻探讨最新行业洞察，帮助企业就人工智能部署计划做出明智决策。


随着人工智能（AI）在各个领域的普及越来越迅速和广泛，想要在AI领域取得成功，除了走在趋势前沿，能够高效获取优质数据是企业快人一步进行AI部署的利器。《澳鹏AI全景报告2024》分析显示，虽然机器学习 
(ML) 和生成式AI (GenAI) 等前沿技术的采用率持续攀升，但缺乏准确、高质量的数据仍是AI部署之旅遭遇的关键挑战。

 <https://mma.prnasia.com/media2/2550140/image_5014143_34837424.html>
《澳鹏AI全景报告2024》

澳鹏Appen战略副总裁Si 
Chen表示："尽管业界对GenAI等前沿AI技术的热情高涨，但这些工具的前景也面临着艰巨的挑战。AI项目的成功很大程度上依赖于高质量的数据，随着AI应用场景的复杂性和专业度不断提升，获取高质量数据变得愈发困难。那些构建未来AI工具和模型的公司比以往任何时候都更重视长期的数据战略合作伙伴。"


《澳鹏AI全景报告2024》探讨了生成式AI日益广泛的应用及其对业务流程的影响，如何通过提升数据质量等关键因素来助力AI部署的成功，以及与数据专家合作把握AI生命周期、优化AI投资回报率等关键要点。主要调研结果包括：

数据管理是首要挑战：随着AI应用场景日趋复杂，与数据获取、清洗和标注相关的瓶颈问题增加10%，数据准确性下降9%，数据可用性相关挑战增加7%；

对外部数据提供商的需求高涨：超过90%的受访者寻求专业、长期的AI生命周期数据合作伙伴，以提高其AI系统的质量和可扩展性；

看重数据多样性和减少偏见：97%的受访者认同数据多样性、减少偏见和可扩展性是构建AI模型的重要组成部分，而定制数据集仍是有效获取AI训练数据的主要方法；

人类洞察力依然至关重要：80%的受访者强调人机协同过程的重要性，凸显了人类监督在完善AI系统中的重要作用。


作为全球图像、文本、语音、音频、视频等AI训练数据服务的主要提供商之一，澳鹏Appen拥有业内先进的人工智能辅助数据标注平台、自研的大模型开发平台及全球100多万名技能娴熟的众包资源，支持290+种语言和方言。目前，澳鹏Appen数据解决方案已助力全球15,000+个AI项目的研发及商业化。未来，澳鹏作为产业链的重要一环，将继续坚持以高质量的数据服务水平和持续不断的研发创新为前沿技术落地赋能，为打造全方位优质的人工智能及大模型生态体系助力。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2024年11月6日</span> /美通社/ -- 近日，澳鹏Appen连续第6年推出系列白皮书——《澳鹏AI全景报告（2024）》（Appen's 2024 State of AI Report），通过调研各行各业的500多位IT决策者（包括企业领导者、数据科学家、数据工程师和开发人员等），深刻探讨最新行业洞察，帮助企业就人工智能部署计划做出明智决策。</p> 
<p>随着人工智能（AI）在各个领域的普及越来越迅速和广泛，想要在AI领域取得成功，除了走在趋势前沿，能够高效获取优质数据是企业快人一步进行AI部署的利器。《澳鹏AI全景报告2024》分析显示，虽然机器学习 (ML) 和生成式AI (GenAI) 等前沿技术的采用率持续攀升，但缺乏准确、高质量的数据仍是AI部署之旅遭遇的关键挑战。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder2215"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2550140/image_5014143_34837424.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2550140/image_5014143_34837424.jpg?p=medium600" title="《澳鹏AI全景报告2024》" alt="《澳鹏AI全景报告2024》" /></a><br /><span>《澳鹏AI全景报告2024》</span></p> 
</div> 
<p>澳鹏Appen战略副总裁Si Chen表示：&quot;尽管业界对GenAI等前沿AI技术的热情高涨，但这些工具的前景也面临着艰巨的挑战。AI项目的成功很大程度上依赖于高质量的数据，随着AI应用场景的复杂性和专业度不断提升，获取高质量数据变得愈发困难。那些构建未来AI工具和模型的公司比以往任何时候都更重视长期的数据战略合作伙伴。&quot;</p> 
<p>《澳鹏AI全景报告2024》探讨了生成式AI日益广泛的应用及其对业务流程的影响，如何通过提升数据质量等关键因素来助力AI部署的成功，以及与数据专家合作把握AI生命周期、优化AI投资回报率等关键要点。主要调研结果包括：</p> 
<p><b>数据管理是首要挑战：</b>随着AI应用场景日趋复杂，与数据获取、清洗和标注相关的瓶颈问题增加10%，数据准确性下降9%，数据可用性相关挑战增加7%；</p> 
<p><b>对外部数据提供商的需求高涨：</b>超过90%的受访者寻求专业、长期的AI生命周期数据合作伙伴，以提高其AI系统的质量和可扩展性；</p> 
<p><b>看重数据多样性和减少偏见：</b>97%的受访者认同数据多样性、减少偏见和可扩展性是构建AI模型的重要组成部分，而定制数据集仍是有效获取AI训练数据的主要方法；</p> 
<p><b>人类洞察力依然至关重要：</b>80%的受访者强调人机协同过程的重要性，凸显了人类监督在完善AI系统中的重要作用。</p> 
<p>作为全球图像、文本、语音、音频、视频等AI训练数据服务的主要提供商之一，澳鹏Appen拥有业内先进的人工智能辅助数据标注平台、自研的大模型开发平台及全球100多万名技能娴熟的众包资源，支持290+种语言和方言。目前，澳鹏Appen数据解决方案已助力全球15,000+个AI项目的研发及商业化。未来，澳鹏作为产业链的重要一环，将继续坚持以高质量的数据服务水平和持续不断的研发创新为前沿技术落地赋能，为打造全方位优质的人工智能及大模型生态体系助力。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏Appen]]></source>
	</item>
		<item>
		<title>澳鹏中国上半年营收1.83亿人民币，在AI和大模型数据赛道勇攀高峰</title>
		<author></author>
		<pubDate>2024-09-03 16:07:00</pubDate>
		<description><![CDATA[上海2024年9月3日 /美通社/ -- 
过去5年，整个社会对于数据的观念和认知，发生了天翻地覆的改变。这要归功于OpenAI与预训练大语言模型（以下简称大模型）的问世以及横扫全球的ChatGPT。从2020年1月OpenAI发表《自然语言模型的"摩尔定律"（Scaling 
Law for Neural Language Models）》论文到2023年的"百模"大战，数据成为了与算力和模型参数并驾齐驱的三驾马车之一。

 <https://mma.prnasia.com/media2/2494361/image_5014143_32770685.html>
澳鹏Appen获评2024全球数据标注领域Top领军者

在AI与大模型数据服务这条赛道上，澳鹏Appen位于Everest Group 2024 AI/ML数据标注解决方案Peak 
Matrix领导者象限第一。2019年，澳鹏（中国）正式成立了，作为独立于澳鹏Appen全球而在中国市场"白手起家"的澳鹏（中国），5年来闯过了中国AI数据"江湖"，实现了在中国市场遥遥领先——从 
2020 年到 2023 年，5年来澳鹏的复合营收增长率是 
90+%以上，2023年澳鹏（中国）实现了近2.5亿人民币营收，刚刚发布的2024年上半年实现了1.83亿人民币（2540万美元）营收，远超业界头部友商。预计2024年将实现3.5～4亿人民币营收，YOY 
的收入增长率 
50%～60%以上，2029年将跨入年营收10亿人民币大关。澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示：“过去5年澳鹏（中国）的成功，可以总结为五大因素：顺势而为、创新为要、资源多样化、洞察客户需求、员工满意与数据合规。

 <https://mma.prnasia.com/media2/2494828/china_revenue_2024.html>
数据来源：澳鹏Appen全球2024上半年财报

AI数据三维度爆发式裂变


所谓AI数据，即经过人工或机器方式标注过的数据。澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，澳鹏（中国）在近五年经历了三大AI浪潮，同时收获了AI数据在三个维度的爆发式裂变增长红利：即从深度学习和机器学习浪潮、到自动驾驶浪潮、再到大模型的"滔天巨浪"；相应带来AI数据在数据规模、数据质量和数据复杂度等三个维度的裂变增长。


在数据规模方面，传统深度学习模型训练数据规模在GB级到TB级，自动驾驶模型和大模型训练数据进一步上升至PB级。一辆智能汽车真实路况采集视频数据可达PB到数十PB，而通用大模型训练甚至已经耗尽了互联网数据，并向更广阔的私域数据高速拓展。


在数据质量方面，由于自动驾驶模型对于真实路况安全的重要性等，要求数据标注的准确性从之前的95%或96%进一步提升到99.5%甚至100%，这就意味着极大提高了数据标注的要求。而对于大模型训练来说，高质量数据则意味着更高水平的人工标注，例如需要量子力学等小众专业知识以及医疗、音乐、科技、金融、制造等垂直行业知识。

数据复杂度更在近年来急剧上升。在自动驾驶、VR/MR、机器人等领域，此前主要为2D、3D和 
2D&3D融合标注，这两年进一步发展到4D标注，也就是将时间作为新增维度，而4D标注对技术和复杂度要求非常高。此外，由于大量AI模型训练和多频次模型迭代的需求，数据流转越来越复杂，数据处理的专业性要求越来越高，既有短周期甚至临时性项目、高频次数据标注需求，也有临时数据耗尽而项目挂起的需求，还有要求安全可控数据标注环境、专业数据人才能力等等。


整体而言，经过了2019年到2024年的飞速发展，从深度学习/机器学习的精品式小模型训练，到自动驾驶的规模化模型训练和高频次迭代，再到"百大"大模型和生成式 
AI的规模化生产，引发了AI数据在规模、质量和复杂度三个维度的同时爆发式裂变，这对于AI数据服务商来说，既是机遇更是挑战。

"押注"技术平台产品，打造核心竞争力


技术能力是传统数据标注服务商长期缺失的核心能力。随着AI数据在三个维度的爆发式裂变，单纯依靠手工方式进行数据标注已经远远不能满足需求，更无法持续降低数据标注项目的成本、提高数据标注的质量、加快数据的有效流转。


在数据标注技术工程平台方面，特斯拉为整个行业立了一面旗帜。从2018到2021年，特斯拉的数据工程平台经历了3次迭代，通过自动标注与多种技术手段配合，一个clip（即最小标注单位，通常特斯拉的一个clip包括45秒到1分钟的路段数据）的标注仅需0.5小时算力+0.1小时人工，效率较2018年提升了800倍之多。


在全球市场，2019年的时候也仅有包括澳鹏Appen在内的少数顶级AI数据标注服务商投资了自有的数据标注工程平台。在2019年澳鹏（中国）成立的时候，当时除了从IBM等世界一流IT公司出来的几位核心主创人员以及澳鹏Appen全球对中国团队的初始投资外，可以说"一穷二白"。


与其它全球公司的中国分公司不同，由于数据行业的高度安全合规要求，澳鹏（中国）必须要独立自主地在中国市场重建所有的资源、系统和流程。摈弃了"拿来主义"，摆在澳鹏（中国）创始团队面前的就是一张白纸，而团队决定对技术进行"押注"式投入：目前公司有60余名全职资深研发技术工程师，其中一半专门聚焦于公司的技术平台产品研发；另一半专门聚焦于和客户在平台数据接收和验收的无缝对接。2023年，澳鹏（中国）投资近5000万元用于技术和系统建设，包括对澳鹏MatrixGo企业级高精度数据标注平台和大模型智能开发平台的开发和增强。

 <https://mma.prnasia.com/media2/2494363/image_5014143_32770732.html>
澳鹏MatrixGo企业级高精度数据标注平台


今天的澳鹏（中国）有两大拳头产品：MatrixGo企业级高精度数据标注平台和大模型智能开发平台，并用这两大平台扛住了AI数据三维度裂变的"滚滚洪流"。澳鹏MatrixGo平台和大模型智能开发平台完全由澳鹏（中国）团队在本地研发，拥有全部的知识产权和产品主导能力。

目前，澳鹏（中国）对MatrixGo平台和大模型智能开发平台每年迭代近百次，相当于每周都有产品更新，国内本地客户的 AI 
数据需求能够快速反应到产品设计和开发中。同时澳鹏自主研发的预标注通用模型和交互式算法在数据标注任务中能产生25%至10倍以上的效率提升。


具体来看，澳鹏MatrixGo平台主要针对深度学习和机器学习小模型的数据采集与标注需求，也服务于自动驾驶场景，覆盖文本、语音、图像、视频、多模态等各种数据类型。目前澳鹏MatrixGo平台已经演进到2.0版本，并不断增强AI辅助智能标注引擎，持续提升人工标注的效率和质量，降低数据标注成本。


例如，澳鹏MatrixGo平台在2D图像类项目上可达到5倍以上的效率提升；3D语义分割数据标注效率提升可达到35%以上；2/3D物体检测预标注模型效率提升15%-30%；数据交付准确率平均达到99%以上。在自动驾驶场景方面，澳鹏MatrixGo平台支持单帧100亿以上点云的加载、提供了多种4D数据标注工具，能够为客户增效30%以上。


澳鹏MatrixGo平台针对各种中国客户的不同信息安全性需求，还提供了客户On-Premise、专属安全屋On-premise、SaaS等多种不同的部署形式， 
如On-premise的部署在48小时内可以完成，不仅极大地满足了针对客户的安全性需求适配，更解决客户快速交付的紧急诉求，已在中国成功地提供几十家客户的On-Premise部署。

 <https://mma.prnasia.com/media2/2494364/image_5014143_32770763.html>
澳鹏大模型智能开发平台


澳鹏大模型智能开发平台是澳鹏（中国）在2023年全新开发的一个新技术工程平台。针对大模型场景，澳鹏（中国）研发了专业的多模态数据标注工具、多轮对话数据标注工具、思维链数据标注工具、工具调用数据标注工具、知识库数据标注工具等多种专业标注工具，支持RLHF、RLAIF、SFT等多种高质量数据的生产；该平台对数据集管理、模型评估进行了针对性设计，通过A/B测试、红蓝对抗、排序打分等对大模型质量进行评估和分析；该平台还集成了算力资源的调度和对接，可以进行算法的微调和部署，一站式完成大模型数据开发。


大模型智能开发平台的快速上线让澳鹏（中国）迅速抓住了大模型商机。2023年，澳鹏（中国）在中国、日本和韩国共拓展了82家新客户，其中8家客户带来了20个大模型项目。2023年全年，澳鹏（中国）大模型业务营收接近3300万，2024上半年更直逼5000万，呈爆发式增长态势。


澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，正是依托澳鹏MatrixGO平台和大模型智能开发平台两大平台的技术能力，让澳鹏（中国）在众多数据项目中脱颖而出，也是获得头部客户青睐的重要原因。


在自主创新方面，澳鹏（中国）目前累计申请的专利数达到24项（其中20个专利申请处于已递交状态）；软著登记共计62项，其中56项已获证。澳鹏（中国）与很多高校和科研院所在计算机视觉、多模态算法、大模型等领域进行了项目合作，也与许多院校在人工智能训练师、人工智能数据标注产业培养等方面深入合作。


正是因为坚持对核心技术进行布局，澳鹏（中国）成功入选艾瑞咨询的《2024年中国AI基础数据服务研究报告》，并作为行业标杆之一被列入AI基础数据服务厂商案例。而在2024世界人工智能大会（WAIC2024）期间，澳鹏（中国）入选了亿欧的2024 
AI产业链图谱，并被评选为2024中国AI企业商业落地基础设施服务商Top20等。

躬身入局AI数据"江湖"，闯出新天地


整个AI数据标注行业在过去5年经历了全面重塑。2019年的数据标注市场，仍处于野蛮生长状态，主要以劳动力密集型企业为主，其竞争优势主要体现在低价格和传统渠道，不少企业在四五线城市建立了低成本的数据标注基地。当时的数据标注员几乎零门槛，整个行业良莠不齐，恶意竞争、低价竞争等种种乱象丛生，可以用"江湖"一词来形容当时的市场状态。


2019年澳鹏（中国）成立的时候，当时已经成立23年、上市4年的澳鹏Appen全球拥有百万众包资源，支持235+种语言和方言，具备成熟的众包人力资源体系和项目管理能力。但对于2019年仅有不到10个人的澳鹏（中国）初创团队来说，这些来自顶级IT公司的专业精英人才，却要面对当时AI数据标注服务市场的各种乱象。

 <https://mma.prnasia.com/media2/2494365/image_5014143_32770794.html>
澳鹏（中国）精彩亮相2024世界人工智能大会


针对处于初级阶段的中国AI数据标注市场，澳鹏（中国）投入了大量时间和精力进行众包资源的招募、培训、流程建设和管理，特别是在二线城市创造性地建立了自营数据服务交付基地，通过自有专职人员+众包资源的方式，适配了中国数据标注行业的初级阶段。


所谓自营数据服务交付基地，即在无锡、大连、重庆等地租用办公楼，招聘专职数据标注服务员工入驻办公，同时为项目提供安全封闭的项目办公空间，供团队与客户共同完成高保密性的项目。而在项目管理方面，面对数据标注项目节奏快、数据需求量不稳定、数据规则不断变化等挑战，澳鹏（中国）从多个维度提升项目管理能力，保障对客户项目交付的稳定性。

澳鹏（中国）非常重视AI数据服务项目的安全和隐私保护，不仅在中国的各个自营基地均已获得ISO 
27001、27701、9001、14001、45001、ISO 
37301等安全及管理领域国际认证，还与客户、众包资源等100%签订NDA协议。此外，根据项目对数据的安全级别、隐私安全等要求，澳鹏（中国）为客户定制专属项目室，包括安全屋、网络专线、信息安全管控等，特殊项目要求员工在进入项目前还需要上交手机。正是因为澳鹏（中国）不遗余力地建设数据安全与隐私保护，才在市场竞争中获得了头部客户的青睐。


为什么要建自营服务交付基地？澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士介绍，尽管澳鹏自身非常重视数据安全与隐私保护，但很多BPO服务商特别是中小BPO服务其实在这方面并不重视，也很难具备高等级数据安保设施，相比之下只有自营服务交付基地才能满足客户高安全、高保密等高等级要求。澳鹏（中国）的自营服务交付基地也为中国AI数据标注行业建立了一个新规范、新标杆。有客户表示在国内所有大型数据标注服务商中，只有澳鹏（中国）是真正将数据安保真正落地的服务商，也是少有的全员交社保的数据标注服务商。


选择在二线城市建设自营数据服务交付基地，还有一个出发点就是为了满足AI数据对于高知识专业人才的需求。田小鹏表示，团队在成立之初就前瞻到了AI模型将越来越向垂直领域和专业化方向发展，对于知识的需求将越来越高。相比于四五线城市，二线城市有大量高水平的高校以及具备高知识的专业化人才，选择在二线城市建设自营数据服务交付基地可就近招募高知识专业化人才，满足AI模型的长期演进需求。


在澳鹏（中国）创业的5年中，经历了中国AI数据标注行业从初期乱象走向规范化发展之路，在这期间还经历了三年疫情这样百年未遇的公共事件，这些都是澳鹏（中国）创业团队在创业之初都始料未及的挑战。


例如，有的客户在项目进行过程中或项目结束就破产了，或因各种原因出现赖账，导致无法收回上百万的项目款或者打折结算，而与此同时很多众包人员的工作已经在进行中或完成了，澳鹏（中国）团队经过慎重考虑选择自行垫款结算所有众包人员和BPO商的项目款，因为对于很多地方上的众包和 
BPO人员来说，项目款是维持生计的重要来源，特别在疫情期间甚至是唯一生计来源。


从"科技向善"的公司理念出发，澳鹏（中国）并没有因为AI数据"江湖"的乱象而放弃原则，而是知行合一地实践了这一理念，杜绝各种"踩红线"行为，为整个行业树立科技向善的标杆，引领AI数据标注行业走出无序和不良竞争乱象，走向更加光明的未来。

下一个5年，勇攀高峰


在过去5年中，出现了大量不确定性的事件，包括全球疫情和中美科技竞争，但也幸运地赶上了自动驾驶和大模型浪潮以及由此引发的AI数据三维度爆发式裂变。由于澳鹏（中国）坚持以科技创新立身，坚定投入自有技术平台，依靠更高效率、更高质量、更高安全性的技术平台和人力资源优势，在市场中站稳了脚跟。

 <https://mma.prnasia.com/media2/2494366/image_5014143_32770825.html>
澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士

过去5年澳鹏（中国）的成功，可以总结为五大因素：顺势而为、创新为要、资源多样化、洞察客户需求、员工满意与数据合规。


顺势而为。澳鹏（中国）非常幸运地抓住了ChatGPT、LLM等AI科技突破性技术创新和成就所产生的商机，特别是敏锐察觉和把握了AI数据三维度爆发式裂变，坚定了对AI数据标注服务、AI和未来科技演进的信心与信念，在前瞻性战略思考基础上，谋定而后动。

创新为要。澳鹏（中国）将创新视为公司和行业发展的动力，以创新谋新局、开新篇：创造性地建立在中国自营 AI 
数据服务交付基地模式；大胆投资开发了澳鹏MatrixGo平台和大模型智能开发平台并建立了技术护城河；率先尝试各种AI数据服务，包括3D数据标注、4D数据标注、大模型数据服务、多模态数据服务、海外路采等等。


资源多样化。通过众包、BPO和专职数据标注与服务人员等多种资源布局与协同，解决了客户在AI数据规模、质量与复杂性方面的挑战，同时也解决了部分大众就业、中小企业生存发展等民生问题，将创业与企业责任结合起来，用实践向业界展现了AI向善的商业与社会价值，引领整个行业走上可持续发展之路。


洞察客户需求。在AI数据服务行业，客户真正关心的是优异的品质和合理的价格。澳鹏（中国）一直秉承"季布一诺千金"的优良文化，全心全意服务好客户，不断打磨精细化管理，以优异的数据质量品质，在业界形成了良好的口碑。


员工满意和数据合规。澳鹏（中国）非常重视员工的满意度，授予员工充分的自主权，让员工全方位参与公司管理，获得员工的高认可度。数据合规红线是企业运营的根本，公司通过各种独立项目交付合规室的建设和管控措施以及ISO信息安全认证等多种举措建立了安全合规的企业文化。


目前，澳鹏（中国）客户主要分布在互联网/电商企业、算法科技公司、自动驾驶等行业，客户包括国内前十大汽车公司、前十大互联网公司和前四大移动互联网公司等。鉴于AI数据与AI模型越来越密不可分，澳鹏（中国）为头部客户配置了专属的客户经理，从而深入理解客户业务，并根据客户业务发展，提前准备相应的资源和能力，灵活及时满足客户需求。


例如，在服务某中国头部社交媒体海外实体公司的过程中，双方在大模型文本生成和多模态数据处理等领域展开了深入合作。澳鹏（中国）在东南亚地区建立了多个大模型标注的基地，招募了当地优秀的本科、硕士毕业生以及部分垂直领域的专家。借助海外专业且稳定的人力资源以及澳鹏丰富的管理经验，为该客户实现了大模型高精度+高一致率的标注结果。目前该客户大模型的业务量已经跻身澳鹏（中国）前三，成为重要的业务支柱。


在下一个5年到来之际，澳鹏（中国）又站在了一个新的起点。未来5年，在大模型的持续影响和应用需求激增下，全社会全面进入AI规模化应用阶段，相关数据标注的需求也呈现爆发式增长。面对下一波AI浪潮，澳鹏（中国）已经做好了充分的准备。


首先，澳鹏（中国）将持续投入两大平台的研发，不断提高产品力，从而提升产品在整个营收中的占比。在数据标注服务外，客户对于数据处理平台、数据处理工具和数据处理算法有大量需求。为此，澳鹏（中国）投入产品研发，打造可商业化的数据标注平台、多模态数据标注工具、成品数据库产品以及覆盖数据采集、数据清洗、数据脱敏、数据挖掘等不同阶段的自动化算法产品，为客户提供全面的产品矩阵。


澳鹏（中国）的团队与客户团队一起，共同探讨算法研发的思路和数据标注工具的产品设计。澳鹏（中国）团队每天都在为客户定制化需求而研发，这些需求可能是为了客户算法工程师的一个新思路而实现一个特殊的数据标注功能以标注特定的数据特征，也可能是为了让客户更好更快地验收数据标注结果而开发更便捷、可视化功能和数据准确率看板。所有这些新算法、新功能、新工具都汇入澳鹏（中国）的两大平台，惠及更多客户。


其次，澳鹏（中国）将继续开拓大模型和中国企业出海两大市场。在大模型市场，科技企业对于AI/LLM的研发投入巨大，迫切需要具有的高质量训练数据交付能力的公司，帮助更好、更快地处理模型训练数据，而澳鹏（中国）已经构建了强大的竞争力。


在中国企业出海市场，企业出海首先面对的就是语言和全球资源的挑战，澳鹏在全球170多个国家拥有290多种语言的资源，同时在菲律宾、越南、美国等地区拥有大型交付中心，这是澳鹏在行业内独一无二的优势，可以很好地支持国内企业出海拓展海外市场业务。


第三，针对AI技术深入行业应用带来的长期需求，包括代码、医疗、教育、金融、工业、汽车等行业，澳鹏（中国）已经储备了超过1500人的高学历专业人士，而且还在无锡、大连、重庆等多地的交付基地同时招聘招募专业人员，从而打造全国性的专业资源能力池。


艾瑞咨询预计到2028年，中国AI基础数据服务市场规模将达170亿元，未来五年的复合增长率为30.4%。澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，有信心在5年后实现12亿人民币的年营收，以至少27.8%+的高速复合增长率，成为中国及亚洲区AI数据专业服务行业的领军服务商。

其中，产品和服务两条线更均衡发展，产品项目的占比将从2024年的4%至少提升到2029年的12%；进一步加速开拓亚洲市场，占比将从 
2024年10%至少提升到2029年15%，澳鹏中国5 年后将完成亚洲、欧洲、非洲、中东、南美、北美等地所有AI数据服务的全覆盖。

展望5年后乃至更长远的未来，田小鹏认为广阔天地在于突破AI数据标注服务窄领域，进入AI数据服务宽领域，即：AI数据服务将会有更广泛行业的覆盖拓展；AI 
数据类型将向多模态、垂类细分颗粒度等演变；AI 
数据产品将更国际化、全球化、多语言覆盖。例如：大模型就将AI数据服务推进到了人工反馈算法迭代服务和模型评估服务，今后随着AI技术的持续发展或将出现新的AI模型，相应带来新的AI数据服务需求，这为澳鹏（中国）基业长青奠定了信心。


回顾过去5年走过的路，田小鹏笑说如果再来一遍，肯定不会选择创业这条道路。因为在一个市场的初级阶段搏杀，再叠加全球三年疫情这样极具挑战的公共事件，即便是老兵创业也是每日如履薄冰。


5年前创业之初，澳鹏（中国）从零起步，没有客户、没有产品、没有流程、没有团队、只有投资和勇气；5年后，澳鹏（中国）已经有两大产品平台、3000+员工、3000+BPO合作伙伴、近百万众包资源、6大服务交付基地、完整的组织、流程与管理以及350+家优质客户……


闯过了前面的险滩，后面就是奔腾不息的大江大河。面向下一个5年，田小鹏说"澳鹏（中国）并不完美，但一直在追求完美的道路上。在 AI 的未来浪潮中，在AI数据主航道上我们将勇往直前。澳鹏（中国）愿做客户在 AI成功的幕后英雄和铺路石，成就客户是我们永远不变的初心！"

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2024年9月3日</span> /美通社/ -- 过去5年，整个社会对于数据的观念和认知，发生了天翻地覆的改变。这要归功于OpenAI与预训练大语言模型（以下简称大模型）的问世以及横扫全球的ChatGPT。从2020年1月OpenAI发表《自然语言模型的&quot;摩尔定律&quot;（Scaling Law for Neural Language Models）》论文到2023年的&quot;百模&quot;大战，数据成为了与算力和模型参数并驾齐驱的三驾马车之一。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder5160"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2494361/image_5014143_32770685.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2494361/image_5014143_32770685.jpg?p=medium600" title="澳鹏Appen获评2024全球数据标注领域Top领军者" alt="澳鹏Appen获评2024全球数据标注领域Top领军者" /></a><br /><span>澳鹏Appen获评2024全球数据标注领域Top领军者</span></p> 
</div> 
<p>在AI与大模型数据服务这条赛道上，澳鹏Appen位于Everest Group 2024 AI/ML数据标注解决方案Peak Matrix领导者象限第一。2019年，澳鹏（中国）正式成立了，作为独立于澳鹏Appen全球而在中国市场&quot;白手起家&quot;的澳鹏（中国），5年来闯过了中国AI数据&quot;江湖&quot;，实现了在中国市场遥遥领先——从 2020 年到 2023 年，5年来澳鹏的复合营收增长率是 90+%以上，2023年澳鹏（中国）实现了近2.5亿人民币营收，刚刚发布的2024年上半年实现了1.83亿人民币（2540万美元）营收，远超业界头部友商。预计2024年将实现3.5～4亿人民币营收，YOY 的收入增长率 50%～60%以上，2029年将跨入年营收10亿人民币大关。澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示：“过去5年澳鹏（中国）的成功，可以总结为五大因素：顺势而为、创新为要、资源多样化、洞察客户需求、员工满意与数据合规。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder1757"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2494828/china_revenue_2024.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2494828/china_revenue_2024.jpg?p=medium600" title="数据来源：澳鹏Appen全球2024上半年财报" alt="数据来源：澳鹏Appen全球2024上半年财报" /></a><br /><span>数据来源：澳鹏Appen全球2024上半年财报</span></p> 
</div> 
<p><b>AI</b><b>数据三维度爆发式裂变</b></p> 
<p>所谓AI数据，即经过人工或机器方式标注过的数据。澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，澳鹏（中国）在近五年经历了三大AI浪潮，同时收获了AI数据在三个维度的爆发式裂变增长红利：即从深度学习和机器学习浪潮、到自动驾驶浪潮、再到大模型的&quot;滔天巨浪&quot;；相应带来AI数据在数据规模、数据质量和数据复杂度等三个维度的裂变增长。</p> 
<p>在数据规模方面，传统深度学习模型训练数据规模在GB级到TB级，自动驾驶模型和大模型训练数据进一步上升至PB级。一辆智能汽车真实路况采集视频数据可达PB到数十PB，而通用大模型训练甚至已经耗尽了互联网数据，并向更广阔的私域数据高速拓展。</p> 
<p>在数据质量方面，由于自动驾驶模型对于真实路况安全的重要性等，要求数据标注的准确性从之前的95%或96%进一步提升到99.5%甚至100%，这就意味着极大提高了数据标注的要求。而对于大模型训练来说，高质量数据则意味着更高水平的人工标注，例如需要量子力学等小众专业知识以及医疗、音乐、科技、金融、制造等垂直行业知识。</p> 
<p>数据复杂度更在近年来急剧上升。在自动驾驶、VR/MR、机器人等领域，此前主要为2D、3D和 2D&amp;3D融合标注，这两年进一步发展到4D标注，也就是将时间作为新增维度，而4D标注对技术和复杂度要求非常高。此外，由于大量AI模型训练和多频次模型迭代的需求，数据流转越来越复杂，数据处理的专业性要求越来越高，既有短周期甚至临时性项目、高频次数据标注需求，也有临时数据耗尽而项目挂起的需求，还有要求安全可控数据标注环境、专业数据人才能力等等。</p> 
<p>整体而言，经过了2019年到2024年的飞速发展，从深度学习/机器学习的精品式小模型训练，到自动驾驶的规模化模型训练和高频次迭代，再到&quot;百大&quot;大模型和生成式 AI的规模化生产，引发了AI数据在规模、质量和复杂度三个维度的同时爆发式裂变，这对于AI数据服务商来说，既是机遇更是挑战。</p> 
<p><b>&quot;</b><b>押注</b><b>&quot;</b><b>技术平台产品，打造核心竞争力</b></p> 
<p>技术能力是传统数据标注服务商长期缺失的核心能力。随着AI数据在三个维度的爆发式裂变，单纯依靠手工方式进行数据标注已经远远不能满足需求，更无法持续降低数据标注项目的成本、提高数据标注的质量、加快数据的有效流转。</p> 
<p>在数据标注技术工程平台方面，特斯拉为整个行业立了一面旗帜。从2018到2021年，特斯拉的数据工程平台经历了3次迭代，通过自动标注与多种技术手段配合，一个clip（即最小标注单位，通常特斯拉的一个clip包括45秒到1分钟的路段数据）的标注仅需0.5小时算力+0.1小时人工，效率较2018年提升了800倍之多。</p> 
<p>在全球市场，2019年的时候也仅有包括澳鹏Appen在内的少数顶级AI数据标注服务商投资了自有的数据标注工程平台。在2019年澳鹏（中国）成立的时候，当时除了从IBM等世界一流IT公司出来的几位核心主创人员以及澳鹏Appen全球对中国团队的初始投资外，可以说&quot;一穷二白&quot;。</p> 
<p>与其它全球公司的中国分公司不同，由于数据行业的高度安全合规要求，澳鹏（中国）必须要独立自主地在中国市场重建所有的资源、系统和流程。摈弃了&quot;拿来主义&quot;，摆在澳鹏（中国）创始团队面前的就是一张白纸，而团队决定对技术进行&quot;押注&quot;式投入：目前公司有60余名全职资深研发技术工程师，其中一半专门聚焦于公司的技术平台产品研发；另一半专门聚焦于和客户在平台数据接收和验收的无缝对接。2023年，澳鹏（中国）投资近5000万元用于技术和系统建设，包括对澳鹏MatrixGo企业级高精度数据标注平台和大模型智能开发平台的开发和增强。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder7534"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2494363/image_5014143_32770732.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2494363/image_5014143_32770732.jpg?p=medium600" title="澳鹏MatrixGo企业级高精度数据标注平台" alt="澳鹏MatrixGo企业级高精度数据标注平台" /></a><br /><span>澳鹏MatrixGo企业级高精度数据标注平台</span></p> 
</div> 
<p>今天的澳鹏（中国）有两大拳头产品：MatrixGo企业级高精度数据标注平台和大模型智能开发平台，并用这两大平台扛住了AI数据三维度裂变的&quot;滚滚洪流&quot;。澳鹏MatrixGo平台和大模型智能开发平台完全由澳鹏（中国）团队在本地研发，拥有全部的知识产权和产品主导能力。</p> 
<p>目前，澳鹏（中国）对MatrixGo平台和大模型智能开发平台每年迭代近百次，相当于每周都有产品更新，国内本地客户的 AI 数据需求能够快速反应到产品设计和开发中。同时澳鹏自主研发的预标注通用模型和交互式算法在数据标注任务中能产生25%至10倍以上的效率提升。</p> 
<p>具体来看，澳鹏MatrixGo平台主要针对深度学习和机器学习小模型的数据采集与标注需求，也服务于自动驾驶场景，覆盖文本、语音、图像、视频、多模态等各种数据类型。目前澳鹏MatrixGo平台已经演进到2.0版本，并不断增强AI辅助智能标注引擎，持续提升人工标注的效率和质量，降低数据标注成本。</p> 
<p>例如，澳鹏MatrixGo平台在2D图像类项目上可达到5倍以上的效率提升；3D语义分割数据标注效率提升可达到35%以上；2/3D物体检测预标注模型效率提升15%-30%；数据交付准确率平均达到99%以上。在自动驾驶场景方面，澳鹏MatrixGo平台支持单帧100亿以上点云的加载、提供了多种4D数据标注工具，能够为客户增效30%以上。</p> 
<p>澳鹏MatrixGo平台针对各种中国客户的不同信息安全性需求，还提供了客户On-Premise、专属安全屋On-premise、SaaS等多种不同的部署形式， 如On-premise的部署在48小时内可以完成，不仅极大地满足了针对客户的安全性需求适配，更解决客户快速交付的紧急诉求，已在中国成功地提供几十家客户的On-Premise部署。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder7670"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2494364/image_5014143_32770763.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2494364/image_5014143_32770763.jpg?p=medium600" title="澳鹏大模型智能开发平台" alt="澳鹏大模型智能开发平台" /></a><br /><span>澳鹏大模型智能开发平台</span></p> 
</div> 
<p>澳鹏大模型智能开发平台是澳鹏（中国）在2023年全新开发的一个新技术工程平台。针对大模型场景，澳鹏（中国）研发了专业的多模态数据标注工具、多轮对话数据标注工具、思维链数据标注工具、工具调用数据标注工具、知识库数据标注工具等多种专业标注工具，支持RLHF、RLAIF、SFT等多种高质量数据的生产；该平台对数据集管理、模型评估进行了针对性设计，通过A/B测试、红蓝对抗、排序打分等对大模型质量进行评估和分析；该平台还集成了算力资源的调度和对接，可以进行算法的微调和部署，一站式完成大模型数据开发。</p> 
<p>大模型智能开发平台的快速上线让澳鹏（中国）迅速抓住了大模型商机。2023年，澳鹏（中国）在中国、日本和韩国共拓展了82家新客户，其中8家客户带来了20个大模型项目。2023年全年，澳鹏（中国）大模型业务营收接近3300万，2024上半年更直逼5000万，呈爆发式增长态势。</p> 
<p>澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，正是依托澳鹏MatrixGO平台和大模型智能开发平台两大平台的技术能力，让澳鹏（中国）在众多数据项目中脱颖而出，也是获得头部客户青睐的重要原因。</p> 
<p>在自主创新方面，澳鹏（中国）目前累计申请的专利数达到24项（其中20个专利申请处于已递交状态）；软著登记共计62项，其中56项已获证。澳鹏（中国）与很多高校和科研院所在计算机视觉、多模态算法、大模型等领域进行了项目合作，也与许多院校在人工智能训练师、人工智能数据标注产业培养等方面深入合作。</p> 
<p>正是因为坚持对核心技术进行布局，澳鹏（中国）成功入选艾瑞咨询的《2024年中国AI基础数据服务研究报告》，并作为行业标杆之一被列入AI基础数据服务厂商案例。而在2024世界人工智能大会（WAIC2024）期间，澳鹏（中国）入选了亿欧的2024 AI产业链图谱，并被评选为2024中国AI企业商业落地基础设施服务商Top20等。</p> 
<p><b>躬身入局</b><b>AI</b><b>数据</b><b>&quot;</b><b>江湖</b><b>&quot;</b><b>，闯出新天地</b></p> 
<p>整个AI数据标注行业在过去5年经历了全面重塑。2019年的数据标注市场，仍处于野蛮生长状态，主要以劳动力密集型企业为主，其竞争优势主要体现在低价格和传统渠道，不少企业在四五线城市建立了低成本的数据标注基地。当时的数据标注员几乎零门槛，整个行业良莠不齐，恶意竞争、低价竞争等种种乱象丛生，可以用&quot;江湖&quot;一词来形容当时的市场状态。</p> 
<p>2019年澳鹏（中国）成立的时候，当时已经成立23年、上市4年的澳鹏Appen全球拥有百万众包资源，支持235+种语言和方言，具备成熟的众包人力资源体系和项目管理能力。但对于2019年仅有不到10个人的澳鹏（中国）初创团队来说，这些来自顶级IT公司的专业精英人才，却要面对当时AI数据标注服务市场的各种乱象。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9104"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2494365/image_5014143_32770794.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2494365/image_5014143_32770794.jpg?p=medium600" title="澳鹏（中国）精彩亮相2024世界人工智能大会" alt="澳鹏（中国）精彩亮相2024世界人工智能大会" /></a><br /><span>澳鹏（中国）精彩亮相2024世界人工智能大会</span></p> 
</div> 
<p>针对处于初级阶段的中国AI数据标注市场，澳鹏（中国）投入了大量时间和精力进行众包资源的招募、培训、流程建设和管理，特别是在二线城市创造性地建立了自营数据服务交付基地，通过自有专职人员+众包资源的方式，适配了中国数据标注行业的初级阶段。</p> 
<p>所谓自营数据服务交付基地，即在无锡、大连、重庆等地租用办公楼，招聘专职数据标注服务员工入驻办公，同时为项目提供安全封闭的项目办公空间，供团队与客户共同完成高保密性的项目。而在项目管理方面，面对数据标注项目节奏快、数据需求量不稳定、数据规则不断变化等挑战，澳鹏（中国）从多个维度提升项目管理能力，保障对客户项目交付的稳定性。</p> 
<p>澳鹏（中国）非常重视AI数据服务项目的安全和隐私保护，不仅在中国的各个自营基地均已获得ISO 27001、27701、9001、14001、45001、ISO 37301等安全及管理领域国际认证，还与客户、众包资源等100%签订NDA协议。此外，根据项目对数据的安全级别、隐私安全等要求，澳鹏（中国）为客户定制专属项目室，包括安全屋、网络专线、信息安全管控等，特殊项目要求员工在进入项目前还需要上交手机。正是因为澳鹏（中国）不遗余力地建设数据安全与隐私保护，才在市场竞争中获得了头部客户的青睐。</p> 
<p>为什么要建自营服务交付基地？澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士介绍，尽管澳鹏自身非常重视数据安全与隐私保护，但很多BPO服务商特别是中小BPO服务其实在这方面并不重视，也很难具备高等级数据安保设施，相比之下只有自营服务交付基地才能满足客户高安全、高保密等高等级要求。澳鹏（中国）的自营服务交付基地也为中国AI数据标注行业建立了一个新规范、新标杆。有客户表示在国内所有大型数据标注服务商中，只有澳鹏（中国）是真正将数据安保真正落地的服务商，也是少有的全员交社保的数据标注服务商。</p> 
<p>选择在二线城市建设自营数据服务交付基地，还有一个出发点就是为了满足AI数据对于高知识专业人才的需求。田小鹏表示，团队在成立之初就前瞻到了AI模型将越来越向垂直领域和专业化方向发展，对于知识的需求将越来越高。相比于四五线城市，二线城市有大量高水平的高校以及具备高知识的专业化人才，选择在二线城市建设自营数据服务交付基地可就近招募高知识专业化人才，满足AI模型的长期演进需求。</p> 
<p>在澳鹏（中国）创业的5年中，经历了中国AI数据标注行业从初期乱象走向规范化发展之路，在这期间还经历了三年疫情这样百年未遇的公共事件，这些都是澳鹏（中国）创业团队在创业之初都始料未及的挑战。</p> 
<p>例如，有的客户在项目进行过程中或项目结束就破产了，或因各种原因出现赖账，导致无法收回上百万的项目款或者打折结算，而与此同时很多众包人员的工作已经在进行中或完成了，澳鹏（中国）团队经过慎重考虑选择自行垫款结算所有众包人员和BPO商的项目款，因为对于很多地方上的众包和 BPO人员来说，项目款是维持生计的重要来源，特别在疫情期间甚至是唯一生计来源。</p> 
<p>从&quot;科技向善&quot;的公司理念出发，澳鹏（中国）并没有因为AI数据&quot;江湖&quot;的乱象而放弃原则，而是知行合一地实践了这一理念，杜绝各种&quot;踩红线&quot;行为，为整个行业树立科技向善的标杆，引领AI数据标注行业走出无序和不良竞争乱象，走向更加光明的未来。</p> 
<p><b>下一个</b><b>5</b><b>年，勇攀高峰</b></p> 
<p>在过去5年中，出现了大量不确定性的事件，包括全球疫情和中美科技竞争，但也幸运地赶上了自动驾驶和大模型浪潮以及由此引发的AI数据三维度爆发式裂变。由于澳鹏（中国）坚持以科技创新立身，坚定投入自有技术平台，依靠更高效率、更高质量、更高安全性的技术平台和人力资源优势，在市场中站稳了脚跟。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder1403"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2494366/image_5014143_32770825.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2494366/image_5014143_32770825.jpg?p=medium600" title="澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士" alt="澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士" /></a><br /><span>澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士</span></p> 
</div> 
<p>过去5年澳鹏（中国）的成功，可以总结为五大因素：顺势而为、创新为要、资源多样化、洞察客户需求、员工满意与数据合规。</p> 
<p>顺势而为。澳鹏（中国）非常幸运地抓住了ChatGPT、LLM等AI科技突破性技术创新和成就所产生的商机，特别是敏锐察觉和把握了AI数据三维度爆发式裂变，坚定了对AI数据标注服务、AI和未来科技演进的信心与信念，在前瞻性战略思考基础上，谋定而后动。</p> 
<p>创新为要。澳鹏（中国）将创新视为公司和行业发展的动力，以创新谋新局、开新篇：创造性地建立在中国自营 AI 数据服务交付基地模式；大胆投资开发了澳鹏MatrixGo平台和大模型智能开发平台并建立了技术护城河；率先尝试各种AI数据服务，包括3D数据标注、4D数据标注、大模型数据服务、多模态数据服务、海外路采等等。</p> 
<p>资源多样化。通过众包、BPO和专职数据标注与服务人员等多种资源布局与协同，解决了客户在AI数据规模、质量与复杂性方面的挑战，同时也解决了部分大众就业、中小企业生存发展等民生问题，将创业与企业责任结合起来，用实践向业界展现了AI向善的商业与社会价值，引领整个行业走上可持续发展之路。</p> 
<p>洞察客户需求。在AI数据服务行业，客户真正关心的是优异的品质和合理的价格。澳鹏（中国）一直秉承&quot;季布一诺千金&quot;的优良文化，全心全意服务好客户，不断打磨精细化管理，以优异的数据质量品质，在业界形成了良好的口碑。</p> 
<p>员工满意和数据合规。澳鹏（中国）非常重视员工的满意度，授予员工充分的自主权，让员工全方位参与公司管理，获得员工的高认可度。数据合规红线是企业运营的根本，公司通过各种独立项目交付合规室的建设和管控措施以及ISO信息安全认证等多种举措建立了安全合规的企业文化。</p> 
<p>目前，澳鹏（中国）客户主要分布在互联网/电商企业、算法科技公司、自动驾驶等行业，客户包括国内前十大汽车公司、前十大互联网公司和前四大移动互联网公司等。鉴于AI数据与AI模型越来越密不可分，澳鹏（中国）为头部客户配置了专属的客户经理，从而深入理解客户业务，并根据客户业务发展，提前准备相应的资源和能力，灵活及时满足客户需求。</p> 
<p>例如，在服务某中国头部社交媒体海外实体公司的过程中，双方在大模型文本生成和多模态数据处理等领域展开了深入合作。澳鹏（中国）在东南亚地区建立了多个大模型标注的基地，招募了当地优秀的本科、硕士毕业生以及部分垂直领域的专家。借助海外专业且稳定的人力资源以及澳鹏丰富的管理经验，为该客户实现了大模型高精度+高一致率的标注结果。目前该客户大模型的业务量已经跻身澳鹏（中国）前三，成为重要的业务支柱。</p> 
<p>在下一个5年到来之际，澳鹏（中国）又站在了一个新的起点。未来5年，在大模型的持续影响和应用需求激增下，全社会全面进入AI规模化应用阶段，相关数据标注的需求也呈现爆发式增长。面对下一波AI浪潮，澳鹏（中国）已经做好了充分的准备。</p> 
<p>首先，澳鹏（中国）将持续投入两大平台的研发，不断提高产品力，从而提升产品在整个营收中的占比。在数据标注服务外，客户对于数据处理平台、数据处理工具和数据处理算法有大量需求。为此，澳鹏（中国）投入产品研发，打造可商业化的数据标注平台、多模态数据标注工具、成品数据库产品以及覆盖数据采集、数据清洗、数据脱敏、数据挖掘等不同阶段的自动化算法产品，为客户提供全面的产品矩阵。</p> 
<p>澳鹏（中国）的团队与客户团队一起，共同探讨算法研发的思路和数据标注工具的产品设计。澳鹏（中国）团队每天都在为客户定制化需求而研发，这些需求可能是为了客户算法工程师的一个新思路而实现一个特殊的数据标注功能以标注特定的数据特征，也可能是为了让客户更好更快地验收数据标注结果而开发更便捷、可视化功能和数据准确率看板。所有这些新算法、新功能、新工具都汇入澳鹏（中国）的两大平台，惠及更多客户。</p> 
<p>其次，澳鹏（中国）将继续开拓大模型和中国企业出海两大市场。在大模型市场，科技企业对于AI/LLM的研发投入巨大，迫切需要具有的高质量训练数据交付能力的公司，帮助更好、更快地处理模型训练数据，而澳鹏（中国）已经构建了强大的竞争力。</p> 
<p>在中国企业出海市场，企业出海首先面对的就是语言和全球资源的挑战，澳鹏在全球170多个国家拥有290多种语言的资源，同时在菲律宾、越南、美国等地区拥有大型交付中心，这是澳鹏在行业内独一无二的优势，可以很好地支持国内企业出海拓展海外市场业务。</p> 
<p>第三，针对AI技术深入行业应用带来的长期需求，包括代码、医疗、教育、金融、工业、汽车等行业，澳鹏（中国）已经储备了超过1500人的高学历专业人士，而且还在无锡、大连、重庆等多地的交付基地同时招聘招募专业人员，从而打造全国性的专业资源能力池。</p> 
<p>艾瑞咨询预计到2028年，中国AI基础数据服务市场规模将达170亿元，未来五年的复合增长率为30.4%。澳鹏Appen全球高级副总裁、大中华及北亚区总经理田小鹏博士表示，有信心在5年后实现12亿人民币的年营收，以至少27.8%+的高速复合增长率，成为中国及亚洲区AI数据专业服务行业的领军服务商。</p> 
<p>其中，产品和服务两条线更均衡发展，产品项目的占比将从2024年的4%至少提升到2029年的12%；进一步加速开拓亚洲市场，占比将从 2024年10%至少提升到2029年15%，澳鹏中国5 年后将完成亚洲、欧洲、非洲、中东、南美、北美等地所有AI数据服务的全覆盖。</p> 
<p>展望5年后乃至更长远的未来，田小鹏认为广阔天地在于突破AI数据标注服务窄领域，进入AI数据服务宽领域，即：AI数据服务将会有更广泛行业的覆盖拓展；AI 数据类型将向多模态、垂类细分颗粒度等演变；AI 数据产品将更国际化、全球化、多语言覆盖。例如：大模型就将AI数据服务推进到了人工反馈算法迭代服务和模型评估服务，今后随着AI技术的持续发展或将出现新的AI模型，相应带来新的AI数据服务需求，这为澳鹏（中国）基业长青奠定了信心。</p> 
<p>回顾过去5年走过的路，田小鹏笑说如果再来一遍，肯定不会选择创业这条道路。因为在一个市场的初级阶段搏杀，再叠加全球三年疫情这样极具挑战的公共事件，即便是老兵创业也是每日如履薄冰。</p> 
<p>5年前创业之初，澳鹏（中国）从零起步，没有客户、没有产品、没有流程、没有团队、只有投资和勇气；5年后，澳鹏（中国）已经有两大产品平台、3000+员工、3000+BPO合作伙伴、近百万众包资源、6大服务交付基地、完整的组织、流程与管理以及350+家优质客户……</p> 
<p>闯过了前面的险滩，后面就是奔腾不息的大江大河。面向下一个5年，田小鹏说&quot;澳鹏（中国）并不完美，但一直在追求完美的道路上。在&nbsp;AI&nbsp;的未来浪潮中，在AI数据主航道上我们将勇往直前。澳鹏（中国）愿做客户在&nbsp;AI成功的幕后英雄和铺路石，成就客户是我们永远不变的初心！&quot;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏Appen（中国）精彩亮相2024世界人工智能大会（WAIC2024）</title>
		<author></author>
		<pubDate>2024-07-10 17:02:00</pubDate>
		<description><![CDATA[上海2024年7月10日 /美通社/ -- 
7月7日，由外交部、国家发展改革委、教育部、科技部、工业和信息化部、国家网信办、中国科学院、中国科协和上海市政府共同主办的2024世界人工智能大会（WAIC 
2024）盛大收官。作为中国和全球人工智能前沿技术的重要展示平台，WAIC 
2024融汇全球人工智能领域前沿思想，链接全球科技创新生态，持续探索人工智能发展新机遇并推动成果落地。


高质量的训练数据始终是人工智能产业链上的重要一环。自2019年始，澳鹏Appen（中国）已连续6届参与这一人工智能产业盛会，与产业链各环节领袖共商人工智能领域前沿技术、产业动向、向善治理。今年，澳鹏Appen（中国）很荣幸携技术驱动的双平台再次重磅亮相本次大会，展示如何以专业、精准、安全的高质量训练数据赋能AI+，助力各行业、各领域AI模型的高效开发和落地。

 <https://mma.prnasia.com/media2/2458070/image_5014143_31161293.html>
WAIC2024 澳鹏展台前人头攒动

澳鹏大模型智能开发平台


澳鹏大模型智能开发平台支持大模型定制开发的全流程需求，集大模型数据准备、训练、推理、部署应用于一体，提供数据管理、模型调优、模型评估、模型管理等全栈产品，赋能医疗、金融、教育、代码、法律等多垂直领域的大模型部署，助力企业轻松拥抱大模型。

 <https://mma.prnasia.com/media2/2458071/image_5014143_31161418.html>
澳鹏大模型智能开发平台支持大模型定制开发的全流程需求


作为大模型产业链的基础环节，澳鹏Appen（中国）支持全栈式大模型数据服务，包括数据集、模型评估、模型调优、标注工具/训练平台部署、领域专家服务等；同时，平台集成的全套标注工具，如大模型智能体标注、多模态数据标注、基于LLM的自动标注能力等，紧跟市场技术前沿，是快速部署大模型应用的利器。

 <https://mma.prnasia.com/media2/2458072/image_5014143_31161514.html>
澳鹏Appen（中国）支持全栈式大模型数据服务，包括数据集、模型评估、模型调优、标注工具/训练平台部署等


澳鹏提供700+个成品数据集，其中包括五万余小时ASR语音数据，一百六十万余张图片，81亿token、千万词条的大语言模型相关文本数据集。澳鹏多模态、多领域、多场景的丰富数据集可高效支持各类模型的各阶段训练。

澳鹏MatrixGo®高精度数据标注平台


持续优化数据精度是人工智能算法提升的关键。澳鹏MatrixGo®平台集成强大的标注工具箱和灵活、可视的工作流，具备多样化的平台部署方式和精细化的人力资源管理。AI行业领军者正在通过MatrixGo®平台强大的标注工具，大幅提升非结构化数据处理能力，赋能全球创新性AI项目部署。

 <https://mma.prnasia.com/media2/2458073/image_5014143_31161605.html>
澳鹏MatrixGo®高精度数据标注平台，大幅提升非结构化数据处理能力

澳鹏MatrixGo®平台自动化数据标注回环，具备场景筛选 + 
数据挖掘能力，为下游提供高质量预标注结果；通过引入交互式智能标注工具，人机协同提高标注效率；可自定义的自动化质检，实时反馈异常标注数据；动态迭代的模型推理能力，不断提升自动识别准确率，真正做到"以AI赋能AI"。

 <https://mma.prnasia.com/media2/2458074/image_5014143_31161702.html>
澳鹏MatrixGo®平台自动化数据标注回环


除了技术水平之外，澳鹏全球化的数据采集能力和多场景、定制化的数据标注服务是客户满意度的保障。澳鹏支持全数据类型的标注，包括大模型、图像视频、3D、语音、文本及内容相关性的标注；在全球范围拥有290+语言资源及100万+众包团队，澳鹏全球化的数据定制采集服务为AI部署提供数据保障。


数据，铸就非凡差异。一直以来，澳鹏Appen（中国）始终致力于以高质量的数据服务及持续不断的技术研发为全球领先人工智能的部署提供动力源泉。澳鹏Appen全球高级副总裁、大中国区及北亚区总经理田小鹏博士表示，"未来，澳鹏将持续以不断迭代的端到端数据平台、灵活高效的数据服务以及深厚的细分领域专业知识，铸就全球非凡的人工智能应用开发和落地，打造专业、精准、安全的高质量数据基石。"

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2024年7月10日</span> /美通社/ -- 7月7日，由外交部、国家发展改革委、教育部、科技部、工业和信息化部、国家网信办、中国科学院、中国科协和上海市政府共同主办的2024世界人工智能大会（WAIC 2024）盛大收官。作为中国和全球人工智能前沿技术的重要展示平台，WAIC 2024融汇全球人工智能领域前沿思想，链接全球科技创新生态，持续探索人工智能发展新机遇并推动成果落地。</p> 
<p>高质量的训练数据始终是人工智能产业链上的重要一环。自2019年始，澳鹏Appen（中国）已连续6届参与这一人工智能产业盛会，与产业链各环节领袖共商人工智能领域前沿技术、产业动向、向善治理。今年，澳鹏Appen（中国）很荣幸携技术驱动的双平台再次重磅亮相本次大会，展示如何以专业、精准、安全的高质量训练数据赋能AI+，助力各行业、各领域AI模型的高效开发和落地。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6287"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2458070/image_5014143_31161293.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2458070/image_5014143_31161293.jpg?p=medium600" title="WAIC2024 澳鹏展台前人头攒动" alt="WAIC2024 澳鹏展台前人头攒动" /></a><br /><span>WAIC2024 澳鹏展台前人头攒动</span></p> 
</div> 
<p><b>澳鹏大模型智能开发平台</b></p> 
<p>澳鹏大模型智能开发平台支持大模型定制开发的全流程需求，集大模型数据准备、训练、推理、部署应用于一体，提供数据管理、模型调优、模型评估、模型管理等全栈产品，赋能医疗、金融、教育、代码、法律等多垂直领域的大模型部署，助力企业轻松拥抱大模型。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder1895"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2458071/image_5014143_31161418.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2458071/image_5014143_31161418.jpg?p=medium600" title="澳鹏大模型智能开发平台支持大模型定制开发的全流程需求" alt="澳鹏大模型智能开发平台支持大模型定制开发的全流程需求" /></a><br /><span>澳鹏大模型智能开发平台支持大模型定制开发的全流程需求</span></p> 
</div> 
<p>作为大模型产业链的基础环节，澳鹏Appen（中国）支持全栈式大模型数据服务，包括数据集、模型评估、模型调优、标注工具/训练平台部署、领域专家服务等；同时，平台集成的全套标注工具，如大模型智能体标注、多模态数据标注、基于LLM的自动标注能力等，紧跟市场技术前沿，是快速部署大模型应用的利器。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9190"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2458072/image_5014143_31161514.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2458072/image_5014143_31161514.jpg?p=medium600" title="澳鹏Appen（中国）支持全栈式大模型数据服务，包括数据集、模型评估、模型调优、标注工具/训练平台部署等" alt="澳鹏Appen（中国）支持全栈式大模型数据服务，包括数据集、模型评估、模型调优、标注工具/训练平台部署等" /></a><br /><span>澳鹏Appen（中国）支持全栈式大模型数据服务，包括数据集、模型评估、模型调优、标注工具/训练平台部署等</span></p> 
</div> 
<p>澳鹏提供700+个成品数据集，其中包括五万余小时ASR语音数据，一百六十万余张图片，81亿token、千万词条的大语言模型相关文本数据集。澳鹏多模态、多领域、多场景的丰富数据集可高效支持各类模型的各阶段训练。</p> 
<p><b>澳鹏</b><b>MatrixGo&reg;</b><b>高精度数据标注平台</b></p> 
<p>持续优化数据精度是人工智能算法提升的关键。澳鹏MatrixGo&reg;平台集成强大的标注工具箱和灵活、可视的工作流，具备多样化的平台部署方式和精细化的人力资源管理。AI行业领军者正在通过MatrixGo&reg;平台强大的标注工具，大幅提升非结构化数据处理能力，赋能全球创新性AI项目部署。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder4965"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2458073/image_5014143_31161605.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2458073/image_5014143_31161605.jpg?p=medium600" title="澳鹏MatrixGo&reg;高精度数据标注平台，大幅提升非结构化数据处理能力" alt="澳鹏MatrixGo&reg;高精度数据标注平台，大幅提升非结构化数据处理能力" /></a><br /><span>澳鹏MatrixGo&reg;高精度数据标注平台，大幅提升非结构化数据处理能力</span></p> 
</div> 
<p>澳鹏MatrixGo&reg;平台自动化数据标注回环，具备场景筛选 + 数据挖掘能力，为下游提供高质量预标注结果；通过引入交互式智能标注工具，人机协同提高标注效率；可自定义的自动化质检，实时反馈异常标注数据；动态迭代的模型推理能力，不断提升自动识别准确率，真正做到&quot;以AI赋能AI&quot;。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder8233"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2458074/image_5014143_31161702.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2458074/image_5014143_31161702.jpg?p=medium600" title="澳鹏MatrixGo&reg;平台自动化数据标注回环" alt="澳鹏MatrixGo&reg;平台自动化数据标注回环" /></a><br /><span>澳鹏MatrixGo&reg;平台自动化数据标注回环</span></p> 
</div> 
<p>除了技术水平之外，澳鹏全球化的数据采集能力和多场景、定制化的数据标注服务是客户满意度的保障。澳鹏支持全数据类型的标注，包括大模型、图像视频、3D、语音、文本及内容相关性的标注；在全球范围拥有290+语言资源及100万+众包团队，澳鹏全球化的数据定制采集服务为AI部署提供数据保障。</p> 
<p>数据，铸就非凡差异。一直以来，澳鹏Appen（中国）始终致力于以高质量的数据服务及持续不断的技术研发为全球领先人工智能的部署提供动力源泉。澳鹏Appen全球高级副总裁、大中国区及北亚区总经理田小鹏博士表示，&quot;未来，澳鹏将持续以不断迭代的端到端数据平台、灵活高效的数据服务以及深厚的细分领域专业知识，铸就全球非凡的人工智能应用开发和落地，打造专业、精准、安全的高质量数据基石。&quot;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏入选亿欧大模型基础层图谱，以优质数据赋能AGI智能涌现</title>
		<author></author>
		<pubDate>2024-05-27 13:10:00</pubDate>
		<description><![CDATA[上海2024年5月27日 /美通社/ -- 
自ChatGPT的发布引发全球范围内对大模型的广泛关注以来，目前，国内公布的大模型数量已超过300个，行业呈现出"百模大战"的竞争格局。在此背景下，亿欧近日发布《2024中国"百模大战"竞争格局分析报告》，全方位呈现大模型产业现状。作为产业链上的重要一环，澳鹏Appen凭借高质量的大模型数据能力入选大模型基础层图谱。与此同时，作为大模型数据领域的代表案例，本次报告还分析了澳鹏如何成功助力全球15,000+个AI项目的研发及商业化，赋能AGI智能涌现。

 <https://mma.prnasia.com/media2/2422336/image_5014143_14655249.html>
澳鹏Appen凭借高质量的大模型数据能力入选大模型基础层图谱


随着"数据二十条"等一系列政策措施相继出台，数据要素市场的探索与发展已步入高速增长阶段。据亿欧预计，2025年数据要素市场规模可达1990亿元，年复合增长率可达25%。尤其是在人工智能快速迭代、大模型与数据相得益彰的发展态势中，数据要素的战略地位进一步凸显。


澳鹏（中国）自主研发的大模型智能开发平台集大模型数据准备、训练、推理、部署应用于一体，支持从数据集管理、数据标注、模型评估、模型调优、训练平台部署及标注工具部署等大模型定制开发的全流程需求，助力企业轻松拥抱大模型。

 <https://mma.prnasia.com/media2/2422337/image_5014143_14655574.html>
澳鹏（中国）自主研发的大模型智能开发平台


澳鹏大模型智能开发平台涵盖三大核心技术：自研的预标注模型、交互式分割模型及算法赋能的文档智能。首先，澳鹏通过海量图像、点云等数据，结合丰富的实际项目经验，预训练了车辆行驶、交通灯、停车位、人像识别等多场景预标注模型，可实现2D 
3D联合拉框、视频连续帧mask追踪等全方位的预识别结果输出，大幅提高后续标注效率。

 <https://mma.prnasia.com/media2/2422338/image_5014143_14655730.html>
澳鹏自研预标注模型


为适应2D图像标注中多样化的物体类别分割与检测，澳鹏结合丰富的图像数据训练了交互式分割模型并内嵌于标注工具中。仅需通过点击的方式标记正确区域并纠正输出结果，即可完成物体识别；再结合连续帧信息引入，大幅提升2D图像标注效率。模型支持微调训练，可适应定制化的场景需求。

 <https://mma.prnasia.com/media2/2422339/image_5014143_14656123.html>
澳鹏交互式分割模型


为解决各类场景下的文档信息转化提取难题，澳鹏基于海量文档数据预训练了智能文档处理模型。支持输入图片或PDF格式文档，对带阴影图片、倾斜图片、手写表格、各类学科公式等多类信息进行识别，并转化成word文档输出，便于人工编辑校对。

 <https://mma.prnasia.com/media2/2422340/image_5014143_14656355.html>
澳鹏Appen算法赋能的文档智能


随着大模型技术的演进，其赋能千行百业的能力不断提升。在数据集方面，澳鹏LLM数据库覆盖教育、法律、医疗、金融、百科等众多热门垂直领域，提供超过290种语言和方言的文本、语音数据库，并创建了一系列大模型专用数据集，如：百科类人工泛化文本问答数据集，知识类百科文本语料对数据库，58亿图文对数据库等等。澳鹏提供JSON格式的多学科题目，并拥有20万余条各种不同类型的高质量指令集文本及法律医疗百科类文本，通过多重质检环节严格把关数据质量，助力通用大模型和各种细分垂类大模型的训练和落地。


澳鹏Appen全球高级副总裁、大中华区及北亚区总经理田小鹏博士表示："数据是决定机器学习模型性能的三大要素之一。随着各类大模型的智能涌现，数据，尤其是高质量的行业数据，正在成为决定大模型高速发展的关键因素。澳鹏自研的算法模型和核心技术，以及一系列大模型数据集，充分给予AI应用优质的数据养料，为大规模的大模型场景落地提供支持。"

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2024年5月27日</span> /美通社/ -- 自ChatGPT的发布引发全球范围内对大模型的广泛关注以来，目前，国内公布的大模型数量已超过300个，行业呈现出&quot;百模大战&quot;的竞争格局。在此背景下，亿欧近日发布《2024中国&quot;百模大战&quot;竞争格局分析报告》，全方位呈现大模型产业现状。作为产业链上的重要一环，澳鹏Appen凭借高质量的大模型数据能力入选大模型基础层图谱。与此同时，作为大模型数据领域的代表案例，本次报告还分析了澳鹏如何成功助力全球15,000+个AI项目的研发及商业化，赋能AGI智能涌现。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder1283"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2422336/image_5014143_14655249.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2422336/image_5014143_14655249.jpg?p=medium600" title="澳鹏Appen凭借高质量的大模型数据能力入选大模型基础层图谱" alt="澳鹏Appen凭借高质量的大模型数据能力入选大模型基础层图谱" /></a><br /><span>澳鹏Appen凭借高质量的大模型数据能力入选大模型基础层图谱</span></p> 
</div> 
<p>随着&quot;数据二十条&quot;等一系列政策措施相继出台，数据要素市场的探索与发展已步入高速增长阶段。据亿欧预计，2025年数据要素市场规模可达1990亿元，年复合增长率可达25%。尤其是在人工智能快速迭代、大模型与数据相得益彰的发展态势中，数据要素的战略地位进一步凸显。</p> 
<p>澳鹏（中国）自主研发的大模型智能开发平台集大模型数据准备、训练、推理、部署应用于一体，支持从数据集管理、数据标注、模型评估、模型调优、训练平台部署及标注工具部署等大模型定制开发的全流程需求，助力企业轻松拥抱大模型。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6913"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2422337/image_5014143_14655574.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2422337/image_5014143_14655574.jpg?p=medium600" title="澳鹏（中国）自主研发的大模型智能开发平台" alt="澳鹏（中国）自主研发的大模型智能开发平台" /></a><br /><span>澳鹏（中国）自主研发的大模型智能开发平台</span></p> 
</div> 
<p>澳鹏大模型智能开发平台涵盖三大核心技术：自研的预标注模型、交互式分割模型及算法赋能的文档智能。首先，澳鹏通过海量图像、点云等数据，结合丰富的实际项目经验，预训练了车辆行驶、交通灯、停车位、人像识别等多场景预标注模型，可实现2D 3D联合拉框、视频连续帧mask追踪等全方位的预识别结果输出，大幅提高后续标注效率。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder8981"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2422338/image_5014143_14655730.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2422338/image_5014143_14655730.jpg?p=medium600" title="澳鹏自研预标注模型" alt="澳鹏自研预标注模型" /></a><br /><span>澳鹏自研预标注模型</span></p> 
</div> 
<p>为适应2D图像标注中多样化的物体类别分割与检测，澳鹏结合丰富的图像数据训练了交互式分割模型并内嵌于标注工具中。仅需通过点击的方式标记正确区域并纠正输出结果，即可完成物体识别；再结合连续帧信息引入，大幅提升2D图像标注效率。模型支持微调训练，可适应定制化的场景需求。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder8575"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2422339/image_5014143_14656123.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2422339/image_5014143_14656123.jpg?p=medium600" title="澳鹏交互式分割模型" alt="澳鹏交互式分割模型" /></a><br /><span>澳鹏交互式分割模型</span></p> 
</div> 
<p>为解决各类场景下的文档信息转化提取难题，澳鹏基于海量文档数据预训练了智能文档处理模型。支持输入图片或PDF格式文档，对带阴影图片、倾斜图片、手写表格、各类学科公式等多类信息进行识别，并转化成word文档输出，便于人工编辑校对。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder4897"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2422340/image_5014143_14656355.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2422340/image_5014143_14656355.jpg?p=medium600" title="澳鹏Appen算法赋能的文档智能" alt="澳鹏Appen算法赋能的文档智能" /></a><br /><span>澳鹏Appen算法赋能的文档智能</span></p> 
</div> 
<p>随着大模型技术的演进，其赋能千行百业的能力不断提升。在数据集方面，澳鹏LLM数据库覆盖教育、法律、医疗、金融、百科等众多热门垂直领域，提供超过290种语言和方言的文本、语音数据库，并创建了一系列大模型专用数据集，如：百科类人工泛化文本问答数据集，知识类百科文本语料对数据库，58亿图文对数据库等等。澳鹏提供JSON格式的多学科题目，并拥有20万余条各种不同类型的高质量指令集文本及法律医疗百科类文本，通过多重质检环节严格把关数据质量，助力通用大模型和各种细分垂类大模型的训练和落地。</p> 
<p>澳鹏Appen全球高级副总裁、大中华区及北亚区总经理田小鹏博士表示：&quot;数据是决定机器学习模型性能的三大要素之一。随着各类大模型的智能涌现，数据，尤其是高质量的行业数据，正在成为决定大模型高速发展的关键因素。澳鹏自研的算法模型和核心技术，以及一系列大模型数据集，充分给予AI应用优质的数据养料，为大规模的大模型场景落地提供支持。&quot;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏Appen精彩亮相第89届中国国际医疗器械博览会（CMEF）</title>
		<author></author>
		<pubDate>2024-04-16 13:29:00</pubDate>
		<description><![CDATA[上海2024年4月16日 /美通社/ -- 
4月14日，为期四天的第89届中国国际医疗器械博览会（CMEF）盛大收官。澳鹏Appen很荣幸再次作为唯一的人工智能训练数据参展商参与此次"航母级"规模医疗产业盛会，展示如何以专业、精准、安全的高质量训练数据赋能AI医疗，助力提升医疗大模型算法精度，让公众享受更精准、更智能、更高品质的智慧医疗服务。

 <https://mma.prnasia.com/media2/2388130/image_1.html>
澳鹏Appen再次作为唯一的人工智能训练数据参展商参与此次"航母级"规模医疗产业盛会


在医疗领域，大模型的智慧生态正在逐步建立。由于学科门槛和专业要求的限制，医疗大数据平台模型往往具有高要求的数据训练标准。对专业和理论化的内容进行整理、审核、分类、排序，获得大规模、高质量的数据集，需要一定数量具备专业医学知识背景的从医人员完成。


在国内，拥有专业医学管理团队和具规模的专业医学标注人员的公司非常少。零散的训练量始终达不到模型训练所需的数据要求。澳鹏Appen医疗团队充分利用自身的专业知识和及时的权威资料学习更新，为医疗大模型部署提供了高效、大规模的数据训练养料。


澳鹏Appen拥有一支专业的医学标注团队，由具有执业医师资格、医学项目经验丰富的医学项目管理者组成；拥有多学科、近百位三甲级医院主治及以上职称医师作为专家顾问，近百人医学专业多学科的全职质检团队，以及近千人的医学资源池；涵盖700w+医学文本数据，8w+医学图像数据，以及中英等多语种医学数据。


澳鹏Appen医疗团队提供专业知识、资源和创新型解决方案。针对医学大模型训练，澳鹏Appen提供专业的医学审核、改写、排序、打分；并转换成自然语言。保障多医疗场景（医患问答、执业考试等）下的专业严谨性和医学逻辑性。

同时，澳鹏团队基于开源通用大语言模型，利用指令精调/指令微调（P-Tuning 
v2）技术，训练开发了澳鹏版本的中文医疗大模型。澳鹏医疗大模型在保留基座模型通用知识能力的基础上，在医疗垂直领域进行优化加强，覆盖医疗咨询、医学问答、导诊、预问诊、检查建议、用药建议等常见实用的医疗场景。


除了医学大模型数据训练，澳鹏还提供医学影像学（放射）图像标注服务。例如，在AI预测的基础上，进行肺部CT数据的医学后处理，纠正标签判断错误，增加未检出病灶，提高数据的病灶检出率并降低假阳率；对于MRA头部血管数据，在AI预测的脑动脉、静脉、微小血管基础上修改AI识别的错误，要求分割精度不低于2个马赛克位点等等。


在临床医学、病理学和心电图图像方面，澳鹏同样能够提供高质量的标注服务。例如，对胃镜图像中的病灶选择对应标签并沿边缘进行分割，保证图像内病灶标注的完整和精准；对胃部组织进行拉框选择ROI，并针对ROI内目标细胞（如慢性胃炎）进行精准的标注；在AI预测的基础上，进行心电图数据的医学后处理，纠正AI预测的错误，添加AI未检出异常等等。


对于医学内容审核和编辑，澳鹏团队针对医学文本、图像、视频等形式中的内容，根据相关规则进行专业审核，纠正文中的医学科学性、医学逻辑、医学名词不准确等错误；同样地，团队能够对医学文本的内容根据相关规则进行专业的编辑，对文中的相关名词做出专业的解释、分类、打标签等。

澳鹏智慧医疗数据是经HIPAA认证的高安全性解决方案，安全设备、现场服务、安全众包模型和技术解决方案亦获得ISO 27001，ISO 9001和ISO 
27701认证，确保智能时代医疗数据的合法、合规、安全。未来，澳鹏Appen将持续以高质量训练数据赋能AI提高诊断和治疗的效率、帮助改善医疗从业者的体验，为更多病人提供更快、更好的服务，助力智慧医疗新生态建立。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2024年4月16日</span> /美通社/ -- 4月14日，为期四天的第89届中国国际医疗器械博览会（CMEF）盛大收官。澳鹏Appen很荣幸再次作为唯一的人工智能训练数据参展商参与此次&quot;航母级&quot;规模医疗产业盛会，展示如何以专业、精准、安全的高质量训练数据赋能AI医疗，助力提升医疗大模型算法精度，让公众享受更精准、更智能、更高品质的智慧医疗服务。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9639"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2388130/image_1.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2388130/image_1.jpg?p=medium600" title="澳鹏Appen再次作为唯一的人工智能训练数据参展商参与此次&quot;航母级&quot;规模医疗产业盛会" alt="澳鹏Appen再次作为唯一的人工智能训练数据参展商参与此次&quot;航母级&quot;规模医疗产业盛会" /></a><br /><span>澳鹏Appen再次作为唯一的人工智能训练数据参展商参与此次&quot;航母级&quot;规模医疗产业盛会</span></p> 
</div> 
<p>在医疗领域，大模型的智慧生态正在逐步建立。由于学科门槛和专业要求的限制，医疗大数据平台模型往往具有高要求的数据训练标准。对专业和理论化的内容进行整理、审核、分类、排序，获得大规模、高质量的数据集，需要一定数量具备专业医学知识背景的从医人员完成。</p> 
<p>在国内，拥有专业医学管理团队和具规模的专业医学标注人员的公司非常少。零散的训练量始终达不到模型训练所需的数据要求。澳鹏Appen医疗团队充分利用自身的专业知识和及时的权威资料学习更新，为医疗大模型部署提供了高效、大规模的数据训练养料。</p> 
<p>澳鹏Appen拥有一支专业的医学标注团队，由具有执业医师资格、医学项目经验丰富的医学项目管理者组成；拥有多学科、近百位三甲级医院主治及以上职称医师作为专家顾问，近百人医学专业多学科的全职质检团队，以及近千人的医学资源池；涵盖700w+医学文本数据，8w+医学图像数据，以及中英等多语种医学数据。</p> 
<p>澳鹏Appen医疗团队提供专业知识、资源和创新型解决方案。针对医学大模型训练，澳鹏Appen提供专业的医学审核、改写、排序、打分；并转换成自然语言。保障多医疗场景（医患问答、执业考试等）下的专业严谨性和医学逻辑性。</p> 
<p>同时，澳鹏团队基于开源通用大语言模型，利用指令精调/指令微调（P-Tuning v2）技术，训练开发了澳鹏版本的中文医疗大模型。澳鹏医疗大模型在保留基座模型通用知识能力的基础上，在医疗垂直领域进行优化加强，覆盖医疗咨询、医学问答、导诊、预问诊、检查建议、用药建议等常见实用的医疗场景。</p> 
<p>除了医学大模型数据训练，澳鹏还提供医学影像学（放射）图像标注服务。例如，在AI预测的基础上，进行肺部CT数据的医学后处理，纠正标签判断错误，增加未检出病灶，提高数据的病灶检出率并降低假阳率；对于MRA头部血管数据，在AI预测的脑动脉、静脉、微小血管基础上修改AI识别的错误，要求分割精度不低于2个马赛克位点等等。</p> 
<p>在临床医学、病理学和心电图图像方面，澳鹏同样能够提供高质量的标注服务。例如，对胃镜图像中的病灶选择对应标签并沿边缘进行分割，保证图像内病灶标注的完整和精准；对胃部组织进行拉框选择ROI，并针对ROI内目标细胞（如慢性胃炎）进行精准的标注；在AI预测的基础上，进行心电图数据的医学后处理，纠正AI预测的错误，添加AI未检出异常等等。</p> 
<p>对于医学内容审核和编辑，澳鹏团队针对医学文本、图像、视频等形式中的内容，根据相关规则进行专业审核，纠正文中的医学科学性、医学逻辑、医学名词不准确等错误；同样地，团队能够对医学文本的内容根据相关规则进行专业的编辑，对文中的相关名词做出专业的解释、分类、打标签等。</p> 
<p>澳鹏智慧医疗数据是经HIPAA认证的高安全性解决方案，安全设备、现场服务、安全众包模型和技术解决方案亦获得ISO 27001，ISO 9001和ISO 27701认证，确保智能时代医疗数据的合法、合规、安全。未来，澳鹏Appen将持续以高质量训练数据赋能AI提高诊断和治疗的效率、帮助改善医疗从业者的体验，为更多病人提供更快、更好的服务，助力智慧医疗新生态建立。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏一站式文档智能识别，为大模型训练数据准备赋能</title>
		<author></author>
		<pubDate>2023-12-14 19:06:00</pubDate>
		<description><![CDATA[上海2023年12月14日 /美通社/ -- 
在大模型训练过程中，许多专业领域知识是基于书籍等纸质文档的形式记录的，常见于教材、期刊论文、特定学科研究等。例如工业、教育等涉及到专业领域的行业应用，大量需要训练的数据沉淀在纸质版上亟待利用。


澳鹏Appen全新推出文档智能识别接口，可将图片、不可编辑的PDF等文档一键识别转换成可编辑的Word或Markdown格式，方便对其中数据作进一步利用。接口支持识别文档中不同模态的数据，如文本、插图、公式、表格等，并支持对不同版面进行识别和还原。

 <https://mma.prnasia.com/media2/2301060/image_5014143_35189835.html>
澳鹏全新推出一站式文档智能识别解决方案，为大模型训练数据准备赋能


在大模型的训练过程中，许多企业或行业数据沉淀在不可编辑的PDF、甚至是纸质文档中。若要将这些数据利用起来，无论是用作基础大模型的训练数据，还是用于RAG或微调，都需要先转化成可编辑的文档格式。


这些文档包含的内容有文本、表格、公式、插图等内容，现有的内容识别技术大多只能识别文字，而对其他形态的内容无法进行识别和转换。若要开发一个能识别所有格式内容的算法，其研发成本往往较高，识别速度和准确率亦无法得以保证。


澳鹏一站式文档智能识别解决方案集成了多种算法能力：首先使用版面识别算法，可识别出PDF中每一页的内容类型，包括文本、表格、公式、插图等；如页面中包含多种内容，则将每个独立的内容块截取出来；再根据内容块的内容类型，调用不同的识别算法，包括文本识别算法、表格识别算法、公式识别算法等。

识别完成后再将内容拼接到一个文档中，可还原成原始版面。同时，澳鹏也提供人工复核服务，进一步提升识别准确率。

在实际应用中，澳鹏一站式文档智能识别解决方案的优势主要包括：

-高效率低成本：使用澳鹏文档智能识别处理文档时，一个上百页的PDF只需耗时数分钟即可完成，远快于人工转写；可批量处理大量文件，降低人力成本。

-高安全性：无需企业外部人员参与文档内容转写过程，降低了敏感数据泄露的风险。

-易于集成：澳鹏文档智能识别方案可与企业现有的业务流程和系统集成，自动输入、输出数据。


助力高科技企业开发行业大模型，澳鹏一站式文档智能识别解决方案能够对专业细分学科数据进行结构化处理，将沉淀在纸质版、PDF等形态的数据应用于大模型训练中，帮助企业自动化地将各种类型的文档转化为结构化数据，为高效训练行业大模型赋能。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2023年12月14日</span> /美通社/ -- 在大模型训练过程中，许多专业领域知识是基于书籍等纸质文档的形式记录的，常见于教材、期刊论文、特定学科研究等。例如工业、教育等涉及到专业领域的行业应用，大量需要训练的数据沉淀在纸质版上亟待利用。</p> 
<p>澳鹏Appen全新推出文档智能识别接口，可将图片、不可编辑的PDF等文档一键识别转换成可编辑的Word或Markdown格式，方便对其中数据作进一步利用。接口支持识别文档中不同模态的数据，如文本、插图、公式、表格等，并支持对不同版面进行识别和还原。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9164"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2301060/image_5014143_35189835.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2301060/image_5014143_35189835.jpg?p=medium600" title="澳鹏全新推出一站式文档智能识别解决方案，为大模型训练数据准备赋能" alt="澳鹏全新推出一站式文档智能识别解决方案，为大模型训练数据准备赋能" /></a><br /><span>澳鹏全新推出一站式文档智能识别解决方案，为大模型训练数据准备赋能</span></p> 
</div> 
<p>在大模型的训练过程中，许多企业或行业数据沉淀在不可编辑的PDF、甚至是纸质文档中。若要将这些数据利用起来，无论是用作基础大模型的训练数据，还是用于RAG或微调，都需要先转化成可编辑的文档格式。</p> 
<p>这些文档包含的内容有文本、表格、公式、插图等内容，现有的内容识别技术大多只能识别文字，而对其他形态的内容无法进行识别和转换。若要开发一个能识别所有格式内容的算法，其研发成本往往较高，识别速度和准确率亦无法得以保证。</p> 
<p>澳鹏一站式文档智能识别解决方案集成了多种算法能力：首先使用版面识别算法，可识别出PDF中每一页的内容类型，包括文本、表格、公式、插图等；如页面中包含多种内容，则将每个独立的内容块截取出来；再根据内容块的内容类型，调用不同的识别算法，包括文本识别算法、表格识别算法、公式识别算法等。</p> 
<p>识别完成后再将内容拼接到一个文档中，可还原成原始版面。同时，澳鹏也提供人工复核服务，进一步提升识别准确率。</p> 
<p>在实际应用中，澳鹏一站式文档智能识别解决方案的优势主要包括：</p> 
<p>-高效率低成本：使用澳鹏文档智能识别处理文档时，一个上百页的PDF只需耗时数分钟即可完成，远快于人工转写；可批量处理大量文件，降低人力成本。</p> 
<p>-高安全性：无需企业外部人员参与文档内容转写过程，降低了敏感数据泄露的风险。</p> 
<p>-易于集成：澳鹏文档智能识别方案可与企业现有的业务流程和系统集成，自动输入、输出数据。</p> 
<p>助力高科技企业开发行业大模型，澳鹏一站式文档智能识别解决方案能够对专业细分学科数据进行结构化处理，将沉淀在纸质版、PDF等形态的数据应用于大模型训练中，帮助企业自动化地将各种类型的文档转化为结构化数据，为高效训练行业大模型赋能。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏中国：聚焦全新大模型智能开发平台4大优势</title>
		<author></author>
		<pubDate>2023-11-07 13:29:00</pubDate>
		<description><![CDATA[上海2023年11月7日 /美通社/ -- 在如今大模型工业化量产和工程化落地的趋势背景下，作为提供高质量数据服务的AI战略合作伙伴，澳鹏中国近期推出
自主研发的全新大模型智能开发平台，
为行业AI客户提供一站式大模型开发工具链，集成主流开源大模型，涵盖从数据集管理、数据标注、计算资源调度、模型评估、模型微调、模型部署等全栈能力。

 <https://mma.prnasia.com/media2/2267340/image_1.html>
澳鹏中国大模型智能开发平台

依托于该平台，澳鹏中国还提供大模型的数据定制和模型定制等全链路解决方案，帮助企业轻松拥抱大模型，构建高质量的生成式AI应用，为最终用户实现变革性体验。
澳鹏中国大模型智能开发平台主要包含4大优势：

第一，  数据优势


澳鹏中国大模型智能开发平台集成多模态的数据标注工具，支持文本、图像、代码、公式等多模态数据融合标注。平台具备完善的数据可视化工具，支持可视化查看数据集和数据标签。完整的数据使用闭环，提供从数据准备、数据存储、数据评估到数据使用的全链路数据闭环。成熟的标注资源管理、标注工作流功能，便于管理大规模的标注人员，并支持自定义工作流。

 <https://mma.prnasia.com/media2/2267506/image_2.html>
多模态的数据标注工具，支持文本、图像、代码、公式等多模态数据融合标注

第二，微调优势


澳鹏中国大模型智能开发平台提供多种不同的模型微调脚本，适用于各类应用场景，有助于降低开发成本；同时，有效提升模型泛化能力，对用户输入内容的理解更准确。大模型经过特定数据集的学习和训练后，可对相应场景做出更相关、优质的回答。

 <https://mma.prnasia.com/media2/2267342/image_3.html>
完善的数据可视化工具，支持可视化查看数据集和数据标签

第三，  模型评估优势


澳鹏中国大模型智能开发平台具备完善的评估流程，支持使用数据集批量触发模型生成结果，将结果一键生成为评估任务，并引入行业专家评价。平台提供了大模型评价的通用指标和数据集，并提供了第三方大模型的评估结果作为对标参照。与此同时，平台还支持对评估结果进行可视化展示。

 <https://mma.prnasia.com/media2/2267343/image_4.html>
平台支持对评估结果进行可视化展示

第四，  算力优势


澳鹏中国大模型智能开发平台支持对接不同云厂商资源，避免资源切换带来的迁移成本。全面拥抱国产化算力资源，为用户提供多元化的算力选择。同时，通过对算力资源虚拟化、集中调度等手段，提升算力利用率。

 <https://mma.prnasia.com/media2/2267344/image_5.html>
提供从数据准备、数据存储、数据评估到数据使用的全链路数据闭环


此外，在大模型项目部署服务方面，澳鹏拥有丰富的大模型相关项目经验，在各垂类领域进行了近百个实战项目打磨，帮助企业加快部署和落地进程。澳鹏高效率、高准确率的交付能力，以及高质量的人员专业素养和精益的项目管理水平，可以快速应对数据规则的多样和灵活，为项目整体的成本效益提升提供有效助力。澳鹏始终采取高标准的数据安全管理措施，多个维度上为数据安全保驾护航。


无论是刚刚开启AI部署之旅，还是加强现有的解决方案，澳鹏Appen作为值得信赖的高质量AI数据合作伙伴，始终致力于以专业的技术产品和数据服务满足各行各业的前沿部署需求。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2023年11月7日</span> /美通社/ -- 在如今大模型工业化量产和工程化落地的趋势背景下，作为提供高质量数据服务的AI战略合作伙伴，澳鹏中国<span id="spanHghltee6b">近期推出</span>自主研发的全新大模型智能开发平台<span id="spanHghlt82e6">，</span>为行业AI客户提供一站式大模型开发工具链，集成主流开源大模型，涵盖从数据集管理、数据标注、计算资源调度、模型评估、模型微调、模型部署等全栈能力。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder7592"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2267340/image_1.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2267340/image_1.jpg?p=medium600" title="澳鹏中国大模型智能开发平台" alt="澳鹏中国大模型智能开发平台" /></a><br /><span>澳鹏中国大模型智能开发平台</span></p> 
</div> 
<p>依托于该平台，澳鹏中国还提供大模型的数据定制和模型定制等全链路解决方案，帮助企业轻松拥抱大模型，构建高质量的生成式AI应用，为最终用户实现变革性体验。<b>澳鹏中国大模型智能开发平台主要包含</b><b>4</b><b>大优势：</b></p> 
<p><b>第一，&nbsp; </b><b>数据优势</b></p> 
<p>澳鹏中国大模型智能开发平台集成多模态的数据标注工具，支持文本、图像、代码、公式等多模态数据融合标注。平台具备完善的数据可视化工具，支持可视化查看数据集和数据标签。完整的数据使用闭环，提供从数据准备、数据存储、数据评估到数据使用的全链路数据闭环。成熟的标注资源管理、标注工作流功能，便于管理大规模的标注人员，并支持自定义工作流。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder8502"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2267506/image_2.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2267506/image_2.jpg?p=medium600" title="多模态的数据标注工具，支持文本、图像、代码、公式等多模态数据融合标注" alt="多模态的数据标注工具，支持文本、图像、代码、公式等多模态数据融合标注" /></a><br /><span>多模态的数据标注工具，支持文本、图像、代码、公式等多模态数据融合标注</span></p> 
</div> 
<p><b>第二，微调优势</b></p> 
<p>澳鹏中国大模型智能开发平台提供多种不同的模型微调脚本，适用于各类应用场景，有助于降低开发成本；同时，有效提升模型泛化能力，对用户输入内容的理解更准确。大模型经过特定数据集的学习和训练后，可对相应场景做出更相关、优质的回答。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder4958"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2267342/image_3.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2267342/image_3.jpg?p=medium600" title="完善的数据可视化工具，支持可视化查看数据集和数据标签" alt="完善的数据可视化工具，支持可视化查看数据集和数据标签" /></a><br /><span>完善的数据可视化工具，支持可视化查看数据集和数据标签</span></p> 
</div> 
<p><b>第三，&nbsp; </b><b>模型评估优势</b></p> 
<p>澳鹏中国大模型智能开发平台具备完善的评估流程，支持使用数据集批量触发模型生成结果，将结果一键生成为评估任务，并引入行业专家评价。平台提供了大模型评价的通用指标和数据集，并提供了第三方大模型的评估结果作为对标参照。与此同时，平台还支持对评估结果进行可视化展示。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder7722"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2267343/image_4.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2267343/image_4.jpg?p=medium600" title="平台支持对评估结果进行可视化展示" alt="平台支持对评估结果进行可视化展示" /></a><br /><span>平台支持对评估结果进行可视化展示</span></p> 
</div> 
<p><b>第四，&nbsp; </b><b>算力优势</b></p> 
<p>澳鹏中国大模型智能开发平台支持对接不同云厂商资源，避免资源切换带来的迁移成本。全面拥抱国产化算力资源，为用户提供多元化的算力选择。同时，通过对算力资源虚拟化、集中调度等手段，提升算力利用率。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder2036"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2267344/image_5.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2267344/image_5.jpg?p=medium600" title="提供从数据准备、数据存储、数据评估到数据使用的全链路数据闭环" alt="提供从数据准备、数据存储、数据评估到数据使用的全链路数据闭环" /></a><br /><span>提供从数据准备、数据存储、数据评估到数据使用的全链路数据闭环</span></p> 
</div> 
<p>此外，在大模型项目部署服务方面，澳鹏拥有丰富的大模型相关项目经验，在各垂类领域进行了近百个实战项目打磨，帮助企业加快部署和落地进程。澳鹏高效率、高准确率的交付能力，以及高质量的人员专业素养和精益的项目管理水平，可以快速应对数据规则的多样和灵活，为项目整体的成本效益提升提供有效助力。澳鹏始终采取高标准的数据安全管理措施，多个维度上为数据安全保驾护航。</p> 
<p>无论是刚刚开启AI部署之旅，还是加强现有的解决方案，澳鹏Appen作为值得信赖的高质量AI数据合作伙伴，始终致力于以专业的技术产品和数据服务满足各行各业的前沿部署需求。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏高精度AI辅助数据标注平台推出全新SaaS版本</title>
		<author></author>
		<pubDate>2023-08-01 12:35:00</pubDate>
		<description><![CDATA[上海2023年8月1日 /美通社/ 
-- 持续优化数据精度是人工智能算法提升的关键。如今，广受行业赞誉的澳鹏企业级高精度人工智能辅助数据标注平台——MatrixGo正式上线SaaS版本，以更加灵活便捷的方式，赋能全球最具创新性的人工智能项目部署。

 <https://mma.prnasia.com/media2/2165791/image_1.html>
澳鹏高精度AI辅助数据标注平台推出全新SaaS版本

行业领军者们正在通过澳鹏MatrixGo平台及其强大的标注工具，大幅提升非结构化数据处理能力。正式上线的MatrixGo SaaS版本主要包含3大优势：

第一，经验优势


澳鹏MatrixGo平台自上线以来，经历了数千个标注项目的实战打磨，累积了来自各行各业、各种类型项目丰富的实战经验。例如：某大型自动驾驶公司私有化部署MatrixGo平台，构建了对点云、图像数据的标注能力，高效提升自动驾驶算法迭代速度的同时，确保数据安全。又如：某大型人工智能公司，通过使用MatrixGo 
SaaS平台，集成了平台的Open API，以及对图像、视频、语音、文本等各种数据的标注能力，搭建了完整的人工智能数据闭环。

第二，功能优势


澳鹏MatrixGo平台集成了多种多样、极致高效的标注工具集，切实帮助提高生产效率。在更新上线的SaaS版本上，同样可以使用到这些专业多样的工具集创建高质量、精细化的数据，满足复杂的标注需求。

 <https://mma.prnasia.com/media2/2165792/image_2.html>
澳鹏MatrixGo平台集成了多种多样、极致高效的标注工具集

在MatrixGo平台的研发方面，澳鹏团队使用的是自研的AI算法，让平台最大化集成AI算法辅助，大幅提升标注效率。与此同时，通过使用平台Open 
API，开发者可以与澳鹏MatrixGo平台进行深度集成，打造数据闭环。

 <https://mma.prnasia.com/media2/2165795/image_5.html>
澳鹏MatrixGo平台智能标注示例

澳鹏MatrixGo平台工作流灵活可视，用户可以根据项目的具体需求设置数据流转方案。例如，数据流转路径灵活、项目进度尽在掌控、数据状态一览无遗，等等。

 <https://mma.prnasia.com/media2/2165793/image_3.html>
澳鹏MatrixGo平台工作流灵活可视

第三，服务优势


澳鹏MatrixGo平台SaaS版本，在尽享平台优质功能的同时，可实现最快一天内开通使用的快速部署。选择配置、免费试用、签署合同、投入生产，简单4步的服务流程即可轻松投入生产。

 <https://mma.prnasia.com/media2/2165794/image_4.html>
简单4步的服务流程即可轻松投入生产


此外，澳鹏MatrixGo平台SaaS版本还配有专业的使用培训及客服支持，更可以同步享受到MatrixGo即时更新的最新版本。低成本、高效率，澳鹏MatrixGo平台SaaS版本支持按年或按季度付费，最大化单位人力输出，提升投入产出比。

无论刚刚开启AI部署之旅，还是加强现有的解决方案，澳鹏作为值得信赖的高质量AI数据合作伙伴，始终致力于以专业的技术产品和数据服务满足各行各业的前沿部署需求。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2023年8月1日</span> /美通社/ --&nbsp;持续优化数据精度是人工智能算法提升的关键。如今，广受行业赞誉的澳鹏企业级高精度人工智能辅助数据标注平台——MatrixGo正式上线SaaS版本，以更加灵活便捷的方式，赋能全球最具创新性的人工智能项目部署。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder8286"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2165791/image_1.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2165791/image_1.jpg?p=medium600" title="澳鹏高精度AI辅助数据标注平台推出全新SaaS版本" alt="澳鹏高精度AI辅助数据标注平台推出全新SaaS版本" /></a><br /><span>澳鹏高精度AI辅助数据标注平台推出全新SaaS版本</span></p> 
</div> 
<p>行业领军者们正在通过澳鹏MatrixGo平台及其强大的标注工具，大幅提升非结构化数据处理能力。正式上线的MatrixGo SaaS版本主要包含3大优势：</p> 
<p><b>第一，经验优势</b></p> 
<p>澳鹏MatrixGo平台自上线以来，经历了数千个标注项目的实战打磨，累积了来自各行各业、各种类型项目丰富的实战经验。例如：某大型自动驾驶公司私有化部署MatrixGo平台，构建了对点云、图像数据的标注能力，高效提升自动驾驶算法迭代速度的同时，确保数据安全。又如：某大型人工智能公司，通过使用MatrixGo SaaS平台，集成了平台的Open API，以及对图像、视频、语音、文本等各种数据的标注能力，搭建了完整的人工智能数据闭环。</p> 
<p><b>第二，功能优势</b></p> 
<p>澳鹏MatrixGo平台集成了多种多样、极致高效的标注工具集，切实帮助提高生产效率。在更新上线的SaaS版本上，同样可以使用到这些专业多样的工具集创建高质量、精细化的数据，满足复杂的标注需求。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder3034"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2165792/image_2.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2165792/image_2.jpg?p=medium600" title="澳鹏MatrixGo平台集成了多种多样、极致高效的标注工具集" alt="澳鹏MatrixGo平台集成了多种多样、极致高效的标注工具集" /></a><br /><span>澳鹏MatrixGo平台集成了多种多样、极致高效的标注工具集</span></p> 
</div> 
<p>在MatrixGo平台的研发方面，澳鹏团队使用的是自研的AI算法，让平台最大化集成AI算法辅助，大幅提升标注效率。与此同时，通过使用平台Open API，开发者可以与澳鹏MatrixGo平台进行深度集成，打造数据闭环。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder5135"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2165795/image_5.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2165795/image_5.jpg?p=medium600" title="澳鹏MatrixGo平台智能标注示例" alt="澳鹏MatrixGo平台智能标注示例" /></a><br /><span>澳鹏MatrixGo平台智能标注示例</span></p> 
</div> 
<p>澳鹏MatrixGo平台工作流灵活可视，用户可以根据项目的具体需求设置数据流转方案。例如，数据流转路径灵活、项目进度尽在掌控、数据状态一览无遗，等等。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder7865"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2165793/image_3.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2165793/image_3.jpg?p=medium600" title="澳鹏MatrixGo平台工作流灵活可视" alt="澳鹏MatrixGo平台工作流灵活可视" /></a><br /><span>澳鹏MatrixGo平台工作流灵活可视</span></p> 
</div> 
<p><b>第三，服务优势</b></p> 
<p>澳鹏MatrixGo平台SaaS版本，在尽享平台优质功能的同时，可实现最快一天内开通使用的快速部署。选择配置、免费试用、签署合同、投入生产，简单4步的服务流程即可轻松投入生产。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder1043"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2165794/image_4.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2165794/image_4.jpg?p=medium600" title="简单4步的服务流程即可轻松投入生产" alt="简单4步的服务流程即可轻松投入生产" /></a><br /><span>简单4步的服务流程即可轻松投入生产</span></p> 
</div> 
<p>此外，澳鹏MatrixGo平台SaaS版本还配有专业的使用培训及客服支持，更可以同步享受到MatrixGo即时更新的最新版本。低成本、高效率，澳鹏MatrixGo平台SaaS版本支持按年或按季度付费，最大化单位人力输出，提升投入产出比。</p> 
<p>无论刚刚开启AI部署之旅，还是加强现有的解决方案，澳鹏作为值得信赖的高质量AI数据合作伙伴，始终致力于以专业的技术产品和数据服务满足各行各业的前沿部署需求。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏中国：突破AI大模型工业化开发，生成式AI迎来全链条服务商</title>
		<author></author>
		<pubDate>2023-07-06 17:00:00</pubDate>
		<description><![CDATA[上海2023年7月6日 /美通社/ -- 
随着LLM"百模大战"的逼近，行业用户需要更加快速地基于现有LLM大模型，开发面向本行业、本企业的定制大模型及生成式AI应用。在2023年7月6日的2023世界人工智能大会（WAIC）上，与全球领先AI公司合作超过27年的澳鹏重磅推出智能LLM大模型开发平台，同时宣布面向生成式AI战略升级——从AI数据服务"破圈"进入全栈AI服务。


澳鹏智能LLM大模型开发平台面向行业AI提供集大模型数据准备、模型训练、模型推理、模型部署应用于一体，涵盖从数据集管理、数据标注、计算资源调度、模型评估、模型微调等全栈能力，帮助企业轻松拥抱大模型，构建生成式AI应用，为最终用户实现变革性体验。此外，澳鹏LLM产品线还包括基础数据、基线模型、模型评估&微调、应用开发等全链条产品、平台与服务。

 <https://mma.prnasia.com/media2/2147197/image_5014143_33277604.html>
澳鹏全球高级副总裁、大中华区及北亚区总经理田小鹏博士


"2023年下半年，LLM大模型和生成式AI市场将呈现巨大的迸发与成长态势。生成式AI的大时代，才刚刚开始"，澳鹏全球高级副总裁、大中华区及北亚区总经理田小鹏博士表示。"澳鹏聚焦于高效经济量产行业大模型与生成式AI应用，为各行业智能化转型全面赋能！"

战略升级正当时


2023年上半年可谓是LLM基础大模型的"春秋战国"时期，从全球到中国纷纷诞生了众多基础大模型，还有更多的团队在跑步入场基础大模型的研发。截止2023年6月底，在Github上已经收录了来自中国的85家大模型——主要为LLM基础大模型，以及部分面向行业和特定领域的大模型，再加上全球顶级的基础大模型，"百模大战"已经不是夸张的表达。


"百模大战"仍在鏖战中，但也成功让AI突破了科技圈，引发了更广泛人群的关注与重视。在全球，根据IBM商业价值研究院在6月底发布的年度CEO调查，四分之三受访CEO认为，拥有最先进的生成式人工智能的企业将拥有竞争优势。在中国，Gartner中国企业人工智能趋势浪潮3.0指出，中国企业正在将人工智能项目从原型转向生产，大多数企业已不再纠结于为何需要AI能力，而更加关注AI工程化能力的建设。


在2023年下半年，LLM大模型工业化量产和工程化落地的趋势，正从"百模大战"中清晰地浮现出来，特别是众多的行业和企业客户更加关注如何选择已有的LLM大模型并微调后适配本行业和企业的业务场景，真正将AI用于提高行业和企业生产力。简单理解，就是高效经济地量产行业LLM大模型以及将行业大模型端到端落地到企业中真正提升生产力，这将是2023年下半年的AI市场重点。


在2023年初，长期致力于为AI企业和企业AI提供高质量标注数据的澳鹏，审时度势、大胆"押注"，全面展开了公司战略升级——从AI数据服务扩展向全栈AI服务，致力于成为面向垂直行业的AI服务商。澳鹏新任全球CEO 
Armughan 
Ahmad在公司2022年报中表示，AI数据标注是基础，而生成式AI所代表的全栈AI服务是增长S曲线，也是澳鹏接下来的战略重点。澳鹏已经有强大的AI数据标注工具、平台和服务，接下来就是在此基础上，快速推动工业化量产行业大模型以及生成式AI应用，打开万亿新增经济体量。

大模型开发一站打尽


想要快速工业化量产行业LLM大模型以及生成式AI应用，就需要面向行业的大模型开发平台，这也是2023年下半年的AI市场热点和重点。在2023年上半年，已经有部分科技企业推出了面向行业的大模型定制化开发或解决方案，而专业化的第三方大模型开发平台及端到端AI大模型开发服务，还是市场空白点。


澳鹏智能LLM大模型开发平台由澳鹏中国团队研发，是面向LLM大模型微调（Fine-tune）的开发平台，主要是对业界已有的开源基础大模型进行选型的基础上，再针对游戏、医疗、客服等行业和业务场景大模型进行微调。澳鹏中国产品负责人周波介绍，澳鹏智能LLM大模型开发平台包括数据、模型和计算资源管理三大模块。

 <https://mma.prnasia.com/media2/2147198/image_5014143_33277684.html>
澳鹏智能LLM大模型开发平台架构图


对于LLM大模型研发来说，高质量的标注数据十分关键。ChatGPT之所以能脱颖而出，就是引入了高质量的人工标注数据。而对UC伯克利的LLM排行榜分析发现，高质量的微调数据集比模型规模更重要，特别是在预训练和微调阶段管理高质量的数据集，是缩小模型规模同时保持模型高质量的关键方法。越来越多的研究发现，高质量的标注数据对于模型微调结果以及缩小模型规模同时保持模型质量来说，是十分重要甚至是关键方法。


澳鹏智能LLM大模型开发平台的数据模块来自于澳鹏中国的另一个拳头产品：MatrixGo企业级高精度数据标注平台，MatrixGo是面向深度学习和机器学习数据标注的企业级平台，不仅有强大的标注工具集，还有AI辅助标注，灵活、可视的工作流，以及Open 
API与外部数据平台的集成和数据闭环。澳鹏中国开发团队针对LLM的开发需求，结合MatrixGo的技术，开发了LLM大模型开发平台的数据模块，可确保数据标注质量和效率，同时不断降低标注成本。


澳鹏智能LLM大模型开发平台的数据模块包括数据集管理与数据采集标注，其中：数据集管理包括数据处理、数据检索、数据可视化、数据切片等功能；数据采集标注包括人员管理、工作流引擎、标注工具引擎和自动标算法等功能。


澳鹏智能LLM大模型开发平台的核心为模型模块，包括模型评估、模型微调和模型部署三大部分，其中：模型评估提供了A/B测试、标准语料测试、自定义测试、测试结果可视化和模型分析等功能，模型微调提供了开源模型库、模型管理、训练任务管理等功能，模型部署提供了自动化部署、运行监控、标准API和自动封装SDK等。


模型评估主要服务于开源大模型的选型，包括用标准语料包或是自定义语料包进行测试，针对不同的开源大模型或同一大模型的不同版本进行A/B测试后，对相关测试结果进行分析和可视化，再结合模型参数、占用资源等，选定要进行微调的大模型。

 <https://mma.prnasia.com/media2/2147199/image_5014143_33277841.html>
澳鹏智能LLM大模型开发平台模型微调示例


模型微调则是在对选定的大模型，用高质量标注数据和RLHF人工反馈增强学习，针对不同的场景进行微调。模型微调的结果将返回到模型评估，两者联动完成模型迭代，直到达成预期效果。模型部署则是将微调成功后的大模型部署到客户的计算资源环境中，并可以API或SDK方式对外服务。

澳鹏智能LLM大模型开发平台的计算资源管理则是对客户的计算资源进行任务管理和资源调度，包括CPU和GPU的资源，以及对上层应用的支持与调度等。

澳鹏智能LLM大模型开发平台可以使用澳鹏中国自研的基础大模型，也可以使用客户自有或是第三方的开源基础大模型。


在自研基础大模型方面，澳鹏中国研发团队主要基于开源社区的工作，也在横向评估其它的选型方案。澳鹏中国自研大模型的特色，主要是在自有数据集上进行微调，包括通用话题对话以及具有专业性背景的语料等。澳鹏本身就对外提供了超过250个预标注的音频、图像、文字和视频等数据集，这些高质量标注数据集对于大模型预训练来说十分珍贵。此外，澳鹏中国研发团队还在关注学界、工业界的进展，从模型结构、优化方式和部署效率等方面，不断优化自研大模型。


在第三方大模型的合作方面，澳鹏全球与NVIDIA、AWS等深入合作，特别是与NVIDIA等大模型以及企业级AI开发平台的深入合作，将澳鹏的数据工具链、标注众包团队以及数据服务等与大厂的大模型、AI平台和工具等结合，为行业和企业提供端到端的一站式生成式AI解决方案。此外，澳鹏还与Cohere、Reka 
AI等企业级大模型初创公司合作，强强联合提供高度安全的定制专有模型。在中国，澳鹏中国也与知名基础大模型深入合作，了解这些大模型的特点及可适用场景，为客户提供专业的选型方案和咨询服务。

技术共创，与AI领军者共同成长

作为交付数据经验丰富的提供方，澳鹏智能LLM大模型开发平台的最大差异化竞争优势在于，从零样本、半监督学习的角度，快速响应迭代模型和数据交付。

作为长期从事有监督学习数据标注服务商，澳鹏在项目交付方面拥有大量的实践经验，可为LLM训练与微调任务以及生成式AI应用，持续挖掘数据价值。主要优势包括：


第一，与客户的算法应用共同成长。由于行业客户在早期实践生成式AI的时候，很难在一开始就明确项目需求，需要边合作、边探索、边开发，通过不断迭代而最终完成应用构建。


澳鹏善于管理和统筹交付周期，可以分批次向客户交付数据采标、模型优化、应用测试等，模型优化可以与数据采标交替进行；可以用小样本、增量学习的方式驱动模型在项目中快速迭代，数据采标更快地集成到应用测试中；甚至可以将标注工程视为客户LLM性能测试之前的"预质检"，这样相当将客户行业或业务场景的知识前置，也就是预训练的预训练。

第二，更好地把握"Human in the 
loop"。该开发平台会分析人工在采集标注过程中的种种交互行为，而澳鹏在这方面有丰富的经验，可以将其转换为RLHF算法中的"奖励功能"，并可挖掘更细粒度的标注信息等等，为制备大模型提供更多的数据养料，体现了对于数据挖掘维度的深刻理解。


第三，长期合作可带来数据采标的规模效应。澳鹏的开发平台具备大规模、安全、高质量的数据，以及完整的视觉、文本、语音类的行业基准模型，且在多个采标项目上实践过。在每一个项目完结阶段，都能产出一个性能不俗、与客户需求完全镜像的模型算法和高质量的数据benchmark。

新澳鹏：全链条AI服务商


自从LLM大模型在全球爆红以来，就一度有大模型将统治AI界的论调。但经过2023年上半年的"百模大战"，大家逐渐认识到深度学习与LLM大模型对于AI应用来说，都同等重要。所谓LLM大模型，即模型参数达到百亿、千亿以上，具有"智能涌现"的通用基础AI大模型，但由于参数和占用计算资源庞大等特点，并不适用于企业和行业场景，深度学习和机器学习则在实际应用中有着不可取代的价值。

澳鹏全球高级副总裁、大中华区及北亚区总经理田小鹏博士表示，对于未来的AI市场和智能经济，澳鹏的策略是深度学习与大模型，两手抓、两手硬。


首先，深度学习、机器学习等对于当下的数字化转型来说正在发挥实效，特别是适用于实时计算和边缘计算等企业级场景，在智能汽车、智能物联网、智能制造等领域发挥着重要的作用，澳鹏仍将坚持面向深度学习和机器学习领域的AI数据服务，同时与顶尖AI企业的深度学习和机器学习平台形成端到端解决方案，满足企业当下的AI工程化落地需求。

 <https://mma.prnasia.com/media2/2147200/image_5014143_33277952.html>



2023年6月底，澳鹏Appen企业级高精度人工智能辅助数据标注平台——MatrixGo正式上线SaaS版本。MatrixGo自发布以来，已经经历了数千个AI数据标注项目的实战打磨，累积了来自各行各业、各种类型项目丰富的实战经验。MatrixGo 
SaaS版本的上线，让企业客户能够更快速地部署MatrixGo，最快一天开通使用、投入生产，同时可以获得专业的使用培训和客服支持，SaaS版本还将持续为客户提供即时更新的MatrixGo最新版本，让企业客户使用最新和最先进的数据服务，打造高质量深度学习和机器学习应用。


此外，澳鹏也将LLM技术用于改善数据标注工具和平台，不断强化澳鹏在深度学习和机器学习数据服务方面的竞争优势。新推出的文档智能产品可以从非结构化文档中自动提取信息，例如从扫描文档或文档照片中提取内容，准确率达到99%，这极大拓展了企业AI数据源。NLP自动标注则采用小样本或零样本学习和LLM模型，对数据进行自动化标注，从而加速数据供应。澳鹏在2022年还投资了全球顶尖的视觉AI合成数据供应商MindTech，可以提供一系列高质量多维度多角度的合成逼真图片，应对小样本甚至零样本问题。


其次，澳鹏将对LLM大模型进行战略投入，推出以澳鹏智能LLM大模型开发平台为代表的LLM产品线。澳鹏LLM产品线包括基础数据、基线模型、评估与微调以及上层生成式AI应用等四大部分。

 <https://mma.prnasia.com/media2/2147201/image_5014143_33278060.html>


LLM基础数据提供成品数据集、数据爬取、数据清洗和开源数据等，为LLM基础大模型训练以及微调大模型提供高质量数据集。


基线模型则提供自研模型和第三方开源或商用模型，以及支持客户自有模型，澳鹏自研模型可根据使用场景定制化、模型私有化体积可以根据运行资源要求进行限制，支持私有化部署、云平台API调用等，第三方合作模型则包括Reka、Cohere等国内外优秀的商用和开源大模型。


评估和微调包括专家语料、RLHF、A/B测试和模型评价等LLM大模型训练服务。澳鹏在全球有上百万的众包数据收集和标注员，支持235+种语言和方言，也有专门面向金融、零售、工业和医疗等行业的专家众包资源。过去，这些资源服务于深度学习和机器学习的数据标注；未来，面向LLM大模型的训练需求，这些资源还能够提供提示词-输出语料包、专业领域语料包，以及将人工嵌入到LLM大模型训练的人工反馈增强环节，实现RLHF算法，提升模型的专业领域能力。


模型评估包括A/B测试、模型评价、红蓝对抗和基准测试等方法，主要是由澳鹏的LLM专家和众包资源一起，评估不同大模型以及同一大模型不同版本的输出结果，对模型输出进行评价以避免歧视和涉黄等风险，在多轮对话对抗中评估模型的能力，以及使用行业标准语料包对大模型进行基准测试。


第三，在更远期，澳鹏将把深度学习和机器学习与LLM大模型结合起来，端到端为企业客户开发生成式AI应用，从数据到模型再到应用开发，提供全链条的咨询与应用开发服务，进而成为核心AI供应商。


相比于其它LLM和生成式AI赛道的参与者，澳鹏有非常扎实的数据"底盘"和全链条的数据工具链、平台和人力资源，而数据能力才是LLM和生成式AI的王道。此外，澳鹏还与全球AI企业、AI生态有着长达27年的合作关系历史，也参与了大量企业和行业AI落地的项目实践，有着丰富的企业级项目实施经验。这些都为澳鹏在LLM和生成式AI时代的自我颠覆，打下了坚实的基础。

展望未来：
LLM大模型和生成式AI是全球智能进化的"奇点"，而一个全新姿态的澳鹏正在LLM大模型和生成式AI中崛起。从顶级AI数据服务商，到快速切入行业LLM大模型和生成式AI赛道，再向生成式AI应用以及全链条AI咨询开发发展，澳鹏正基于过去27年的积累，在全球智能进化"奇点"时刻，把握机会、迅速蝶变，并与全球AI生态一起，打开生成式AI的大未来。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2023年7月6日</span> /美通社/ -- 随着LLM&quot;百模大战&quot;的逼近，行业用户需要更加快速地基于现有LLM大模型，开发面向本行业、本企业的定制大模型及生成式AI应用。在2023年7月6日的2023世界人工智能大会（WAIC）上，与全球领先AI公司合作超过27年的澳鹏重磅推出智能LLM大模型开发平台，同时宣布面向生成式AI战略升级——从AI数据服务&quot;破圈&quot;进入全栈AI服务。</p> 
<p>澳鹏智能LLM大模型开发平台面向行业AI提供集大模型数据准备、模型训练、模型推理、模型部署应用于一体，涵盖从数据集管理、数据标注、计算资源调度、模型评估、模型微调等全栈能力，帮助企业轻松拥抱大模型，构建生成式AI应用，为最终用户实现变革性体验。此外，澳鹏LLM产品线还包括基础数据、基线模型、模型评估&amp;微调、应用开发等全链条产品、平台与服务。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder4091"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2147197/image_5014143_33277604.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2147197/image_5014143_33277604.jpg?p=medium600" title="澳鹏全球高级副总裁、大中华区及北亚区总经理田小鹏博士" alt="澳鹏全球高级副总裁、大中华区及北亚区总经理田小鹏博士" /></a><br /><span>澳鹏全球高级副总裁、大中华区及北亚区总经理田小鹏博士</span></p> 
</div> 
<p>&quot;2023年下半年，LLM大模型和生成式AI市场将呈现巨大的迸发与成长态势。生成式AI的大时代，才刚刚开始&quot;，澳鹏全球高级副总裁、大中华区及北亚区总经理田小鹏博士表示。&quot;澳鹏聚焦于高效经济量产行业大模型与生成式AI应用，为各行业智能化转型全面赋能！&quot;</p> 
<p><b>战略升级正当时</b></p> 
<p>2023年上半年可谓是LLM基础大模型的&quot;春秋战国&quot;时期，从全球到中国纷纷诞生了众多基础大模型，还有更多的团队在跑步入场基础大模型的研发。截止2023年6月底，在Github上已经收录了来自中国的85家大模型——主要为LLM基础大模型，以及部分面向行业和特定领域的大模型，再加上全球顶级的基础大模型，&quot;百模大战&quot;已经不是夸张的表达。</p> 
<p>&quot;百模大战&quot;仍在鏖战中，但也成功让AI突破了科技圈，引发了更广泛人群的关注与重视。在全球，根据IBM商业价值研究院在6月底发布的年度CEO调查，四分之三受访CEO认为，拥有最先进的生成式人工智能的企业将拥有竞争优势。在中国，Gartner中国企业人工智能趋势浪潮3.0指出，中国企业正在将人工智能项目从原型转向生产，大多数企业已不再纠结于为何需要AI能力，而更加关注AI工程化能力的建设。</p> 
<p>在2023年下半年，LLM大模型工业化量产和工程化落地的趋势，正从&quot;百模大战&quot;中清晰地浮现出来，特别是众多的行业和企业客户更加关注如何选择已有的LLM大模型并微调后适配本行业和企业的业务场景，真正将AI用于提高行业和企业生产力。简单理解，就是高效经济地量产行业LLM大模型以及将行业大模型端到端落地到企业中真正提升生产力，这将是2023年下半年的AI市场重点。</p> 
<p>在2023年初，长期致力于为AI企业和企业AI提供高质量标注数据的澳鹏，审时度势、大胆&quot;押注&quot;，全面展开了公司战略升级——从AI数据服务扩展向全栈AI服务，致力于成为面向垂直行业的AI服务商。澳鹏新任全球CEO Armughan Ahmad在公司2022年报中表示，AI数据标注是基础，而生成式AI所代表的全栈AI服务是增长S曲线，也是澳鹏接下来的战略重点。澳鹏已经有强大的AI数据标注工具、平台和服务，接下来就是在此基础上，快速推动工业化量产行业大模型以及生成式AI应用，打开万亿新增经济体量。</p> 
<p><b>大模型开发一站打尽</b></p> 
<p>想要快速工业化量产行业LLM大模型以及生成式AI应用，就需要面向行业的大模型开发平台，这也是2023年下半年的AI市场热点和重点。在2023年上半年，已经有部分科技企业推出了面向行业的大模型定制化开发或解决方案，而专业化的第三方大模型开发平台及端到端AI大模型开发服务，还是市场空白点。</p> 
<p>澳鹏智能LLM大模型开发平台由澳鹏中国团队研发，是面向LLM大模型微调（Fine-tune）的开发平台，主要是对业界已有的开源基础大模型进行选型的基础上，再针对游戏、医疗、客服等行业和业务场景大模型进行微调。澳鹏中国产品负责人周波介绍，澳鹏智能LLM大模型开发平台包括数据、模型和计算资源管理三大模块。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder5359"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2147198/image_5014143_33277684.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2147198/image_5014143_33277684.jpg?p=medium600" title="澳鹏智能LLM大模型开发平台架构图" alt="澳鹏智能LLM大模型开发平台架构图" /></a><br /><span>澳鹏智能LLM大模型开发平台架构图</span></p> 
</div> 
<p>对于LLM大模型研发来说，高质量的标注数据十分关键。ChatGPT之所以能脱颖而出，就是引入了高质量的人工标注数据。而对UC伯克利的LLM排行榜分析发现，高质量的微调数据集比模型规模更重要，特别是在预训练和微调阶段管理高质量的数据集，是缩小模型规模同时保持模型高质量的关键方法。越来越多的研究发现，高质量的标注数据对于模型微调结果以及缩小模型规模同时保持模型质量来说，是十分重要甚至是关键方法。</p> 
<p>澳鹏智能LLM大模型开发平台的数据模块来自于澳鹏中国的另一个拳头产品：MatrixGo企业级高精度数据标注平台，MatrixGo是面向深度学习和机器学习数据标注的企业级平台，不仅有强大的标注工具集，还有AI辅助标注，灵活、可视的工作流，以及Open API与外部数据平台的集成和数据闭环。澳鹏中国开发团队针对LLM的开发需求，结合MatrixGo的技术，开发了LLM大模型开发平台的数据模块，可确保数据标注质量和效率，同时不断降低标注成本。</p> 
<p>澳鹏智能LLM大模型开发平台的数据模块包括数据集管理与数据采集标注，其中：数据集管理包括数据处理、数据检索、数据可视化、数据切片等功能；数据采集标注包括人员管理、工作流引擎、标注工具引擎和自动标算法等功能。</p> 
<p>澳鹏智能LLM大模型开发平台的核心为模型模块，包括模型评估、模型微调和模型部署三大部分，其中：模型评估提供了A/B测试、标准语料测试、自定义测试、测试结果可视化和模型分析等功能，模型微调提供了开源模型库、模型管理、训练任务管理等功能，模型部署提供了自动化部署、运行监控、标准API和自动封装SDK等。</p> 
<p>模型评估主要服务于开源大模型的选型，包括用标准语料包或是自定义语料包进行测试，针对不同的开源大模型或同一大模型的不同版本进行A/B测试后，对相关测试结果进行分析和可视化，再结合模型参数、占用资源等，选定要进行微调的大模型。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder9084"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2147199/image_5014143_33277841.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2147199/image_5014143_33277841.jpg?p=medium600" title="澳鹏智能LLM大模型开发平台模型微调示例" alt="澳鹏智能LLM大模型开发平台模型微调示例" /></a><br /><span>澳鹏智能LLM大模型开发平台模型微调示例</span></p> 
</div> 
<p>模型微调则是在对选定的大模型，用高质量标注数据和RLHF人工反馈增强学习，针对不同的场景进行微调。模型微调的结果将返回到模型评估，两者联动完成模型迭代，直到达成预期效果。模型部署则是将微调成功后的大模型部署到客户的计算资源环境中，并可以API或SDK方式对外服务。</p> 
<p>澳鹏智能LLM大模型开发平台的计算资源管理则是对客户的计算资源进行任务管理和资源调度，包括CPU和GPU的资源，以及对上层应用的支持与调度等。</p> 
<p>澳鹏智能LLM大模型开发平台可以使用澳鹏中国自研的基础大模型，也可以使用客户自有或是第三方的开源基础大模型。</p> 
<p>在自研基础大模型方面，澳鹏中国研发团队主要基于开源社区的工作，也在横向评估其它的选型方案。澳鹏中国自研大模型的特色，主要是在自有数据集上进行微调，包括通用话题对话以及具有专业性背景的语料等。澳鹏本身就对外提供了超过250个预标注的音频、图像、文字和视频等数据集，这些高质量标注数据集对于大模型预训练来说十分珍贵。此外，澳鹏中国研发团队还在关注学界、工业界的进展，从模型结构、优化方式和部署效率等方面，不断优化自研大模型。</p> 
<p>在第三方大模型的合作方面，澳鹏全球与NVIDIA、AWS等深入合作，特别是与NVIDIA等大模型以及企业级AI开发平台的深入合作，将澳鹏的数据工具链、标注众包团队以及数据服务等与大厂的大模型、AI平台和工具等结合，为行业和企业提供端到端的一站式生成式AI解决方案。此外，澳鹏还与Cohere、Reka AI等企业级大模型初创公司合作，强强联合提供高度安全的定制专有模型。在中国，澳鹏中国也与知名基础大模型深入合作，了解这些大模型的特点及可适用场景，为客户提供专业的选型方案和咨询服务。</p> 
<p><b>技术共创，与AI领军者共同成长</b></p> 
<p>作为交付数据经验丰富的提供方，澳鹏智能LLM大模型开发平台的最大差异化竞争优势在于，从零样本、半监督学习的角度，快速响应迭代模型和数据交付。</p> 
<p>作为长期从事有监督学习数据标注服务商，澳鹏在项目交付方面拥有大量的实践经验，可为LLM训练与微调任务以及生成式AI应用，持续挖掘数据价值。主要优势包括：</p> 
<p>第一，与客户的算法应用共同成长。由于行业客户在早期实践生成式AI的时候，很难在一开始就明确项目需求，需要边合作、边探索、边开发，通过不断迭代而最终完成应用构建。</p> 
<p>澳鹏善于管理和统筹交付周期，可以分批次向客户交付数据采标、模型优化、应用测试等，模型优化可以与数据采标交替进行；可以用小样本、增量学习的方式驱动模型在项目中快速迭代，数据采标更快地集成到应用测试中；甚至可以将标注工程视为客户LLM性能测试之前的&quot;预质检&quot;，这样相当将客户行业或业务场景的知识前置，也就是预训练的预训练。</p> 
<p>第二，更好地把握&quot;Human in the loop&quot;。该开发平台会分析人工在采集标注过程中的种种交互行为，而澳鹏在这方面有丰富的经验，可以将其转换为RLHF算法中的&quot;奖励功能&quot;，并可挖掘更细粒度的标注信息等等，为制备大模型提供更多的数据养料，体现了对于数据挖掘维度的深刻理解。</p> 
<p>第三，长期合作可带来数据采标的规模效应。澳鹏的开发平台具备大规模、安全、高质量的数据，以及完整的视觉、文本、语音类的行业基准模型，且在多个采标项目上实践过。在每一个项目完结阶段，都能产出一个性能不俗、与客户需求完全镜像的模型算法和高质量的数据benchmark。</p> 
<p><b>新澳鹏：全链条AI服务商</b></p> 
<p>自从LLM大模型在全球爆红以来，就一度有大模型将统治AI界的论调。但经过2023年上半年的&quot;百模大战&quot;，大家逐渐认识到深度学习与LLM大模型对于AI应用来说，都同等重要。所谓LLM大模型，即模型参数达到百亿、千亿以上，具有&quot;智能涌现&quot;的通用基础AI大模型，但由于参数和占用计算资源庞大等特点，并不适用于企业和行业场景，深度学习和机器学习则在实际应用中有着不可取代的价值。</p> 
<p>澳鹏全球高级副总裁、大中华区及北亚区总经理田小鹏博士表示，对于未来的AI市场和智能经济，澳鹏的策略是深度学习与大模型，两手抓、两手硬。</p> 
<p>首先，深度学习、机器学习等对于当下的数字化转型来说正在发挥实效，特别是适用于实时计算和边缘计算等企业级场景，在智能汽车、智能物联网、智能制造等领域发挥着重要的作用，澳鹏仍将坚持面向深度学习和机器学习领域的AI数据服务，同时与顶尖AI企业的深度学习和机器学习平台形成端到端解决方案，满足企业当下的AI工程化落地需求。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder3807"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2147200/image_5014143_33277952.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2147200/image_5014143_33277952.jpg?p=medium600" title="" alt="" /></a><br /><span></span></p> 
</div> 
<p>2023年6月底，澳鹏Appen企业级高精度人工智能辅助数据标注平台——MatrixGo正式上线SaaS版本。MatrixGo自发布以来，已经经历了数千个AI数据标注项目的实战打磨，累积了来自各行各业、各种类型项目丰富的实战经验。MatrixGo SaaS版本的上线，让企业客户能够更快速地部署MatrixGo，最快一天开通使用、投入生产，同时可以获得专业的使用培训和客服支持，SaaS版本还将持续为客户提供即时更新的MatrixGo最新版本，让企业客户使用最新和最先进的数据服务，打造高质量深度学习和机器学习应用。</p> 
<p>此外，澳鹏也将LLM技术用于改善数据标注工具和平台，不断强化澳鹏在深度学习和机器学习数据服务方面的竞争优势。新推出的文档智能产品可以从非结构化文档中自动提取信息，例如从扫描文档或文档照片中提取内容，准确率达到99%，这极大拓展了企业AI数据源。NLP自动标注则采用小样本或零样本学习和LLM模型，对数据进行自动化标注，从而加速数据供应。澳鹏在2022年还投资了全球顶尖的视觉AI合成数据供应商MindTech，可以提供一系列高质量多维度多角度的合成逼真图片，应对小样本甚至零样本问题。</p> 
<p>其次，澳鹏将对LLM大模型进行战略投入，推出以澳鹏智能LLM大模型开发平台为代表的LLM产品线。澳鹏LLM产品线包括基础数据、基线模型、评估与微调以及上层生成式AI应用等四大部分。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder4346"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2147201/image_5014143_33278060.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2147201/image_5014143_33278060.jpg?p=medium600" title="" alt="" /></a><br /><span></span></p> 
</div> 
<p>LLM基础数据提供成品数据集、数据爬取、数据清洗和开源数据等，为LLM基础大模型训练以及微调大模型提供高质量数据集。</p> 
<p>基线模型则提供自研模型和第三方开源或商用模型，以及支持客户自有模型，澳鹏自研模型可根据使用场景定制化、模型私有化体积可以根据运行资源要求进行限制，支持私有化部署、云平台API调用等，第三方合作模型则包括Reka、Cohere等国内外优秀的商用和开源大模型。</p> 
<p>评估和微调包括专家语料、RLHF、A/B测试和模型评价等LLM大模型训练服务。澳鹏在全球有上百万的众包数据收集和标注员，支持235+种语言和方言，也有专门面向金融、零售、工业和医疗等行业的专家众包资源。过去，这些资源服务于深度学习和机器学习的数据标注；未来，面向LLM大模型的训练需求，这些资源还能够提供提示词-输出语料包、专业领域语料包，以及将人工嵌入到LLM大模型训练的人工反馈增强环节，实现RLHF算法，提升模型的专业领域能力。</p> 
<p>模型评估包括A/B测试、模型评价、红蓝对抗和基准测试等方法，主要是由澳鹏的LLM专家和众包资源一起，评估不同大模型以及同一大模型不同版本的输出结果，对模型输出进行评价以避免歧视和涉黄等风险，在多轮对话对抗中评估模型的能力，以及使用行业标准语料包对大模型进行基准测试。</p> 
<p>第三，在更远期，澳鹏将把深度学习和机器学习与LLM大模型结合起来，端到端为企业客户开发生成式AI应用，从数据到模型再到应用开发，提供全链条的咨询与应用开发服务，进而成为核心AI供应商。</p> 
<p>相比于其它LLM和生成式AI赛道的参与者，澳鹏有非常扎实的数据&quot;底盘&quot;和全链条的数据工具链、平台和人力资源，而数据能力才是LLM和生成式AI的王道。此外，澳鹏还与全球AI企业、AI生态有着长达27年的合作关系历史，也参与了大量企业和行业AI落地的项目实践，有着丰富的企业级项目实施经验。这些都为澳鹏在LLM和生成式AI时代的自我颠覆，打下了坚实的基础。</p> 
<p><b>展望未来：</b>LLM大模型和生成式AI是全球智能进化的&quot;奇点&quot;，而一个全新姿态的澳鹏正在LLM大模型和生成式AI中崛起。从顶级AI数据服务商，到快速切入行业LLM大模型和生成式AI赛道，再向生成式AI应用以及全链条AI咨询开发发展，澳鹏正基于过去27年的积累，在全球智能进化&quot;奇点&quot;时刻，把握机会、迅速蝶变，并与全球AI生态一起，打开生成式AI的大未来。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
		<item>
		<title>澳鹏与Reka AI强强联合，构建高质量的多模态LLM应用</title>
		<author></author>
		<pubDate>2023-05-10 16:18:00</pubDate>
		<description><![CDATA[美国华盛顿州柯克兰2023年5月10日 /美通社/ -- 近日，澳鹏Appen官宣与AI新兴公司Reka 
AI合作，以实现世界级数据服务与多模态语言模型的出色结合。Reka AI是一家全栈模型提供商，提供由基础模型开始、创建企业级生产模型的解决方案。

 <https://mma.prnasia.com/media2/2073782/image.html>
澳鹏与Reka AI强强联合，构建高质量的多模态LLM应用


ChatGPT等创新应用的崛起让大型语言模型（LLM）实现了突飞猛进的发展。LLM可以助力企业提升运营效率，并为最终用户提供耳目一新的体验。然而，大型企业在LLM的部署过程中常会遇到摩擦和挑战，因为这些LLM对于企业而言并非现成的解决方案。为充分利用LLM的强大功能，企业需要针对其应用场景对基础模型进行微调，并持续评估和监控这些模型在现实世界中的性能。

Reka AI依托团队深厚的行业专业知识开发出高级专有算法，此前还曾在Google 
Brain和DeepMind等公司领导实现AI研究领域的一些重大突破，可经济高效地针对任何数据和应用场景定制模型。而在AI训练数据和语言服务领域深耕26年的澳鹏Appen，具有独特的优势助力企业加快LLM部署，充分解锁生成式AI的潜能。

此次澳鹏Appen和Reka AI的强强联手，将为企业开发有效、全面的生成式AI解决方案，助力企业创建并拥有满足其特定部署要求的企业级生产模型。

澳鹏Appen CEO Armughan 
Ahmad表示：“携手Reka将使领先企业能够构建高度安全的定制专有模型。业界目前仅限于依赖公共API，这使得企业很容易受到数据泄露和高度敏感数据隐私问题的影响。澳鹏和Reka将联手为企业提供一种前所未有的保护其LLM应用的能力。”


将生成式AI解决方案产品化，不仅需要数据监管方面的专业知识，还需要持续的人类反馈帮助提高模型性能，以及强大的模型评估平台。依托澳鹏Appen强大的人类测试数据，Reka能够更快地构建、测试和部署LLM，使得其专有算法可根据诸多用例快速定制Yasa。此次合作使企业能够拥有全栈式解决方案，将Yasa用于企业部署的诸多应用场景。

Reka AI CEO Dani 
Yogatama表示：“我们的方法灵活，让企业能够在不同的质量、延迟和隐私限制下部署Yasa。与澳鹏合作，我们的客户能够进一步受益于澳鹏的世界级数据服务专业知识，大大简化生产就绪的创建流程。”


在超过25年的发展历程里，澳鹏Appen一直是创新型AI的领军企业。伴随整个行业的发展，始终致力于为客户提供高质量的AI训练数据，助力最先进AI系统的开发。澳鹏Appen提倡“AI向善的力量”，即利用这种呈指数级增长的技术帮助解决全球不平等的挑战，从而对人类和地球产生可持续的积极影响，建立大众对AI的信任，让AI成为世界的美好源泉。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">美国华盛顿州柯克兰</span><span class="legendSpanClass">2023年5月10日</span> /美通社/ -- 近日，澳鹏Appen官宣与AI新兴公司Reka AI合作，以实现世界级数据服务与多模态语言模型的出色结合。Reka AI是一家全栈模型提供商，提供由基础模型开始、创建企业级生产模型的解决方案。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6533"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2073782/image.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2073782/image.jpg?p=medium600" title="澳鹏与Reka AI强强联合，构建高质量的多模态LLM应用" alt="澳鹏与Reka AI强强联合，构建高质量的多模态LLM应用" /></a><br /><span>澳鹏与Reka AI强强联合，构建高质量的多模态LLM应用</span></p> 
</div> 
<p>ChatGPT等创新应用的崛起让大型语言模型（LLM）实现了突飞猛进的发展。LLM可以助力企业提升运营效率，并为最终用户提供耳目一新的体验。然而，大型企业在LLM的部署过程中常会遇到摩擦和挑战，因为这些LLM对于企业而言并非现成的解决方案。为充分利用LLM的强大功能，企业需要针对其应用场景对基础模型进行微调，并持续评估和监控这些模型在现实世界中的性能。</p> 
<p>Reka AI依托团队深厚的行业专业知识开发出高级专有算法，此前还曾在Google Brain和DeepMind等公司领导实现AI研究领域的一些重大突破，可经济高效地针对任何数据和应用场景定制模型。而在AI训练数据和语言服务领域深耕26年的澳鹏Appen，具有独特的优势助力企业加快LLM部署，充分解锁生成式AI的潜能。</p> 
<p>此次澳鹏Appen和Reka AI的强强联手，将为企业开发有效、全面的生成式AI解决方案，助力企业创建并拥有满足其特定部署要求的企业级生产模型。</p> 
<p>澳鹏Appen CEO Armughan Ahmad表示：“携手Reka将使领先企业能够构建高度安全的定制专有模型。业界目前仅限于依赖公共API，这使得企业很容易受到数据泄露和高度敏感数据隐私问题的影响。澳鹏和Reka将联手为企业提供一种前所未有的保护其LLM应用的能力。”</p> 
<p>将生成式AI解决方案产品化，不仅需要数据监管方面的专业知识，还需要持续的人类反馈帮助提高模型性能，以及强大的模型评估平台。依托澳鹏Appen强大的人类测试数据，Reka能够更快地构建、测试和部署LLM，使得其专有算法可根据诸多用例快速定制Yasa。此次合作使企业能够拥有全栈式解决方案，将Yasa用于企业部署的诸多应用场景。</p> 
<p>Reka AI CEO Dani Yogatama表示：“我们的方法灵活，让企业能够在不同的质量、延迟和隐私限制下部署Yasa。与澳鹏合作，我们的客户能够进一步受益于澳鹏的世界级数据服务专业知识，大大简化生产就绪的创建流程。”</p> 
<p>在超过25年的发展历程里，澳鹏Appen一直是创新型AI的领军企业。伴随整个行业的发展，始终致力于为客户提供高质量的AI训练数据，助力最先进AI系统的开发。澳鹏Appen提倡“AI向善的力量”，即利用这种呈指数级增长的技术帮助解决全球不平等的挑战，从而对人类和地球产生可持续的积极影响，建立大众对AI的信任，让AI成为世界的美好源泉。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏Appen]]></source>
	</item>
		<item>
		<title>澳鹏Appen推出三款新产品：从数据开始，构建值得信赖的生成式AI应用</title>
		<author></author>
		<pubDate>2023-03-02 17:37:00</pubDate>
		<description><![CDATA[美国华盛顿州柯克兰2023年3月2日 /美通社/ 
-- 生成式AI有望从根本上打开新世界机遇的大门。越来越多的领先企业正在构建可信的生成式AI应用，让它们在现实世界中提供更加卓越的用户体验。作为AI生命周期的高质量数据提供商，近日，澳鹏Appen推出三款新产品，助力更多AI企业解锁引领未来的生成式AI应用。


构建值得信赖的生成式AI需要坚持四个原则：信任、质量、多样性和持续反馈。澳鹏Appen将行业领先的平台、深厚的专业知识和全球AI数据训练专家团队结合，推出三款新产品如下：

1. 基于人类反馈的强化学习（Reinforcement Learning with Human Feedback）：用以解决大型语言模型中存在偏见的风险；

2. 文档智能（Document Intelligence）：使企业能从非结构化文档中提取关键洞察；

3. 自动化NLP数据标注（Automated NLP Labeling）：利用生成式AI功能和零样本/少样本学习技术加快数据标注。

澳鹏Appen首席执行官Armughan 
Ahmad表示："正如本次推出的生成式AI产品，我们将继续打造满足客户数据需求的产品和服务。我们正在开发垂直行业AI解决方案，扩大与系统集成商、软件供应商和超大规模企业的合作，为客户提供影响深远的解决方案。"

 <https://mma.prnasia.com/media2/2014389/image_5014143_30524895.html>
以ChatGPT为代表的生成式AI正在成为新的潮流


ChatGPT和大型语言模型的崛起引发了人们对生成式AI潜力的关注，它将彻底改变人机交互方式。然而，生成式AI还面临一项挑战，即如何使模型产生的结果足够准确且合乎道德。这就是澳鹏Appen基于人类反馈的强化学习的用武之地。该产品使客户能够生成由AI训练专家设计的快速问答，并由不同的AI训练专家组对其准确性和偏见进行审核。


生成式AI面临的另一项挑战是，如何从扫描件和照片文件形式的非结构化数据中提取洞察。澳鹏Appen的文档智能产品可以将任何文档转化为可用的数据源，且准确率高达99%。通过利用高质量的数据，企业可以更好地了解客户的需求、偏好和行为，再使用这些信息与客户进行个性化交互，并预测他们的需求。


交付速度亦是澳鹏Appen数据解决方案中重要的一环。利用零样本或少样本学习技术和生成式AI大型语言模型自动标注数据，澳鹏Appen自动化NLP数据标注可以为企业节省大量部署时间。

澳鹏Appen首席产品官Sujatha 
Sagiraju表示："生成式AI将以超乎我们想象的方式改变人类体验。我们很高兴能够助力客户构建生成式AI应用，确保品牌诚信，防止出现有偏见的结果。"

 <https://mma.prnasia.com/media2/2014390/image_5014143_30525008.html>
澳鹏Appen以高质量数据助力企业构建值得信赖的生成式AI应用


澳鹏Appen新产品基于行业领先的变革模型和生成式AI研究，无论是刚刚开启生成式AI之旅，还是加强现有的解决方案，澳鹏Appen作为值得信赖的高质量AI数据合作伙伴，始终致力于以专业的知识和数据服务满足前沿部署需求。


除了本次三款新产品的发布，澳鹏Appen还在不断扩大产品范围，纳入下一阶段发展愿景：为人工智能生命周期企业的战略部署扩展数据，致力于成为一家AI平台公司，助力各行各业领军者创造AI支持的高质量用户体验。

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">美国华盛顿州柯克兰</span><span class="legendSpanClass">2023年3月2日</span> /美通社/ --&nbsp;生成式AI有望从根本上打开新世界机遇的大门。越来越多的领先企业正在构建可信的生成式AI应用，让它们在现实世界中提供更加卓越的用户体验。作为AI生命周期的高质量数据提供商，近日，澳鹏Appen推出三款新产品，助力更多AI企业解锁引领未来的生成式AI应用。</p> 
<p>构建值得信赖的生成式AI需要坚持四个原则：信任、质量、多样性和持续反馈。澳鹏Appen将行业领先的平台、深厚的专业知识和全球AI数据训练专家团队结合，推出三款新产品如下：</p> 
<p>1. 基于人类反馈的强化学习（Reinforcement Learning with Human Feedback）：用以解决大型语言模型中存在偏见的风险；</p> 
<p>2. 文档智能（Document Intelligence）：使企业能从非结构化文档中提取关键洞察；</p> 
<p>3. 自动化NLP数据标注（Automated NLP Labeling）：利用生成式AI功能和零样本/少样本学习技术加快数据标注。</p> 
<p>澳鹏Appen首席执行官Armughan Ahmad表示：&quot;正如本次推出的生成式AI产品，我们将继续打造满足客户数据需求的产品和服务。我们正在开发垂直行业AI解决方案，扩大与系统集成商、软件供应商和超大规模企业的合作，为客户提供影响深远的解决方案。&quot;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder7761"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2014389/image_5014143_30524895.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2014389/image_5014143_30524895.jpg?p=medium600" title="以ChatGPT为代表的生成式AI正在成为新的潮流" alt="以ChatGPT为代表的生成式AI正在成为新的潮流" /></a><br /><span>以ChatGPT为代表的生成式AI正在成为新的潮流</span></p> 
</div> 
<p>ChatGPT和大型语言模型的崛起引发了人们对生成式AI潜力的关注，它将彻底改变人机交互方式。然而，生成式AI还面临一项挑战，即如何使模型产生的结果足够准确且合乎道德。这就是澳鹏Appen基于人类反馈的强化学习的用武之地。该产品使客户能够生成由AI训练专家设计的快速问答，并由不同的AI训练专家组对其准确性和偏见进行审核。</p> 
<p>生成式AI面临的另一项挑战是，如何从扫描件和照片文件形式的非结构化数据中提取洞察。澳鹏Appen的文档智能产品可以将任何文档转化为可用的数据源，且准确率高达99%。通过利用高质量的数据，企业可以更好地了解客户的需求、偏好和行为，再使用这些信息与客户进行个性化交互，并预测他们的需求。</p> 
<p>交付速度亦是澳鹏Appen数据解决方案中重要的一环。利用零样本或少样本学习技术和生成式AI大型语言模型自动标注数据，澳鹏Appen自动化NLP数据标注可以为企业节省大量部署时间。</p> 
<p>澳鹏Appen首席产品官Sujatha Sagiraju表示：&quot;生成式AI将以超乎我们想象的方式改变人类体验。我们很高兴能够助力客户构建生成式AI应用，确保品牌诚信，防止出现有偏见的结果。&quot;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6593"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/2014390/image_5014143_30525008.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/2014390/image_5014143_30525008.jpg?p=medium600" title="澳鹏Appen以高质量数据助力企业构建值得信赖的生成式AI应用" alt="澳鹏Appen以高质量数据助力企业构建值得信赖的生成式AI应用" /></a><br /><span>澳鹏Appen以高质量数据助力企业构建值得信赖的生成式AI应用</span></p> 
</div> 
<p>澳鹏Appen新产品基于行业领先的变革模型和生成式AI研究，无论是刚刚开启生成式AI之旅，还是加强现有的解决方案，澳鹏Appen作为值得信赖的高质量AI数据合作伙伴，始终致力于以专业的知识和数据服务满足前沿部署需求。</p> 
<p>除了本次三款新产品的发布，澳鹏Appen还在不断扩大产品范围，纳入下一阶段发展愿景：为人工智能生命周期企业的战略部署扩展数据，致力于成为一家AI平台公司，助力各行各业领军者创造AI支持的高质量用户体验。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏Appen]]></source>
	</item>
		<item>
		<title>Armughan Ahmad新任澳鹏Appen首席执行官兼总裁，加速拓展人工智能的应用边界</title>
		<author></author>
		<pubDate>2023-02-01 19:21:00</pubDate>
		<description><![CDATA[美国华盛顿州柯克兰2023年2月1日 /美通社/ -- 近日，澳鹏Appen正式宣布任命Armughan 
Ahmad为首席执行官兼总裁。Armughan在科技行业拥有超过25年的经验，曾领导市值数十亿美元的技术企业拓展业务并建立了强大的全球团队。Armughan计划在蓬勃发展的AI市场进一步加速推进企业AI的部署。

 <https://mma.prnasia.com/media2/1993876/image.html>
澳鹏Appen CEO Armughan Ahmad


在加入澳鹏Appen之前，Armughan曾担任跨行业创新数字转型服务全球领导者——毕马威公司的数字总裁兼管理合伙人。在加入毕马威之前，他曾担任戴尔科技公司的高级副总裁兼总经理，负责云、高性能计算和解决方案业务。Armughan曾管理产品、工程、销售、营销和服务等，并将其收入提升至数十亿美元，尤其在集成戴尔收购的EMC数据存储技术、构建多种成功的多云平台方面，发挥了至关重要的作用。

澳鹏Appen CEO Armughan 
Ahmad表示：“我很高兴能加入澳鹏成为新任CEO，期待能帮助我们的客户构建任务关键型AI应用程序，提供全新的客户体验。随着Open 
AI公司的ChatGPT和DALL.E等生成型AI不断创新，AI的发展速度大大提升。作为快速增长的AI行业领导者，澳鹏在2021财年创收超4.4亿美元，并能够随着AI需求的变化而不断发展，我相信我们凭借这种独一无二的能力，能够不断创造合乎道德且值得信赖的AI。作为AI行业的领先数据提供商，我们有责任为行业的卓越性和完整性树立标准。我们将继续拓展AI的应用边界，并对世界产生积极和可持续的影响。”


在超过25年的发展历程里，澳鹏Appen一直是创新型AI的领军企业。伴随整个行业的发展，我们始终致力于为客户提供高质量的AI训练数据，帮助客户开发出最先进的AI系统，例如搜索算法、自动驾驶和语音接口系统等。澳鹏Appen为全球许多大型科技公司和财富500强客户提供AI产品和服务：微软、谷歌、亚马逊、Salesforce、空中客车、彭博、Pinterest、家得宝、西门子等重要客户，都信任澳鹏Appen为其AI应用程序提供支持。

Armughan表示加入澳鹏Appen最重要的一个原因，是“AI for 
good”，即为了让AI朝着好的方向发展。利用这种呈指数级增长的技术帮助解决全球不平等的挑战，从而对人类和地球产生可持续的积极影响。在近期的合作项目中，澳鹏Appen与一家全球领先的安全及航空航天公司合作，通过计算机视觉应用增强其扑灭山林野火的能力；澳鹏Appen还作为CLEAR 
Global的长期公益合作伙伴，帮助研究开发斯瓦希里语的AI应用等，以建立大众对AI的信任，让AI成为世界的美好源泉。


而当前，生成型AI正通过使高度重复性的任务实现自动化，为我们迈向AI辅助员工的时代铺平了道路。在AI辅助下，员工现在可以腾出时间来专注于制定和落实战略，进行创造和创新。Armughan表示：“AI可优化我们的任务，但并非我们的最终目的。它们只是工具，我们人类才是创造奇迹的关键。AI加速了人类和机器之间的协作，在保留人类创造力的同时为娱乐和工作添加了一些奇妙的元素，使我们能够为人类成就新时代的崛起做出贡献。通过我们的技术和全球多元化的众包团队，澳鹏有很大的机会抓住AI的下一波增长。”

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">美国华盛顿州柯克兰</span><span class="legendSpanClass">2023年2月1日</span> /美通社/ -- 近日，澳鹏Appen正式宣布任命Armughan Ahmad为首席执行官兼总裁。Armughan在科技行业拥有超过25年的经验，曾领导市值数十亿美元的技术企业拓展业务并建立了强大的全球团队。Armughan计划在蓬勃发展的AI市场进一步加速推进企业AI的部署。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6682"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/1993876/image.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/1993876/image.jpg?p=medium600" title="澳鹏Appen CEO Armughan Ahmad" alt="澳鹏Appen CEO Armughan Ahmad" /></a><br /><span>澳鹏Appen CEO Armughan Ahmad</span></p> 
</div> 
<p>在加入澳鹏Appen之前，Armughan曾担任跨行业创新数字转型服务全球领导者——毕马威公司的数字总裁兼管理合伙人。在加入毕马威之前，他曾担任戴尔科技公司的高级副总裁兼总经理，负责云、高性能计算和解决方案业务。Armughan曾管理产品、工程、销售、营销和服务等，并将其收入提升至数十亿美元，尤其在集成戴尔收购的EMC数据存储技术、构建多种成功的多云平台方面，发挥了至关重要的作用。</p> 
<p>澳鹏Appen CEO Armughan Ahmad表示：“我很高兴能加入澳鹏成为新任CEO，期待能帮助我们的客户构建任务关键型AI应用程序，提供全新的客户体验。随着Open AI公司的ChatGPT和DALL.E等生成型AI不断创新，AI的发展速度大大提升。作为快速增长的AI行业领导者，澳鹏在2021财年创收超4.4亿美元，并能够随着AI需求的变化而不断发展，我相信我们凭借这种独一无二的能力，能够不断创造合乎道德且值得信赖的AI。作为AI行业的领先数据提供商，我们有责任为行业的卓越性和完整性树立标准。我们将继续拓展AI的应用边界，并对世界产生积极和可持续的影响。”</p> 
<p>在超过25年的发展历程里，澳鹏Appen一直是创新型AI的领军企业。伴随整个行业的发展，我们始终致力于为客户提供高质量的AI训练数据，帮助客户开发出最先进的AI系统，例如搜索算法、自动驾驶和语音接口系统等。澳鹏Appen为全球许多大型科技公司和财富500强客户提供AI产品和服务：微软、谷歌、亚马逊、Salesforce、空中客车、彭博、Pinterest、家得宝、西门子等重要客户，都信任澳鹏Appen为其AI应用程序提供支持。</p> 
<p>Armughan表示加入澳鹏Appen最重要的一个原因，是“AI for good”，即为了让AI朝着好的方向发展。利用这种呈指数级增长的技术帮助解决全球不平等的挑战，从而对人类和地球产生可持续的积极影响。在近期的合作项目中，澳鹏Appen与一家全球领先的安全及航空航天公司合作，通过计算机视觉应用增强其扑灭山林野火的能力；澳鹏Appen还作为CLEAR Global的长期公益合作伙伴，帮助研究开发斯瓦希里语的AI应用等，以建立大众对AI的信任，让AI成为世界的美好源泉。</p> 
<p>而当前，生成型AI正通过使高度重复性的任务实现自动化，为我们迈向AI辅助员工的时代铺平了道路。在AI辅助下，员工现在可以腾出时间来专注于制定和落实战略，进行创造和创新。Armughan表示：“AI可优化我们的任务，但并非我们的最终目的。它们只是工具，我们人类才是创造奇迹的关键。AI加速了人类和机器之间的协作，在保留人类创造力的同时为娱乐和工作添加了一些奇妙的元素，使我们能够为人类成就新时代的崛起做出贡献。通过我们的技术和全球多元化的众包团队，澳鹏有很大的机会抓住AI的下一波增长。”</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏Appen]]></source>
	</item>
		<item>
		<title>澳鹏Appen以数据赋能更精准、更智能、更高品质的智慧医疗</title>
		<author></author>
		<pubDate>2023-01-06 14:00:00</pubDate>
		<description><![CDATA[上海2023年1月6日 /美通社/ -- 
随着我国经济的不断增长，以及生命科学的迅速发展，国人预期寿命有了显著的提升。人们的健康需求在人口老龄化等一系列因素的影响下持续增长，这意味着卫生系统将面对更多具有复杂健康需求的患者。因此，信息化、数字化、智能化已经成为医疗行业的重要发展趋势。


人工智能将在很大程度上改变医疗服务的方式。它可以提高诊断和治疗的效率，在使用相同医疗资源的前提下，为更多病人提供更快、更好的服务。人工智能也可以帮助改善医疗从业者的体验，将他们从繁重而机械的工作中解放出来，有更多的时间直接接触和帮助患者。


然而，医学内容的特殊性和专业性对于训练机器模型的数据提出了更高的要求。澳鹏Appen以专业、精准、安全的高质量训练数据赋能AI医疗，助力提升算法精度，让公众享受更精准、更智能、更高品质的智慧医疗服务。

 <https://mma.prnasia.com/media2/1978130/image_1.html>
澳鹏Appen以专业、精准、安全的高质量训练数据赋能AI医疗


澳鹏Appen拥有一支专业的医学标注团队，由具有执业医师资格、医学项目经验丰富的医学项目管理者组成；拥有多学科、近百位三甲级医院主治及以上职称医师作为专家顾问，以及近千人的医学资源池。团队能够做到对医学文本内容审核编辑、医学图像处理、医学语音转写等进行专业、高效地标注。


例如，医学影像学（放射）图像标注——肺部结节CT数据：在AI预测的基础上，进行肺部CT数据的医学后处理，纠正标签判断错误，增加未检出病灶，提高数据的病灶检出率并降低假阳率。

 <https://mma.prnasia.com/media2/1978131/image_2.html>
医学影像学（放射）图像标注——肺部结节CT数据标注

再例如，临床医学图像标注——皮肤科痤疮数据：对皮肤图像中的痤疮选择对应标签类型进行打点，保证图像内病灶标注的完整和精准。

病理学图像标注——胃组织病理数据：对胃部组织进行拉框选择ROI，并针对ROI内目标细胞（如慢性胃炎）进行标注，保证ROI内目标细胞标注的完整和精准。


心电图图像标注——心电图数据：在AI预测的基础上，进行心电图数据的医学后处理，纠正AI预测的错误，添加AI未检出异常，以提高数据的异常检出率、降低检出错误率。


澳鹏Appen能够提供的智慧医疗数据服务包括：医学内容审核、医学内容编辑、医学名词标签判断、医药学数据库编写、医疗音频标注ASR、医学辅助诊断图像标注等。澳鹏Appen医疗团队拥有300w+医学文本数据、3w+医学图像数据、10+位具有丰富临床经验的医学管理人员、近百位多学科专家、近千人医学资源池及中英日多语种医学数据。

澳鹏Appen智慧医疗数据是经HIPAA认证的高安全性解决方案，安全设备、现场服务、安全众包模型和技术解决方案亦获得ISO 27001, ISO 
9001和ISO 27701认证，确保智能时代医疗数据的合法、合规、安全。

 <https://mma.prnasia.com/media2/1978132/image_3.html>
澳鹏Appen智慧医疗数据是经HIPAA认证的高安全性解决方案


随着社会经济发展水平的提高及民众对于健康愈发重视，医疗数据行业应AI及互联网医疗的黄金浪潮而生，催生了医疗智慧化的多种场景，辅助医院诊疗及国民就医更加智能、便捷。澳鹏Appen始终以专业的医疗标注团队、高响应度的医疗数据项目管理水平、HIPAA认证的医疗解决方案来支持AI医疗服务的多类型数据需求，以高质量的数据作为各类智慧医疗产品及服务的基石，赋能更精准、更智能、更高品质的智慧医疗时代。

 

]]></description>
		<detail><![CDATA[<p><span class="legendSpanClass">上海</span><span class="legendSpanClass">2023年1月6日</span> /美通社/ -- 随着我国经济的不断增长，以及生命科学的迅速发展，国人预期寿命有了显著的提升。人们的健康需求在人口老龄化等一系列因素的影响下持续增长，这意味着卫生系统将面对更多具有复杂健康需求的患者。因此，信息化、数字化、智能化已经成为医疗行业的重要发展趋势。</p> 
<p>人工智能将在很大程度上改变医疗服务的方式。它可以提高诊断和治疗的效率，在使用相同医疗资源的前提下，为更多病人提供更快、更好的服务。人工智能也可以帮助改善医疗从业者的体验，将他们从繁重而机械的工作中解放出来，有更多的时间直接接触和帮助患者。</p> 
<p>然而，医学内容的特殊性和专业性对于训练机器模型的数据提出了更高的要求。澳鹏Appen以专业、精准、安全的高质量训练数据赋能AI医疗，助力提升算法精度，让公众享受更精准、更智能、更高品质的智慧医疗服务。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder1022"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/1978130/image_1.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/1978130/image_1.jpg?p=medium600" title="澳鹏Appen以专业、精准、安全的高质量训练数据赋能AI医疗" alt="澳鹏Appen以专业、精准、安全的高质量训练数据赋能AI医疗" /></a><br /><span>澳鹏Appen以专业、精准、安全的高质量训练数据赋能AI医疗</span></p> 
</div> 
<p>澳鹏Appen拥有一支专业的医学标注团队，由具有执业医师资格、医学项目经验丰富的医学项目管理者组成；拥有多学科、近百位三甲级医院主治及以上职称医师作为专家顾问，以及近千人的医学资源池。团队能够做到对医学文本内容审核编辑、医学图像处理、医学语音转写等进行专业、高效地标注。</p> 
<p>例如，医学影像学（放射）图像标注——肺部结节CT数据：在AI预测的基础上，进行肺部CT数据的医学后处理，纠正标签判断错误，增加未检出病灶，提高数据的病灶检出率并降低假阳率。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder8025"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/1978131/image_2.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/1978131/image_2.jpg?p=medium600" title="医学影像学（放射）图像标注——肺部结节CT数据标注" alt="医学影像学（放射）图像标注——肺部结节CT数据标注" /></a><br /><span>医学影像学（放射）图像标注——肺部结节CT数据标注</span></p> 
</div> 
<p>再例如，临床医学图像标注——皮肤科痤疮数据：对皮肤图像中的痤疮选择对应标签类型进行打点，保证图像内病灶标注的完整和精准。</p> 
<p>病理学图像标注——胃组织病理数据：对胃部组织进行拉框选择ROI，并针对ROI内目标细胞（如慢性胃炎）进行标注，保证ROI内目标细胞标注的完整和精准。</p> 
<p>心电图图像标注——心电图数据：在AI预测的基础上，进行心电图数据的医学后处理，纠正AI预测的错误，添加AI未检出异常，以提高数据的异常检出率、降低检出错误率。</p> 
<p>澳鹏Appen能够提供的智慧医疗数据服务包括：医学内容审核、医学内容编辑、医学名词标签判断、医药学数据库编写、医疗音频标注ASR、医学辅助诊断图像标注等。澳鹏Appen医疗团队拥有300w+医学文本数据、3w+医学图像数据、10+位具有丰富临床经验的医学管理人员、近百位多学科专家、近千人医学资源池及中英日多语种医学数据。</p> 
<p>澳鹏Appen智慧医疗数据是经HIPAA认证的高安全性解决方案，安全设备、现场服务、安全众包模型和技术解决方案亦获得ISO 27001, ISO 9001和ISO 27701认证，确保智能时代医疗数据的合法、合规、安全。</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder5121"> 
 <p style="TEXT-ALIGN: center; WIDTH: 100%"><a href="https://mma.prnasia.com/media2/1978132/image_3.html" target="_blank" rel="nofollow"><img src="https://mma.prnasia.com/media2/1978132/image_3.jpg?p=medium600" title="澳鹏Appen智慧医疗数据是经HIPAA认证的高安全性解决方案" alt="澳鹏Appen智慧医疗数据是经HIPAA认证的高安全性解决方案" /></a><br /><span>澳鹏Appen智慧医疗数据是经HIPAA认证的高安全性解决方案</span></p> 
</div> 
<p>随着社会经济发展水平的提高及民众对于健康愈发重视，医疗数据行业应AI及互联网医疗的黄金浪潮而生，催生了医疗智慧化的多种场景，辅助医院诊疗及国民就医更加智能、便捷。澳鹏Appen始终以专业的医疗标注团队、高响应度的医疗数据项目管理水平、HIPAA认证的医疗解决方案来支持AI医疗服务的多类型数据需求，以高质量的数据作为各类智慧医疗产品及服务的基石，赋能更精准、更智能、更高品质的智慧医疗时代。</p> 
<p>&nbsp;</p> 
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0"> 
</div>]]></detail>
		<source><![CDATA[澳鹏数据科技（上海）有限公司]]></source>
	</item>
	
</channel>
</rss>