网易易盾正式发布AIGC内容风控解决方案【图】

发布日期：2023-05-27 23:45:39 来源：互联网作者：56之窗网浏览次数：79

2023年，必定是AIGC发展的核心一年，它意味着人工智能技术已经从科学研究迈向产业发展，并和商业服务结合产生相互之间支撑点的新格局，进到产业链商业期。

技术无罪，商业但有风险性。许多AIGC机构在正式上线只是几天之内不断遭受大型翻车。就其身后,是国家对于人工智能应用持续发展的指导和标准反映。

4月11日，我国国家网信办发布了《生成式人工智能服务管理办法(征求意见稿)》(下称方法)。这代表了，中国即将步入第一个AIGC最新政策。在其中，在《办法》的21条现行政策中释放出来出了一条的关键所在数据信号，我国适用AIGC健康有序发展和商用化，前提条件一定要依法依规，并有13条的规定都确立指向了”AIGC 服务提供商“。

在这样的背景下，网易易盾从AIGC服务提供商经营角度考虑，融合国家新政策与丰富多样的从业经验，给予遮盖事先—电商平台运营外置风险、事中—服务平台具体内容合规风险、过后—举报与违规处理风险性等各个环节解决方法。

01 事先—电商平台运营外置风险性

1. AI优化算法整治

从优化算法整治角度考虑，AIGC服务提供商有义务在行业交付使用时对可能出现的情况进行预计、判断制定相对应对策，对优化算法使用中的安全监控、优化算法评定及其个性化推荐对私人信息行为主体造成的影响等信息进行标准。

与此同时，《办法》中明文规定，AIGC服务和形成具体内容务必“合乎社会主义社会的观念”，避免出现中华民族、信念等岐视、重视商业伦理、尊重别人合法权利、“避免形成不实信息”等意识形态领域和价值趋向难题。

因而，人工智能技术服务供应商需对生成式人工智能应用的预训练数据信息、优化训练信息来源的合规性担负，给予预训练和优化训练数据信息的源头等叙述，人工标注标准，人工标注数据库的经营规模种类等必需信息内容。

因为大模型依靠训练样本，在数据传送方面可能存在故意控制风险，包含有害键入、成见、意识形态领域进攻、社会舆论操纵、不实信息、个人隐私泄露等。因而，模型推理词库基本上确定AIGC形成具体内容的观念。数据堂是AI数据训练环节中的“关键一步”，纯粹、迎合AI场景应用的数据库可解决数据训练中90%问题。

对于此事，易盾可以对模型推理词库给予人工标注服务项目。易盾有着头部企业海量信息的标明工作经验，可以快速、清晰地提供全方位人工标注服务项目，包含文本、照片、音频视频及独特情境与角色，并且对猛增信息量可创建应急处置步骤，为模型推理给予迎合适用场景的高品质数据信息。

2. 安全制度

用户认证管理方法

AIGC服务提供商还需提供包含用户认证、重点群体保护与优化算法全透明服务项目。依照《中华人民共和国网络安全法》要求，给予生成式人工智能服务理应规定客户提供身份信息内容。

在强化信息内容验证能力水平，易盾提供丰富的身份认证方法，灵便组成;自主创新优化算法水平，积极应对AI技术性生成面部、3D面罩等鼻子假体进攻;另外在用户注册或使用AIGC服务项目前集成化启用信息内容验证水平，降低恶意注册的安全隐患。

技术性安全风险评估

《互联网信息服务深度合成管理规定》第二十条深层生成服务供应商开发设计发布具备社会舆论特性或是社会发展动员能力的新品、创新应用、特色功能的，理应按照有关规定进行安全风险评估。

易盾可帮助AIGC服务提供商不断完善AIGC有关的安全制度及业务技能材料的适用，帮助企业进行了现场迎查，包含文档提前准备，工作人员采访，技术检测，问题记录，问题整改。

服务项目优化算法办理备案

AIGC服务提供商应当按照《互联网信息服务算法推荐管理规定》执行优化算法办理备案和变动、强制注销办理手续。易盾可以提供优化算法办理备案资询一站式服务，帮助企业进行办理备案信息填写。

02 事中—服务平台具体内容合规风险

1.AI实时互动内容审查

为了能遵守法律和反映践行社会主义核心价值观，针对实时互动内容审查和运用AI形成具体内容，应加强比较敏感内容审查，比如涉政、色情交易、涉暴等相关信息，以保证信息内容的安全合规。但是，特殊prompt命令可能绕开AI自已的安全策略，提升审批的难度复杂性。

针对这种情况，网易易盾带来了对于AIGC+UGC环境下的设备审批水平，可以根据需求场景配置审核的紧松水平，选择合适的审批对策去满足不同的场景的合规管理规定。

如果在语音聊天会话场景下，存有真正消费者和服务机器人两种角色，这就要求机审能够迅速鉴别不良记录，保证人机对战聊天实用性。易盾的机审技术性可以根据需求场景不一样，在UGC内容与AIGC形成具体内容配备不同类型的松紧程度审批对策，兼具用户体验感和网络安全内容合规。

2.前后文相关性分析+人审

AI形成具体内容因为优化算法体制缘故，具有客户运用敏感词汇、循序渐进诱发提出问题等形式导出不合理AIGC视频的状况，尤其是包括好几条前后文具体内容，单关键词阅读文章没什么问题，关系前后文多关键词阅读文章会出现违规违纪的信息，违法人员常使用藏头诗、场景台本、歌曲歌词等方式形成长文本(长图文)共享，来避开平台上的审查制度。

网易易盾自主开发AI文本挖掘技术性，给予AI机审前后文关系水平;同时结合视频审核，对AI形成长图分享、记忆力薄等信息进行关系测试分析。此外易盾自主研发视频审核系统软件能还原历史会话情景，区别AI智能机器人与真实客户的对话，大幅度提高审批精确度及审批高效率，合理识别预防客户运用敏感词汇、循序渐进诱发提出问题等形式导出不合理信息内容。

3.AI仿冒内容识别

因为Deepfake等新技术的乱用可能会致使很严重的行骗和诈骗行为，所以需要采取有效措施来严厉打击AI乱用个人行为。易盾根据深度伪造检测算法，打造出了动态性自我防御机制，可以检测由AI产生的视频和声频。这项技术可以检测Deepfake等不实信息，以保护社交媒体和其它服务平台的消费者免遭诈骗和诈骗的损害。

依据《互联网信息服务深度合成管理规定》针对由AI产生的照片、视频等具体内容要进行标志，以保证信息真实性和精确性，防止不实信息传播造成影响。网易易盾提议系统提供深层生成视频的明显标志作用，客户在设计AIGC具体内容的时候也可以自主进行明显标志的标识实际操作。标志AI产生的具体内容，及其采用防护措施来严厉打击AI乱用个人行为，是保证互联网技术网络信息安全的重要手段。

03 过后—举报与违规处理风险性

网易易盾可帮助客户创建举报接手体制，提议系统提供消费者投诉举报渠道，激励用户参与服务平台具体内容整治，易盾智能审批系统软件都将给予客户投诉审核制度，连通设备审查和服务平台业务接口，及时将客户投诉具体内容进行审查处理。

AIGC能够降低写作门坎,为信息生产与传播带来了全新的转型和机会。针对AIGC服务提供商来讲，与机遇共存更多风险性和挑战。

新技术应用和新市场的发展也与现行政策合规管理紧密联系，怎样在合规管理的前提下平稳完成运用落地式、推动产品升级，是AIGC服务提供商进入后避不开的一点。做为新一代数据内容风控服务提供商，网易易盾将帮助AIGC服务平台合规管理发展趋势，给新行业可持续发展观不断做出贡献。

关键词： 人间百态,实时热点,娱乐资讯,奇闻异事,社会万象

　　以上就是【网易易盾正式发布AIGC内容风控解决方案【图】】全部内容，更多资讯请关注56之窗网。

本文地址:http://hot1.ffsy56.com/newsdetail1751075.html

版权与免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。56之窗网对此不承担任何直接责任及连带责任，56之窗网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

推荐图文

王力宏发文悼念舅公许	闫妮悼念朱龙广曾在
倪萍称董璇不应该结婚	黄宗泽称女朋友经常被
曝“赵四”刘小光儿子	马景涛金铭时隔30多年
张碧晨告别《年轮》	王菲穿搭被赞“朝阳区