本文为您提供关于「A/B 测试」(又名DataTester)使用功能的各项发版更新记录。
功能模块 | 更新描述 |
---|---|
流量层/互斥域 | 优化流量层、互斥域功能的操作交互。优化后,您可以根据实验需要先创建好实验流量层,并创建互斥域,将互斥的流量层绑定至对应的互斥域中。
更多介绍请参见流量层与互斥域。 |
功能模块 | 更新描述 |
---|---|
大模型测评 | SaaS-云原生环境的大模型测评功能,新增支持Hiagent来源的数据集,丰富了大模型测评的丰富度、提高接入效率。 |
实验Demo | 优化了面向新用户的演示Demo和**操作Demo,**演示Demo和操作Demo均优化了其中的教学引导和Demo示例,丰富细化了入门学习教程,便于您端到端学习体验Demo,了解实验创建、实验效果的基本流程。 |
界面UI优化 | 实验创编选择实验指标时,鼠标悬停在指标名称上时可展示指标的口径信息,便于您快速选择实验相关指标。 |
功能模块 | 更新描述 |
---|---|
实验创编 | 优化升级流量计算器功能。优化境界了流量计算器的配置交互,便于您更深入理解流量计算器的计算逻辑。 |
数据接入-服务端接入 | 服务端的Node.js SDK更新新版本,新增支持UserAbInfoHandler初始化参数。更多Node.js SDK的详细介绍请参见Node.js SDK。 |
功能模块 | 更新描述 |
---|---|
指标组-权限管理 | 对指标组的权限管理做了功能升级,后续可对指标组进行数据权限管控,实验报告也可结合指标组权限进行针对性的展示。 说明 集团管理员、项目管理员默认有指标组权限,可查看所有指标组数据。 |
实验报告 | 新增实验组排序功能。在实验报告的核心指标概览部分,新增一个排序功能,后续您可根据需要选择按指标值排序,默认为您按分组顺序排序。 |
功能模块 | 更新描述 |
---|---|
大模型评测 | 大模型评测功能新增支持数据集功能和自定义指标功能,您可以创建数据集并通过API上传数据;您也可以在预置指标基础之上灵活的创建自定义指标;后续创建测评任务时即可直接选用已创建的数据集、指标,配置映射关系。 |
功能模块 | 更新描述 |
---|---|
全局设置-系统设置 | 新增任务管理功能,本次上线任务管理的全局任务页面,您可以在全局任务页面修改全局的实验指标计算任务的触发时间,也可修改指标计算任务的开关:
更多任务管理功能的介绍请参见任务管理。 |
数据管理-元数据管理 | 新增支持事件分类能力。您可以对一般事件、虚拟事件、圈选事件进行事件分类管理操作,可根据业务需求创建不同的事件分类,并将对应事件归类到对应事件类型中,后续在新建指标、创建用户分群等操作时,即可根据事件分类快速查看选择事件,提高操作效率。
|
实验报告 | 实验报告的数据指标页面新增跳转至DataFinder的链接,便于您对实验指标进一步下钻分析。
|
实验命中诊断工具 | 对实验命中诊断工具的操作交互进行了优化,详情参见实验命中诊断工具。 |
功能模块 | 更新描述 |
---|---|
Demo-App | DataTester上线AI智能机器人——AB小助手,结合AI大模型能力,为您提供智能问答、智能指标离线计算分析的AI能力。
|
功能模块 | 更新描述 |
---|---|
场景能力 | 新增支持大模型评测功能。面向大模型采购客户,DataTester提供高效易用的大模型在线评测、分析、监控和快速优化产品能力,DataTester为您预置了大模型评测指标,支持从回答关联度、回答真实度、上下文关联度等指标维度,对大模型的应用效果进行评测,并为您生成评测报告。您可以基于评测报告进一步调试优化模型,以达到更优的应用效果。 |
实验创编 | 新增支持个性化实验,与普通A/B实验相比,个性化实验可针对不同人群分别找到实验的优胜版本,针对不同的人群分发最符合其偏好的更优版本,从而提高用户的转化率。如下图所示。 |
场景能力-智能运营 | 推送通道的Webhook通道,新增支持自定义接口接入的方式进行Webhook接入,此方式不仅可以提高Webhook接入效率降低接入成本,也可支持直接对接客户已有的Webhook API接口。 |
服务端实验&客户端实验 | 对于在调试中的实验,支持在实验列表中查看实验详情时,查看实验各个版本的VID信息。 |
受众管理-用户分群 | 上传用户分群文件来创建用户分群时,新增支持多口径的用户ID,历史版本仅支持使用user_unique_id类型的用户标识ID,本次新增支持ssid和device_id。 |
OpenAPI | 对实验操作的接口进行优化:
详情请参见开放接口V3。 |
指标管理 | 在指标组列表页中查看指标组详情时,可直接查看到指标id,便于使用OpenAPI时获取需要使用的指标id。 |
系统管理-数据概览 | 在系统管理的数据概览页面中,新增支持汇总并展示当前集团下的DataTester用量情况的数据,便于管理员查看并了解当前整体的使用情况。 |
功能模块 | 更新描述 |
---|---|
系统设置 | 在系统设置处,新增支持配置上报指标数据截止时间,即后续实验结束后,实验指标数据计算任务可以持续执行天数,支持设置0~7天,默认为0天。 |
指标管理 | 对指标管理-埋点实时验证功能进行适配优化,对于没有购买DataFinder、仅购买了DataTester的用户而言,后续可更顺畅地使用埋点实时验证功能。 |
试用Demo | 对创建操作DemoApp的操作进行性能优化,优化后创建Demo的耗时下降40%。 |
功能模块 | 更新描述 |
---|---|
OpenAPI | 新增部分接口和字段参数,便于您通过OpenAPI获取更丰富的实验、指标和报告信息。
详细介绍请参见开放接口V3。 |
功能模块 | 更新描述 |
---|---|
可视化编辑器 |
|
OpenAPI |
详细介绍请参见开放接口V3。 |
实验报告 | 优化各种实验场景下的实验报告结论,主要展示对您更有价值的报告总结描述;并且在本次实验结果不明确时,进一步为您提供实验数据和实验优化方案,辅助您进行业务决策。 |
数据指标 |
|
指标组 |
|
功能模块 | 更新描述 |
---|---|
MAB实验 | MAB实验的转化率流量调优算法更新迭代,本次算法迭代在上个版本的基础上,主要增加了:
|
实验列表 | 实验列表页面做了加载的性能优化,通过降低前端umi.js的体积大小,从而降低打开实验列表页面时的耗时,本次性能优化后,前端总体积优化下降下降约25%(130MB => 96.4MB)。 |
功能模块 | 更新描述 |
---|---|
体验demo | 全量升级改造Demo项目,区分体验Demo、操作Demo,便于在初始使用时体验DataTester的实验能力和上手体验操作。 |
数据指标 | 按……去重的指标作为分子或分母时,支持计算置信度,如果您的实验包含相关指标,可在实验报告中查看对应指标的置信度相关数据。 |
可视化编辑器 | 新增支持响应式图片编辑。详情可参见可视化编辑器 3.x介绍。 |
功能模块 | 更新描述 |
---|---|
广告实验 | 广告实验支持渠道拓展:新增支持对微信小程序创建广告实验。 |
MAB智能调优实验 | MAB智能调优实验功能升级,优化实验创编流程、实验报告页面展示;支持在实验过程中人工调整实验流量等功能升级。 |