数据集中的字段使用中文别名时需要唯一,否则在使用时「分析助手」功能时,大模型可能会使用相似字段名称进行理解和答复,导致结果不精准。
数据库中的字段可能是英文的。在数据集的编辑页面中,直接使用原始数据表,即直接使用英文字段。如果不对其进行处理,在使用「分析助手」功能时,大模型将无法完美地将您的中文自然语言与英文字段进行对应,也就无法给出令人满意的答案。因此,我们需要在数据集的编辑页面中将字段名称设置为可读性较高的中文别名。
「分析助手」需要根据您设置的字段类型,进行关键词识别、匹配和处理,因此对于日期、时间相关字段,您需要在数据集页面进行数据类型转换。
例如,如果日期字段本来以字符串形式存储,选中对应的字段名称,在「类型转换」将其转成日期类型。设置完成后,您即可在「分析助手」页面中直接针对日期范围的筛选进行相关提问。
数据集中的字段可以设置描述信息,您可以在描述中添加具有业务含义的中文描述,同时注意描述内容需要唯一。否则在使用时「分析助手」功能时,大模型可能会使用相似描述进行理解和答复,导致结果不精准。
若需要在提问中对已有维度和指标之外的字段进行提问,则需要在数据集中根据新字段的计算逻辑点击「添加字段」,从而「新增计算维度」或者「新增计算指标」,否则可能会导致「分析助手」因无法直接识别和分析未知的维度或指标,而返回不够准确的结果。
示例:表中已存在指标字段“成本”和“销售额”,若我们想针对表中未明确定义的“利润”进行提问和分析,则需在数据集中点击「添加字段」,从而新增指标字段,进一步对新增字段的「表达式」或「表计算」进行定义,计算字段添加完成后,即可在「分析助手」页面对“利润”相关的数据信息进行直接提问,更多关于计算字段的内容可参考计算字段的帮助文档。
如果您需要新增和定义的是日期、时间类字段,为了便于「分析助手」识别,请将直接将计算字段设置为对应的字段类型。
如果您的数据源中有多个类似或相同类别的字段,如有多个日期或地理字段,那么当进行日期筛选的提问时,大模型可能会因无法区分相似的维度或指标而无法提供准确的分析。
您的数据源中可能涉及一些特定的知识、一些不常见的字段匹配、有多种含义的业务称呼等,直接提问可能无法让大模型理解相应的意思,需要您在提问前告诉大模型需要注意或学习的特定内容,在数据集的「知识管理」中进行业务词汇的配置,可以提升「分析助手」的准确性。 例如,涉及到特定含义的名词“老家”时,可以配置 “老家=北京=BJ=BeiJing”。
恰当的提问描述有助于您获取想要的图表和结论。目前,「分析助手」支持多种类型的提问,包括简单指标类、时间筛选类、地域类和其他复杂类问题。以下是部分典型提问类型的示例,您可以参考并使用类似的问题描述进行提问。
若您需要获得某个具体的数据指标,如销量、成本等,您可直接对数据集中的维度或指标进行限定性地提问,如:
您可基于时间维度对指标进行提问分析,如针对具体的日期范围,日/周/月/季度/年等。
为了准确识别相应字段,若您的日期类字段本身以字符串形式存储,则需要您在数据集的编辑页面将其转成日期类型,详见章节:1.数据准备指南。
部分提问举例:
您可基于地域维度对指标进行提问分析,如针对具体的省份、城市等。
为了准确匹配地图类图表进行分析展示,您需要在数据集中将包含地理信息的字段,明确中文地理位置信息。
部分提问举例:
记录数类提问指的是根据特定条件过滤数据,并要求提供符合条件的记录总数。
部分提问举例:
除上述问题之外,您可能还会遇到需要根据多种维度或多种指标数据分析呈现的复杂问题,如排序/排名类、模糊匹配类、日期时间类型聚合类问题。
在筛选日期时间和地域的同时,您可以针对具体的维度和指标进行排名或排序类提问,请表达清楚您希望选取的前几名。
部分提问举例:
您可以根据特定条件模糊搜索数据,系统将返回与条件相匹配的数据分析。这种提问方式适用于那些您可能无法提供完整的条目名称,或者需要更大细粒度的数据统计。
例如,当前数据集内不同产品名称众多,且没有分类,那么可以选取产品名称中的部分词汇进行针对性提问,如复印纸:
您可以通过按照不同的时间单位(如年、季度、月、周、日、小时等)对日期时间数据进行分类和聚合,更好地了解数据在不同时间维度上的表现。
部分提问举例: