庄重:从版块 2020.4.1 驱动911色色色,您面前不错在 Tableau Server 和 Tableau Cloud 中创建和剪辑过程。除非高出指出,本主题中的本体适用于统统平台。运筹帷幄在 Web 上制作过程的精致信息,请参见 Tableau Server(流畅在新窗口中掀开) 和 Tableau Cloud(流畅在新窗口中掀开) 匡助中的 Web 上的 Tableau Prep。
Tableau Prep 提供了您可用来清算和调整数据的多样清算操作。通过清算不良数据,不错更拖沓地合并和分析数据,或不错让其他东说念主在分享您的数据集时更拖沓地融会您的数据。
您还不错使用转置技术或剧本技术来清算数据,以将 R 或 Python 剧本讹诈于过程。Tableau Cloud 不维持剧本技术。运筹帷幄精致信息,请参见转置您的数据(流畅在新窗口中掀开)或在过程中使用 R 和 Python 剧本(流畅在新窗口中掀开)。
对于清算操作您通过讹诈诸如筛选、添加、重定名、拆分、分组或移除字段等清算操作来清算数据。您不错在过程中的大大齐技术类型中扩充清算操作。您还不错在数据网格的清算技术中扩充清算操作。
您不错在输入技术中讹诈有限的清算操作,况兼不行在输出技术中讹诈清算操作。运筹帷幄在输入技术中讹诈清算操作的精致信息,请参见在输入技术中讹诈清算操作(流畅在新窗口中掀开)。
可用的清算操作下表清醒了在每个技术类型中不错扩充哪些清算操作:
输入清算团员转置麇集并集新建行输出筛选XXXXXXX 对值进行分组 X X XX 清算 X XXXX 养息日历 XXXXXX 拆分值 X XXXX 重定名字段XX XXXX 重定名字段(批量) X 复制字段 X XXXX 仅保留字段XXXXXXX 移除字段XXXXXXX 创建联想字段 X XXXX 剪辑值 X XXXX 转换数据类型XXXXXXX对数据进行转换时,将会向“过程”窗格中的对应技术中添加注目,并会在“转换”窗格中添加一个条件来追踪您的操作。若是在“输入”技术中进行转换,则注目会清醒在“过程”窗格中技术的左侧,并会清醒在字段列表的“输入成就”中。
您讹诈转换的轨则很遑急。在“团员”、“转置”、“麇集”和“合并”技术类型中进行的转换会在这些清算操作之前或之后扩充,具体情况取决于您进行转换时字段的位置。进行转换的位置清醒在技术的“转换”窗格中。
以下示例清醒了麇集技术中对多少字段所作念的转换。将在麇集操作之前扩充转换以生成调动的效用。
操作轨则下表清醒了“团员”、“转置”、“麇集”和“合并”技术类型中清算操作的扩充位置,具体情况取决于字段在技术中的那儿。
操作技术类型:团员团员转置转置麇集麇集并集并集新建行 字段位置:分组字段团员字段不在转置中通过转置创建包含在一个表中*同期包含在两个表中*不匹配的字段合并字段用于生成行的字段筛选 团员之前团员之后转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后对值进行分组 NANA转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后清算 NANA转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后养息日历 团员之前团员之后转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后拆分值 NANA转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后重定名字段 NANA转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之前复制字段 NANA转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后仅保留字段 团员之后团员之后转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后移除字段 从团员中移除从团员中移除转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后创建联想字段 NANA转置之前转置之后麇集之后麇集之后合并之前合并之后新建行之后剪辑值 NANA转置之前转置之后麇集之前麇集之后合并之前合并之后新建行之后转换数据类型 团员之前团员之后转置之前转置之后麇集之前麇集之前合并之前合并之后新建行之前庄重:对于麇集,若是字段是使用一个表中的字段创建的联想字段,则在麇集之前讹诈转换。若是字段是同期使用两个表中的字段创建的,则在麇集之后讹诈转换。
讹诈清算操作若要向字段讹诈清算操作,请使用用具栏选项,或在字段成就卡、数据网格或“效用”窗格上单击“更多选项” 掀开菜单。
在“团员”、“转置”、“麇集”和“合并”技术类型中,不错在“效用”窗格和对应数据网格中的成就卡上找到“更多选项” 菜单。若是您在统统过程中反复扩充疏通的清算操作或操作,则不错复制和粘贴技术、操作致使字段。运筹帷幄精致信息,请参见复制技术、操作和字段。
“成就”窗格用具栏下拉菜单遴荐视图您不错在数据网格或列表视图中的成就窗格或效用窗格外部中扩充清算操作。使用视图用具栏(Tableau Prep Builder 版块 2019.3.2 及更高版块以及在 Web 上)转换视图,然后在字段上单击“更多选项” 掀开清算菜单。
清醒成就窗格 :这是默许视图。遴荐此按钮可复返成就窗格或效用窗格视图。
清醒数据网格 :折叠成就窗格或效用窗格以伸开并仅清醒数据网格。此视图提供了更精致的数据视图,在您需要处理特定字段值时高出有用。遴荐此选项后,此视图景况将在过程的统统技术中保捏不变,但您不错随时对其进行转换。
庄重:并非统统清算操作齐可在数据网格中使用。例如来说,若是对值进行内联剪辑,则必须使用“成就”窗格。
清醒列表视图 (Tableau Prep Builder 版块 2019.3.2 及更高版块以及在 Web 上):将成就窗格或效用窗格养息为列表。遴荐此选项后,此视图景况将在过程的统统技术中保捏不变,但您不错随时对其进行转换。
在此视图中,您不错:
使用“X”选项遴荐和移除多行。(版块 2021.1.4 及更高版块)使用 选项遴荐并荫藏或取消荫藏多行。(版块 2021.2.1 及更高版块)批量重定名字段。使用“更多选项” 菜单将操作讹诈于所选字段。
若是为字段分派数据扮装,或遴荐“筛选”、“对值进行分组”、“清算”或“拆分值”,则将复返到“成就”或“效用”视图来完成这些操作。不错在列表视图中扩充统统其他选项。
暂停数据更新以提升性能对数据扩充清算操作时,Tableau Prep 会跟着推崇讹诈转换,以便立即向您清醒效用。当您知说念需要进行的转换况兼在进行每次转换时不需要立即反映时,为了轻松珍贵的处理时间,您不错通过暂停数据更新来提升性能。
暂停数据更新时,不错一次进行统统转换,然后规复更新以张望效用。您不错随时规复数据更新并启用统统可用操作。
庄重:暂停数据更新时,将禁用任何要求您张望值的操作。例如来说,若是要将筛选器讹诈于所选值,则需要张望要排斥的值。
在顶部菜单中,单击“暂停数据更新”以暂停更新。
Tableau Prep 会将“成就”窗格养息为“列表”视图。在“列表”视图中,使用“更多选项” 菜单将操作讹诈于所选字段。 若是操作要求您张望值,它将被禁用。若要启用该操作,您必须规复数据更新。
运筹帷幄使用“列表”视图模式的精致信息,请参见遴荐视图。
若要张望转换的效用或启用禁用的功能,请规复数据更新。单击“规复数据更新”按钮,单击菜单对话框中或“过程”窗格顶部音信横幅中的“规复”按钮。
庄重:Tableau Prep Builder 为您提供胜仗从菜单中规复更新的选项。若是在 Web 上剪辑过程,您需要从顶部菜单规复更新。
色图讹诈清算操作若要将清算操作讹诈于字段,请扩充以下操作:
庄重:从 Tableau Prep Builder 版块 2019.3.2 驱动以及在 Tableau Server 和 Tableau Cloud 上从版块 2020.4 驱动,您不错在列表视图中扩充清算操作。
在“成就”窗格、数据网格、“效用”窗格或列表视图中,遴荐要进行转换的字段。
从用具栏或字段的“更多选项” 菜单中,从以下选项中进行遴荐:
筛选或筛选值:遴荐筛选器选项之一,右键单击或按住 Ctrl 并单击 (MacOS) 字段值以保留或排斥值。您也不错使用“汲取值”筛选器来登第和遴荐要筛选的值,包括过程样本中莫得的值。运筹帷幄筛选器选项的精致信息,请参见筛选您的数据(流畅在新窗口中掀开)。
对值进行分组(以往时的版块中为“分组和替换”):手动遴荐值或使用自动分组。您也不错在“成就”卡中遴荐多个值,并右键单击或按住 Ctrl 并单击 (MacOS) 以对值进行分组或取消分组,或者剪辑组值。运筹帷幄使用“对值进行分组”的精致信息,请参见使用隐隐匹配将值自动映射到程序值。
清算:从快速清算操作列表中进行遴荐,以便讹诈于字段中的统统值。
养息日历(Tableau Prep Builder 版块 2020.1.4 及更高版块以及在 Web 上):对于分派给“日历”或“日历和时间”数据类型的字段,从 DATEPART 快速清算操作列表中遴荐,将日历字段值养息为默示年份、季度、月份、周、日或日历和时间值的整数值。
从版块 2021.1.4 驱动,您还不错从两个 DATENAME 快速清算操作中遴荐星期几或月份称呼,以养息日历字段值。
自界说司帐年度 (Tableau Prep Builder 版块 2020.3.3 及更高版块以及在 Web 上):若是您的司帐年度未在 1 月驱动,则不错成立自界说司帐月份以使用该月份而不是默许的 1 月养息日历。
此成立基于每个字段,因此若是要将自界说司帐年度讹诈于其他字段,请重叠此疏通的技术。
若要掀开对话框,请从“更多选项” 菜单中遴荐“养息日历”>“自界说司帐年度”。
拆分值:基于常见分隔符自动拆分值,或使用自界说拆分来指定要何如拆分字段值。
自动拆分和自界说拆分的责任样式与它们在 Tableau Desktop 中的责任样式疏通。运筹帷幄精致信息,请参见 Tableau Desktop 和 Web 制作匡助中的将字段拆分为多个字段(流畅在新窗口中掀开)。
重定名字段:剪辑字段称呼。
复制字段(Tableau Prep Builder 版块 2019.2.3 及更高版块以及在 Web 上):创建字段和值的副本。
仅保留字段(Tableau Prep Builder 版块 2019.2.2 及更高版块以及在 Web 上):仅保留所选字段比肩斥技术中的统统其他字段。
创建联想字段:在联想剪辑器中编写自界说联想,或使用可视化联想剪辑器(Tableau Prep Builder 版块 2020.1.1 及更高版块以及在 Web 上)创建精致级别、排行或行号联想。运筹帷幄精致信息,请参见创建精致级别、排行和分片联想。
以数据扮装样式发布:创建自界说数据扮装,然后可将其讹诈于您的字段,以在清算数据时考证字段值。运筹帷幄此选项的精致信息,请参见创建自界说数据扮装(流畅在新窗口中掀开)。荫藏字段:若是您有字段念念要保留在过程中但不需要清算,您不错将这些字段荫藏起来,而不是删除它们。运筹帷幄精致信息,请参见荫藏字段。移除(在往时的版块中为“移除字段”):从过程中移除字段。
若要剪辑值,请右键单击或按住 Ctrl 并单击 (MacOS) 一个或多个值,遴荐“剪辑值”,然后输入新值。您也不错遴荐“替换为 Null”将值替换为 Null 值,欧美色色或在单个字段中双击以胜仗对其进行剪辑。运筹帷幄剪辑字段值的精致信息,请参见剪辑字段值。
在“成就”窗格、“摘录”窗格或数据网罗中张望这些操作的效用。批量重定名字段在 Tableau Prep Builder 版块 2021.2.1 及更高版块中受维持。在 Tableau Server 和 Tableau Cloud 版块 2021.2 及更高版块的 Web 版 Tableau Prep 中受维持。
使用“重定名字段”选项批量重定名多个字段。搜索字段称呼的一部分以替换或移除它,或者为数据汇集的统统或汲取字段添加前缀或后缀。
通过在进行转换时选中“自动重定名新字段”复选框,您还不错自动将疏通的转换讹诈于异日添加的任何合适您条件的字段。
庄重:此选项仅在“清算”技术类型中可用。
在“清算”技术中,从用具栏中遴荐“重定名字段”。
您的视图会自动养息为清醒过程中统统字段的“列表视图”。您不错使用用具栏中的“搜索”选项来减弱效用边界。
统统字段默许情况下处于汲取景况。断根顶部复选框可断根统统字段的遴荐,从而仅手动遴荐要转换的字段。
在“重定名字段”窗格中,从以下选项中进行遴荐:替换文本:在“查找文本”字段中,使用“搜索选项”查找匹配文本911色色色,然后在“替换为”字段中输入替换文本。若要查找空格,请在“查找文本”字段中按空格键。
庄重:重定名字段不会导致空缺或重叠的字段称呼。
添加前缀:将文本添加到统统汲取字段称呼的起原。添加后缀:在统统汲取字段称呼的末尾添加文本。
当您进行输入时,您的效用将清醒在“列表视图”窗格中。
(可选)遴荐“自动重定名新字段”以在刷新数据时自动将这些疏通的转换讹诈到合适替换条件的新字段。单击“重定名”讹诈您的转换并关闭窗格。“重定名”按钮清醒受转换影响的字段数。
张望您所作念的转换不同类型的清算操作由过程中技术上的图标默示。若是向技术讹诈了进步四种类型的操作,则技术上会清醒概略号。将光标悬停在这些图标上即可张望清醒所讹诈的操作偏执扩充轨则的注目。
从 Tableau Prep Builder 版块 2019.1.3 及更高版块驱动以及在 Web 上,您不错在“过程”窗格中某个技术上单击转换图标上的注目,或者单击“成就”或“效用”窗格中的某个成就卡,转换偏执影响的字段将会在“转换”窗格以及“成就”或“效用”窗格中凸起清醒。
您也不错遴荐技术,然后伸开“转换”窗格以张望每个转换的精致信息、剪辑或移除转换,或者将转换朝上或向下拖动以转换其讹诈轨则,况兼您不错添加态状,以便为其他用户提供凹凸文。运筹帷幄为转换添加态状的精致信息,请参见为过程技术和清算动作添加讲解(流畅在新窗口中掀开)。
清算注目“转换”窗格在“团员”、“转置”、“麇集”或“合并”技术中张望转换时,转换的讹诈轨则会在调整操作之前或之后清醒。这些转换的轨则由系统讹诈,无法转换。您不错剪辑和移除转换。
合并字段若是字段包含的值疏通,但称呼不同,您不错通过将一个字段拖到另一个字段上,拖沓地将它们合并为单个字段。在合并字段时,指标字段将成为主字段,况兼指标字段的字段称呼保捏不变。合并到指标字段的字段会被移除。
示例:
输入并集生成 3 个具有疏通值的字段将 3 个字段合并为 1 个字段合并字段时,Tableau Prep 会保留指标字段中的统统字段,并将该字段中的任何 null 值替换为您与指标字段合并的源字段中的值。源字段会被移除。
示例
NameContact_PhoneBusiness_PhoneCell_PhoneHome_PhoneBob123-4567123-4567nullnullSallynullnull456-7890789-0123Frednullnullnull567-8901Emmanull234-5678345-6789null若是将 Business _Phone、Cell_Phone 和 Home_Phone 字段与 Contact_phone 字段合并,则会移除其他字段并生成以下本体:
NameContact_PhoneBob123-4567Sally456-7890Fred567-8901Emma234-5678若要合并字段,请扩充以下操作之一:
将一个字段拖放到另一个字段上。将清醒“甩掉以合并字段”带领符。
遴荐多个字段,并在所选边界内右键单击以掀开凹凸文菜单 ,然后单击“合并字段”。
遴荐多个字段,然后在用具栏上单击“合并字段”。
运筹帷幄何如建立合并所产生的不匹配字段的信息,请参见建立不匹配的字段。
使用建议讹诈清算操作随机可能很难细目您需要使用哪些清算操作来建立数据中的问题。Tableau Prep 可对数据进行分析并提倡清算操作建议,您不错自动讹诈这些操作来快速建立数据字段中的问题,或者匡助细目问题以便能对其进行建立。除“输入”、“输出”和“麇集”技术类型外的统统技术类型中提供了此功能。
庄重:在 Tableau Prep Builder 中,若是不念念使用此功能,您不错将其关闭。从顶部菜单中,转到“匡助”>“成立和性能”。然后单击“启用建议”以断根成立阁下的复选标记。
建议类型包括:
数据扮装
筛选
对值进行分组(从 Tableau Prep Builder 版块 2019.2.3 驱动以及在 Web 上,也适用具迥殊据扮装的字段)将列转置为行(Tableau Prep Builder 版块 2019.4.2 及更高版块以及在 Web 上)
将值替换为 Null 值移除字段
拆分(Tableau Prep Builder 版块 2019.1.1 及更高版块以及在 Web 上)
庄重:此选项专用于处理固定宽度类型文本文献中的数据。若要将拆分建议与此文献类型结合使用,请在联结到数据源后,在“输入”技术的“文本成立”选项卡中遴荐一个数据中未使用的“字段分隔符”字符,使数据以单一字段样式加载。
剪裁空格
讹诈建议扩充以下操作之一:
单击成就卡右上角中的灯泡 图标。从用具栏中单击“建议”下拉箭头以张望适用于您的数据集的统统建议,并从列表中遴荐一个建议。唯有在 Tableau Prep 细目了建议的转换时,此选项才会出现。
若要讹诈建议,请将鼠标指针悬停在“建议”卡上,然后单击“讹诈”。
系统会自动讹诈转换,并向“转换”窗格中添加一个条件。若要移除转换,请在顶部菜单中单击“消除”,或将鼠标指针悬停在“转换”窗格中的转换上,并单击“X”将其移除。
若是将建议讹诈于转置字段,将自动创建一个“转置”技术,您不错在其中扩充当何其他转置操作,如重定名转置字段或对其他字段进行转置。
若是 Tableau Prep 因为所作念转换而细目了进一步的建议,则灯泡图标会一直清醒在“成就”卡上,直至找不到进一步的建议为止。
重叠上头的技术以讹诈任何其他转换或忽略建议的转换,并使用其他清算用具来处治数据问题。
剪辑字段值疏通值的多个变体可能会让您无法准确地汇总和据。不错使用以下选项快捷拖沓地矫正这些变化。
庄重:对值进行的任何剪辑齐必须与字段数据类型兼容。
剪辑单个值在“成就”卡中,单击要剪辑的值,并输入新值。值阁下将清醒一个组图标 。
或者,右键单击值并单击“剪辑值”。转换纪录在屏幕左侧的“转换”窗格中。
在“成就”窗格和数据网罗中张望效用。
剪辑多个值可通过多个选项来一次性剪辑多个值。例如,使用快速清算操作来移除字段中统统值的标点标志、使用多选手动将值分组、使用可找到近似值的隐隐匹配算法自动将值分组在统统,或者遴荐多个值并将它们替换为 Null。
庄重:将多个值映射到单个值时,原始字段会在值阁下清醒一个分组图标 ,清醒哪些值分组在统统。
使用快速清算操作剪辑多个值此选项仅适用于文本字段。
在“成就”窗格、“效用”窗格或数据网格中,遴荐要剪辑的字段。
单击“更多选项”,遴荐“清算”,然后遴荐以下选项之一:
设为大写:将统统值转换为大写文本。
设为小写:将统统值转换为小写文本。
设为首字母大写:将统统值转换为首字母大写文本。
移除字母:移除统统字母并仅保留其他字符。
移除数字:移除所迥殊字并保留字母和其他字符。
移除标点标志:移除统统标点标志。
剪裁空格:移除前导和尾随空格。
移除格外的空格:移除前导和尾随空格,以及将字符之间的格外空格替换为单一空格。移除统统空格:移除统统空格,包括前导和尾随空格以及字符之间的任何空格。您不错累加操作,以将多个清算操作讹诈于字段。例如,率先遴荐“清算”>“移除数字”,然后遴荐“清算”>“移除标点标志”以从字段值中移除所迥殊字和标点标志。
若要消除转换,请单击“过程”窗格顶部的“消除”箭头,或从转换列表中移除转换。
以内联样式剪辑分组或多个值使用此选项可手动遴荐多个值,并将它们分组在成就卡中的某个程序值下。若要使用其他措施对值进行分组,请参见将多个值手动映射到程序值和使用隐隐匹配将值自动映射到程序值。
在“成就”卡中,遴荐要剪辑的字段。
按 Ctrl 或按住 Shift 并单击,或者按 Command 或按住 Shift 并单击 (MacOS),并遴荐要分组的值。
右键单击,并从凹凸文菜单中遴荐“分组”。您右键单击的所选本体中的值将成为新组的默许称呼,但您不错对此称呼进行内联剪辑。
若要剪辑组称呼,请遴荐分组的字段并剪辑值,或者右键单击或按住 Ctrl 单击 (Mac) 分组的字段并从凹凸文菜单中遴荐“剪辑值”。
若要取消分组已分组的字段值,请右键单击分组的字段,并从凹凸文菜单中遴荐“取消分组”。
将一个或多个值替换为 Null若是有要包括在分析中的数据行,但念念要排斥特定字段值,您不错将这些值转换为 Null 值。
在“成就”卡中,按 Ctrl 或按住 Shift 并单击,或者按 Command 或按住 Shift 并单击(Mac 上),并遴荐要转换的值
右键单击或按住 Ctrl 单击 (Mac),并从菜单中遴荐“替换为 Null”。值将转换为 Null,况兼值阁下会清醒分组图标 。
将多个值手动映射到程序值使用“对值进行分组”(往时的版块中为“分组和替换”)将字段的值从一个值映射到另一个值,或者手动遴荐多个值以对它们进行分组。您致使不错添加新值,成立映射干系来组织数据。
例如,假定字段中有三个值:“My Company”、“My Company Incorporated”和“My Company Inc”。统统这些值齐默示消亡公司,即“My Company”。您不错使用“对值进行分组”将值“My Company Incorporated”和“My Company Inc”映射到“My Company”,以便统统三个值在字段中齐清醒为“My Company”。
将多个值映射到单个所选字段在“成就”窗格或“效用”窗格中,遴荐要剪辑的字段。
单击“更多选项”,并从菜单中遴荐“对值进行分组”(往时的版块中为“分组和替换”)>“手动遴荐”。
在“对值进行分组”剪辑器的左侧窗格中,遴荐要用作分组值的字段值。此值面前清醒在右侧窗格的顶部。
在“对值进行分组”剪辑器右侧窗格的下半部分中,遴荐要添加到组的值。
若要从组中移除值,请在“对值进行分组”剪辑器右侧窗格的上半部分中,断根值阁下的复选框。
通过遴荐多个值来创建组在“成就”窗格或“效用”窗格中,遴荐要剪辑的字段。
单击“更多选项”,并从菜单中遴荐“对值进行分组”(往时的版块中为“分组和替换”)>“手动遴荐”。
在“对值进行分组”剪辑器的左侧窗格中,遴荐要分组的多个值。
在“对值进行分组”剪辑器的右侧窗格中,单击“对值进行分组”。
将会使用终末一个所选的值动作组称呼创建一个新组。若要剪辑组称呼,请遴荐分组的字段并剪辑值,或者右键单击或按住 Ctrl 单击 (MacOS) 分组的字段并从菜单中遴荐“剪辑值”。
添加和标志不在数据汇集的值若是要将数据汇集的值映射到不存在的新值,您不错使用“对值进行分组”(往时的版块中为“分组和替换”)来添加该值。为了拖沓识别数据汇集莫得的任何值,这些值在“对值进行分组”剪辑器中的值称呼阁下带有红点标记。
例如不才图中,Wyoming 和 Nevada 不在数据汇集。
数据汇集之是以可能莫得某个值,可能有以下一些原因:
您刚刚手动添加了新值。
值不再在数据中。
值在数据中,但不在抽样数据汇集。
添加新值:
在“成就”窗格或“效用”窗格中,遴荐要剪辑的字段。
单击“更多选项”,并从凹凸文菜单中遴荐“对值进行分组”(往时的版块中为“分组和替换”)>“手动遴荐”。
在“对值进行分组”剪辑器的左侧窗格中,单击加号 以添加新值。
在字段中键入新值,并按 Enter 添加该值。
在右侧窗格中,遴荐要映射到新值的值。
(可选)若要向映射的值中添加其他新值,请单击“对值进行分组”剪辑器右侧窗格中的加号 按钮。使用隐隐匹配将值自动映射到程序值若要搜索近似的值并对其进行自动分组,请使用隐隐匹配算法之一。字段值依据最通常出现的值进行分组。张望分组的值,并证实需要在组中添加或移除值。
若是使用数据扮装来考证字段值,则不错使用“对值进行分组”(往时的版块中为“分组和替换”)选项将无效值与灵验值匹配。运筹帷幄精致信息,请参见按数据扮装对近似值进行分组(流畅在新窗口中掀开)
遴荐以下选项之一双值进行分组:
发音:查找发音近似的值并对其进行分组。此选项使用 Metaphone 3 算法,该算法按单词的发音对单词编制索引,最妥当于英语单词。好多常用的拼写搜检器齐使用这种类型的算法。此选项对于数据扮装不可用。
常用字符:查找具有共同字母或数字的值并对其进行分组。此选项使用 ngram 指纹算法,该算法按单词移除标点标志、重叠字符和空格之后的唯独字符对单词编制索引。此算法妥当于任何维持的说话。此选项对于数据扮装不可用。
例如,此算法将匹配默示为“John Smith”和“Smith, John”的称呼,因为它们均生成键“hijmnost”。由于此算法不商酌发音,因此值“Tom Jhinois”将具有疏通的键“hijmnost”,并也会包括在组中。
拼写:查找拼写近似的值并对其进行分组。此选项使用 Levenshtein 距离算法,使用固定默许阈值来联想两个文本值之间的剪辑距离。当剪辑距离小于阈值时,则将这两个值分组在统统。此算法妥当于任何维持的说话。
从 Tableau Prep Builder 版块 2019.2.3 驱动以及在 Web 上,此选项可在讹诈了数据扮装之后使用。在这种情况下,它会使用剪辑距离将无效值与最近的灵验值匹配。若是数据集示例中莫得程序值,Tableau Prep 会自动添加该值,并将值标记为不在原始数据汇集。
发音 + 拼写:(Tableau Prep Builder 版块 2019.1.4 及更高版块以及在 Web 上)若是为字段分派数据扮装,您不错使用该数据扮装,通过数据扮装界说的程序值来匹配值和对值进行分组。此选项随后将证实拼写和发音将无效值与最一样的灵验值匹配。若是数据集示例中莫得程序值,Tableau Prep 会自动添加该值,并将值标记为不在原始数据汇集。此选项最妥当于英文单词。
运筹帷幄精致信息,请参见清算和调整数据念念了解更多对于这些隐隐匹配算法的信息吗?在 Tableau.com 上张望 Tableau Prep Builder 中的自动分组(流畅在新窗口中掀开)
庄重:在 Tableau Prep Builder 版块 2019.1.4 和 2019.2.1 中,此选项标为“数据扮装匹配”。
使用隐隐匹配分组近似值在“成就”窗格或“效用”窗格中,遴荐要剪辑的字段。
单击“更多选项”并遴荐“对值进行分组”,然后遴荐以下选项之一:
发音
常用字符
拼写
Tableau Prep Builder 将查找匹配的值并对其进行分组,并将它们替换为组中出现最通常的值。
张望分组,并证实需要手动添加或移除值或对其进行剪辑。然后单击“完成”。
在对字段值进行分组时调整效用若是按“拼写”或“发音”对近似值进行分组,您不错使用字段上的滑块来调整分组参数的严格进度,从而转换效用。
证实滑块的成立样式,您不错更猛进度地适度组中包括的值数目以及创建的组数目。默许情况下,Tableau Prep 会检测最好分构成立,并将滑块清醒在该位置。
转换阈值时,Tableau Prep 会对值的样本进行分析来细目新的分组。依据成立生成的组保存并纪录在“转换”窗格中,但不会保存阈值成立。下次通过剪辑现存转换或进行新转换掀开“对值进行分组”剪辑器时,阈值滑块会清醒在默许位置,使您概况证实现时数据集进行任何调整。
在“成就”窗格或“效用”窗格中,遴荐要剪辑的字段。
单击“更多选项”,并遴荐“对值进行分组”(在前的版块中为“分组和替换”),然后遴荐以下选项之一:
发音
拼写
Tableau Prep 将查找匹配的值并对其进行分组,并将它们替换为组中出现最通常的值。
在“对值进行分组”剪辑器的左侧窗格中,将滑块拖到 5 个阈值级别之一以转换效用。
若要成立更严格的阈值911色色色,请将滑块向左挪动。这会使匹配数更少,并创建更少的组。若要成立更宽松的阈值,请将滑块向右挪动。这会使匹配数更多,并创建更多的组。
单击“完成”保存您所作念的转换。