Skip to content

本地表抽取器

处理模式

处理模式是否支持
批处理支持
流处理不支持
同步流不支持
数据验证不支持

配置

操作步骤:

  1. 拖动文件至上传区域,或者点击上传区域并选择文件进行上传
    若处理器曾上传过文件,那么重新编辑当前抽取器时,将不需要重新上传,当然你仍然可以用新文件覆盖。

    支持文件格式:.csv, .xls, .xlsx, .json
    文件大小限制:小于 16 MB
    文件个数限制:1

  2. (可选)点击配置解析规则,弹出配置面板。

    配置项解释
    分割符(仅csv)指定当前文件中值的分割符。
    文件编码(仅csv)当前文件的编码格式,默认值为 UTF-8。
    列信息是否定义在表头当前文件中,表头是否为列信息。
    若否,你可在文件解析完成后为数据声明表头信息。
    忽略空行导入数据时是否排除空行。
    忽略错误数据用空值填充未定义的值。
    如果不选择当前选项, 当遇到缺省值的行将触发错误。
    丢弃最后一列后面的多余数据如果不选择当前选项,当遇到多余列的行时将触发错误。
    要跳过的行数在导入数据之前要跳过的行数。
    主要用于跳过表头元数据。
    要导入的数据行数要导入数据的最大行数。
    主要用于跳过页脚元数据。为空时将导入所有数据
    注释字符(仅csv)在行首遇到该符号表示该行为注释数据,该行数据将不会被导入。
    引号字符(仅csv)指定引号字符。
  3. 点击“解析文件”按钮,弹出如下界面:

  4. 在此界面,你可修改系统自动解析出的列信息(列名、数据类型),选择你想要导入的列。

    若解析结果出现乱码,则意味着你可能需要返回上一步修改文件编码,并重新解析。

  5. 点击“保存”按钮。

输出

配置完成后,输出配置页面可以做以下操作

操作名称描述
配置列通过删除、导入等操作配置需要往下游输出的列
配置主键点击列名后的钥匙按钮,配置主键列
溯源验证列是否可溯源