VIP专享

异常值去除

异常值去除,利用数据处理工具,对数据样本中的异常值进行处理。
文章引用说明:如果您使用美吉生物云工具完成了数据分析,我们期望您在文章发表时,在方法学部分或致谢部分引用或提及美吉生物云工具以及我们发表的文章。
可参考示例:The data were analyzed on the online tool of Majorbio Cloud Platform (https://cloud.majorbio.com/page/tools/)
可参考文献:Han, Jichen. et al. 2024. Majorbio Cloud 2024: Update single-cell and multiomics workflows. iMeta, e217, doi:10.1002/imt2.217
  • 帮助文档
  • FAQ

工具概述

异常值去除,利用数据处理工具,对数据样本中的异常值进行处理,从而保证数据的正常有效利用。

 

操作方法

1. 输入任务名。

2. 输入需要进行分析的数据表,文件应为txt格式,数据表必须包含行头和列头为物种、基因或功能名称。数据与数据之间务必用制表符隔开(tab符),首列为样本名称。以下表为例:

DE32C48C-16B6-49b2-A23B-2DE283B637BA.png 


3. 检测方法有4种:

DBSCAN 这个算法以密度为基础,给定某空间里的一个点集合,能把附近的点分成一组(有很多相邻点的点),并标记出位于低密度区域的局外点

Isolation Forest:任何可以将数据分隔开的方法都可以实现Isolation,采用binary tree结构来实现,称为iTree,在iTree中,异常点被isolated之后更加靠近树的根部。

OneClassSVM在数据维度很高,或者对相关数据分布没有任何假设的情况下,OneClassSVM也可以作为一种很好的outlier detection方法。

Local Outlier Factor(LOF)通过计算一个数值score来反映一个样本的异常程度一个样本点周围的样本点所处位置的平均密度比上该样本点所在位置的密度。比值越大于1,则该点所在位置的密度越小于其周围样本所在位置的密度,这个点就越有可能是异常点。

 

 

结果解读

1.异常数据去除结果表:去除异常数据的数据表。

2.异常数据行列对照表:异常值对应的行列信息。


Q1:文件如何上传和删除?

①通过云工具页面上的选择文件按钮可以上传本地文件到云工具文件夹中,上传成功后可以直接选择目的文件进行分析。

图片1.png

②可以在项目中心——工具数据——我的云工具文档 文件夹中查看、上传和删除云工具文件。

图片2.png

图片3.png

Q2:运行成功的任务在哪里查看结果?

投递运行的任务可以在项目中心——我的工具任务 中查看运行状态和结果,点击“结果”可查看页面运行结果,点击“文件”可查看结果文件夹,如果运行失败可以点击“排查”查看报错原因。部分工具没有结果按钮只有文件按钮。

图片4.pngQ3:云工具任务如何删除?

运行失败或不需要的任务可以在项目中心——我的工具任务中勾选后删除,删除的文件会在回收站保存30天,期间可随时复原。

图片5.png

在线咨询