从高维到低维:
Aivia带你轻松驾驭3种数据降维技术
在Aivia中的应用:通过选择不同的测量方法,帮助用户为不同类别实现清晰的决策边界,这些测量方法可以用于不同的聚类技术。
Aivia中的三种降维方法:
关于参数和不同使用示例的详细技术说明,请参见Aivia Wiki。
UMAP(统一流形近似与投影)是一种现代降维技术,主要用于高维数据集的可视化。它的用途与t-SNE相似,但通常速度更快且能够处理更大的数据集。UMAP基于保持数据的拓扑结构的原则,通过利用黎曼几何和代数拓扑来近似数据的底层流形。通过捕捉局部和全局结构,它提供了数据簇和关系的全面视图。
UMAP的两个主要步骤
深入了解UMAP理论
UMAP的核心工作原理与t-SNE非常相似——两者都使用图布局算法在低维空间中排列数据。UMAP构建数据的高维图表示,然后优化一个低维图,使其在结构上尽可能相似。UMAP通过基于每个点的第n个最近邻的距离来局部选择半径,从而确保局部结构与全局结构的平衡。
如何(误)解读UMAP
虽然UMAP相较于t-SNE有许多优势,但它绝不是万能的——解读和理解其结果需要一定的谨慎。需要注意以下几点:
超参数非常重要:选择合适的值取决于数据和你的目标。
UMAP图中的簇大小毫无意义:簇之间的相对大小基本上没有意义。
簇之间的距离可能毫无意义:尽管UMAP在全局位置上更好地保留了簇的位置,但它们之间的距离并不具有意义。
随机噪声不总是看起来随机:特别是在n_neighbors值较低时,可能会观察到虚假的聚类。
你可能需要不止一张图:由于UMAP算法是随机的,不同的运行可能产生不同的结果。
图2:对Fashion MNIST数据集应用降维。10类服装物品的28x28图像被编码为784维向量,然后通过UMATt-SNE投影到3维。
t-SNE(t-随机邻域嵌入)是一种流行的降维方法,用于高维数据的可视化。t-SNE通过保留数据的局部结构来工作,通常会导致簇的清晰分离。与专注于最大化方差的PCA(主成分分析)不同,t-SNE强调在降维空间中保持相似的距离接近,不相似的距离远离。然而,由于其对局部结构的强调,它有时会夸大簇,并不总是能保留数据的全局结构。此方法计算量大,尤其是对于大型数据集。
PaCMAP(成对控制流形近似)是一种降维技术,作为t-SNE和UMAP等方法的替代方案被引入。该方法旨在平衡数据中局部和全局结构的保留,解决其他技术中观察到的一些挑战。它引入了成对吸引和排斥项,以在流形学习过程中控制平衡,并以其速度和处理大数据集的能力而著称,同时能够生成可解释的嵌入。
快来申请Aivia14试用吧!
更有免费软件Aivia community等你来探索!
Aivia14新产品发布会
参考文献:
1. Becht E, McInnes L, Healy J, Dutertre CA, Kwok IW, Ng LG, Ginhoux F, Newell EW. Dimensionality reduction for visualizing single-cell data using UMAP. Nature biotechnology. 2019 Jan;37(1):38-44.
2. Wang Y, Huang H, Rudin C, Shaposhnik Y. Understanding how dimension reduction tools work: an empirical approach to deciphering t-SNE, UMAP, TriMAP, and PaCMAP for data visualization. The Journal of Machine Learning Research. 2021 Jan 1;22(1):9129-201.
3. Van der Maaten L, Hinton G. Visualizing data using t-SNE. Journal of machine learning research. 2008 Nov 1;9(11).
4. McInnes L, Healy J, Melville J. Umap: Uniform manifold approximation and projection for dimension reduction. arXiv preprint arXiv:1802.03426. 2018 Feb 9.
关于徕卡显微系统
显微图库 | THUNDER技术图库 第三弹
月满中秋 | 海上观月影,心向未“徕”
【案例分享】脑部手术中的最佳可视化
类器官研究利器-MICA
相关产品
德国徕卡 体视显微镜-数码显微镜 DVM6
德国徕卡 倒置荧光金相显微镜 Leica DMi8 M
MICA 全场景显微成像分析平台
ARveo 8数字化手术显微镜
德国徕卡 MICA宽焦全场景显微成像分析平台
德国徕卡 MICA宽场活细胞全场景显微成像分析平台
德国徕卡手术显微镜系统 Leica M525 F20
德国徕卡眼科手术显微镜徕卡M620 F20
德国徕卡桌面眼科手术显微镜 Leica M620 TTS
德国徕卡红光反射手术显微镜 M822
德国徕卡眼科手术显微镜M844 F40 / F20
德国徕卡眼科手术显微镜 Proveo 8
德国徕卡眼科手术显微镜 Leica ToricEyePiece
德国徕卡视网膜正像观察镜 Leica RUV800
德国徕卡摆臂式旋转分光器Leica Rotatable Beamsplitt
关注
拨打电话
留言咨询