可视化资源

t-SNE 与降维

t-SNE(t-distributed Stochastic Neighbor Embedding)是高维数据二维可视化的事实标准。但它的输出有不少容易被误读的”陷阱”——超参数、迭代步数、簇的大小都会改变最终图形的解读。

不同 perplexity 下的同一组数据

distill.pub How to Use t-SNE Effectively
原文给出十余组对照实验:同一份高维数据,只改 perplexity 或随机种子,输出的形状就可能截然不同。
来源:Wattenberg 等 — How to Use t-SNE Effectively

看的时候要小心

交互式资源