自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

白景屹的博客

原创展望：多模态融合与marker推断

多模态融合----展望

2024-11-11 17:00:38 613

原创机器学习分析scRNA-seq解析急性髓系白血病中的疾病和免疫过程

AML发展过程分析

2024-11-11 15:37:15 542

原创 scIDST：弱监督学习推断单细胞转录组数据中的疾病进展阶段

scIDST用概率标签代替伪标签，分类患病细胞

2024-11-03 16:53:24 861

原创分析报告：使用healthy reference检测疾病细胞状态的变化

健康图谱+健康对照+疾病查询整合，差异分析推断疾病相关的细胞

2024-11-03 13:03:11 934

原创 scRank从untreated数据推断药物有反应细胞类型

药物有反应细胞类型排序

2024-11-01 17:55:41 640

原创多模态弱监督学习识别细胞图谱的疾病状态变化

MultiMIL：多模态整合+临床标签传播到细胞水平

2024-10-08 09:52:51 1115

原创 Mowgli方法细节与可解释性实验设置

Mowgli的方法细节和可解释性实验设置

2024-09-23 11:25:46 898

原创 Geneformer中文教程(2).huggingface transformers

Geneformer中文教程(2)

2024-09-14 19:00:36 1028

原创 Geneformer中文教程(1).方法描述

Geneformer中文教程(1)

2024-09-13 16:59:02 1509

原创 IoT客户端+联邦学习微调大模型

客户端+联邦学习微调大模型

2024-08-29 19:12:44 1271

原创 spatialGLUE：空间多组学整合

配对空间多组学整合

2024-08-28 13:51:08 885

原创 SATURN：跨物种整合scRNA-seq数据集

跨物种sc样本统一编码

2024-08-07 15:53:31 1005

原创深入研究scRNA-seq基础模型

高度的细胞注释accuracy不代表模型能学习有意义的表示

2024-08-06 16:24:49 661

原创 Transformer在生成细胞数据上的应用

细胞数据生成

2024-08-06 12:21:17 1069

原创 GeneCompass：跨物种大模型用于破解基因调控机理

GeneCompass：把先验知识编码到预训练中

2024-07-27 14:51:47 1211

原创 DEGAS：将临床属性转移到细胞

通过整合single-cell与bulk将临床标签转移到cell

2024-07-21 12:37:53 1050

原创 MOGONET：患者分类与biomarker识别

有标签的配对数据整合

2024-07-19 23:14:52 852

原创 CLAM用于弱监督WSI分析

CLAM：注意力MIL用于WSI

2024-07-04 19:54:09 1247

原创 TransMIL：基于Transformer的多实例学习

TransMIL

2024-07-02 22:13:33 1238

原创 BioCLIP：物种图像的基础视觉模型

以分类学name组成句子结合CLIP分类生命树

2024-06-27 22:49:16 1124

原创 LangCell：用于细胞注释的语言-细胞预训练模型

细胞-文本检索实现零样本细胞注释

2024-06-27 15:07:04 839

原创 Cell2Sentence：为LLM传输生物语言

设计自然语言LLM支持的生物语言并微调

2024-06-24 17:10:00 818

原创 AlphaMissense：预测错义变异的致病性

AlphaMissense预测错义变异致病性

2024-06-22 14:00:52 1126

原创从Instance classifier重新思考多实例学习

弱监督多实例对比学习

2024-06-17 13:15:06 1076

原创基于注意力的MIL

AttentionMIL

2024-06-13 19:13:52 722

原创 Multimodal Dynamics：用于多模态融合背景下的分类

利用不确定性在联合场景下处理多模态融合

2024-06-12 21:48:05 1004 1

原创 LaDM3IL：多实例学习用于免疫库分类

MIL应用：免疫库分类

2024-06-11 21:38:16 984

原创 DT-MIL：用于组织病理学图像的MIL方法

WSI与MIL

2024-06-07 16:49:13 863

原创 SIMBA方法解读

simba方法解读

2024-06-06 22:16:48 1117

原创 SEACells：元细胞分析

SEACells：元细胞

2024-06-06 12:06:00 1385

原创 scGPT实验解读

scGPT的实验解读

2024-06-02 20:28:53 1242

原创 SIMBA：单细胞嵌入与特征

SIMBA：细胞与特征embedding联合学习

2024-06-02 17:23:49 1104

原创 scButterfly：单细胞跨模态翻译

scButterfly-跨模态翻译

2024-06-01 14:49:15 1118

原创 UnpairReg：回归分析用于不配对多组学分析

UnpairReg：推断调控系数+ATAC预测RNA

2024-05-29 23:28:58 1072

原创 Mowgli用于配对多组学整合

iNMF-based配对整合

2024-05-28 20:26:21 1118

原创 5.基于python的scRNA-seq细胞状态分析-细胞扰动

scRNA-seq细胞扰动分析

2024-05-28 14:34:09 1228

原创融合基因组序列识别scATAC-seq的细胞类型

SANGO：scATAC-seq注释

2024-05-22 21:30:15 1036

原创 5.基于python的scRNA-seq细胞状态分析-细胞组成

scRNA-seq细胞组成分析

2024-05-22 20:32:30 822

原创 5.基于python的scRNA-seq细胞状态分析-差异表达

scRNA-seq差异表达分析

2024-05-22 14:09:42 932

原创 4.基于python的scRNA-seq轨迹推断-RNA速率

scRNA-seq估计RNA速率+伪时间估计

2024-05-19 17:53:07 924

红楼梦人物图谱csv文件

红楼梦人物图谱csv文件

2023-08-30

mackey_glass_t17.npy

Mackey-Glass (MG)序列的部分内容，shape为(10000,)，这个时间序列是混乱的，没有明确的周期。级数不收敛也不发散，轨迹对初始条件高度敏感。这个基准问题用于神经网络和模糊建模研究。

2021-07-12

Kaggle交易预测.rar

基于 Kaggle 竞赛数据，原始数据文件较大，故本数据集只选用了 train.csv 中的 5 万条样本作为模型训练集（train.csv.gzip），1 万条样本作为模型测试集（test.csv.gzip）

2021-02-17

olivetti_py3.pkz

人脸图像数据集 olivetti_py3.pkz，该数据集一共有 400 张人脸图片，每张图片的大小是：64x64，每张图片作为一个样本，一共有 400 个样本，每个样本的特征维度是：64x64 = 4096；400 张图片一共包含 40 个不同的人，每个人有 10 张人脸图片

2021-02-13

随机森林评估特征重要性wine.rar

基于 UCI 葡萄酒数据，使用随机森林进行特征重要性分析，这些数据是对意大利同一地区种植的三种不同品种葡萄酒的化学分析结果，分析确定了三种葡萄酒中13种成分的含量，数据的第一列是葡萄酒的类别

2021-02-02

决策树预测用户流失data.csv

基于某信息公司的用户数据，使用决策树预测用户是否会流失，字段Churn代表客户是否流失，取值：['Yes', 'No']，其余字段为特征

2021-02-01

基于朴素贝叶斯的垃圾邮件过滤data.rar

邮件数据包括训练集train（正常邮件normal，垃圾邮件spam），测试集test，中文停用词文件cn_stopwords.txt

2021-01-31

LR预测CTR数据集data.zip

数据集是电商领域数据集，共计200万的样本记录。原始特征均为ID类特征；字段说明： userid 用户ID itemid 商品ID categoryid 商品类目ID action 用户行为类型 timestamp 时间戳

2021-01-25

机器翻译nmt.zip

轻量级机器翻译数据集，en-cn为英文与中文，en-fr为英文与法文

2021-01-22

nltk_data.rar

nltk的分词工具，将其解压，放置到当前虚拟环境（假设环境名为TORCH），则目录结构为"TORCH/nltk_data/tokenizers/punkt"

2021-01-22

google.csv

机器学习第六课，使用线性回归预测未来30天 Google 股票的收盘价走势，表格中的列代表每天的股票指数，如：Open 开盘价、High 最高价、Low 最低价、Volume 成交量。Adj. Open、Adj. High、Adj. Low、Adj. Close、Adj. Volume 代表调整后的数据

2021-01-15

hymenoptera_data.zip

hymenoptera_data数据集，这个数据集包括两类图片, bees 和 ants, 这些数据都被处理成了可以使用"torchvision.datasets.ImageFolder"来读取的格式。

2020-12-02

glove.6B.100d.txt.zip

glove.6B是斯坦福大学训练的词向量包(862MB)，glove.6B.100d是100维词向量，TEXT.build_vocab可以根据我自己的词汇表内的词匹配到glove内的词，组建成为需要的词向量；后面如果想使用这个新词向量，可以通过TEXT.vocab.vectors返回

2020-11-29

MNIST与FashionMNIST数据集

数据集包括了MNIST和FashionMNIST，有原始数据集raw和经过torchvision.datasets处理过的processed目录

2020-11-29

TextSet.zip

该文件用于词向量训练，Skip-Gram训练，主要是texttrain.txt文件，训练细节见白景屹的Pytorch笔记本-第四课.词向量：https://blog.csdn.net/qq_40943760/category_10532835.html

2020-11-09

fasterRCNN口罩检测

使用fasterrcnn实现口罩检测，fasterrcnn基于keras搭建，训练需要口罩数据集，数据集必须是VOC格式，预测需要权重文件，权重文件已经存在

2020-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除