ML & Data Science Skills

Machine Learning, MLOps, Data Pipelines, Analytics

Showing 57 skills in ML & Data Science

langchain-architecture

5.2k

Design LLM applications using the LangChain framework with agents, memory, and tool integration patterns.

ml-dataclaudecodex

View Details

ml-pipeline-workflow

5.2k

Build end-to-end MLOps pipelines from data preparation through model training, validation, and production deployment.

ml-dataclaudecodex

View Details

data-storytelling

5.2k

Transform data into compelling narratives using visualization, context, and persuasive structure.

ml-dataclaudecodex

View Details

pyhealth

2.8k

Comprehensive healthcare AI toolkit for developing, testing, and deploying machine learning models with clinical data. This skill should be used when working with electronic health records (EHR), clinical prediction tasks (mortality, readmission, drug recommendation), medical coding systems (ICD, ND

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

biomni

2.8k

Autonomous biomedical AI agent framework for executing complex research tasks across genomics, drug discovery, molecular biology, and clinical analysis. Use this skill when conducting multi-step biomedical research including CRISPR screening design, single-cell RNA-seq analysis, ADMET prediction, GW

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

scientific-schematics

2.8k

Create publication-quality scientific diagrams using Nano Banana Pro AI with smart iterative refinement. Uses Gemini 3 Pro for quality review. Only regenerates if quality is below threshold for your document type. Specialized in neural network architectures, system diagrams, flowcharts, biological p

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

aeon

2.8k

This skill should be used for time series machine learning tasks including classification, regression, clustering, forecasting, anomaly detection, segmentation, and similarity search. Use when working with temporal data, sequential patterns, or time-indexed observations requiring specialized algorit

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

alphafold-database

2.8k

Access AlphaFold's 200M+ AI-predicted protein structures. Retrieve structures by UniProt ID, download PDB/mmCIF files, analyze confidence metrics (pLDDT, PAE), for drug discovery and structural biology.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

anndata

2.8k

This skill should be used when working with annotated data matrices in Python, particularly for single-cell genomics analysis, managing experimental measurements with metadata, or handling large-scale biological datasets. Use when tasks involve AnnData objects, h5ad files, single-cell RNA-seq data,

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

biopython

2.8k

Primary Python toolkit for molecular biology. Preferred for Python-based PubMed/NCBI queries (Bio.Entrez), sequence manipulation, file parsing (FASTA, GenBank, FASTQ, PDB), advanced BLAST workflows, structures, phylogenetics. For quick BLAST, use gget. For direct REST API, use pubmed-database.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

biorxiv-database

2.8k

Efficient database search tool for bioRxiv preprint server. Use this skill when searching for life sciences preprints by keywords, authors, date ranges, or categories, retrieving paper metadata, downloading PDFs, or conducting literature reviews.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

bioservices

2.8k

Primary Python tool for 40+ bioinformatics services. Preferred for multi-database workflows: UniProt, KEGG, ChEMBL, PubChem, Reactome, QuickGO. Unified API for queries, ID mapping, pathway analysis. For direct REST control, use individual database skills (uniprot-database, kegg-database).

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

brenda-database

2.8k

Access BRENDA enzyme database via SOAP API. Retrieve kinetic parameters (Km, kcat), reaction equations, organism data, and substrate-specific enzyme information for biochemical research and metabolic pathway analysis.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

chembl-database

2.8k

Query ChEMBL's bioactive molecules and drug discovery data. Search compounds by structure/properties, retrieve bioactivity data (IC50, Ki), find inhibitors, perform SAR studies, for medicinal chemistry.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

clinicaltrials-database

2.8k

Query ClinicalTrials.gov via API v2. Search trials by condition, drug, location, status, or phase. Retrieve trial details by NCT ID, export data, for clinical research and patient matching.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

clinpgx-database

2.8k

Access ClinPGx pharmacogenomics data (successor to PharmGKB). Query gene-drug interactions, CPIC guidelines, allele functions, for precision medicine and genotype-guided dosing decisions.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

clinvar-database

2.8k

Query NCBI ClinVar for variant clinical significance. Search by gene/position, interpret pathogenicity classifications, access via E-utilities API or FTP, annotate VCFs, for genomic medicine.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

cosmic-database

2.8k

Access COSMIC cancer mutation database. Query somatic mutations, Cancer Gene Census, mutational signatures, gene fusions, for cancer research and precision oncology. Requires authentication.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

datacommons-client

2.8k

Work with Data Commons, a platform providing programmatic access to public statistical data from global sources. Use this skill when working with demographic data, economic indicators, health statistics, environmental data, or any public datasets available through Data Commons. Applicable for queryi

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

datamol

2.8k

Pythonic wrapper around RDKit with simplified interface and sensible defaults. Preferred for standard drug discovery: SMILES parsing, standardization, descriptors, fingerprints, clustering, 3D conformers, parallel processing. Returns native rdkit.Chem.Mol objects. For advanced control or custom para

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

deepchem

2.8k

Molecular machine learning toolkit. Property prediction (ADMET, toxicity), GNNs (GCN, MPNN), MoleculeNet benchmarks, pretrained models, featurization, for drug discovery ML.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

drugbank-database

2.8k

Access and analyze comprehensive drug information from the DrugBank database including drug properties, interactions, targets, pathways, chemical structures, and pharmacology data. This skill should be used when working with pharmaceutical data, drug discovery research, pharmacology studies, drug-dr

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

ena-database

2.8k

Access European Nucleotide Archive via API/FTP. Retrieve DNA/RNA sequences, raw reads (FASTQ), genome assemblies by accession, for genomics and bioinformatics pipelines. Supports multiple formats.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

ensembl-database

2.8k

Query Ensembl genome database REST API for 250+ species. Gene lookups, sequence retrieval, variant analysis, comparative genomics, orthologs, VEP predictions, for genomic research.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

exploratory-data-analysis

2.8k

Perform comprehensive exploratory data analysis on scientific data files across 200+ file formats. This skill should be used when analyzing any scientific data file to understand its structure, content, quality, and characteristics. Automatically detects file type and generates detailed markdown rep

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

fda-database

2.8k

Query openFDA API for drugs, devices, adverse events, recalls, regulatory submissions (510k, PMA), substance identification (UNII), for FDA regulatory data analysis and safety research.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

gene-database

2.8k

Query NCBI Gene via E-utilities/Datasets API. Search by symbol/ID, retrieve gene info (RefSeqs, GO, locations, phenotypes), batch lookups, for gene annotation and functional analysis.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

geo-database

2.8k

Access NCBI GEO for gene expression/genomics data. Search/download microarray and RNA-seq datasets (GSE, GSM, GPL), retrieve SOFT/Matrix files, for transcriptomics and expression analysis.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

gtars

2.8k

High-performance toolkit for genomic interval analysis in Rust with Python bindings. Use when working with genomic regions, BED files, coverage tracks, overlap detection, tokenization for ML models, or fragment analysis in computational genomics and machine learning applications.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details

gwas-database

2.8k

Query NHGRI-EBI GWAS Catalog for SNP-trait associations. Search variants by rs ID, disease/trait, gene, retrieve p-values and summary statistics, for genetic epidemiology and polygenic risk scores.

ml-dataclaude

From:K-Dense-AI/claude-scientific-skillsspecialized

View Details