Genera o edita imágenes utilizando modelos de IA (FLUX, Gemini). Úsalo para la generación de imágenes de propósito general, incluyendo fotos, ilustraciones, obras de arte, recursos visuales, arte conceptual y cualquier imagen que no sea un diagrama técnico o esquema. Para diagramas de flujo, circuitos, rutas y diagramas técnicos, utiliza en su lugar la habilidad scientific-schematics.
Crea presentaciones y diapositivas para charlas de investigación. Úsalo para hacer diapositivas de PowerPoint, presentaciones en conferencias, charlas en seminarios, presentaciones de investigación, diapositivas para defensa de tesis o cualquier charla científica. Proporciona estructura de diapositivas, plantillas de diseño, guía de tiempos y validación visual. Funciona con PowerPoint y LaTeX Beamer.
Evalúe el rigor de la investigación. Evalúe la metodología, el diseño experimental, la validez estadística, los sesgos, la confusión, la calidad de la evidencia (GRADE, Cochrane ROB), para un análisis crítico de las afirmaciones científicas.
Generar informes completos de investigación de mercado (más de 50 páginas) al estilo de las principales firmas de consultoría (McKinsey, BCG, Gartner). Cuenta con formato profesional en LaTeX, generación extensa de elementos visuales con esquemas científicos y generate-image, integración profunda con research-lookup para la recopilación de datos, y análisis estratégico multi-marco que incluye las Cinco Fuerzas de Porter, PESTLE, SWOT, TAM/SAM/SOM y la Matriz BCG.
Realice revisiones bibliográficas exhaustivas y sistemáticas utilizando múltiples bases de datos académicas (PubMed, arXiv, bioRxiv, Semantic Scholar, etc.). Esta habilidad debe emplearse al llevar a cabo revisiones sistemáticas de la literatura, metaanálisis, síntesis de investigación o búsquedas bibliográficas completas en dominios biomédicos, científicos y técnicos. Crea documentos en markdown con formato profesional y PDFs con citas verificadas en múltiples estilos de citación (APA, Nature, Vancouver, etc.).
Biblioteca interactiva de visualización de datos científicos y estadísticos para Python. Úsela al crear gráficos, diagramas o visualizaciones que incluyen diagramas de dispersión, gráficos de líneas, gráficos de barras, mapas de calor, gráficos 3D, mapas geográficos, distribuciones estadísticas, gráficos financieros y paneles de control. Soporta tanto visualizaciones rápidas (Plotly Express) como personalización detallada (objetos de gráfico). Genera HTML interactivo o imágenes estáticas (PNG, PDF, SVG).
Kit de herramientas de análisis estadístico. Pruebas de hipótesis (t-test, ANOVA, chi-cuadrado), regresión, correlación, estadística bayesiana, análisis de potencia, verificación de supuestos, reporte APA, para investigación académica.
Habilidad central para la herramienta de investigación profunda y redacción. Escribir manuscritos científicos en párrafos completos (nunca en viñetas). Utilizar un proceso de dos etapas: (1) crear esquemas de secciones con puntos clave usando research-lookup, (2) convertirlos en prosa fluida. Estructura IMRAD, citas (APA/AMA/Vancouver), figuras/tablas, guías de reporte (CONSORT/STROBE/PRISMA), para artículos de investigación y envíos a revistas.
Crea figuras para publicaciones con matplotlib/seaborn/plotly. Diseños multipanel, barras de error, marcadores de significancia, apto para daltónicos, exporta en PDF/EPS/TIFF, para gráficos científicos listos para revistas.
Socio de ideación para la investigación. Generar hipótesis, explorar conexiones interdisciplinarias, desafiar suposiciones, desarrollar metodologías, identificar vacíos en la investigación, para la resolución creativa de problemas científicos.
Cree pósters de investigación profesionales en LaTeX utilizando beamerposter, tikzposter o baposter. Soporte para presentaciones en conferencias, pósters académicos y comunicación científica. Incluye diseño de distribución, esquemas de color, formatos de múltiples columnas, integración de figuras y mejores prácticas específicas para pósters en comunicación visual.
Gestión integral de citas para la investigación académica. Busca en Google Scholar y PubMed artículos, extrae metadatos precisos, valida citas y genera entradas BibTeX correctamente formateadas. Esta habilidad debe usarse cuando necesites encontrar artículos, verificar información de citas, convertir DOIs a BibTeX o asegurar la precisión de las referencias en la escritura científica.
Biblioteca de trazado fundamental. Crea gráficos de líneas, dispersión, barras, histogramas, mapas de calor, 3D, subgráficos, exporta PNG/PDF/SVG, para visualización científica y figuras para publicación.
Realice búsquedas web impulsadas por IA con información en tiempo real utilizando modelos Perplexity a través de LiteLLM y OpenRouter. Esta habilidad debe usarse al realizar búsquedas web para obtener información actual, encontrar literatura científica reciente, obtener respuestas fundamentadas con citas de fuentes o acceder a información más allá del límite de conocimiento del modelo. Proporciona acceso a múltiples modelos Perplexity, incluyendo Sonar Pro, Sonar Pro Search (búsqueda agente avanzada) y Sonar Reasoning Pro mediante una única clave API de OpenRouter.
Cree diagramas científicos de calidad para publicación utilizando Nano Banana Pro AI con refinamiento iterativo inteligente. Utiliza Gemini 3 Pro para la revisión de calidad. Solo regenera si la calidad está por debajo del umbral para su tipo de documento. Especializado en arquitecturas de redes neuronales, diagramas de sistemas, diagramas de flujo, vías biológicas y visualizaciones científicas complejas.
Realice un análisis exploratorio de datos exhaustivo en archivos de datos científicos en más de 200 formatos de archivo. Esta habilidad debe utilizarse al analizar cualquier archivo de datos científicos para comprender su estructura, contenido, calidad y características. Detecta automáticamente el tipo de archivo y genera informes detallados en markdown con análisis específicos del formato, métricas de calidad y recomendaciones para análisis posteriores. Cubre química, bioinformática, microscopía, espectroscopía, proteómica, metabolómica y formatos generales de datos científicos.
Consulta información de investigación actual utilizando los modelos Sonar Pro Search o Sonar Reasoning Pro de Perplexity a través de OpenRouter. Selecciona automáticamente el mejor modelo según la complejidad de la consulta. Busca artículos académicos, estudios recientes, documentación técnica e información general de investigación con citas.
Acceso directo a la API REST de PubMed. Consultas avanzadas Booleanas/MeSH, API de E-utilities, procesamiento por lotes, gestión de citas. Para flujos de trabajo en Python, se recomienda biopython (Bio.Entrez). Use esto para trabajo directo con HTTP/REST o implementaciones personalizadas de API.
Marco de optimización multiobjetivo. NSGA-II, NSGA-III, MOEA/D, frentes de Pareto, manejo de restricciones, benchmarks (ZDT, DTLZ), para problemas de diseño e ingeniería y optimización.
Esta habilidad debe utilizarse al convertir artículos académicos en formatos promocionales y de presentación, incluyendo sitios web interactivos (Paper2Web), videos de presentación (Paper2Video) y carteles para conferencias (Paper2Poster). Utilice esta habilidad para tareas que involucren la difusión de artículos, preparación de conferencias, creación de páginas académicas explorables, generación de resúmenes en video o producción de carteles listos para impresión a partir de fuentes LaTeX o PDF.
Aprendizaje automático en Python con scikit-learn. Úselo al trabajar con aprendizaje supervisado (clasificación, regresión), aprendizaje no supervisado (agrupamiento, reducción de dimensionalidad), evaluación de modelos, ajuste de hiperparámetros, preprocesamiento o construcción de pipelines de ML. Proporciona documentación de referencia completa para algoritmos, técnicas de preprocesamiento, pipelines y mejores prácticas.
Kit de herramientas para la revisión por pares sistemática. Evaluar metodología, estadística, diseño, reproducibilidad, ética, integridad de figuras, estándares de reporte, para la revisión de manuscritos y subvenciones en diversas disciplinas.
Kit de herramientas de modelado estadístico. OLS, GLM, logístico, ARIMA, series temporales, pruebas de hipótesis, diagnósticos, AIC/BIC, para inferencia estadística rigurosa y análisis econométrico.
Kit de herramientas integral para crear, analizar y visualizar redes y grafos complejos en Python. Úselo al trabajar con estructuras de datos de redes/grafos, analizar relaciones entre entidades, calcular algoritmos de grafos (caminos más cortos, centralidad, agrupamiento), detectar comunidades, generar redes sintéticas o visualizar topologías de redes. Aplicable a redes sociales, redes biológicas, sistemas de transporte, redes de citación y cualquier dominio que involucre relaciones por pares.
Escribir informes clínicos completos que incluyan informes de casos (directrices CARE), informes diagnósticos (radiología/patología/laboratorio), informes de ensayos clínicos (ICH-E3, SAE, CSR) y documentación del paciente (SOAP, H&P, resúmenes de alta). Soporte completo con plantillas, cumplimiento normativo (HIPAA, FDA, ICH-GCP) y herramientas de validación.
Cree pósters de investigación profesionales en LaTeX utilizando beamerposter, tikzposter o baposter. Soporte para presentaciones en conferencias, pósters académicos y comunicación científica. Incluye diseño de distribución, esquemas de color, formatos de múltiples columnas, integración de figuras y mejores prácticas específicas para pósters en comunicación visual.
Generar hipótesis comprobables. Formular a partir de observaciones, diseñar experimentos, explorar explicaciones alternativas, desarrollar predicciones, proponer mecanismos, para la investigación científica en diversos dominios.
Visualización estadística. Diagramas de dispersión, de caja, de violín, mapas de calor, gráficos de pares, regresión, matrices de correlación, KDE, gráficos facetados, para análisis exploratorio y figuras para publicación.
Biblioteca de Python para trabajar con datos vectoriales geoespaciales, incluyendo shapefiles, GeoJSON y archivos GeoPackage. Úsela al trabajar con datos geográficos para análisis espacial, operaciones geométricas, transformaciones de coordenadas, uniones espaciales, operaciones de superposición, mapeo coroplético o cualquier tarea que implique leer/escribir/analizar datos geográficos vectoriales. Soporta bases de datos PostGIS, mapas interactivos e integración con matplotlib/folium/cartopy. Úsela para tareas como análisis de buffer, uniones espaciales entre conjuntos de datos, disolución de límites, recorte de datos, cálculo de áreas/distancias, reproyección de sistemas de coordenadas, creación de mapas o conversión entre formatos de archivos espaciales.
Escribir propuestas de investigación competitivas para NSF, NIH, DOE y DARPA. Formato específico de la agencia, criterios de revisión, preparación del presupuesto, impactos más amplios, declaraciones de importancia, narrativas de innovación y cumplimiento con los requisitos de presentación.
Generar documentos profesionales de soporte de decisiones clínicas (CDS) para entornos farmacéuticos e investigación clínica, incluyendo análisis de cohortes de pacientes (estratificados por biomarcadores con resultados) e informes de recomendaciones de tratamiento (guías basadas en evidencia con algoritmos de decisión). Soporta la clasificación de evidencia GRADE, análisis estadístico (razones de riesgo, curvas de supervivencia, gráficos de cascada), integración de biomarcadores y cumplimiento regulatorio. Produce salidas en formato LaTeX/PDF listo para publicación, optimizado para desarrollo de fármacos, investigación clínica y síntesis de evidencia.
Esta habilidad debe utilizarse para tareas de aprendizaje automático en series temporales, incluyendo clasificación, regresión, agrupamiento, pronóstico, detección de anomalías, segmentación y búsqueda de similitud. Úsese al trabajar con datos temporales, patrones secuenciales u observaciones indexadas en el tiempo que requieran algoritmos especializados más allá de los enfoques estándar de ML. Particularmente adecuada para el análisis de series temporales univariantes y multivariantes con APIs compatibles con scikit-learn.
Herramienta eficiente de búsqueda en bases de datos para el servidor de preprints bioRxiv. Utiliza esta habilidad al buscar preprints de ciencias de la vida por palabras clave, autores, rangos de fechas o categorías, recuperando metadatos de artículos, descargando PDFs o realizando revisiones bibliográficas.
Biblioteca rápida de DataFrame (Apache Arrow). Seleccionar, filtrar, agrupar_por, uniones, evaluación perezosa, entrada/salida CSV/Parquet, API de expresiones, para flujos de trabajo de análisis de datos de alto rendimiento.
Marco de aprendizaje profundo (PyTorch Lightning). Organiza el código de PyTorch en LightningModules, configura Trainers para multi-GPU/TPU, implementa pipelines de datos, callbacks, registro (W&B, TensorBoard), entrenamiento distribuido (DDP, FSDP, DeepSpeed), para entrenamiento escalable de redes neuronales.
Interpretabilidad y explicabilidad de modelos usando SHAP (SHapley Additive exPlanations). Utilice esta habilidad al explicar predicciones de modelos de aprendizaje automático, calcular la importancia de características, generar gráficos SHAP (waterfall, beeswarm, bar, scatter, force, heatmap), depurar modelos, analizar sesgos o equidad del modelo, comparar modelos o implementar IA explicable. Funciona con modelos basados en árboles (XGBoost, LightGBM, Random Forest), aprendizaje profundo (TensorFlow, PyTorch), modelos lineales y cualquier modelo de caja negra.
Kit principal de Python para biología molecular. Preferido para consultas basadas en Python a PubMed/NCBI (Bio.Entrez), manipulación de secuencias, análisis de archivos (FASTA, GenBank, FASTQ, PDB), flujos de trabajo avanzados de BLAST, estructuras, filogenia. Para BLAST rápido, use gget. Para API REST directa, use pubmed-database.
Acceso directo a la API REST de KEGG (solo uso académico). Análisis de vías metabólicas, mapeo gen-vía, vías metabólicas, interacciones farmacológicas, conversión de IDs. Para flujos de trabajo en Python con múltiples bases de datos, se recomienda bioservices. Use esto para trabajo directo con HTTP/REST o control específico de KEGG.
Consulta y analiza la literatura académica utilizando la base de datos OpenAlex. Esta habilidad debe usarse al buscar artículos académicos, analizar tendencias de investigación, encontrar trabajos de autores o instituciones, rastrear citas, descubrir publicaciones de acceso abierto o realizar análisis bibliométricos en más de 240 millones de trabajos académicos. Úsala para búsquedas bibliográficas, análisis de producción investigadora, análisis de citas y consultas en bases de datos académicas.
Generar planes de tratamiento médico concisos (3-4 páginas), enfocados, en formato LaTeX/PDF para todas las especialidades clínicas. Soporta tratamiento médico general, terapia de rehabilitación, atención de salud mental, manejo de enfermedades crónicas, cuidado perioperatorio y manejo del dolor. Incluye marcos de objetivos SMART, intervenciones basadas en evidencia con citas textuales mínimas, cumplimiento normativo (HIPAA) y formato profesional. Prioriza la brevedad y la aplicabilidad clínica.
Acceda a plantillas completas de LaTeX, requisitos de formato y directrices de envío para los principales lugares de publicación científica (Nature, Science, PLOS, IEEE, ACM), conferencias académicas (NeurIPS, ICML, CVPR, CHI), pósteres de investigación y propuestas de subvenciones (NSF, NIH, DOE, DARPA). Esta habilidad debe utilizarse al preparar manuscritos para la presentación en revistas, artículos para conferencias, pósteres de investigación o propuestas de subvenciones y se necesitan requisitos y plantillas de formato específicos para cada lugar.
Kit de herramientas integral de IA para atención médica para desarrollar, probar y desplegar modelos de aprendizaje automático con datos clínicos. Esta habilidad debe utilizarse al trabajar con registros electrónicos de salud (EHR), tareas de predicción clínica (mortalidad, reingreso, recomendación de medicamentos), sistemas de codificación médica (ICD, NDC, ATC), señales fisiológicas (EEG, ECG), conjuntos de datos de atención médica (MIMIC-III/IV, eICU, OMOP) o al implementar modelos de aprendizaje profundo para aplicaciones de atención médica (RETAIN, SafeDrug, Transformer, GNN).
Análisis de RNA-seq de célula única. Cargar datos .h5ad/10X, control de calidad (QC), normalización, PCA/UMAP/t-SNE, agrupamiento Leiden, genes marcadores, anotación de tipos celulares, trayectoria, para análisis de scRNA-seq.
Utilice esta habilidad al trabajar con matemáticas simbólicas en Python. Esta habilidad debe usarse para tareas de cálculo simbólico, incluyendo la resolución de ecuaciones algebraicamente, la realización de operaciones de cálculo (derivadas, integrales, límites), la manipulación de expresiones algebraicas, el trabajo con matrices simbólicamente, cálculos de física, problemas de teoría de números, cálculos de geometría y la generación de código ejecutable a partir de expresiones matemáticas. Aplique esta habilidad cuando el usuario necesite resultados simbólicos exactos en lugar de aproximaciones numéricas, o cuando trabaje con fórmulas matemáticas que contengan variables y parámetros.
Esta habilidad debe utilizarse al trabajar con matrices de datos anotados en Python, particularmente para el análisis de genómica de una sola célula, la gestión de mediciones experimentales con metadatos o el manejo de conjuntos de datos biológicos a gran escala. Úsese cuando las tareas involucren objetos AnnData, archivos h5ad, datos de RNA-seq de una sola célula o la integración con herramientas scanpy/scverse.
Herramienta principal de Python para más de 40 servicios de bioinformática. Preferida para flujos de trabajo multi-base de datos: UniProt, KEGG, ChEMBL, PubChem, Reactome, QuickGO. API unificada para consultas, mapeo de IDs, análisis de vías metabólicas. Para control REST directo, use habilidades individuales de bases de datos (uniprot-database, kegg-database).
Sistema de IA multiagente para asistencia en investigación científica que automatiza los flujos de trabajo de investigación desde el análisis de datos hasta la publicación. Esta habilidad debe utilizarse al generar ideas de investigación a partir de conjuntos de datos, desarrollar metodologías de investigación, ejecutar experimentos computacionales, realizar búsquedas bibliográficas o generar artículos listos para publicación en formato LaTeX. Soporta pipelines de investigación de extremo a extremo con orquestación de agentes personalizable.
Plataforma de genómica en la nube DNAnexus. Construya aplicaciones/applets, gestione datos (subida/descarga), SDK de Python dxpy, ejecute flujos de trabajo, FASTQ/BAM/VCF, para el desarrollo y ejecución de pipelines genómicos.
Marco autónomo de agentes de IA biomédica para ejecutar tareas complejas de investigación en genómica, descubrimiento de fármacos, biología molecular y análisis clínico. Utilice esta habilidad al realizar investigaciones biomédicas de múltiples pasos, incluyendo el diseño de cribado CRISPR, análisis de RNA-seq de célula única, predicción ADMET, interpretación de GWAS, diagnóstico de enfermedades raras u optimización de protocolos de laboratorio. Aprovecha el razonamiento de LLM con ejecución de código y bases de datos biomédicas integradas.
Consulta ClinicalTrials.gov a través de la API v2. Busca ensayos por condición, medicamento, ubicación, estado o fase. Recupera detalles del ensayo por ID NCT, exporta datos, para investigación clínica y emparejamiento de pacientes.
Accede a más de 200 millones de estructuras de proteínas predichas por IA de AlphaFold. Recupera estructuras por ID de UniProt, descarga archivos PDB/mmCIF, analiza métricas de confianza (pLDDT, PAE), para el descubrimiento de fármacos y biología estructural.
Ejecute código Python en la nube con contenedores serverless, GPUs y escalado automático. Úselo al desplegar modelos de ML, ejecutar trabajos de procesamiento por lotes, programar tareas intensivas en cómputo o servir APIs que requieran aceleración por GPU o escalado dinámico.
Esta habilidad debe utilizarse al trabajar con modelos transformadores preentrenados para procesamiento de lenguaje natural, visión por computadora, audio o tareas multimodales. Úsela para generación de texto, clasificación, respuesta a preguntas, traducción, resumen, clasificación de imágenes, detección de objetos, reconocimiento de voz y ajuste fino de modelos en conjuntos de datos personalizados.
Computación paralela/distribuida. Escalar pandas/NumPy más allá de la memoria, DataFrames/Arrays paralelos, procesamiento de múltiples archivos, gráficos de tareas, para conjuntos de datos mayores que la RAM y flujos de trabajo paralelos.
Simulaciones y análisis de mecánica cuántica utilizando QuTiP (Quantum Toolbox in Python). Úselo al trabajar con sistemas cuánticos que incluyen: (1) estados cuánticos (kets, bras, matrices de densidad), (2) operadores y puertas cuánticas, (3) evolución temporal y dinámica (Schrödinger, ecuaciones maestras, Monte Carlo), (4) sistemas cuánticos abiertos con disipación, (5) mediciones cuánticas y entrelazamiento, (6) visualización (esfera de Bloch, funciones de Wigner), (7) estados estacionarios y funciones de correlación, o (8) métodos avanzados (teoría de Floquet, HEOM, solucionadores estocásticos). Maneja tanto sistemas cuánticos cerrados como abiertos en diversos dominios incluyendo óptica cuántica, computación cuántica y física de la materia condensada.
Consulta el gen NCBI a través de la API E-utilities/Datasets. Busca por símbolo/ID, recupera información del gen (RefSeqs, GO, ubicaciones, fenotipos), búsquedas por lotes, para anotación génica y análisis funcional.
Acceda a NCBI GEO para datos de expresión génica/genómica. Busque/descargue conjuntos de datos de microarrays y RNA-seq (GSE, GSM, GPL), recupere archivos SOFT/Matrix, para análisis de transcriptómica y expresión.
Marco de simulación de eventos discretos basado en procesos en Python. Utilice esta habilidad al construir simulaciones de sistemas con procesos, colas, recursos y eventos basados en el tiempo, como sistemas de manufactura, operaciones de servicio, tráfico de red, logística o cualquier sistema donde las entidades interactúan con recursos compartidos a lo largo del tiempo.
Acceda a las API de la USPTO para búsquedas de patentes/marcas, historial de examen (PEDS), asignaciones, citas, acciones de oficina, TSDR, para análisis de PI y búsquedas de arte previo.
Biblioteca integral de Python para astronomía y astrofísica. Esta habilidad debe utilizarse al trabajar con datos astronómicos que incluyen coordenadas celestes, unidades físicas, archivos FITS, cálculos cosmológicos, sistemas de tiempo, tablas, sistemas de coordenadas mundiales (WCS) y análisis de datos astronómicos. Úsese cuando las tareas involucren transformaciones de coordenadas, conversiones de unidades, manipulación de archivos FITS, cálculos de distancias cosmológicas, conversiones de escalas de tiempo o procesamiento de datos astronómicos.
Kit de herramientas de aprendizaje automático molecular. Predicción de propiedades (ADMET, toxicidad), GNNs (GCN, MPNN), benchmarks de MoleculeNet, modelos preentrenados, featurización, para ML en descubrimiento de fármacos.
Biblioteca de Python para trabajar con archivos DICOM (Digital Imaging and Communications in Medicine). Utilice esta habilidad al leer, escribir o modificar datos de imágenes médicas en formato DICOM, extraer datos de píxeles de imágenes médicas (TC, RM, rayos X, ultrasonido), anonimizar archivos DICOM, trabajar con metadatos y etiquetas DICOM, convertir imágenes DICOM a otros formatos, manejar datos DICOM comprimidos o procesar conjuntos de datos de imágenes médicas. Se aplica a tareas que involucran análisis de imágenes médicas, sistemas PACS, flujos de trabajo de radiología y aplicaciones de imágenes en el cuidado de la salud.
Acceda a RCSB PDB para estructuras 3D de proteínas/ácidos nucleicos. Busque por texto/secuencia/estructura, descargue coordenadas (PDB/mmCIF), recupere metadatos, para biología estructural y descubrimiento de fármacos.
Kit de herramientas para el descubrimiento de fármacos basado en grafos. Predicción de propiedades moleculares (ADMET), modelado de proteínas, razonamiento con grafos de conocimiento, generación molecular, retrosíntesis, GNNs (GIN, GAT, SchNet), más de 40 conjuntos de datos, para ML basado en PyTorch sobre moléculas, proteínas y grafos biomédicos.
Acceso directo a la API REST de UniProt. Búsquedas de proteínas, recuperación FASTA, mapeo de ID, Swiss-Prot/TrEMBL. Para flujos de trabajo en Python con múltiples bases de datos, se recomienda bioservices (interfaz unificada para más de 40 servicios). Use esto para trabajo directo con HTTP/REST o control específico de UniProt.
Marco para simulaciones de dinámica de fluidos computacional usando Python. Úselo al ejecutar simulaciones de dinámica de fluidos que incluyan las ecuaciones de Navier-Stokes (2D/3D), ecuaciones de aguas poco profundas, flujos estratificados, o al analizar turbulencia, dinámica de vórtices o flujos geofísicos. Proporciona métodos pseudospectrales con FFT, soporte HPC y análisis exhaustivo de resultados.
Kit completo de procesamiento de biosenales para analizar datos fisiológicos que incluyen señales de ECG, EEG, EDA, RSP, PPG, EMG y EOG. Utilice esta habilidad al procesar señales cardiovasculares, actividad cerebral, respuestas electrodermales, patrones respiratorios, actividad muscular o movimientos oculares. Aplicable para el análisis de la variabilidad de la frecuencia cardíaca, potenciales relacionados con eventos, medidas de complejidad, evaluación del sistema nervioso autónomo, investigación en psicofisiología e integración multimodal de señales fisiológicas.
Consultar la API REST de Reactome para análisis de vías, enriquecimiento, mapeo gen-vía, vías de enfermedades, interacciones moleculares, análisis de expresión, para estudios de biología de sistemas.
Matrices N-D fragmentadas para almacenamiento en la nube. Matrices comprimidas, E/S en paralelo, integración con S3/GCS, compatible con NumPy/Dask/Xarray, para canalizaciones de computación científica a gran escala.
Consulta la API REST de la base de datos genómica Ensembl para más de 250 especies. Búsqueda de genes, recuperación de secuencias, análisis de variantes, genómica comparativa, ortólogos, predicciones VEP, para la investigación genómica.
Parse archivos FCS (Flow Cytometry Standard) v2.0-3.1. Extraer eventos como arrays de NumPy, leer metadatos/canales, convertir a CSV/DataFrame, para el preprocesamiento de datos de citometría de flujo.
Kit de herramientas de alto rendimiento para el análisis de intervalos genómicos en Rust con enlaces en Python. Úselo al trabajar con regiones genómicas, archivos BED, pistas de cobertura, detección de solapamientos, tokenización para modelos de ML o análisis de fragmentos en aplicaciones de genómica computacional y aprendizaje automático.
API de Query STRING para interacciones proteína-proteína (59M proteínas, 20B interacciones). Análisis de redes, enriquecimiento GO/KEGG, descubrimiento de interacciones, más de 5000 especies, para biología de sistemas.
Redes Neuronales de Grafos (PyG). Clasificación de nodos/grafos, predicción de enlaces, GCN, GAT, GraphSAGE, grafos heterogéneos, predicción de propiedades moleculares, para aprendizaje profundo geométrico.
Utilice esta habilidad para procesar y analizar grandes conjuntos de datos tabulares (miles de millones de filas) que superan la RAM disponible. Vaex sobresale en operaciones de DataFrame fuera de núcleo, evaluación perezosa, agregaciones rápidas, visualización eficiente de big data y aprendizaje automático en grandes conjuntos de datos. Aplíquelo cuando los usuarios necesiten trabajar con archivos grandes CSV/HDF5/Arrow/Parquet, realizar estadísticas rápidas en conjuntos de datos masivos, crear visualizaciones de big data o construir pipelines de ML que no caben en memoria.
Marco de computación cuántica para construir, simular, optimizar y ejecutar circuitos cuánticos. Utilice esta habilidad al trabajar con algoritmos cuánticos, diseño de circuitos cuánticos, simulación cuántica (sin ruido o con ruido), ejecución en hardware cuántico (Google, IonQ, AQT, Pasqal), optimización y compilación de circuitos, modelado y caracterización de ruido, o experimentos y evaluación cuántica (VQE, QAOA, QPE, evaluación aleatoria).
Kit de herramientas para análisis de NGS. Conversión de BAM a bigWig, control de calidad (correlación, PCA, huellas digitales), mapas de calor/perfiles (TSS, picos), para visualización de ChIP-seq, RNA-seq, ATAC-seq.
Plataforma de gestión de datos de microscopía. Acceda a imágenes mediante Python, recupere conjuntos de datos, analice píxeles, gestione ROI/anotaciones, procesamiento por lotes, para cribado de alto contenido y flujos de trabajo de microscopía.
Esta habilidad debe utilizarse al trabajar con tareas de aprendizaje por refuerzo que incluyen entrenamiento RL de alto rendimiento, desarrollo de entornos personalizados, simulación paralela vectorizada, sistemas multiagente o integración con entornos RL existentes (Gymnasium, PettingZoo, Atari, Procgen, etc.). Utilice esta habilidad para implementar el entrenamiento PPO, crear entornos PufferEnv, optimizar el rendimiento RL o desarrollar políticas con CNNs/LSTMs.
Consulta NCBI ClinVar para la significancia clínica de variantes. Busca por gen/posición, interpreta clasificaciones de patogenicidad, accede vía API E-utilities o FTP, anota VCFs, para medicina genómica.
Trabaje con Data Commons, una plataforma que proporciona acceso programático a datos estadísticos públicos de fuentes globales. Utilice esta habilidad al trabajar con datos demográficos, indicadores económicos, estadísticas de salud, datos ambientales o cualquier conjunto de datos públicos disponibles a través de Data Commons. Aplicable para consultar estadísticas de población, cifras del PIB, tasas de desempleo, prevalencia de enfermedades, resolución de entidades geográficas y exploración de relaciones entre entidades estadísticas.
Kit de herramientas CLI/Python para consultas rápidas de bioinformática. Preferido para búsquedas rápidas de BLAST. Acceso a más de 20 bases de datos: información genética (Ensembl/UniProt), AlphaFold, ARCHS4, Enrichr, OpenTargets, COSMIC, descargas de genomas. Para BLAST avanzado/procesamiento por lotes, use biopython. Para integración multi-base de datos, use bioservices.
Consulta la plataforma Open Targets para asociaciones objetivo-enfermedad, descubrimiento de objetivos farmacológicos, datos de tractabilidad/seguridad, evidencia genética/ómica, medicamentos conocidos, para la identificación de objetivos terapéuticos.
Biblioteca de Python multiplataforma para computación cuántica, aprendizaje automático cuántico y química cuántica. Permite construir y entrenar circuitos cuánticos con diferenciación automática, integración fluida con PyTorch/JAX/TensorFlow y ejecución independiente del dispositivo en simuladores y hardware cuántico (IBM, Amazon Braket, Google, Rigetti, IonQ, etc.). Úsese al trabajar con circuitos cuánticos, algoritmos cuánticos variacionales (VQE, QAOA), redes neuronales cuánticas, modelos híbridos cuántico-clásicos, simulaciones moleculares, cálculos de química cuántica o cualquier tarea de computación cuántica que requiera optimización basada en gradientes, programación agnóstica al hardware o flujos de trabajo de aprendizaje automático cuántico.
Integración de la plataforma R&D de Benchling. Acceso al registro (ADN, proteínas), inventario, entradas ELN, flujos de trabajo vía API, creación de aplicaciones Benchling, consulta del Data Warehouse, para la automatización de la gestión de datos de laboratorio.
Consulta las moléculas bioactivas y los datos de descubrimiento de fármacos de ChEMBL. Busca compuestos por estructura/propiedades, recupera datos de bioactividad (IC50, Ki), encuentra inhibidores, realiza estudios SAR, para química medicinal.
Wrapper pythonico alrededor de RDKit con interfaz simplificada y valores predeterminados sensatos. Preferido para el descubrimiento estándar de fármacos: análisis de SMILES, estandarización, descriptores, huellas digitales, agrupamiento, conformadores 3D, procesamiento en paralelo. Devuelve objetos nativos rdkit.Chem.Mol. Para control avanzado o parámetros personalizados, use rdkit directamente.
Esta habilidad debe utilizarse al inicio de cualquier tarea científica intensiva en computación para detectar y reportar los recursos del sistema disponibles (núcleos de CPU, GPUs, memoria, espacio en disco). Crea un archivo JSON con información de los recursos y recomendaciones estratégicas que informan las decisiones sobre el enfoque computacional, como si se debe usar procesamiento en paralelo (joblib, multiprocessing), computación fuera de núcleo (Dask, Zarr), aceleración por GPU (PyTorch, JAX) o estrategias eficientes en memoria. Use esta habilidad antes de ejecutar análisis, entrenar modelos, procesar grandes conjuntos de datos o cualquier tarea donde las limitaciones de recursos sean importantes.
Kit de herramientas para el procesamiento de imágenes de patología digital para imágenes de portaobjetos completos (WSI). Utilice esta habilidad al trabajar con portaobjetos de histopatología, procesar imágenes de tejido teñidas con H&E o IHC, extraer mosaicos de imágenes patológicas de gigapíxeles, detectar regiones de tejido, segmentar máscaras de tejido o preparar conjuntos de datos para pipelines de aprendizaje profundo en patología computacional. Se aplica a formatos WSI (SVS, TIFF, NDPI), análisis basado en mosaicos y flujos de trabajo de preprocesamiento de imágenes histológicas.
Generación y prueba automatizada de hipótesis utilizando grandes modelos de lenguaje. Utilice esta habilidad al generar hipótesis científicas a partir de conjuntos de datos, combinando conocimientos de la literatura con datos empíricos, probando hipótesis contra datos observacionales o realizando una exploración sistemática de hipótesis para el descubrimiento de investigación en dominios como la detección de engaños, la detección de contenido de IA, el análisis de salud mental u otras tareas de investigación empírica.
Integración de API de cuaderno de laboratorio electrónico. Acceda a cuadernos, gestione entradas/adjuntos, realice copias de seguridad de cuadernos, integre con Protocols.io/Jupyter/REDCap, para flujos de trabajo ELN programáticos.
Filtros de química medicinal. Aplicar reglas de similitud a fármacos (Lipinski, Veber), filtros PAINS, alertas estructurales, métricas de complejidad, para la priorización de compuestos y el filtrado de bibliotecas.
Análisis diferencial de expresión génica (Python DESeq2). Identificar genes DE a partir de conteos de RNA-seq a granel, pruebas de Wald, corrección FDR, gráficos volcán/MA, para análisis de RNA-seq.
Interfaz de Python para OpenMS para el análisis de datos de espectrometría de masas. Úsese para flujos de trabajo de proteómica y metabolómica LC-MS/MS que incluyen manejo de archivos (mzML, mzXML, mzTab, FASTA, pepXML, protXML, mzIdentML), procesamiento de señales, detección de características, identificación de péptidos y análisis cuantitativo. Aplíquese al trabajar con datos de espectrometría de masas, analizar experimentos de proteómica o procesar conjuntos de datos de metabolómica.
Kit de herramientas de quimioinformática para el control molecular detallado. Análisis de SMILES/SDF, descriptores (PM, LogP, TPSA), huellas digitales, búsqueda de subestructuras, generación 2D/3D, similitud, reacciones. Para flujos de trabajo estándar con una interfaz más sencilla, use datamol (envoltorio alrededor de RDKit). Use rdkit para control avanzado, sanitización personalizada, algoritmos especializados.
Kit de herramientas de datos biológicos. Análisis de secuencias, alineamientos, árboles filogenéticos, métricas de diversidad (alfa/beta, UniFrac), ordenación (PCoA), PERMANOVA, entrada/salida FASTA/Newick, para análisis de microbiomas.
Utilice esta habilidad para tareas de aprendizaje por refuerzo que incluyen el entrenamiento de agentes RL (PPO, SAC, DQN, TD3, DDPG, A2C, etc.), la creación de entornos personalizados Gym, la implementación de callbacks para monitoreo y control, el uso de entornos vectorizados para entrenamiento paralelo, y la integración con flujos de trabajo de RL profundo. Esta habilidad debe usarse cuando los usuarios soliciten implementación de algoritmos RL, entrenamiento de agentes, diseño de entornos o experimentación en RL.
Acceda a la base de datos de enzimas BRENDA a través de la API SOAP. Recupere parámetros cinéticos (Km, kcat), ecuaciones de reacción, datos del organismo e información específica de la enzima para sustratos, para la investigación bioquímica y el análisis de vías metabólicas.
Consulta el censo CZ CELLxGENE (más de 61 millones de células). Filtra por tipo de célula/tejido/enfermedad, recupera datos de expresión, integra con scanpy/PyTorch, para análisis a escala poblacional de células individuales.
Modelado metabólico basado en restricciones (COBRA). FBA, FVA, deleciones génicas, muestreo de flujos, modelos SBML, para análisis de biología de sistemas e ingeniería metabólica.
Acceda a la base de datos de mutaciones cancerosas COSMIC. Consulte mutaciones somáticas, el Censo de Genes del Cáncer, firmas mutacionales, fusiones génicas, para la investigación del cáncer y la oncología de precisión. Requiere autenticación.
Acceda al Archivo Europeo de Nucleótidos a través de API/FTP. Recupere secuencias de ADN/ARN, lecturas en bruto (FASTQ), ensamblajes genómicos por acceso, para pipelines de genómica y bioinformática. Soporta múltiples formatos.
Consulta el Catálogo GWAS de NHGRI-EBI para asociaciones SNP-rasgo. Busca variantes por ID rs, enfermedad/rasgo, gen, recupera valores p y estadísticas resumidas, para epidemiología genética y puntuaciones de riesgo poligénico.
Análisis de espectrometría de masas. Procesamiento de mzML/MGF/MSP, similitud espectral (coseno, coseno modificado), armonización de metadatos, identificación de compuestos, para metabolómica y procesamiento de datos de MS.
Análisis de grabaciones neuronales Neuropixels. Carga de datos SpikeGLX/OpenEphys, preprocesamiento, corrección de movimiento, clasificación de picos con Kilosort4, métricas de calidad, curación Allen/IBL, análisis visual asistido por IA, para electrofisiología extracelular Neuropixels 1.0/2.0. Úsese al trabajar con grabaciones neuronales, clasificación de picos, electrofisiología extracelular, o cuando el usuario mencione Neuropixels, SpikeGLX, Open Ephys, Kilosort, métricas de calidad o curación de unidades.
Kit de herramientas para archivos genómicos. Leer/escribir alineamientos SAM/BAM/CRAM, variantes VCF/BCF, secuencias FASTA/FASTQ, extraer regiones, calcular cobertura, para pipelines de procesamiento de datos NGS.
Kit completo para análisis de supervivencia y modelado de tiempo hasta el evento en Python utilizando scikit-survival. Utilice esta habilidad al trabajar con datos de supervivencia censurados, realizar análisis de tiempo hasta el evento, ajustar modelos de Cox, Random Survival Forests, modelos de Gradient Boosting o Survival SVMs, evaluar predicciones de supervivencia con el índice de concordancia o la puntuación de Brier, manejar riesgos competitivos o implementar cualquier flujo de trabajo de análisis de supervivencia con la biblioteca scikit-survival.
Plataforma de laboratorio en la nube para pruebas y validación automatizadas de proteínas. Úsela al diseñar proteínas y necesitar validación experimental que incluya ensayos de unión, pruebas de expresión, mediciones de termostabilidad, ensayos de actividad enzimática u optimización de secuencias de proteínas. También úsela para enviar experimentos vía API, rastrear el estado de los experimentos, descargar resultados, optimizar secuencias de proteínas para una mejor expresión utilizando herramientas computacionales (NetSolP, SoluProt, SolubleMPNN, ESM) o gestionar flujos de trabajo de diseño de proteínas con validación en laboratorio húmedo.
Acceda a los datos de farmacogenómica de ClinPGx (sucesor de PharmGKB). Consulte interacciones gen-droga, guías CPIC, funciones alélicas, para medicina de precisión y decisiones de dosificación guiadas por genotipo.
Consultar la API openFDA para medicamentos, dispositivos, eventos adversos, retiradas, presentaciones regulatorias (510k, PMA), identificación de sustancias (UNII), para el análisis de datos regulatorios de la FDA y la investigación de seguridad.
Featurización molecular para ML (más de 100 featurizadores). ECFP, MACCS, descriptores, modelos preentrenados (ChemBERTa), conversión de SMILES a características, para QSAR y ML molecular.
Integración con la API de protocols.io para la gestión de protocolos científicos. Esta habilidad debe utilizarse al trabajar con protocols.io para buscar, crear, actualizar o publicar protocolos; gestionar los pasos y materiales del protocolo; manejar discusiones y comentarios; organizar espacios de trabajo; subir y gestionar archivos; o integrar la funcionalidad de protocols.io en flujos de trabajo. Aplicable para el descubrimiento de protocolos, desarrollo colaborativo de protocolos, seguimiento de experimentos, gestión de protocolos de laboratorio y documentación científica.
Therapeutics Data Commons. Conjuntos de datos para descubrimiento de fármacos listos para IA (ADME, toxicidad, DTI), benchmarks, divisiones de andamiaje, oráculos moleculares, para ML terapéutico y predicción farmacológica.
Esta habilidad debe utilizarse al trabajar con análisis de datos ómicos de una sola célula utilizando scvi-tools, incluyendo scRNA-seq, scATAC-seq, CITE-seq, transcriptómica espacial y otras modalidades de una sola célula. Use esta habilidad para modelado probabilístico, corrección de lotes, reducción de dimensionalidad, expresión diferencial, anotación de tipos celulares, integración multimodal y tareas de análisis espacial.
Acceda y analice información completa sobre medicamentos de la base de datos DrugBank, incluyendo propiedades de los fármacos, interacciones, objetivos, vías, estructuras químicas y datos de farmacología. Esta habilidad debe utilizarse al trabajar con datos farmacéuticos, investigación en descubrimiento de fármacos, estudios de farmacología, análisis de interacciones entre medicamentos, identificación de objetivos, búsquedas de similitud química, predicciones ADMET o cualquier tarea que requiera información detallada sobre medicamentos y objetivos farmacológicos de DrugBank.
Esta habilidad debe utilizarse al trabajar con LaminDB, un marco de datos de código abierto para biología que hace que los datos sean consultables, rastreables, reproducibles y FAIR. Úsese al gestionar conjuntos de datos biológicos (scRNA-seq, espacial, citometría de flujo, etc.), rastrear flujos de trabajo computacionales, curar y validar datos con ontologías biológicas, construir data lakehouses o asegurar la procedencia y reproducibilidad de los datos en la investigación biológica. Cubre la gestión de datos, anotación, ontologías (genes, tipos celulares, enfermedades, tejidos), validación de esquemas, integraciones con gestores de flujos de trabajo (Nextflow, Snakemake) y plataformas MLOps (W&B, MLflow), y estrategias de despliegue.
Reducción de dimensionalidad UMAP. Aprendizaje de variedades no lineales rápido para visualización 2D/3D, preprocesamiento de agrupamiento (HDBSCAN), UMAP supervisado/paramétrico, para datos de alta dimensionalidad.
Inferir redes regulatorias génicas (GRNs) a partir de datos de expresión génica utilizando algoritmos escalables (GRNBoost2, GENIE3). Usar al analizar datos de transcriptómica (RNA-seq masivo, RNA-seq de célula única) para identificar relaciones entre factores de transcripción y genes diana, así como interacciones regulatorias. Soporta computación distribuida para conjuntos de datos a gran escala.
Acoplamiento molecular basado en difusión. Predice las posiciones de unión proteína-ligando a partir de PDB/SMILES, puntuaciones de confianza, cribado virtual, para el diseño de fármacos basado en estructura. No es para la predicción de afinidad.
Kit de herramientas integral para modelos de lenguaje de proteínas que incluye ESM3 (diseño multimodal generativo de proteínas a través de secuencia, estructura y función) y ESM C (embeddings y representaciones eficientes de proteínas). Utilice esta habilidad al trabajar con secuencias de proteínas, estructuras o predicción de funciones; diseñar proteínas novedosas; generar embeddings de proteínas; realizar plegamiento inverso; o llevar a cabo tareas de ingeniería de proteínas. Soporta tanto el uso local de modelos como la API Forge basada en la nube para inferencia escalable.
Kit de herramientas para árboles filogenéticos (ETE). Manipulación de árboles (Newick/NHX), detección de eventos evolutivos, ortología/paralogía, taxonomía NCBI, visualización (PDF/SVG), para filogenómica.
Esta habilidad debe utilizarse al trabajar con datos de intervalos genómicos (archivos BED) para tareas de aprendizaje automático. Úsese para entrenar incrustaciones de regiones (Region2Vec, BEDspace), análisis de ATAC-seq de célula única (scEmbed), construcción de picos consensuados (universes) o cualquier análisis basado en ML de regiones genómicas. Se aplica a colecciones de archivos BED, datos de scATAC-seq, conjuntos de datos de accesibilidad a la cromatina y aprendizaje de características genómicas basadas en regiones.
Acceda a la Base de Datos del Metaboloma Humano (más de 220K metabolitos). Busque por nombre/ID/estructura, recupere propiedades químicas, datos de biomarcadores, espectros NMR/MS, vías metabólicas, para metabolómica e identificación.
Plataforma Latch para flujos de trabajo de bioinformática. Construya canalizaciones con Latch SDK, decoradores @workflow/@task, despliegue flujos de trabajo sin servidor, LatchFile/LatchDir, integración con Nextflow/Snakemake.
Kit de herramientas de patología computacional para analizar imágenes de portaobjetos completos (WSI) y datos de imágenes multiparamétricas. Utilice esta habilidad al trabajar con portaobjetos de histopatología, imágenes teñidas con H&E, inmunofluorescencia multiplex (CODEX, Vectra), proteómica espacial, detección/segmentación de núcleos, construcción de grafos tisulares o entrenamiento de modelos de ML en datos de patología. Soporta más de 160 formatos de portaobjetos incluyendo Aperio SVS, NDPI, DICOM, OME-TIFF para flujos de trabajo de patología digital.
Kit de herramientas integral de computación cuántica para construir, optimizar y ejecutar circuitos cuánticos. Úselo al trabajar con algoritmos cuánticos, simulaciones o hardware cuántico que incluye (1) Construcción de circuitos cuánticos con puertas y mediciones, (2) Ejecución de algoritmos cuánticos (VQE, QAOA, Grover), (3) Transpilación/optimización de circuitos para hardware, (4) Ejecución en IBM Quantum u otros proveedores, (5) Química cuántica y ciencia de materiales, (6) Aprendizaje automático cuántico, (7) Visualización de circuitos y resultados, o (8) Cualquier tarea de desarrollo en computación cuántica.
Acceda a ZINC (más de 230 millones de compuestos disponibles para compra). Busque por ID de ZINC/SMILES, búsquedas por similitud, estructuras listas en 3D para acoplamiento, descubrimiento de análogos, para cribado virtual y descubrimiento de fármacos.
Acceda al NIH Metabolomics Workbench a través de la API REST (más de 4,200 estudios). Consulte metabolitos, nomenclatura RefMet, datos MS/NMR, búsquedas m/z, metadatos de estudios, para metabolómica y descubrimiento de biomarcadores.
Plataforma de automatización de laboratorio para robots Flex/OT-2. Escribe protocolos Protocol API v2, manejo de líquidos, módulos de hardware (agitador-calentador, termociclador), gestión de material de laboratorio, para flujos de trabajo automatizados de pipeteo.
Consulta PubChem a través de la API PUG-REST/PubChemPy (más de 110 millones de compuestos). Busca por nombre/CID/SMILES, recupera propiedades, búsquedas de similitud/subestructura, bioactividad, para quimioinformática.
Kit de automatización de laboratorio para controlar manipuladores de líquidos, lectores de placas, bombas, agitadores calefactores, incubadoras, centrífugas y equipos analíticos. Utilice esta habilidad al automatizar flujos de trabajo de laboratorio, programar robots de manipulación de líquidos (Hamilton STAR, Opentrons OT-2, Tecan EVO), integrar equipos de laboratorio, gestionar disposiciones de bandejas y recursos (placas, puntas, contenedores), leer placas o crear protocolos de laboratorio reproducibles. Aplicable tanto para protocolos simulados como para control de hardware físico.
Kit de herramientas de ciencia de materiales. Estructuras cristalinas (CIF, POSCAR), diagramas de fases, estructura de bandas, DOS, integración con Materials Project, conversión de formatos, para la ciencia de materiales computacional.