type 2 diabetes symbol type 2 diabetes and sexuality what is type 2 diabetes
free coupon for cialis lipseysguns.com cialis generic
" /> Excelenciencia
Excelenciencia

Un millón de gigabytes para el genoma

Xavier Pujol Gebellí

INNOVACIÓN     |    BIOINFORMÁTICA    |    22/05/2014

La secuenciación del genoma humano y el alud de proyectos asociados que se han venido sucediendo en los últimos años, han generado una inmensidad de datos no siempre al alcance de la comunidad científica. Para facilitar el acceso de forma segura, garantizar su custodia y profundizar en su investigación, se ha constituido el Archivo Europeo del Genoma-Fenoma (EGA), con sede en el Barcelona Supercomputing Center y la coordinación del Centro de Regulación Genómica.

type 2 diabetes symbol type 2 diabetes and sexuality what is type 2 diabetes
free coupon for cialis lipseysguns.com cialis generic

where buy viagra online viagra for sale uk how to buy viagra online without
free coupon for cialis lipseysguns.com cialis generic

Para cuando termine la primera fase de carga de datos, previsiblemente a inicios de 2015, el Archivo Europeo del Genoma-Fenoma (EGA) habrá empleado un millón de gigabytes que se corresponden con la información obtenida de más de 700 proyectos de investigación desarrollados en unos 200 centros y grupos de investigación de todo el mundo. Las cifras dan cuenta de estudios sobre cáncer, diabetes, enfermedades autoinmunes y cardiovasculares y trastornos neurológicos y psiquiátricos, además de otras que alcanzan hasta una cincuentena de patologías, entre las que figuran algunas extraordinariamente minoritarias pero de gran interés científico.

El volumen de información que se habrá almacenado concierne a unas 100 000 personas, cifra que se irá incrementando con el paso del tiempo. "Continuamente se están generando datos de interés para la comunidad científica”, explica Modesto Orozco, director del Departamento de Ciencias de la Vida que agrupa a investigadores del Barcelona Supercomputing Center (BSC-CNS) y del Instituto de Investigación Biomédica (IRB Barcelona). Orozco dirige también el programa conjunto entre estos dos centros y el Centro de Regulación Genómica (CRG). La suma de todos ellos configura uno de los clústers de mayor capacidad y prestigio en biología computacional de Europa.

Y un dato todavía más relevante: en el poco tiempo que EGA lleva de funcionamiento, prácticamente en perÍodo de pruebas, ha recogido más de 20 000 peticiones en apenas cuatro meses, procedentes de 5000 usuarios de todo el mundo. El dato no debería sorprender si se tiene en cuenta el prestigio de las entidades proveedoras: Wellcome Trust (Reino Unido), International Cancer Genome Consortium, las universidades de Tokio (Japón), Pekín (China), Harvard (Estados Unidos) y Ginebra (Suiza), y la British Columbia Cancer Agency (Canadá), entre otras. En conjunto, más de 140 instituciones internacionales.


Cómo y para qué

EGA surge como una iniciativa del Instituto Europeo de Bioinformática, vinculado al European Molecular Biology Laboratory (EMBL), con el objetivo de agrupar en un formato "estable, accesible y seguro”, relata Modesto Orozco, las múltiples bases de datos genómicos que han ido construyéndose en los últimos años. Muchas de ellas forman parte de estudios ya finalizados y cuyos datos ya se explotaron con un fin específico. "La idea es que no se pierdan estos datos y que puedan usarse bajo estrictas medidas de seguridad en posteriores estudios”, sigue.

Con este objetivo, el clúster formado por el CRG y el BSC se postuló como sede del archivo, al tiempo que establecían, de común acuerdo con el EMBL, las características y protocolos de acceso. "Los datos están doblemente encriptados, se ha procedido a un diseño específico para las bases de datos y se han adoptado medidas de seguridad adicionales para preservar la confidencialidad y la seguridad frente a eventuales hackers”, añade Orozco. En esencia, significa que se ha diseñado un sofisticado sistema de acceso, que las bases de datos están replicadas por motivos de seguridad y que están pensadas de forma que exista un lenguaje universal de consulta.


El precedente de Pan-Cáncer

El tratamiento dado a la gran base de datos de genoma humano tiene un claro referente en el proyecto Pan-Cáncer, impulsado por distintos consorcios internacionales con el objetivo de agrupar la información generada por la secuenciación de tumores humanos en el medio centenar de afecciones oncológicas más prevalentes y su comparación con el genoma obtenido de células sanas. El archivo está igualmente gestionado por el BSC y el volumen de datos, al menos en una primera fase, es equivalente al de EGA.

Para el BSC, destaca Orozco, la gestión de ambos archivos supone un espaldarazo a la investigación en genoma que se hace desde España, país que no participó de los primeros grandes hitos de la genómica y que ha tenido que hacer un importante esfuerzo "por entrar en la carrera”.

Ese esfuerzo se traduce en una posición destacada en cuanto a capacidad de gestión y análisis de datos bioinformáticos, en la prestación de servicios especializados y en el desarrollo de soluciones en biocomputación, supercomputación y generación de software específico de análisis. Por ejemplo, el diseño de un programa específicamente pensado para detectar "mutaciones, inserciones, deleciones y translocaciones” al que las primeras críticas otorgan una calidad y potencia superior a las versiones actualmente existentes. "Se está abriendo un gran abanico de posibilidades en el diseño de programas de minería de datos”, remata Orozco. Porque el problema, ahora que ya existen los datos y empiezan a estar archivados y son consultables, es qué hacer con ellos, cómo interpretarlos para obtener información útil. Pero esta tarea, aún no resuelta, forma parte del "futuro inmediato”.



Las empresas aguardan


La participación del sector empresarial en todo cuanto concierne a la generación y posterior explotación de datos genómicos, y por extensión en los distintos campos de las ómicas, es por el momento muy limitada. Con la salvedad de proveedores de equipamiento o desarrolladores de software, las empresas del sector biomédico apenas participan.

Los datos son públicos, no hay información propietaria y no existe, por consiguiente, ventaja competitiva.
La razón es simple: los datos son públicos, por lo que todo el mundo, en las debidas condiciones, tiene derecho a acceder a ellos. "No hay información propietaria”, resume Modesto Orozco. Esto es que las bases de datos se han generado con fondos públicos y estrictas medidas legales de protección dictadas por cada país. Además, son visibles para cualquier empresa farmacéutica o biotecnológica. Ninguna de ellas tiene derecho a apropiarse de una información con el objetivo de desarrollar una patente o investigar una diana. "No existe ventaja competitiva”, zanja el investigador.

A la espera que las empresas del sector biomédico encuentren la fórmula para sacar provecho de la ingente cantidad de información generada, solo la comunidad científica académica está avanzando en su explotación. Esta y las empresas informáticas y tecnológicas que aportan equipamientos y su mantenimiento, y las que ya están especializadas en el diseño de bases de datos y data mining.

discount prescriptions coupons site coupons for prescription medications





Xavier Pujol Gebellí

Periodista

type 2 diabetes symbol type 2 diabetes and sexuality what is type 2 diabetes

Excelencia Severo Ochoa

Logos colaboradores julio 2014

Grupo XLC In