Skip to content

Комплексный анализ белковых взаимодействий, ассоциированных со старением человека, с использованием данных STRING базы данных и продвинутых методов визуализации сетевых структур.

Notifications You must be signed in to change notification settings

alksqw/Aging-Protein-Network-Analyzer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Анализ белковых взаимодействий в контексте старения

Описание проекта

Проект предназначен для анализа и визуализации взаимодействий между белками, связанными с процессами старения человека. Система использует данные из базы данных STRING для построения сетей взаимодействий и комплексного анализа белковых пар.

Структура проекта

1. UniProt transformer.py

Назначение: Конвертация идентификаторов UniProt в ENSP-идентификаторы STRING базы данных

Функциональность:

  • Принимает список UniProt ID
  • Выполняет запрос к STRING API для преобразования идентификаторов
  • Сохраняет результаты в CSV-файл uniprot_to_ensp.csv

2. Request_o_the_CVS.py

Назначение: Получение данных о белковых взаимодействиях из STRING базы данных

Функциональность:

  • Запрашивает информацию о взаимодействиях для списка ENSP-идентификаторов
  • Фильтрует взаимодействия с высоким уровнем достоверности (score ≥ 900)
  • Сохраняет результаты в файл protein_interactions.csv

3. Analytical_Engine.py

Назначение: Комплексный анализ и визуализация данных о белковых взаимодействиях

Аналитические возможности:

Статистический анализ

  • Дескриптивная статистика датасета
  • Анализ пропущенных значений
  • Корреляционный анализ (метод Спирмена)

Визуализация

  • Гистограммы распределения оценок взаимодействий (score, escore, dscore, tscore, ascore)
  • Тепловая карта корреляций между различными типами оценок
  • Топ-20 генов по количеству взаимодействий
  • Сетевые графики взаимодействий высокой достоверности:
    • 2D сеть (spring layout)
    • 3D интерактивная сеть
  • Scatter plots для анализа соотношения экспериментальных и баз данных оценок

Фильтрация данных

  • Выделение высоконадежных взаимодействий:
    • score ≥ 0.9
    • escore ≥ 0.8
    • dscore ≥ 0.7
  • Анализ взаимодействий с известными генами старения

Требования

Для работы проекта необходимы следующие библиотеки Python:

pip install pandas matplotlib seaborn networkx plotly requests

Гены старения

Проект включает анализ взаимодействий с ключевыми генами, ассоциированными со старением:

  • TP53, SIRT1, SIRT6, FOXO3, MTOR
  • AKT1, IGF1R, TERT, CDKN2A, KLOTHO

Выходные данные

Проект генерирует:

  1. Таблицы соответствия идентификаторов
  2. Статистические отчеты
  3. Множество визуализаций:
    • Статические графики (PNG)
    • Интерактивные 3D визуализации
    • Тепловые карты корреляций
    • Сетевые диаграммы

Особенности

  • Многомерный анализ: использование различных типов оценок достоверности
  • Интерактивность: 3D визуализации сетей взаимодействий
  • Гибкая фильтрация: настраиваемые пороги достоверности
  • Биологическая релевантность: фокус на генах, связанных со старением

Проект предоставляет комплексный инструмент для анализа белковых взаимодействий с акцентом на процессы старения, что может быть полезно для исследований в области геронтологии и молекулярной биологии.

About

Комплексный анализ белковых взаимодействий, ассоциированных со старением человека, с использованием данных STRING базы данных и продвинутых методов визуализации сетевых структур.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages