Studierea acidobacteriilor se citeste dintr-un set de date metagenomice nanopore | Python v3.5 | PyPI (vezi versiunea)

Autor Samantha C Pendleton , Data Science MSc Aberystwyth University, Twitter | GitHub

Urmati botul pe care l-am creat pe Twitter, acido_bot, care distribuie informatii zilnice despre Acidobacteria!

Continutul GC al genomilor Acidobacteria este in concordanta cu plasarea lor, de exemplu, speciile din aceeasi subdiviziune (peste 60% pentru fragmentele din grupa V si aproximativ 10% mai mici pentru fragmentele din grupa III) sunt similare, prezentand diversitatea din filum [1]. Abundenta subdiviziunilor corelata cu pH depinde de subdiviziuni: 1, 2, 3, 12, 13 au o relatie negativa pe masura ce pH-ul creste, in timp ce 4, 6, 7, 10, 11, 16, 17, 18, 22, 25 sunt rare in pH scazut si au o relatie pozitiva pe masura ce pH-ul creste [2].

Acest pachet include studierea unei colectii de citiri si adunarea celor atribuite ca acidobacterii dintr-o iesire Kaiju. Exista diverse informatii statistice si grafice GC. Mai mult, grupul de citiri Acidobacterii neclasificate sunt vizualizate in subdiviziuni pe baza nivelului de pH al probei de sol.

Introducere

Iesirea Kaiju ofera ID-ul taxonului si secventa corespunzatoare, pachetul meu afiseaza speciile Acidobacteria alaturi de adnotare, parcele si informatii despre citirile neclasificate.

Conditie prealabila
  • Formatul FASTA al tuturor citirilor.
  • Iesire Kaiju dupa extragerea celor doua coloane: ID secventa si ID-uri NCBI.
Dependente
import os import csv import pysam import colectii import matplotlib.pyplot as plt import matplotlib.patches as mpatches import aleatoriu de la termcolor import color from colorama import init import click

$ pip3 instaleaza matplotlib

Instalare

GitClone

$ git clone https://github.com/sap218/acidoseq.git

pip

$ pip instala acidoseq

Kaiju

Am folosit rezultatul Kaiju: coloanele 2 si 3 care includeau referinte de secventa si taxonii NCBI.

  1. Filtrati rezultatul numai cu etichete clasificate $ awk ‘$ 1 == “C”‘ kaiju.out> kaijuC.out
  2. Taiati coloanele $ cut -f2,3 kaijuC.out> results.txt
  3. Conversia txt in csv (virgula delimitata) $ sed ‘s / \ s \ + /, / g’ results.txt> result_seqid_taxon.

    viendo como se follan a mi mujer sin bragas en la calle
    zofilia porno rspañol
    videos de zofilia incestos gays
    española follando videos de lucio saints
    incestos lesbicos recopilacion pajas
    mujer masturbandose venezolanas desnudas
    mujeres normales desnudas española viciosa
    tetona amateur forzadas a follar
    peliculas porno gay españolas jovencitas pilladas masturbandose
    sexo maduras españolas madre española follando con su hijo
    porno obligado shemalehd
    porno maduras en español vidio pirno
    super tetudas maduras lesbianas tetonas
    mamada a dos bocas abuela enculada
    triple anal pareja follando en la playa
    xxx gratis en español xxxgay
    swingers españoles incestos jovencitas
    follando en casa mujeres fornicando
    porno amateur hd bbw abuelas
    abuelas porno españolas madres que se follan a sus hijos

    csv

Harta

Daca nu sunteti sigur de pH-ul probelor de sol, va recomandam sa folositi mai intai scriptul hartii – orasul implicit este Aberystwyth.

Va rugam sa retineti : datorita faptului ca Pamantul este sferic si hartile sunt bidimensionale, va exista o anumita distorsiune la trasarea locatiilor.

$ acidomap –city Birmingham

Utilizare

CLI are nevoie de fisierul Kaiju si FASTA, toate celelalte optiuni au valori implicite: de exemplu, pH = 5.

Daca nu a fost furnizat niciun stil de intrare sau nu a fost introdus incorect, acesta va alege unul aleatoriu.

Rulati dupa cum urmati cu Linux (aflati cum sa rulati cu alte sisteme de operare aici):

$ acidoseq –help Utilizare: acidoseq [OPTIUNI] Optiuni: –taxdumptype TEXT Studiati “ALL” sau doar “U” neclasificat? –kaijufile TEXT Place a editat Kaiju (csv) in director pentru usurinta. –fastapath TEXT Plasati FASTA in director pentru usurinta. –style TEXT [‘seaborn-bright’, ‘seaborn-poster’, ‘seaborn-white’, ‘bmh’, ‘seaborn-darkgrid’, ‘seaborn-pastel’, ‘scale de gri’, ‘_classic_test’, ‘ggplot’ , ‘seaborn- whitegrid’, ‘seaborn-dark’, ‘seaborn-muted’, ‘seaborn- daltonist’, ‘seaborn-ticks’, ‘Solarize_Light2’, ‘seaborn-notebook’, ‘dark_background’, ‘fast’, ‘ seaborn ‘,’ fivethirtyeight ‘,’ seaborn-paper ‘,’ seaborn- dark-palette ‘,’ seaborn-talk ‘,’ classic ‘,’ seaborn- deep ‘] –plottype TEXT “span” range of GC inseamna SAU “line” medie medie GC –ph TEXT pH-ul solului, folositi scriptul hartii pentru asistenta. –help Afisati acest mesaj si iesiti.
Exemple

$ acidoseq –kaijufile result_seqid_taxon.csv –fastapath all.fa

$ acidoseq –taxdumptype ALL –kaijufile result_seqid_taxon.csv –fastapath all.fa –style ggplot –plottype span –ph 4.92

$ acidoseq –taxdumptype U –kaijufile result_seqid_taxon.csv –fastapath all.fa –style seaborn –plottype line –ph 7.14

Iesire

  • Fisier FASTA: o colectie de citiri care au fost identificate ca acidobacterii
  • Diagrama comparatiei raportului AT si GC cu mediile
  • Grafic adanc al raportului GC cu subdiviziuni etichetate (regiuni cu „span” si inseamna cu „linie”)
  • Fisiere FASTA separate ale citirilor neclasificate alocate in subdiviziuni pe baza pH-ului, de exemplu un fisier de secvente care se afla in subdiviziunea 1 GC daca pH-ul este scazut

Multumiri

  • Amanda Clare , lector superior, supervizor MSc la Universitatea Aberystwyth, Twitter | GitHub | Profilul personalului
  • Sam Nicholls , postdoc la Universitatea din Birmingham, Twitter | GitHub
  • Arwyn Edwards , lector superior la Universitatea Aberystwyth, a furnizat setul de date, Twitter | Profilul personalului

Multumesc! ????

Nu ezitati sa creati o problema sau sa faceti o sugestie!

Lista Todo
  • Pune la dispozitie
  • Imbunatatiti descrierile si comentariile
  • Cautati in interfata liniei de comanda
  • Remediati codul pentru a genera subdiviziuni neclasificate pe baza pH-ului
  • Modificati codul, astfel incat fisierul de intrare sa poata fi iesirea originala Kaiju
  • Pune la dispozitie pe Conda
Referinte

[1] Quaiser, A., Ochsenreiter, T., Lanz, C., Schuster, SC, Treusch, AH, Eck, J. si Schleper, C. (2003). Acidobacteriile formeaza un grup coerent, dar extrem de divers, in domeniul bacterian: dovezi din genomica mediului. Microbiologie moleculara, 50 (2), 563-575.

[2] Eichorst, SA, Breznak, JA si Schmidt, TM (2007). Izolarea si caracterizarea bacteriilor din sol care definesc genul Terriglobus. nov., in filumul Acidobacterii. Microbiologie aplicata si de mediu, 73 (8), 2708-2717.