Gensekvenser för Coronavirus borttagna från avslöjad forskning

Hittills har den nya typen av coronavirus orsakat 3,9 miljoner dödsfall över hela världen. I början av pandemin

undersökningar av ursprunget till SARS-CoV-2 har försvårats av bristande tillgång till information från Kina, där fall först dök upp.

Nu har en Seattle-baserad forskare upptäckt borttagna filer från Google Cloud som avslöjar 13 partiella genetiska sekvenser från några av de tidigaste fallen av COVID-19 i Wuhan.

Sekvenser tippar inte balansenfrån eller från många teorier om hur SARS-CoV-2 uppstod. Till exempel stöder de inte teorin om att viruset läckte från ett högsäkerhetslaboratorium i Wuhan. Ändå tyder bevis på att det nya coronaviruset cirkulerade redan innan det första stora utbrottet upptäcktes på en skaldjursmarknad i provinsen Kina.

Att hitta exakt hur och var händeett virus, måste forskare hitta det så kallade föregångarviruset som alla andra stammar härstammar från. Hittills har de tidigaste sekvenserna oftast tagits från fall på Huanan Seafood Market i Wuhan. Det spekulerades ursprungligen i att SARS-CoV-2 först dök upp i slutet av december 2019. Fall från början av december till november samma år hade emellertid ingen marknadsförbindelse. Detta indikerar att viruset härstammar från en annan plats.

Fall som finns på marknaden inkluderar tremutationer som saknas i virusprover som upptäcks veckor senare utanför marknaden. Virus utan mutationer matchade närmare koronvirus som finns i hästskofladdermöss. Forskare är övertygade om att det nya koronaviruset på något sätt härstammar från fladdermöss, så det är logiskt att anta att stamfadern inte heller hade dessa mutationer.

Och nu Jesse Bloom från Medical InstituteHoward Hughes i Seattle upptäckte att raderade sekvensdata (förmodligen några av de tidigaste proverna av viruset) också saknar dessa mutationer.

För ungefär ett år sedan, 241 genetiskasekvensen från coronaviruspatienter har försvunnit i Sequence Read Archive, en online-databas som underhålls av National Institutes of Health (NIH).

Bloom märkte de saknade sekvenserna,när jag snubblade över ett kalkylark i en studie som publicerades i maj 2020 i PeerJ. De var en del av Wuhan University-projektet PRJNA612766 och överfördes förmodligen till arkivet. Forskaren sökte i arkivdatabasen efter sekvenser och fick meddelandet "Objekt hittades inte."

Hans undersökning avslöjade att den raderadesekvenserna samlas av Wuhan University Hospital. Samtidigt antyder förtrycket av en publicerad studie baserad på dessa sekvenser att de togs från prover av nässvetsar från polikliniska patienter med misstänkt COVID-19 i början av epidemin.

Bloom kunde inte hitta någon förklaring till varför sekvenserna togs bort och hans e-postmeddelanden till studieförfattarna inte besvarades.

Forskaren konstaterar att "det finns ingen övertygande vetenskapskäl för att radera data." Poängen är att sekvenserna helt motsvarar de prover som beskrivs i arbetet. Det finns inga korrigeringar i dokumentet. Dessutom betonar studien att proverna erhölls frivilligt från individer, och sekvensering visar inga tecken på plasmidkontamination eller kontaminering av proverna. "Det verkar troligt att sekvenserna togs bort för att dölja deras existens", avslutar Bloom.

En artikel med hans fynd publicerades på biorxiv preprint-webbplatsen.

Läs mer

Den största kometen i historien ses i solsystemet: den är nästan en planet

Ny metod omvandlar omedelbart kol till grafen eller diamanter

Hittade ett billigt sätt att rädda storstadscentra från överhettning

Geek Tech Online

Allt om teknik och prylar

Coronavirus-gensekvenser borttagna från forskning upptäcktes