Help CERN door te spelen met 300 Terabytes aan openbare Large Hadron Collider-gegevens

$config[ads_kvadrat] not found

Inside the World's Largest Science Experiment

Inside the World's Largest Science Experiment
Anonim

De Europese Organisatie voor Nucleair Onderzoek (CERN) heeft zojuist een enorme hoeveelheid gegevens vrijgegeven die zijn verzameld door de Large Hadron Collider via zijn Open Data Portal. De informatie is vrijgegeven in twee hoofdformaten: primaire datasets die de oorspronkelijke gegevens vertegenwoordigen die CERN-wetenschappers zouden hebben geanalyseerd, en afgeleide datasets die vereenvoudigd zijn om te helpen bij de analyse en om de gegevens een potentieel krachtige leermiddel te maken. CERN biedt ook een "virtuele machine", gratis online beschikbaar voor iedereen, om gebruikers te helpen de gegevens te analyseren, wat betekent dat ongeacht het type computer dat u hebt, u kunt rommelen met de resultaten van een van de experimenten in de geschiedenis van de mensheid.

De Large Hadron Collider is het meest bekend voor het ontdekken van het Higgs Boson-deeltje een paar jaar geleden. Het is de meest krachtige (en beroemde) deeltjesversneller ter wereld. De gegevens die CERN heeft vrijgegeven, bedragen in totaal 300 terabytes, wat overeenkomt met ongeveer de helft van de totale LHC-gegevens die in 2011 zijn verzameld. Van bijzonder belang voor velen is de opname van meer dan 100 terabytes aan gegevens over protonbotsingen bij 7 TeV, volgens CERN. De laatste dergelijke dataversie van CERN was in november 2011, maar omvatte slechts ongeveer 27 terabytes.

Nadat u de VM hebt geïnstalleerd (klik gewoon op "Uw virtuele machine installeren" en volg de instructies), kunt u beginnen met het analyseren van de gegevens van de Compact Muon Solenoid (CMS), zelfs als u anders geen toegang hebt tot de specifieke software dat is meestal nodig om dergelijke gegevens te verwerken - deze is vooraf geladen op de virtuele machine. U kunt dan kiezen om te werken aan een primaire gegevensset of een beperkte (afgeleide) gegevensset.

. @ CMSexperiment maakt 300 TB LHC-onderzoeksgegevens openbaar beschikbaar http://t.co/Lq3ExL7owW#opendata #openscience pic.twitter.com/fCL6B1wwky

- CERN (@CERN) 25 april 2016

"Leden van de CMS Collaboration hebben met veel inspanning en duizenden persoonuren elk servicewerk uitgevoerd om de CMS-detector te bedienen en deze onderzoeksgegevens te verzamelen voor onze analyse", zegt Kati Lassila-Perini, een CMS-fysicus die de leiding heeft over gegevensbehoud, in een verklaring. "Echter, als we eenmaal onze verkenning van de gegevens hebben opgebruikt, zien we geen reden om ze niet openbaar te maken. De voordelen zijn talrijk, van inspirerende middelbare scholieren tot de training van de deeltjesfysici van morgen. En persoonlijk, als CMS-coördinator voor het bewaren van gegevens, is dit een cruciaal onderdeel om de beschikbaarheid van onze onderzoeksgegevens op de lange termijn te waarborgen."

Vertegenwoordigers van CERN spraken ook de wens uit om nieuwe ogen te openen voor de gegevens, en zeiden dat het vrijgeven van informatie in zulke grote hoeveelheden een geest van samenwerking bevorderde en dus meer ontdekkingen mogelijk maakte.

"We zijn erg blij dat we al deze gegevens openbaar beschikbaar kunnen maken," zei Lassila-Perini in de verklaring. "We kijken uit naar de manier waarop ze buiten onze samenwerking worden gebruikt, zowel voor onderzoek als voor het bouwen van educatieve hulpmiddelen."

$config[ads_kvadrat] not found