Un “Nuovo Capitolo” per Foldit
Sotto la scocca, Foldit sta subendo una sottile modifica alla sua funzione energetica: la funzione di energia (la funzione del punteggio) è ciò che decide se una struttura è migliore di un’altra, ed è destinata a catturare la fisica delle proteine nel solvente acquoso. I cambiamenti che stiamo introducendo rappresentano anni di lavoro: poiché abbiamo rilevato nel tempo parecchi problemi in Foldit riguardanti le precedenti funzioni energetiche, la loro “riparazione” è stata molto difficile!
Queste sono alcune cose che noterete circa la nuova funzione energetica.
Primo, il legame idrogeno è, adesso, un po’ diverso. Alcuni accettori del legame idrogeno – in particolare gli ossigeni (rossi) che non dispongono di idrogeni collegati, i quali ossigeni sono la maggior parte degli ossigeni della proteina – ora preferiscono che i loro atomi di idrogeno donatori siano “sul piano” in cui si trovano gli accettori. Per esempio, nella catena laterale dell’Aspartato (ASP o D) ci sono due atomi di ossigeno (OD1 e OD2) che si trovano sullo stesso piano con due carboni (CG e CB), conferendo a questa catena laterale un aspetto “piatto” (vedasi la figura sotto). Questi ossidi “SP2 Ibridizzati” preferiscono gli atomi di idrogeno per stare sullo stesso piano, e la preferenza è chiaramente visibile nelle strutture proteiche note. Finora, tuttavia, questa non è stata catturata dalla funzione energetica di Foldit: questo nuovo aggiornamento dovrebbe portare la funzione energetica del gioco più vicino alla caratteristica elettronica nota degli ossigeni.
L'Aspartato (a destra) preferisce che gli atomi polari dell'idrogeno si trovino nel piano in cui si trovano i suoi due ossigeni a catena laterale (rossa) e i suoi due di carbonio a catena laterale (verde). Qui è possibile vedere un azoto di spina dorsale (sinistra). Qui si può vedere una dorsale azotata mettere l’idrogeno nel piano della catena laterale dell’Aspartato, creando un legame idrogeno.
Secondo, adesso Foldit contiene un riferimento esplicito (anche se di corto raggio) alla forza di Coulomb, che descrive come gli atomi (elettricamente carichi) interagiscono: in sostanza dice “le cariche opposte vogliono stare vicine, le cariche uguali lontane”. Finora, Foldit faceva affidamento su un riferminento “a bassa definizione” che cercava di catturare questa proprietà abbastanza fondamentale in maniera grezza sulle catene laterali fallendo, però, la cattura delle interazioni sulla dorsale. Perché non abbiamo incluso questo riferimento finora? Beh, ci vuole un po' per valutare questa energia di interazione e non sapevamo, fino a poco tempo fa, quanto fosse utile questa energia nel descrivere l'energia energetica delle proteine. Abbiamo già avuto un riferimento esplicito del legame idrogeno che descrive interazioni carica/carica molto vicine e il riferimento “grezzo” ha impedito che troppe catene laterali (simil-addizionate) diventassero troppo vicine. Per un bel po' di tempo, i dati che avevamo sembravano dirci che la combinazione era abbastanza buona. Tuttavia i dati più recenti ci hanno convinto che il “riferimento coulombico” fosse veramente utile nel descrivere la differenza tra i modelli ripiegati correttamente e quelli non. Questo riferimento renderà Foldit un po’ più lento, ma meglio perdere qualche minuto per progettare una proteina corretta che spendere alcune settimane (e soldi) per cercare di sintetizzare un “bidone”!!
Infine, si potrebbe notare che l'energia della catena laterale, per diversi amminoacidi, è un po’ più regolare.
Noterete questa differenza per gli amminoacidi "piatti" (quelli con ibridazione SP2) che sono quasi la metà: ASP, GLU, PHE, HIS, ASN, GLN, TRP e TYR! Prima la funzione energetica sarebbe “saltata qua e là” (perdendo precisione) nel momento in cui avesse attraversato i confini, definiti in maniera artificiale, angolari e l’algoritmo di minimizzazione (Wiggle) avrebbe deluso ogni qual volta si fosse passati su questi confini. Con questo nuovo riferimento dell’energia della catena laterale, il wiggle dovrebbe essere più efficace.
Ci sono una manciata di altri piccoli cambiamenti legati alla funzionalità energetica in Foldit che, probabilmente, non saranno visibili. Il potenziale di Lennard-Jones ora è valutato in maniera analitica, anzichè attraverso l’interpolazione della tabella, cosa che lo renderà più efficiente. Gli angoli e le lunghezze di un legame ideale sono stati corretti per diversi idrogeni e per alcuni atomi CB. Infine, il termine che descrive le geometrie di legame dei disolfuri (legami chimici Cys-Cys) è stato reso più raffinato.
Oltre a questi cambiamenti fondamentali nel punteggio, il parametro di densità sarà normalizzato per rendere più consistenti i punteggi su mappe di diversa densità. Ci sarà anche un termine di legame che forzerà la geometria della proteina per essere più ideale.
Affrontare i problemi sorti con il “Nuovo Capitolo”
Il rilascio del “Nuovo Capitolo” ha creato una certa frustrazione tra i giocatori. Gli scienziati e gli sviluppatori vogliono rassicurare tutti che stanno ascoltando i vostri problemi e stanno lavorando sodo per risolverli: potete aspettarvi che la “giocabilità” migliorerà notevolmente a breve. Questo post serve per aiutare le persone a capire le ragioni di questi problemi temporanei e per ringraziarvi della vostra pazienza mentre risolviamo i problemi, guidati dai vostri feedback.
Cos’è Rosetta, e come è legata agli attuali problemi di Foldit?
Rosetta è il software sviluppato dal laboratorio Baker per la progettazione di proteine e la predizione della loro struttura. Ha moduli principali per valutare l'energia di una proteina in una determinata conformazione e un certo numero di protocolli automatici che utilizzano questi moduli base per fare cose specifiche (ad esempio prevedere una struttura da una sequenza lineare, progettare una sequenza per ripiegare in una struttura desiderata, progettare un'interfaccia di binding, ecc.). Per ragioni che vengono descritte nella serie di post sul blog della fisica di Foldit, gli scienziati stanno costantemente migliorando i moduli di base di Rosetta che controllano come vengono calcolate le energie proteiche. Mentre sviluppiamo questi moduli principali, spesso dobbiamo cambiare le nostre strategie per la previsione delle strutture e per la progettazione di proteine. Ciò può essere frustrante per noi, dal momento che significa rivisitare e rivedere i protocolli stabiliti, ma in ultima analisi questo lavoro produce un maggiore potere predittivo e nuove capacità di progettazione.
Foldit utilizza i moduli core di Rosetta per ottenere l'energia energetica delle proteine, ma consente all'ingegnosità dei giocatori umani di sostituirsi alla limitata intelligenza artificiale dei protocolli automatizzati. Questo aiuta la scienza in due modi: i giocatori spesso possono fare migliori previsioni rispetto ai protocolli automatizzati e studiando come i giocatori stanno “facendo quello che fanno”, noi (gli scienziati) possiamo rendere migliori i protocolli automatizzati.
Ovviamente, a differenza dei protocolli automatici, i giocatori devono avere uno “strato” tra loro e i moduli base di Rosetta: il motore di gioco reale, che include l'interfaccia grafica per l’utente e gli strumenti specifici, che i giocatori utilizzano per manipolare strutture proteiche.
Periodicamente, così come la capacità di Rosetta di ottenere le proteine migliora, così è importante aggiornare Foldit con i più recenti moduli base di Rosetta. Nell'ultimo anno sono stati apportati alcuni importanti miglioramenti alla funzione energetica di Rosetta, e la release “Nuovo Capitolo” aveva lo scopo di trasportarli in Foldit. Il processo di attuazione dei moduli base di Rosetta in Foldit può, tuttavia, creare problemi.
Quindi, quali sono i problemi?
I problemi che si sono verificati nel passare ad una nuova funzione energetica possono essere inclusi in alcune categorie:
1. Bugs: attualmente ci sono errori nel programma (crash, problemi di stabilità, ecc); questo deriva dal fatto che gli strumenti speciali che sono stati riscritti per permettere ai giocatori di interfacciarsi con il “nucleo” di Rosetta (ovvero l’interfaccia di gioco e gli strumenti di manipolazione delle proteine) devono essere compatibili con il “nucleo” stesso e le modifiche possono rompere la connessione con la grafica del gioco. La maggior parte degli errori sono stati corretti molto prima della release “Nuovo Capitolo”. In alcuni casi, è stato necessario cambiare un bel po’ gli strumenti per renderli compatibili con il nucleo aggiornato – quindi il nuovo Wiggle, per esempio. Alcuni bug intermittenti (particolarmente legati alla stabilità) sono più difficili da diagnosticare, senza base di utenti più larga che li riporti e questi vengono affrontati ora come gli sviluppatori li conoscono.
2. Lentezze o performance alterate: il nuovo “cuore” di Rosetta calcola le energie proteiche in una maniera più accurate che mai, con pochi artefatti o falsi positivi di basse energie, ma questo comporta dei calcoli più pesanti a livello computazionale. Questo significa che, in assenza di altri cambiamenti, il gioco potrebbe essere più lento e meno divertente: per cercare di correggere questo problema, gli strumenti sono stati leggermente rivisitati (per esempio, un particolare strumento potrebbe aggiornare la visualizzazione delle proteine dopo pochi cicli di calcolo, ora, permettendo una ragionevole interattività, nonostante sia più lento nel calcolo per ciclo). Il feedback di un largo numero di utente è necessario, tuttavia, per stabilire il giusto equilibrio tra la capacità di risposta e il tasso di convergenza di una soluzione. Possiamo non avere ancora l’equilibrio ottimale, ma possiamo migliore grazie a voi.
3. Strumenti meno funzionali: in alcuni casi, uno strumento è funzionale (es. quando si clicca su di esso, lui fa quello che si suppone debba fare), ma non ha più il comportamento che il giocatore si aspetta abbia e, possibilmente, sia meno utilizzabile di prima. Molti problemi sono stati sollevati riguardo lo strumento di ricostruzione che sta trovando meno strutture utili, per esempio, in modo particolare quando si costruiscono eliche. Le cause possono essere problemi complessi legati all’interazione tra lo strumento sviluppato da noi e i moduli base di Rosetta sviluppati dagli scienziati. Questi sono problemi che gli sviluppatori di giochi possono e vogliono risolvere, ma questo si basa sull’ascoltare da molti giocatori cosa significhi esattamente “meno funzionale” per loro. Mentre i bugs generici sono, solitamente, facili da riconoscere, non sempre lo è per gli sviluppatori, i quali potrebbero non conoscere le strategie preferite dai giocatori per riconoscere le funzionalità ridotte di uno strumento.
4. Script o strategie che non funzionano più come prima: nonostante possa essere frustrante, questo non è un problema che gli sviluppatori possono risolvere, ma è piuttosto una sfida che attiene all’inventiva dei giocatori. Da un punto di vista scientifico, è un parallelo con il fatto che gli sviluppatori di Rosetta spesso devono revisionare i protocolli automatici per adattarsi ai cambiamenti dei moduli base, destinati a migliorare l’accuratezza delle previsioni. Da un punto di vista del gioco, potete pensarla così: abbiamo cambiato leggermente le regole del gioco, proprio come cambierebbero le regole degli scacchi se la scacchiera fosse una fila più larga o fosse introdotto un nuovo pezzo. I giocatori sono invitati ad utilizzare la loro intelligenza e la loro abilità per rivedere le strategie esistenti o per sviluppare nuove strategie per massimizzare i loro punteggi, dato l'ambiente di gioco leggermente modificato.
Perché abbiamo introdotto la nuova funzione, ma abbiamo lasciato i vecchi strumenti com’erano?
Come detto sopra, la nuova funzione prende un po’ più di tempo per “segnare” una proteina. Ciò significa che la reattività standard del gioco sarebbe comunque un grande successo, avendo lasciato tutto il resto come era prima. Alcuni degli strumenti del gioco potrebbero anche non interfacciarsi correttamente con i nuovi moduli del nucleo di Rosetta, richiedendo versioni riviste che sono state già state introdotte.
In ultima analisi, le modifiche del “Nuovo Capitolo” rappresentano il set minimo di modifiche necessarie per accogliere la funzione di punteggio aggiornata pur mantenendo intatto il gameplay: vale a dire che stiamo cercando di non modificare l'esperienza di gioco se possiamo evitarlo; siamo talvolta costretti a rendere tali modifiche agli strumenti, in quanto senza di essi i cambiamenti sarebbero ancora più grandi.
Perché non possiamo tornare al vecchio gioco mentre gli sviluppatori risolvono tutti i nuovi problemi?
Al fine di rendere Foldit uno strumento scientifico utile (in particolare nel confronto con il nostro altro strumento, Rosetta), abbiamo bisogno di avere le funzionalità base più recenti ed accurate, in particolare per quanto riguarda il punteggio energetico delle proteine. Questo rende il rilascio del “Nuovo Capitolo” critico; le modifiche sono state testate dagli sviluppatori per trovare la maggior parte dei bug diretti e altri bug sono stati identificati e risolti durante la pre-release. Alcuni bug “sottili” (e un po' più rari) non potrebbero essere identificati fino a quando non ci giocheranno più persone, ma questi sono ora affrontati. I problemi di giocabilità, d’altro canto, possono essere scoperti solo dagli esperti del gioco: i giocatori stessi. Come detto prima, i giocatori di Foldit contribuiscono alla scienza non solo creando predizioni utilizzabili circa le proteine, ma anche insegnando (agli scienziati) come spiegare ai computer il ripiegamento proteico. In parte, è imparando dalla comunità ciò che costituisce un “gioco giocabile” che otteniamo il secondo obiettivo; in cambio, faremo del nostro meglio per rendere il gioco più giocabile possibile per voi. Una volta che i problemi di giocabilità saranno risolti, le modifiche del “Nuovo Capitolo” consentiranno ai giocatori di fare previsioni più affidabili sulle strutture di proteine e nuovi disegni più propensi a ripiegare, rendendo questo rilascio un passo veramente importante per Foldit. Tornare indietro, però, significherebbe che non avere alcun mezzo per valutare la giocabilità e affrontare le questioni che sono state sollevate adesso: significherebbe dare a voi, giocatori, ancora le stesse frustrazioni nello stesso momento in cui decidessimo un nuovo rilascio – i problemi non si possono risolvere senza che la comunità giochi e ci fornisca feedback. Proprio a causa di questi problemi, apprezziamo ancor di più la vostra pazienza e stiamo lavorando per rendere il gioco funzionale, divertente e il più giocabile possibile.