Allora amici miei, essendo un amante degli ebook mi sono fatto una certa cultura.
Parto dal fatto che sono in possesso di un Kobo Touch, con display e-ink touch non retroilluminato da 6''. Non è un modello avanzatissimo, ma nemmeno scrausissimo, affinale questi dispositivi servono per leggere libri, e quindi il componente più importante è lo schermo: non ho guardato ad altro per il suo acquisto, non mi interessava che andasse su Internet, che avesse l'adattatore Wifi, che facesse i chionzi, nulla (lo schermo touch però è un bonus non indifferente).
Il mio dispositivo legge i formati txt, epub, mobi e pdf, le cui differenze sono abbastanza chiare a tutti: il txt è puro testo, senza alcun tipo di formattazione, fronzolo, immagini e via dicendo. Non è possibile sbagliare, a livello di apertura del file, però ovviamente quello quello quell'è, è proprio il livello base dell'informazione via testo.
Epub e mobi sono due formati molto simili, nel senso che di base si appoggiano ad una struttura del file parente all'Xml: esistono programmi (tipo Calibre, per l'appunto) che permettono di far "scoppiare" un ebook nei suoi componenti, che altro non sono che pagine xml o html, per cui chiunque abbia una conoscenza di questi sistemi di programmazione può mettere mano al testo e reimpaginarli, aggiungere un sommario, aggiungere grassetti e cose del genere.
Epub e mobi permettono al lettore di ebook una serie di manipolazioni sul testo come ad esempio l'aumento della dimensione del carattere o il cosiddetto "reflow" (l'adattamento della pagina dell'ebook al display del dispositivo: non bisogna scrollare a destra e a sinistra), consentono (se il dispositivo ne è capace) l'aggiunta di note, ricerca nel testo, sottolineatura eccetera. Tra le limitazioni invece, almeno per quanto mi riguarda c'è il fatto che questi due formati non mostrano linguaggio matematico oltre ai semplici operatori della matematica di base (+, -, x, / e =): niente linguaggio LaTeX, per intenderci, e chiunque voglia studiarci materie scientifiche sopra deve rivolgersi ad un altro formato file.
Il pdf lo conosciamo tutti, anche se non approfonditamente come dovremmo. Questo formato è lo stato dell'arte per quanto riguarda il contenuto di testo ed immagine, ma è anche un formato difficile da leggere, per i lettori di ebook: quando comprai il mio affarino ci caricai un libro di fisica sopra, e scoprii che leggerlo era una mazzata in fronte. Niente reflow significava che io dovevo ZOOMARE nella pagina e scorrere avanti e indietro, e siccome un ebook reader non visualizza le immagini bene come il testo, la lettura era un cazzo in culo di proporzioni armeriane.
Risultato numero uno: se cercate un libro, mirate direttamente all'epub o al mobi (Calibre converte benissimo da uno all'altro, hanno struttura simile). Spesso e volentieri su Internet si "trovano" file zip che contengono tutti e 4 i formati, e poi uno si tiene quello che preferisce; c'è da dire però che il pdf è il formato decisamente più diffuso di tutti, quindi la probabilità di trovare un testo in questo formato è nettamente più alta; inoltre rimane il problema del linguaggio matematico, per il quale il pdf resta la scelta obbligata. Come fare?
Analizziamo prima il primo problema. Iniziamo dicendo che per convertire il pdf è necessario che questo sia OCRato, ossia il testo deve essere selezionabile da Adobe Reader: se non è selezionabile significa che il testo visulaizzato nel pdf è in realtà un'immagine e allora non lo convertirete nè mò nè mai (ma la seconda soluzione potrebbe aiutarvi): il mio consiglio è di trovare un modo per effettuare scansione OCR, perchè restituisce risultati migliori, ma estrema ratio passate avanti.
Supponendo dunque che abbiate un pdf OCRato, Calibre (e gli altri programmi, in generale) convertono il pdf UNA CHIAVICA in epub e mobi: la formattazione spesso va a puttane, non vengono riconosciuti i termine di linea (quindi il testo va a capo alla cazzo di cane, lasciando
delle righe appese, proprio
così, perchè il rigo è terminato nel file pdf, ma
per adattarlo all'epub o mobi
Calibre non riconosce il termine di linea)
ed evidentemente leggere così è uno scristo; aggiungiamoci altri fattori, ossia che può capitare che il programma non riconosca tabelle, piazzi a cazzo le immagini e via dicendo ed il quadro è completo.
Dopo una estenuante ricerca ho trovato la soluzione, che si chiama
MobiPocket Creator. Questo programmino, di facilissimo utilizzo, può importare un pdf e lo può esportare in html. In effetti in pratica anche Calibre fa una cosa del genere, però nella mia esperienza MobiPocket Creator lo fa molto, molto meglio: a parte il fatto che lascia praticamente inalterata la struttura del testo, ma poi tirando fuori l'html permette di applicare in maniera molto semplice modifiche e correzioni (se sapete destreggiarvi un po' con l'html, ma non ci vuole molto ad imparare). Esempio banale, l'ultima volta che ho convertito un libro c'erano delle immagini al posto del titolo dei capitoli: dopo aver convertito il pdf sono entrato nell'html, ho trovato le posizioni dei vari titoli di capitolo e con il tag <h1> </h1> ci ho aggiunto il testo del titolo (cosa che, incidentalmente, favorisce anche Calibre nella creazione del sommario). Insomma, una volta creato e corretto l'html si tratta di importarlo in Calibre e convertirlo in epub o mobi, e credetemi, i risultati sono decisamente superiori (se non altro, tanto per dirne una, i termini di rigo sono rispettati).
Quindi, la combo MobiPocket Creator + Calibre permette conversioni quasi perfette.
Che si fa invece col testo matematico? In questi casi, così come in ogni altro caso in cui sia necessario avere la pagina pdf visualizzata, dopo vari tentativi la soluzione che ho trovato è un programma che si chiama
papercrop: questo strumento può ritagliare un pdf in maniera tale che ciascun ritaglio sia un'immagine della dimensione giusta da essere visualizzato sul dispositivo a tutto schermo senza zoomare nè scrollare avanti o indietro. Immaginate ad esempio di avere un articolo scientifico, il cui formato base è su due colonne: il programmino riconosce da solo che sono due colonne, ed una volta inserite le dimensioni dello schermo del vostro dispositivo (e qui ci vuole un po' di tentativi) ritaglia il testo di ciascuna colonna producendo una sequenza di immagini che fittano bene lo schermo. L'articolo si legge che è un bijoux.
L'unico malus è che bisogna giocare un po' con preset ed opzioni varie prima di trovare la combinazione giusta, ma una volta trovata il gioco è fatto.