Indice del forum Olimpo Informatico
I Forum di Zeus News
Leggi la newsletter gratuita - Attiva il Menu compatto
 
 FAQFAQ   CercaCerca   Lista utentiLista utenti   GruppiGruppi   RegistratiRegistrati 
 ProfiloProfilo   Messaggi privatiMessaggi privati   Log inLog in 

    Newsletter RSS Facebook Twitter Contatti Ricerca
Convertire PDF in formato ODT
Nuovo argomento   Rispondi    Indice del forum -> Office e LibreOffice
Precedente :: Successivo  
Autore Messaggio
OrchidBlues
Dio minore
Dio minore


Registrato: 18/06/05 06:00
Messaggi: 809
Residenza: ...nel mio giardino segreto...

MessaggioInviato: 16 Mar 2011 14:26    Oggetto: Convertire PDF in formato ODT Rispondi citando

Qualcuno sa aiutarmi nella ricerca di un programma che mi permetta di confertire un file Pdf in formato Odt?
Ho diversi file Pdf, alcuni solo di testo, altri di testo e immagini, che vorrei convertire in modo da poter prelevare il testo e poter fare dei copiaincolla in altri documenti o sul web.
Ne ho provato qualcuno online ma i risultati sono stati negativi.
Grazie. Ciao
Top
Profilo Invia messaggio privato HomePage
Silent Runner
Supervisor sezione Chiacchiere a 360°
Supervisor sezione Chiacchiere a 360°


Registrato: 16/05/05 09:17
Messaggi: 23491
Residenza: Pianeta Terra

MessaggioInviato: 16 Mar 2011 16:02    Oggetto: Rispondi citando

Ciao OrchidBlues! Very Happy
Negativi in che senso? Sono venuti male o non hanno funzionato?
Quali programmi hai provato?
Top
Profilo Invia messaggio privato
OrchidBlues
Dio minore
Dio minore


Registrato: 18/06/05 06:00
Messaggi: 809
Residenza: ...nel mio giardino segreto...

MessaggioInviato: 16 Mar 2011 16:25    Oggetto: Rispondi citando

Ciao Silent!! Very Happy
Oddio, ricordarmi i siti è un problema, ma credo di averli sfruttati quasi tutti; ricordo che si doveva lasciare un indirizzo email e il file convertito ti veniva recapitato nel servizio posta...peccato che non siano mai arrivati!
Quelli che lo convertivano al momento non davano segni di vita, ovvero, mai andato a buon fine la conversione o ne riportavano degli errori.
Insomma un buco nell'acqua.
Ho provato a dare un'occhiata qui con il motore di ricerca ma non ho trovato nulla che potesse rispondere al mio quesito quindi ho deciso di aprire una discussione apposita.
L'unica cosa che mi fa rabbia è che ci sono dei programmini che convertono i file da Pdf a Doc (Word) ma non nel formato di OpenOffice.
E io il pacchetto di microsoft non c'è l'ho e non ho neanche intenzione di installarlo Mad Caspita, va tanto bene O.O.!
Top
Profilo Invia messaggio privato HomePage
uomodeighiacci
Dio minore
Dio minore


Registrato: 01/01/09 19:29
Messaggi: 769

MessaggioInviato: 16 Mar 2011 16:57    Oggetto: Rispondi citando

Openoffice apre anche i file .doc, converti da pdf a doc e poi importa
Top
Profilo Invia messaggio privato
OrchidBlues
Dio minore
Dio minore


Registrato: 18/06/05 06:00
Messaggi: 809
Residenza: ...nel mio giardino segreto...

MessaggioInviato: 16 Mar 2011 17:08    Oggetto: Rispondi citando

Shocked provo! Grazie!!!!



---------------------------------------------

Niente da fare...ho trovato un programma che mi ha fatto la conversione in un attimo, ma non mi è possibile modificare il documento Crying or Very sad
Top
Profilo Invia messaggio privato HomePage
uomodeighiacci
Dio minore
Dio minore


Registrato: 01/01/09 19:29
Messaggi: 769

MessaggioInviato: 16 Mar 2011 18:52    Oggetto: Rispondi citando

Quanto vuoi che il file odt venga fedele al pdf?

Se ti interessa solo il testo puro e semplice basta usare seleziona testo od un tasto simile nel tuo lettore pdf. (salvo che il testo sia la foto di un testo nel qual caso ti serve un programma OCR )

Poi c'è Free PDF to Word Converter. La conversione in word è buona ma quando l'ho importato in Oo ogni frase è venuta racchiusa in un riquadro, tipo pagina web, con frasi parzialmente sovrapposte, fa schifo ma è modificabile. Se poi salvi in .rtf ottieni solo il testo, ma mantieni la formattazione. In questo caso avrai testo formattato e foto che dovrai rimmettere insieme tu se vuoi il documento come l'originale.

Con PDF2HTML GUI invece viene tutto quasi ok (ma le immagini verranno tutte spostate sul lato sinistro). Converte da pdf a html, poi importi in Openoffice. Per far funzionare questo programma devi installare anche Ghostscript e poi specificare al primo avvio il percorso di un paio di eseguibili che ti indicherà il programma.
Top
Profilo Invia messaggio privato
OrchidBlues
Dio minore
Dio minore


Registrato: 18/06/05 06:00
Messaggi: 809
Residenza: ...nel mio giardino segreto...

MessaggioInviato: 18 Mar 2011 15:25    Oggetto: Rispondi citando

Diciamo che mi interessa che il testo sia perfettamente leggibile e selezionabile. In alcuni file pdf ci sono anche delle immagini ma di quelle poco m'importa, non le considero neanche.

Ho provato a scaricare Free Pdf to Word Converter e l'ho subito messo alla prova; testo convertito in modo leggibile ma niente funzione di 'copiaincolla': poi è scattato un flash...ho provato a convertire un'altro documento in pdf e l'ha fatto però con una formattazione pietosa. Lettere sovrapposte nella parte sinistra del documento, però insomma si poteva copiare e incollare e poi ricostruire le parole sovrapposte.

Ma perchè non me lo faceva fare con gli altri file che mi interessavano di più? Perchè sono scannerizzati!

Non sapevo che, convertendoli, in ogni caso non si possono manipolare.
Però ripensandoci anche il secondo file pdf che ho convertito è stato fatto con lo scanner....quindi sono allo stesso punto di prima. Non capisco perchè alcuni si e altri no.

Dovrei allora utilizzare un programma simile a Ominipage 17 programma OCR di cui mi parlavi tu uomodeighiacci...
Potrei risolvere il problema della conversione, per i nuovi file che potrò creare, ma rimane comunque quella degli altri file pdf che ho già e su cui non posso 'lavorare'.
Top
Profilo Invia messaggio privato HomePage
Silent Runner
Supervisor sezione Chiacchiere a 360°
Supervisor sezione Chiacchiere a 360°


Registrato: 16/05/05 09:17
Messaggi: 23491
Residenza: Pianeta Terra

MessaggioInviato: 18 Mar 2011 17:54    Oggetto: Rispondi citando

Ricordati che per avere una migliore resa con gli OCR è bene eseguire la scansione alla massima risoluzione possibile. Se invece parti da immagini già esistenti sul pc, in caso di risultati pessimi, potresti provare a ingrandirle un po' e vedere se l'OCR li legge meglio.
Top
Profilo Invia messaggio privato
uomodeighiacci
Dio minore
Dio minore


Registrato: 01/01/09 19:29
Messaggi: 769

MessaggioInviato: 18 Mar 2011 18:39    Oggetto: Rispondi citando

OrchidBlues ha scritto:
Lettere sovrapposte nella parte sinistra del documento, però insomma si poteva copiare e incollare e poi ricostruire le parole sovrapposte.

Lo avevo notato anche io, l'ho scritto prima, ma tu salvalo in formato .rtf e vedrai che si sistemano da sole.

OrchidBlues ha scritto:
Potrei risolvere il problema della conversione, per i nuovi file che potrò creare, ma rimane comunque quella degli altri file pdf che ho già e su cui non posso 'lavorare'.

Non ho capito. Se è testo lo puoi convertire, se è foto usa un programma OCR (ti consiglio Free OCR, apre direttamente i pdf), in ogni caso otterrai il testo modificabile.

Silent Runner ha scritto:
Ricordati che per avere una migliore resa con gli OCR è bene eseguire la scansione alla massima risoluzione possibile.

Almeno 300dpi, e come dice Silent aumentala "artificialmente" se hai problemi.
Top
Profilo Invia messaggio privato
OrchidBlues
Dio minore
Dio minore


Registrato: 18/06/05 06:00
Messaggi: 809
Residenza: ...nel mio giardino segreto...

MessaggioInviato: 19 Mar 2011 11:07    Oggetto: Rispondi citando

uomodeighiacci ha scritto:

Lo avevo notato anche io, l'ho scritto prima, ma tu salvalo in formato .rtf e vedrai che si sistemano da sole.


Ok!


Citazione:

Non ho capito. Se è testo lo puoi convertire, se è foto usa un programma OCR (ti consiglio Free OCR, apre direttamente i pdf), in ogni caso otterrai il testo modificabile.


Già scaricato anche FreeOcr. Ma il problema lo riscontro con i file che ho creato io quando ho scannerizzato da alcuni libri. Sono riuscita a riunire più pagine in un file pdf con le funzioni personalizzate dello scan Epson.
Questi file, sia con FreePdftoWordConverter e FreeOcr non sono modificabili.
Mi permette di farlo con altri file che ho scaricato dalla rete, che non ho fatto io personalmente.

Citazione:
Ricordati che per avere una migliore resa con gli OCR è bene eseguire la scansione alla massima risoluzione possibile.
Almeno 300dpi, e come dice Silent aumentala "artificialmente" se hai problemi.


Ok, provo subito.
Grazie!


-------------------------------------------------------------------------------------


Ecco il risultato con la massima risoluzione

Citazione:
ir0l0 sesto RELIGIONE I I GIUDIZI DEGLI ANTICHI religione e senza dubbic unc dei campi pin studiati del m0nd0 etrusco sia per- · gli scrittori antichi, in particolare quelli di eta tardo-repubblicana e imperiale, ` hanno trasmessc una discreta quantita di notizie sull’arg0ment0 sia perché la - ggior parte delle testimcnianze archeologiche etrusche proviene da aree sacre th tombe. Le nctizie delle fonti letterane s0n0 in opere destinate a un pubblico, greco 0 . .. . 0 0 romanizzatc, che ha istanze e orientamenti pr0pri in fatt0 di religicme, e ¤ ue contengcnc s0l0 compendi, estratti, accenni, che hannc il valore di una ci- · 0ne occasionale 0 di un riferimentc dotto e non di una trattazione sistematica. Le fonti monumentali si rifannc a tradizioni si l0cali, ma anche allctriez ba- ~ ricordare che in genere l’ic0n0graiia delle divinita etrusche e di origine gre- — senza che tuttavia ci0 signiiichi che due divinitia, che hanno la stessa ic0n0- J a e appartengcno a due m0ndi diversi, abbiano anche sfere di influenza pun- · ¤ ente e completamente simili. Il caso del dio supreme del pantheon etrusco, · (0 Tina 0 Tinia), pub valere c0me esempioz Fimmagine affermata nella tradi- . i iigurativa etrusca dalla fine del VII sec0l0 a.C., una figura maestosa con co- - in testa e fulmine 0 scettro nelle mani, a prescindere da variazioni contin- - ` legate ai vari pericdi st0rici, e analoga a quella del greco Zeus, ma la va- · · . infemale che il dic ha nelle credenze etrusche (Nnia calusna), attestata da `epigrafe di Volsinii (TLE, 270) — l’epitet0 calusna e attestato insieme al teoni- · Perhn anche in un’iscrizi0ne da Corcianc (PG), incisa su una base per una sta- —. non ha risc0ntr0 nel corrispondente dic greco. Un’altra ccntmversia relati- al d10 supremo E: scaturita dalla definizione che Varrone (De Ling. Lat., V, 8, )dE1 di Vortumnusz deux Etruriae princeps. Di tale divinita, come s’é gia dett0, .· vano a Roma una statua all’ingress0 del quartiere etrusco (Van., De Ling. , V, 8, 46; Prop., IV, 2, 59-63) e un tempio sull`Aventin0 (Paul. Fest., 228L). tonimo, di cui si c0n0sc0n0 le vananti Voltumna (Liv., IV, 23, 5; IV, 25, 7; IV, , 2: \C 17, 6; VI, 2, 2) e Vertumnus, non ha alcuna pcssibilita di essere collega- con l’etrusc0 Tinia (e varianti). Sembrava che le due denominazioni dovessero . . · due divinita diverse, con conseguente diflicclta sulla detlnizicne del rap-


Sicuramente è più leggibile rispetto a prima e le parole possono essere corrette con minor spreco di tempo.
Ora provo a convertire un file con FreePdftoWordConverte dandogli il formato .rtf


E questo è il risultato

Citazione:
INTRODUZIONE
La vita quotidiana dei mortali, il favoloso regno degli uccelli e degli animali, e il mondo
soprannaturale degli dèi e dei fantasmi, si mescolano in questi racconti, fiabe e fantasie. Come le
ILDEH
SRSRODUL
GHOO¶2FFLGHQWH
HVVL
VJRUJDQR
GDOOH
SURIRQGH
VRUJHQWL
GHOOD
VWRULD
H
GHOO¶LPPDJLQD]LRQH GL XQD FLYLOWj H L FRQWDGLQL L ILORVRIL OH YHUJLQL L UH L JLXGLFL OH WLJUL H L
SDSSDJDOOL FKH Y¶LQFRQWULDPR FL ULFRUGDQR D YROWH SHUVRQDJJL di leggende più familiari. Allo stesso
WHPSR TXHVWH VWRULH UHFDQR O¶LPSURQWD GHOOD VRFLHWj H GHOOH WUDGL]LRQL RULJLQDOL FKH OH KDQQR
SURGRWWH (VVH RIIURQR XQD FKLDUD YLVLRQH GHOO¶RUGLQH VRFLDOH FLQHVH DWWUDYHUVR OH FRPSOHVVH
relazioni che lo definiscono: imperatore e suddito, padre e figlio, marito e moglie (o mogli),
funzionario e contadino, uomo e animale.
I filosofi confuciani, che prevalsero nello stato cinese, concepivano queste relazioni come un
armonioso equilibrio di doveri, e numerosi scritti di questa raccolta illustrano la loro concezione
GHOO¶RUGLQH H GHOO¶DXWRULWj *HQHUDOPHQWH SDUODQGR L FRQIXFLDQL HUDQR OD YRFH GHJOL RUGLQL VXSHULRUL
imperatore, padre, marito. La maggior parte dei nostri racconti, tuttavia, danno voce alle altre parti
sociali, poiché essi provengono dai taoisti, filosofi e critici che rappresentano gli ordini inferiori e
che furono, storicamente, oppositori dei confuciani. La visione taoista trovò un vivido mezzo di
espressione nella letteratura popolare: in novelle, scherzi, racconti e leggende, come quelli che
possiamo leggere in questo libro. In effetti, uno degli scopi di questo genere narrativo, disprezzato e
anche messo al bando dalle autorità confuciane, fu quello di dare pubblicità ai crimini dei potenti e
alle ingiurie sofferte dai subordinati, inclusi i bambini, le donne, gli animali. Come il conflitto tra
superiori e inferiori plasmò la storia della Cina, così la rivalità tra le due grandi filosofie plasmò la
cultura cinese.
1HOOD GRWWULQD GL &RQIXFLR O¶LPSHUDWRUe siede al centro dei regni: politico, sociale e naturale. Egli


JRYHUQD VX PDQGDWR GHO FLHOR H OD VXD DXWRULWj VSLULWXDOH V¶LUUDGLD LQ FHUFKL FRQFHQWULFL LQ FDPELR
ULFHYH O¶REEHGLHQ]D H OD IHGHOWj GHJOL HVVHUL XPDQL H OD VRWWRPLVVLRQH GHOOH FUHDWXUH H GHlle cose. Il
suddito cinese vedeva simultaneamente in lui il Figlio del Cielo e il padre del popolo, fondendo così
i ruoli occidentali del re e del papa in una sola figura di semidio. Come discendente del fondatore
GHOOD SURSULD GLQDVWLD O¶LPSHUDWRUH HUD WHQXWR DOO¶DGRUD]LRQH ILOLDOH GHJOL DQWHQDWL H DO EXRQ JRYHUQR
della famiglia; in particolare, doveva aver cura della sistemazione matrimoniale e della


Dove sto sbagliando? Crying or Very sad
Top
Profilo Invia messaggio privato HomePage
uomodeighiacci
Dio minore
Dio minore


Registrato: 01/01/09 19:29
Messaggi: 769

MessaggioInviato: 19 Mar 2011 12:22    Oggetto: Rispondi citando

Facciamo così (se sei d'accordo) carica uno dei pdf che ti da problemi, lo stesso dei pezzi che hai riportato sarebbe perfetto così posso confrontare, e gli do uno sguardo io.
Usa wikisend e posta il link che ti viene assegnato.
Top
Profilo Invia messaggio privato
Silent Runner
Supervisor sezione Chiacchiere a 360°
Supervisor sezione Chiacchiere a 360°


Registrato: 16/05/05 09:17
Messaggi: 23491
Residenza: Pianeta Terra

MessaggioInviato: 19 Mar 2011 23:10    Oggetto: Rispondi citando

OrchidBlues ha scritto:
Dove sto sbagliando? Crying or Very sad
Da nessuna parte. a sbagliare è l'OCR. Tieni conto che questi programmi probabilmente cercano di confrontare immagini a pixel con modelli di carattere prestabiliti e una volta riconosciuti restituiscono in font modificabile il carattere che più somiglierebbe a quello che loro hanno rilevato dalla scansione.
Purtroppo per gli OCR i caratteri possono assumere molte forme e varianti: i caratteri privi di "grazie" (detti "San Serif" come per esempio la classe degli Arial) probabilmente sono più leggibili dagli OCR di quelli con le grazie (Serif, come i Times, Georgia ecc.). Se la scansione è "sporcata" da variazioni del bianco della pagina o sporco trasmesso dal vetro dello scanner, questo può influire sulla riconoscibilità del testo e confondere il programma che restituirà qualcosa che somiglierà a quello che ha creduto di vedere ma sostanzialmente non corrisponde a niente come ci hai fatto vedere nel tuo esempio.

Con gli OCR è necessario fare parecchie prove per trovare il modo di rendere leggibile l'immagine di partenza. Alle volte, schiarire l'immagine aumentando, al contempo, leggermente il contrasto e la nitidezza può essere d'aiuto.
Puoi inoltre provare a fare più scansioni di piccole parti del testo e vedere se riesce a leggere meglio.
Dicci come va a finire.
Top
Profilo Invia messaggio privato
OrchidBlues
Dio minore
Dio minore


Registrato: 18/06/05 06:00
Messaggi: 809
Residenza: ...nel mio giardino segreto...

MessaggioInviato: 20 Mar 2011 11:46    Oggetto: Rispondi citando

uomodeighiacci ha scritto:
Facciamo così (se sei d'accordo) carica uno dei pdf che ti da problemi, lo stesso dei pezzi che hai riportato sarebbe perfetto così posso confrontare, e gli do uno sguardo io.
Usa wikisend e posta il link che ti viene assegnato.


Per me va benissimo, solo che te lo allego da un'altro sito di hosting perchè quello segnalato mi ha dato problemi nel caricamento del file.
Uno è questo link ed è un file che ho scannerizzato io...

L'altro che ho postato è questo link ed è uno dei file che ho trovato in rete.

Grazie per l'aiuto uomodeighiacci!

Silent, sicuramente l'OCR avrà delle difficoltà nel riconoscimento ottico dei caratteri, non sarà fedelissimo, ma fidati che io qualche pasticcio l'avrò fatto sicuramente, senza accorgermene però Wink
Top
Profilo Invia messaggio privato HomePage
uomodeighiacci
Dio minore
Dio minore


Registrato: 01/01/09 19:29
Messaggi: 769

MessaggioInviato: 20 Mar 2011 17:14    Oggetto: Rispondi citando

-pdf creato da te con lo scanner (convertito con Free OCR)
La risoluzione è buona ma il bordo è sfocato, le parole in quei punti verranno male, è inevitabile. Alcune pagine sono un pò storte, bisogna raddrizzarle prima di convertirle.
Ho riguardato la conversione della prima pagina, quella fatta da te, ci sono problemi nel riconoscimento delle "o" e parole sbagliate.
Questo mi fa pensare che hai fatto una selezione troppo larga. Devi fare la selezione abbastanza precisa, ma non tagliare le parole.
Mi accorgo ora (l'ho installato da tempo, l'avevo scordato) che il pacchetto per l'italiano va scaricato a parte. Estrai il contenuto di questo archivio in C:/Windows/tessdata. Quando avvii il programma, prima di iniziare la conversione, scegli la lingua italiana (in alto a destra).

-il pdf al secondo link (convertito con Free PDF to Word)
Non ho notato particolari problemi. Free PDF to Word Converter lo converte benissimo. Come avevi detto, quando lo importi in Openoffice le frasi sono sovrapposte, ma una volta salvato in rtf viene perfetto, e mantiene la formattazione. Non capisco cosa vada storto.
Ad ogni modo ricordati che il testo senza formattazione è prelevabile direttamente dal lettore pdf (solo nei casi, come questo, in cui il testo non sia una foto)


Questa funzione ci dovrebbe essere in ogni lettore (nel mio caso PDFXCview)
Top
Profilo Invia messaggio privato
OrchidBlues
Dio minore
Dio minore


Registrato: 18/06/05 06:00
Messaggi: 809
Residenza: ...nel mio giardino segreto...

MessaggioInviato: 21 Mar 2011 17:32    Oggetto: Rispondi citando

- si, in effetti la scannerizzazione in certi punti non è al top; riproverò a rifare lo scan.
Per la lingua, ok...scarico il pacchetto.


Citazione:
Non capisco cosa vada storto.


- Eh! vorrei proprio capirlo anch'io perchè ho eseguito passo passo le tue indicazioni. Riprovo!

Citazione:
Ad ogni modo ricordati che il testo senza formattazione è prelevabile direttamente dal lettore pdf (solo nei casi, come questo, in cui il testo non sia una foto)


Non lo sapevo! Grazie!
Top
Profilo Invia messaggio privato HomePage
uomodeighiacci
Dio minore
Dio minore


Registrato: 01/01/09 19:29
Messaggi: 769

MessaggioInviato: 21 Mar 2011 20:52    Oggetto: Rispondi

OrchidBlues ha scritto:
Per la lingua, ok...scarico il pacchetto.

L'ho dato per scontato ma giustamente non potevi saperlo: il pacchetto per l'italiano non serve a cambiare la lingua del programma. Serve a specificare in che lingua è il testo che sta convertendo, serve a migliorare la conversione.
Top
Profilo Invia messaggio privato
Mostra prima i messaggi di:   
Nuovo argomento   Rispondi    Indice del forum -> Office e LibreOffice Tutti i fusi orari sono GMT + 1 ora
Pagina 1 di 1

 
Vai a:  
Non puoi inserire nuovi argomenti
Non puoi rispondere a nessun argomento
Non puoi modificare i tuoi messaggi
Non puoi cancellare i tuoi messaggi
Non puoi votare nei sondaggi