Precedente :: Successivo |
Autore |
Messaggio |
horus Macchinista
Registrato: 22/03/05 09:48 Messaggi: 2554 Residenza: Sirio e dintorni
|
Inviato: 14 Ago 2008 08:46 Oggetto: [PHP] Leggere PDF al volo |
|
|
In un sito che gestisco è sorto un problema. Prelevavo alcune informazioni da una pagina web di un sito esterno, le elaboravo e le mostravo, tutto funzionante. Da qualche tempo il sito esterno ha modificato il modo in cui fornisce quelle informazioni ed ora sono disponibili in formato PDF.
Il mio problema ora è di far funzionare la mia procedura che prende quei dati, li elabora e li pubblica sul web.
I requisiti sono:
- freeware (non ho budget se non il mio tempo)
- no installazioni (il sito è in hosting condiviso e non posso installare nulla che non siano script php)
- php (è un server linux)
- automatico (non posso farlo manualmente, deve essere qualcosa che avviene automaticamente all'apertura della pagina, eventualmente poi studierò un meccanismo di cache visto che le informazioni cambiano una volta al giorno)
Esiste quindi qualcosa in php che mi permetta di leggere il contenuto di un file pdf? |
|
Top |
|
|
freemind Supervisor sezione Programmazione
Registrato: 04/04/07 20:28 Messaggi: 4643 Residenza: Internet
|
Inviato: 14 Ago 2008 10:08 Oggetto: |
|
|
Mamma mia ( ), stai chiedendo qualche cosa di difficile (a parer mio)...
La cosa mi ha incuriosito, però codice php che converte un pdf in qualche cosa "al volo" non l'ho trovato.
Se per culo sulla macchina in cui risiede il tuo sito c'è installato pdftohtml (o almeno pdftotext) puoi fare uno script php che quando l'utente digita scarica sul tuo sito il file pdf, poi tramite exec(...)
esegue pdftohtml e elabora l'output del comando per buttarlo nel browser.
Al momento di più non mi viene in mente nulla. |
|
Top |
|
|
horus Macchinista
Registrato: 22/03/05 09:48 Messaggi: 2554 Residenza: Sirio e dintorni
|
Inviato: 14 Ago 2008 14:34 Oggetto: |
|
|
Non a caso mi sono rivolto all'olimpo le semplici ricerche sui motori di ricerca non mi avevano portato a nulla.
Purtroppo exec rientra nelle disable_functions.
Quello che ho pensato è che se è possibile scriverli dovrebbe essere anche possibile leggerli, proverò a cercare ancora, se intanto trovi qualcosa fammi sapere. |
|
Top |
|
|
freemind Supervisor sezione Programmazione
Registrato: 04/04/07 20:28 Messaggi: 4643 Residenza: Internet
|
Inviato: 14 Ago 2008 17:20 Oggetto: |
|
|
Da quando pdf è diventato aperto non c'è problema a leggere e scrivere, tranne per il fatto che se nessuno scrive in php un qualcosa che , date le specifiche pdf, parserizzi un file, ci tocca farlo da noi! |
|
Top |
|
|
chemicalbit Dio maturo
Registrato: 01/04/05 17:59 Messaggi: 18597 Residenza: Milano
|
Inviato: 14 Ago 2008 17:57 Oggetto: |
|
|
Tra l'altro un PDF può essere fatto in vari modi,
ad es. c'è chi scrive del testo vero e proprio
e chi mette nel PDF un'immagine che è una scansione (o comunque uan raffiguraizone) del testo.
Nel tuo caso è testo vero?
p.s. se a te serve solo il testo, senza formattazione,
di potrebbe cercare se esista già un programma php che converta ad es. in puro testo,
e poi usare un altro programma php che prenda dal file di testo. |
|
Top |
|
|
horus Macchinista
Registrato: 22/03/05 09:48 Messaggi: 2554 Residenza: Sirio e dintorni
|
Inviato: 14 Ago 2008 19:15 Oggetto: |
|
|
Dunque, per rispondere a chemicalbit, sì il mio è solo testo, cioè in realtà ci sono anche altre cose ma mi interessa solo il testo anche senza formattazione, poi in qualche modo mi arrangio a riformattarlo.
Il problema sta proprio nel trovare quel programma che converta pdf in txt, ce ne sono ma non è ho trovato nessuno in php e per tutti è richiesto di eseguire comandi sul server ed io non posso farlo.
Ho speso il pomeriggio a fare varie prove, ho provato con fpdi che crea pdf a partire da un template, sembra promettente ma non sono riuscito a trovare un metodo che mi facesse vedere il testo.
Poi ho fatto qualche tentativo con un parser trovato qui ma anche in questo caso ho avuto qualche problema, sembrava promettere bene anche questo e sono riuscito a fare qualche modifica per superare qualche intoppo ma poi mi sono impantanato anche con questo.
Infine ho trovato questa cosa in java che dice di poter leggere i pdf. Non ho ancora guardato nulla in quanto non conosco molto bene java, se non troverò altro dovrò imparare quel tanto che basta per provarlo ed eventualmente convertirlo in php. |
|
Top |
|
|
horus Macchinista
Registrato: 22/03/05 09:48 Messaggi: 2554 Residenza: Sirio e dintorni
|
Inviato: 15 Ago 2008 09:15 Oggetto: |
|
|
Forse ho trovato qualcosa meno complicato di quel java: vbPDFParser. Non ho potuto provarlo perché non ho visual basic però non sembra troppo complicato e la data di rilascio mi fa ben sperare per quanto riguarda le versioni di pdf. Se non troverò entro breve nulla di meglio proverò a convertirlo in php e a vedere se fa al caso mio. |
|
Top |
|
|
SverX Supervisor Macchinisti
Registrato: 25/03/02 11:16 Messaggi: 11568 Residenza: Tokelau
|
Inviato: 20 Ago 2008 09:01 Oggetto: |
|
|
e usare un tool online di conversione così da leggere il risultato via HTTP?
http://www.adobe.com/products/acrobat/access_onlinetools.html |
|
Top |
|
|
horus Macchinista
Registrato: 22/03/05 09:48 Messaggi: 2554 Residenza: Sirio e dintorni
|
Inviato: 20 Ago 2008 10:35 Oggetto: |
|
|
Ci avevo pensato però i tempi di risposta mi sembrano veramente biblici, tu sei riuscito a convertire qualcosa? Io è da una vita (decine di minuti) che sono fermo con la schermatina "in progress", ogni tanto la pagina si aggiorna ma non esce nulla. |
|
Top |
|
|
horus Macchinista
Registrato: 22/03/05 09:48 Messaggi: 2554 Residenza: Sirio e dintorni
|
Inviato: 20 Ago 2008 10:39 Oggetto: |
|
|
Manco a farlo apposta, è arrivato ora il messaggio:
Online Conversion Tools ha scritto: |
Error
Your request could not be processed. Please try again.
There was an error processing your request. Please click here to return to Online Conversion Tools.
|
|
|
Top |
|
|
SverX Supervisor Macchinisti
Registrato: 25/03/02 11:16 Messaggi: 11568 Residenza: Tokelau
|
Inviato: 21 Ago 2008 09:59 Oggetto: |
|
|
horus ha scritto: | Ci avevo pensato però i tempi di risposta mi sembrano veramente biblici, tu sei riuscito a convertire qualcosa? Io è da una vita (decine di minuti) che sono fermo con la schermatina "in progress", ogni tanto la pagina si aggiorna ma non esce nulla. |
non l'ho provato. Magari è stato un caso, magari ieri funzionava male... o magari lo fanno apposta per non fartelo usare |
|
Top |
|
|
|