Indice del forum Olimpo Informatico
I Forum di Zeus News
Leggi la newsletter gratuita - Attiva il Menu compatto
 
 FAQFAQ   CercaCerca   Lista utentiLista utenti   GruppiGruppi   RegistratiRegistrati 
 ProfiloProfilo   Messaggi privatiMessaggi privati   Log inLog in 

    Newsletter RSS Facebook Twitter Contatti Ricerca
[PHP] Leggere PDF al volo
Nuovo argomento   Rispondi    Indice del forum -> Linguaggi per Internet
Precedente :: Successivo  
Autore Messaggio
horus
Macchinista
Macchinista


Registrato: 22/03/05 09:48
Messaggi: 2554
Residenza: Sirio e dintorni

MessaggioInviato: 14 Ago 2008 08:46    Oggetto: [PHP] Leggere PDF al volo Rispondi citando

In un sito che gestisco è sorto un problema. Prelevavo alcune informazioni da una pagina web di un sito esterno, le elaboravo e le mostravo, tutto funzionante. Da qualche tempo il sito esterno ha modificato il modo in cui fornisce quelle informazioni ed ora sono disponibili in formato PDF.
Il mio problema ora è di far funzionare la mia procedura che prende quei dati, li elabora e li pubblica sul web.

I requisiti sono:
- freeware (non ho budget se non il mio tempo)
- no installazioni (il sito è in hosting condiviso e non posso installare nulla che non siano script php)
- php (è un server linux)
- automatico (non posso farlo manualmente, deve essere qualcosa che avviene automaticamente all'apertura della pagina, eventualmente poi studierò un meccanismo di cache visto che le informazioni cambiano una volta al giorno)

Esiste quindi qualcosa in php che mi permetta di leggere il contenuto di un file pdf?
Top
Profilo Invia messaggio privato
freemind
Supervisor sezione Programmazione
Supervisor sezione Programmazione


Registrato: 04/04/07 20:28
Messaggi: 4643
Residenza: Internet

MessaggioInviato: 14 Ago 2008 10:08    Oggetto: Rispondi citando

Shocked Shocked Shocked
Mamma mia ( Shocked ), stai chiedendo qualche cosa di difficile (a parer mio)...

La cosa mi ha incuriosito, però codice php che converte un pdf in qualche cosa "al volo" non l'ho trovato.

Se per culo sulla macchina in cui risiede il tuo sito c'è installato pdftohtml (o almeno pdftotext) puoi fare uno script php che quando l'utente digita scarica sul tuo sito il file pdf, poi tramite exec(...)
esegue pdftohtml e elabora l'output del comando per buttarlo nel browser.

Al momento di più non mi viene in mente nulla.
Top
Profilo Invia messaggio privato
horus
Macchinista
Macchinista


Registrato: 22/03/05 09:48
Messaggi: 2554
Residenza: Sirio e dintorni

MessaggioInviato: 14 Ago 2008 14:34    Oggetto: Rispondi citando

Non a caso mi sono rivolto all'olimpo Wink le semplici ricerche sui motori di ricerca non mi avevano portato a nulla.

Purtroppo exec rientra nelle disable_functions.

Quello che ho pensato è che se è possibile scriverli dovrebbe essere anche possibile leggerli, proverò a cercare ancora, se intanto trovi qualcosa fammi sapere.
Top
Profilo Invia messaggio privato
freemind
Supervisor sezione Programmazione
Supervisor sezione Programmazione


Registrato: 04/04/07 20:28
Messaggi: 4643
Residenza: Internet

MessaggioInviato: 14 Ago 2008 17:20    Oggetto: Rispondi citando

Da quando pdf è diventato aperto non c'è problema a leggere e scrivere, tranne per il fatto che se nessuno scrive in php un qualcosa che , date le specifiche pdf, parserizzi un file, ci tocca farlo da noi!
Top
Profilo Invia messaggio privato
chemicalbit
Dio maturo
Dio maturo


Registrato: 01/04/05 17:59
Messaggi: 18597
Residenza: Milano

MessaggioInviato: 14 Ago 2008 17:57    Oggetto: Rispondi citando

Tra l'altro un PDF può essere fatto in vari modi,
ad es. c'è chi scrive del testo vero e proprio
e chi mette nel PDF un'immagine che è una scansione (o comunque uan raffiguraizone) del testo.

Nel tuo caso è testo vero?


p.s. se a te serve solo il testo, senza formattazione,
di potrebbe cercare se esista già un programma php che converta ad es. in puro testo,
e poi usare un altro programma php che prenda dal file di testo.
Top
Profilo Invia messaggio privato
horus
Macchinista
Macchinista


Registrato: 22/03/05 09:48
Messaggi: 2554
Residenza: Sirio e dintorni

MessaggioInviato: 14 Ago 2008 19:15    Oggetto: Rispondi citando

Dunque, per rispondere a chemicalbit, sì il mio è solo testo, cioè in realtà ci sono anche altre cose ma mi interessa solo il testo anche senza formattazione, poi in qualche modo mi arrangio a riformattarlo.
Il problema sta proprio nel trovare quel programma che converta pdf in txt, ce ne sono ma non è ho trovato nessuno in php e per tutti è richiesto di eseguire comandi sul server ed io non posso farlo.

Ho speso il pomeriggio a fare varie prove, ho provato con fpdi che crea pdf a partire da un template, sembra promettente ma non sono riuscito a trovare un metodo che mi facesse vedere il testo.
Poi ho fatto qualche tentativo con un parser trovato qui ma anche in questo caso ho avuto qualche problema, sembrava promettere bene anche questo e sono riuscito a fare qualche modifica per superare qualche intoppo ma poi mi sono impantanato anche con questo.
Infine ho trovato questa cosa in java che dice di poter leggere i pdf. Non ho ancora guardato nulla in quanto non conosco molto bene java, se non troverò altro dovrò imparare quel tanto che basta per provarlo ed eventualmente convertirlo in php.
Top
Profilo Invia messaggio privato
horus
Macchinista
Macchinista


Registrato: 22/03/05 09:48
Messaggi: 2554
Residenza: Sirio e dintorni

MessaggioInviato: 15 Ago 2008 09:15    Oggetto: Rispondi citando

Forse ho trovato qualcosa meno complicato di quel java: vbPDFParser. Non ho potuto provarlo perché non ho visual basic però non sembra troppo complicato e la data di rilascio mi fa ben sperare per quanto riguarda le versioni di pdf. Se non troverò entro breve nulla di meglio proverò a convertirlo in php e a vedere se fa al caso mio.
Top
Profilo Invia messaggio privato
SverX
Supervisor Macchinisti
Supervisor Macchinisti


Registrato: 25/03/02 11:16
Messaggi: 11566
Residenza: Tokelau

MessaggioInviato: 20 Ago 2008 09:01    Oggetto: Rispondi citando

e usare un tool online di conversione così da leggere il risultato via HTTP?

http://www.adobe.com/products/acrobat/access_onlinetools.html
Top
Profilo Invia messaggio privato HomePage
horus
Macchinista
Macchinista


Registrato: 22/03/05 09:48
Messaggi: 2554
Residenza: Sirio e dintorni

MessaggioInviato: 20 Ago 2008 10:35    Oggetto: Rispondi citando

Ci avevo pensato però i tempi di risposta mi sembrano veramente biblici, tu sei riuscito a convertire qualcosa? Io è da una vita (decine di minuti) che sono fermo con la schermatina "in progress", ogni tanto la pagina si aggiorna ma non esce nulla.
Top
Profilo Invia messaggio privato
horus
Macchinista
Macchinista


Registrato: 22/03/05 09:48
Messaggi: 2554
Residenza: Sirio e dintorni

MessaggioInviato: 20 Ago 2008 10:39    Oggetto: Rispondi citando

Manco a farlo apposta, è arrivato ora il messaggio:
Online Conversion Tools ha scritto:

Error
Your request could not be processed. Please try again.


There was an error processing your request. Please click here to return to Online Conversion Tools.
Top
Profilo Invia messaggio privato
SverX
Supervisor Macchinisti
Supervisor Macchinisti


Registrato: 25/03/02 11:16
Messaggi: 11566
Residenza: Tokelau

MessaggioInviato: 21 Ago 2008 09:59    Oggetto: Rispondi

horus ha scritto:
Ci avevo pensato però i tempi di risposta mi sembrano veramente biblici, tu sei riuscito a convertire qualcosa? Io è da una vita (decine di minuti) che sono fermo con la schermatina "in progress", ogni tanto la pagina si aggiorna ma non esce nulla.


non l'ho provato. Magari è stato un caso, magari ieri funzionava male... o magari lo fanno apposta per non fartelo usare Wink
Top
Profilo Invia messaggio privato HomePage
Mostra prima i messaggi di:   
Nuovo argomento   Rispondi    Indice del forum -> Linguaggi per Internet Tutti i fusi orari sono GMT + 1 ora
Pagina 1 di 1

 
Vai a:  
Non puoi inserire nuovi argomenti
Non puoi rispondere a nessun argomento
Non puoi modificare i tuoi messaggi
Non puoi cancellare i tuoi messaggi
Non puoi votare nei sondaggi