John 0 Zgłoś post Napisano Marzec 29, 2007 Hi, I hope some can understand me... I'm trying to convert a pdf document to html and some characters do not appear correctly. I don't know whether there is something wrong with my environment or if its a bug in pdftohtml. Could someone check this for me? pdftohtml Polish.pdf using:- http://sourceforge.net/projects/pdftohtml/ http://www.workingintheuk.gov.uk/working_i....tmp/Polish.pdf If you look on page 2 you will see O czym jest ta broszura? Ta broszura podaje informacje dotyczące przybycia do Zjednoczonego Królestwa, zamieszkania tu i podjęcia pracy przez obywateli nowych krajów członkowskich UE (krajów A8) wyszczególnionych na okładce. Podaje też, gdzie można znaleźć dalsze informacje. but in the converted text (at last on my system) it says <b>O czym jest ta broszura?</b><br> Ta broszura podaje informacje dotyczce przybycia do Zjednoczonego <br> Królestwa, zamieszkania tu i podjcia pracy przez obywateli nowych krajów <br> czlonkowskich UE (krajów A8) wyszczególnionych na okladce. Podaje te, <br> gdzie mona znale dalsze informacje.<br> Can anyone else see if they get the same output? Udostępnij ten post Link to postu Udostępnij na innych stronach
zin 0 Zgłoś post Napisano Marzec 29, 2007 A lot of errors on page and the same output ... probably pdftohtml doesnt work correctly ... Udostępnij ten post Link to postu Udostępnij na innych stronach
moron 0 Zgłoś post Napisano Marzec 29, 2007 maybe try set charset=iso-8859-2 or utf ps. bad section (and forum) for this topic try there http://forum.webhelp.pl/index.php?f=1 Udostępnij ten post Link to postu Udostępnij na innych stronach
Przemysław 0 Zgłoś post Napisano Marzec 29, 2007 I've moved theard to suitable section, but this is polish webhosting talk, so please avoid english theards in future. I can confirm that pdftohtml doesn't work properly. Udostępnij ten post Link to postu Udostępnij na innych stronach