Preskoči do glavnog sadržaja

Mnoge web stranice koriste PDF datoteke za dodatno obogaćivanje sadržaja. S obzirom na to da je organsko pretraživanje često najvažniji kanal priljeva posjetitelja za većinu tvrtka, ima smisla paziti da su svi mogući dijelovi stranice optimalno prezentirani. Trebali bi učiniti sve kako bi se tražilice uvjerile u vrhunsku kvalitetu web stranica.

Kod PDF dokumenata potrebno je samo držati se nekoliko načela dobre prakse. U ovom članku istražit ćemo što možemo napraviti po pitanju optimizacije tih datoteka te kako blokirati indeksiranje osjetljivih PDF dokumenata ako će nam trebati.

Što je PDF datoteka

PDF (eng. Portable Document Format) je format dokumenta koji je razvio Apple davne 1993. godine i danas je industrijski standard za dijeljenje i ispis dokumenata. Kreiran je s ciljem da uvijek zadržava isti izgled, konzinstneno se prikazuje neovisno o uređaju koji ga čita. Svaki dokument može sadržavati tekst, rasterske slike, vektorsku grafiku, uključene fontove potrebne za prikaz teksta. Za prikaz dokumenta na operativnom sustavu potreno je imati odgovarajući program, od kojih je većina besplatna. Za prikaz na web stranici nije potrebno instalirati ništa dodatno jer svi moderni web preglednici podržavaju pregled PDF datoteka.

Svaki dokument pretvoren u PDF ili spremljen kao PDF ima mogućnost spremanja u određenom standardu. Ovisno za koji standard će se datoteka spremiti, to će odrediti svrha gdje će se koristiti. Ako spremite kao pogrešan standard, možda ćete imati problema prilikom pokušaja ispisa, dijeljenja ili arhiviranja datoteka, sada ili u budućnosti. Međutim ovo je uglavnom značajno za tisak, za web industriju ne toliko. Svaki uobičajeni program za bogato kreiranje dokumenta (Word, Google Docs, OpenOffice Writer…) omogućuje izvoz dokumenta kao PDF. Kroz godine specifikacije su se mijenjale više puta. Omogućeno je uređivanje zaglavlja i podnožja, dodavanje vodenog žiga, ugradnja digitalnih sadržaja (video, 2D i 3D), zaštita pristupa…

Prednost PDF datoteka

Da rezimiramo, glavne prednosti PDF datoteka u odnosu na HTML stranice:

  • odlične za printanje – PDF datoteke su idealne za tisak u industriji kao i u za obično printanje jednostavnih datoteka u kućnoj radinosti. HTML stranice bi trebalo posebno podešavati da bi bile prikladne za ispis
  • jednostavnost korištenja – PDF datoteke možemo spremiti na računalo ili mobitel, one će se spremiti kao jedna datoteka. Time vam je omogućen offline pristup bilokada a svi resursi koji su potrebni za rad datoteke su njezin dio i ne treba ih posebno skidati. Ovo nije slučaj kod HTML stranica (osim u slučaju PWA aplikacija), jer za rad im je potreban velik broj skripta, stilova i slika i spremanjem HTML stranice sve datoteke potrebne za rad će se skinuti kao direktorij što stvara kaos u organizaciji
  • prikaz matematičkih simbola i jednadžbi – HTML stranice same po sebi nemaju nikakvu podršku za prikaz jednadžbi, već je potrebno koristiti neke od vanjskih skripta (kao što je MathJax) i dodatno ih podešavati

Nedostaci PDF datoteka

Kako je PDF odličan format za tisak, za web tehnologiju ima određenih mana. Pogledajmo koji su to nedostaci zašto PDF nisu idealni za prikaz na web stranicama ili bolje rangiranje na tražilicama.

  • nisu prikladni za mobilne uređaje – PDF datoteke su kreirane s ciljem da se uvijek prikazuju konzistentno na svim uređajima. Tako se prikazuju jednako u svim web preglednicima i bez obzira koja je platforma (PC, Mac, Linux, iPhone, Android…). HTML stranice koje na desktop verziji imaju u lijevom stupcu tekst a u desnom stupcu sliku, na mobitelu samo podesimo da se prvo prikazuje tekst a ispod slika. PDF datoteke se ne mogu posebno prilagođavati manjim ekranima i nezgodno ih je pregledavati na mobitelu.
  • nedostatak navigacije – PDF skoro nikad nema navigacijskih elemenata zbog čega je često slijepa ulica korisnicima koji kada ju otvore mogu jedino ići nazad, ili ako je datoteka otvorena u novom tabu oni je samo mogu zatvoriti. Ne mogu se kretati dalje kroz sadržaj što je loše za korisničko iskustvo a i nama koji želimo korisniku dalje pružati druge povezani sadržaj.
  • slaba interaktivnost – PDF datoteke se ne mogu se opisivati HTML kodom i atributima kako bi tražilicama dali do znanja što je što u datoteci. Primjerice ako PDF i ima neke linkove, ne možemo ih tagirati atributima nofollow. Veoma je malo toga što možemo kontrolirati.
  • analitike ne funkcioniraju u potpunosti – sustavi za metriku (kao što je Google Analytics) ne funkcioniraju na PDF datotekama. Možemo jedino mjeriti njihovo otvaranje tj. klik na link datoteke ili kao alternativu koristiti PDF unutar same stranice kao iframe (što nije dobro rješenje)
  • neke datoteke nemaju dobru pristupačnost – premda se to često odnosi i na web stranice koje razne tvrtke izrađuju ne vodeći računa o digitalnoj pristupačnosti, nešto se ipak može učiniti po tom pitanju (https://webaim.org/techniques/acrobat/acrobat)

Kada koristiti PDF datoteke?

Upotreba PDF datoteka je odličan način da se prikaže velik broj podataka na način a da stranica ne izgleda prekomplicirana i zbunjujuća korisnicima. Obično ih koristimo kada želimo konzistentnost i profesionalnost zapisa za tisak, ili pružiti korisnicima detaljne informacije proizvođača.
Razni su primjeri kada je najprikladnije koristiti PDF a neki takvi primjeri su:

  • specifikacije
  • tehnički radovi
  • znanstveni članci i istraživački radovi
  • priručnici
  • brošure
  • životopisi
  • računi
  • pravni dokument

Sve to mogu biti vrlo korisne datoteke posjetiteljima, ali imaju malu vidljivost je ne rangiraju dobro u rezultatima pretraživanja.

PDF je prikladan format i za elektroničke knjige ili generalni sadržaj koji želimo imati pri ruci.

U strategiji sadržaja stvarajte PDF datoteke kako bi potakli raznovrsnost. No ako vidite da PDF rangira za neke važne pojmove, razmislite ne bi li bilo bolje kreirati web stranicu koja će zauzeti njegovu poziciju i bolje predstaviti sadržaj.
Ako želite navesti ljude da preuzmu PDF, stvorite odredišnu stranicu i dodatno je optimizirajte za promociju PDF dokumenta. Sadržaj bi trebao ukratko predstaviti svrhu dokumenta a na usluzi sve značajke koje web stranica nudi za maksimalnu optimizaciju. Usput vam se pruža prilika uhvatiti korisnika na newsletter ili mu samo pružiti da lakše stupi u interakciju ili odradi poziv na akciju. Odredišne stranice su također posebno važne kada želimo promovirati sadržaj putem reklamnih kampanja, poput Google Ads.

Zašto optimizirati PDF

PDF dokumenti se indeksiraju identično kao HTML a mogu rangirati na višim pozicijama ispred HTML stranica ako tražilica zaključi da je sadržaj datoteke relevantniji. Rijedak je slučaj da tvrtke optimiziraju svoje PDF datoteke čime se tražilicama otežava indeksiranje i ne ispunjuje se njihov potencijal u potpunosti.

Ako prilaz svojim PDF datotekama omogućujete samo onim korisnicima koji zadovolje određeni uvjet (obave kupnju ili ispune kontaktni obrazac), neke stavke kao uređivanje meta podataka možete preskočiti.

Google rezultati pretrage

Google je počeo indeksirati PDF datoteke još 2001. godine. Na rezultatima pretraga stoji mala oznaka PDF pored hijerarhije dokumenta. PDF se indeksira identično kao HTML. Ponekad baš za PDF datoteke uključuju istaknute isječke na vrhu rezultata pretrage.

{slika kako je prikazan PDF isječak na vrhu rezultata pretrage https://www.searchenginejournal.com/pdf-seo-best-practices/59975/#close}

Sakrivanje PDF datoteka

U određenim slučajevima želimo izbjeći da se određeni dokumenti mogu pronaći na tražilicama. Na primjer, želite omogućiti pristup dokumentu jedino ako se korisnik pretplati na vaš newsletter, što je jedna od čestih tehnika prikupljanja korisnika. Ili imate web trgovinu digitalnih proizvoda te vašim kupcima nudite elektroničke knjige u PDF formatu. Ili možda održavate online edukacije i ne želite običnim posjetiteljima učiniti datoteke pristupnima već samo određenoj publici koja se prijavila na edukaciju. U svakom slučaju važno je blokirati tražilice od indeksiranja tih datoteka.

Ovo je moguće učiniti na nekoliko načina:

  • Upotrebom robots.txt datoteke
  • Atributom rel=”nofollow” na linkovima koji vode do PDF datoteka
  • Upotrebom x-robots-tag: noindex u HTTP zaglavlju
  • Postavljanjem lozinke na datoteku koja će botovima vratiti HTTP 403 statusnu grešku

Kako kreirati optimalan PDF

Optimizacija PDF nije komplicirana jer nema puno toga za razliku od web stranica. U nastavku navodimo nekoliko najboljih praksi pravilne optimizacije:

  • pisanje dobrog sadržaja
  • prikladan naziv datoteke
  • dobra putanja do direktorija gdje se datoteka nalazi
  • napisati relevantnan naziv i opis datoteke
  • definirati naslove radi pravilno strukturiranog sadržaja
  • optimizacija slika alt atributima
  • dodavanje zaglavlja
  • ubacivanjem linkova na naše ili vanjske stranice
  • optimizacija same datoteke radi smanjivanja veličine

Pogledajmo ove stavke detaljnije:

Kreirajte dobar sadržaj

Sadržaj koji kreirate neka bude unikatan što je jedan od glavnih faktora za visoko rangiranje. Ako do toga neće doći, tražilice će dati prioritet izvornoj web stranici na kojoj je datoteka objavljen. Najbolji način da korisnici dolaze je da osigurate kvalitetan, koristan, zanimljiv i jedinstven sadržaj.

Premda nije baš moguće prilagođavati sadržaj za mobilne uređaje, ipak na neke stvari možemo obratiti pozornosti:

  • tekst uvijek poravnajte ulijevo, čime korisnici neće trebati pomicati dokument da bi vidjeli tekst. Ovo je uvijek dobro imati i zbog pristupačnosti stranica
  • koristite popise i podebljane riječi koji će olakšati pregledavanje sadržaja
  • dlomke pokušajte zadržati u 3-4 rečenice

Sav sadržaj spremite kao običan tekst, nemojte ga spremati kao sliku. Premda su tražilice danas sve naprednije i pomoću OCR tehnike mogu odgonetnuti što piše na slici, olakšajte situaciju njima a i vašim korisnicima. Običan tekst lako se pretraži i indeksira. Ako možete odabrati, kopirati i zalijepiti tekst iz PDF-a, sve radi kako treba.

OCR tehnika prepoznavanja teksta na slikama

Ako se unutar PDF datoteka nalaze slike i na njima je ispisan tekst (što je loša praksa), tražilice ipak nastoje saznati što piše na njima kako bi mogle bolje razumijeti sadržaj. U tu svrhu koriste tehnologiju optičkog prepoznavanja znakova (OCR, eng. Optical Character Recognition kako bi rasterski tekst preveli u čisti tekst.

Nekoliko je razloga zašto je ova tehnologija dobra:

  • tekstualni zapis možemo dalje uređivati i kopirati
  • štedimo prostor jer tekstualni zapis zahtijeva malo prostora nauštrb slikovnih zapisa teksta
  • sadržaj se optimizira za brzinu jer je brže procesuiranje i prikaz teksta u pregledniku, a isto se odnosi i na indeksiranje radi tražilica

Tehnologija je toliko napredovala da je danas moguće gotovo pouzdano prepoznavati znakove kada su uvjeti optimalni. Idealno, slike trebaju biti jasne i oštre a tekst pisan standardiziranim fontovima. Rukopisi i tekstovi pisani nelatiničnim pismom imaju znatno manju stopu konvertiranja u točan tekst, a bilokakva oštećenja čitljivosti teksta povećavaju mogućnost grešaka.

Testiranje rada OCR tehnologije

Kako bi se i sami uvjerili u pouzdanost ove tehnologije testirali smo sami konvertiranje. Kreirali smo novi slikovni zapis u Photoshopu te smo unijeli tekst. Tekst smo definirali u nekoliko različitih varijacija jedan ispod drugog:

  • tekst različite boje
  • tekst različitog tipa fonta
  • tekst različite prozirnosti, od pune boje do 10% transparentne
  • tekst koji je zamućen i zamrljan
  • tekst na hrvatskom, slovenskom, engleskom, njemačkom, francuskom i talijanskom

Potom smo ga spremili kao JPG datoteku i uploadali u Google Drive. Desnim klikom smo odabrali opciju “Open with Google Docs”. Rezultat? U kreiranoj datoteci Google je ubacio našu sliku i ispod je točno naveo tekst. Dakle, stvar funkcionira perfektno.

Osmislite prikladan naziv datoteke

Prije spremanja za web prijenos, razmislite koje relevantne ključne riječi najbolje opisuju sadržaj datoteke. Baš kao što je to slučaj i kod optimizacije slika, naziv datoteke napišite tako da:

  • riječi odvojite malom crticom i nemojte koristiti razmak
  • sve riječi pišite malim slovima
  • ako imate više datoteka koje imaju isti naziv, na kraj naziva dodajte malu crticu i broj (naziv-1.pdf)

Loš primjer: 10-D514-hr-4.pdf
Primjer dobre prakse: napredna-seo-optimizacija.pdf

Dakle, pazite da je naziv datoteke deskriptivan ali sažet i prilagođenog formata za web. Nije rijetkost da drugi PDF datoteke stvaraju s generičkim nazivom koji sadrži kombinaciju nasumičnih slova i brojeva, pogotovo kada je naziv računalno generiran. Potrudite se da takve nazive ručno korigirate.

Pazite na cjelokupnu putanju do datoteke

Osim kreiranja naziva datoteka, imajte na umu u koji direktorij ćete ubaciti datoteku jer se konačan URL sastoji od domene, naziva poddirektorija i samog naziva datoteke i cjelokupna slika je bitna.

Loš primjer: https://web-trgovina.hr/uploads/2020/04/10-D514-hr-4.pdf
Primjer dobre prakse: https://web-trgovina.hr/vodici/napredna-seo-optimizacija.pdf

Korištenjem naziva koji je bogat ključnim riječima a opet strukturno jednostavan kreira se optimalan URL što je dobar temelj tražilicama za razumijevanje i shodno tome bolje rangiranje.

Uredite meta podatke

Mnogi to ne znaju ali PDF datoteke također imaju svoje meta podatke koji se mogu podesiti unutar programa za editiranje PDF-a. ove opcije se mogu razlikovati ovisno koji program koristite ili operativni sustav (Windows, Mac…). Ako za pregled i uređivanje PDF-a koristite Adobe Acrobat, te meta podatke možete uređivati unutar File > Properties.

{slika opcija uređivanja}

Upišite naslov dokumenta

Naslov PDF-a tretira se isto kao i naslov tradicionalne web stranice. Ako zanemarite njegov unos tada će naziv datoteke bit će prikazan kao naslov u rezultatima pretrage.

Par crtica na koje je potrebno obratiti pozornost:

  • neka naslov bude deskriptivan, sa barem jednom ili dvije ključne riječi koje ga opisuju
  • izbjegavajte prekratke ali i preduge naslove, optimalno neka dužina bude 50-60 znakova

Primjer dobre prakse: Napredna SEO optimizacija

Upišite opis

Kao što naslov datoteke ima svog ekvivalenta u naslovu web stranice, tako postoji i opis. Većina ljudi preskače ovaj korak prilikom kreiranja datoteka. Opis kao i kod stranica nije faktor koji utječe na rangiranje već je cilj korisnika privući da ga klikne. Za dodavanje opisa ova stavka se obično nalazi u polju Predmet.

  • Unesite sažetak sadržaja između 250-300 znakova
  • Neka opis sadrži ključnu riječ
  • Dobro je koristiti superlative

Upišite autora

U polje autora upišite naziv tvrtke na koju se odnosi domena. U polje autora upišite naziv tvrtke na koju se odnosi domena. Premda realno nismo sigurni ima li ovo kakvog utjecaja, dobra je praksa ispuniti podatke u potpunosti i ugrabiti autorska prava.

Koristite pravilnu strukturu naslova

Kao i web stranice, tako i PDF dokumenti mogu koristiti naslove i dublje ugniježđene podnaslovi koji služe strukturiranju sadržaja. Oni pomažu korisnicima da brzo pročitaju i razumiju o čemu se radi, a u iste svrhe služe i tražilicama.
Slijedite najbolje prakse:

  • Koristite jedan H1 naslov u cijeloj datoteci
  • Razbijte sadržaj na nekoliko sekcija i svaka sekcija neka ima H2 naslov
  • Ako su sekcije duže razgranajte ih dalje pomoću H3-H5 tagova
  • Sve tagove koristite po redoslijedu, nemojte preskakati, npr. nakon H2 koristiti H4
  • Naslovima jezgrovito opišite svaku sekciju
  • Glavne naslove optimizirajte pomoću relevantnih ključnih riječi

Nemojte koristiti stilske promjene da bi istaknuli naslove, već baš upotrijebite tagove naslova koji će utjecati na samu strukturu sadržaja. Ovo će omogućiti korisnicima i tražilicama uvid u pregled sadržaja (eng. Table of contents).

Optimizirajte slike

Sažmite slike radi brzine

Vodite računa da slike koje ubacujete u PDF nisu preteške. Prije ubacivanja u PDF, smanjite rezoluciju slika na potrebnu veličinu, koristite prikladan format slika (PNG, JPG i drugi) i podesite postavke u programu za editiranje slika tako da se smanji težina. Prednost dajte slikama koje su vektorske. Kako ćete slike sažeti, time će biti manja PDF datoteka te u konačnici kraće vrijeme njezina preuzimanja. A dobro znamo kako je brzina otvaranja stranica bitna za rangiranje. Isti princip odnosi se i na PDF. Možete ih komprimirati poput besplatnih mrežnih alata.

Da bi smanjili veličinu PDF-a, ograničite upotrebu slika te koristite one koje su bitne za informaciju a ne za dizajn. Slike čine većinu ukupne veličine datoteke. Neke PDF datoteke znaju biti kreirane tako a je svaka stranica jedna slika, kao što je slučaj sa skeniranim knjigama. Takve datoteke znaju biti jako velike i zbog toga se jako sporo učitavaju a korisnicima je otežano i kretanje između stranice jer preglednik sve sporo procesuira.

Uredite alt tagove

Alt tekst služi za opisivanje sadržaja slike, od velikog je značaja za pristupačnost korisnicima a dodatan plus je da ga tražilice koriste kako bi bolje razumjele njihovu funkciju. Obratite pozornost da je deskriptivno opisano što se nalazi na slici i da su uključene relevantne ključne riječi.

Uredite zaglavlje

Uključivanje zaglavanja u datoteke korisno je za posjetitelje jer omogućuje skeniranje sadržaja za glavne točke dokumenta i lakše snalaženje. Ako je sadržaj PDF-a kreiran kao veliki blok teksta posjetitelj će se vjerojatno obeshrabriti da ga čitaju. S obzirom na to da tražilice kuže kako posjetitelji brzo napuštaju PDF datoteke i vraćaju se nazad na rezultate pretraga, u daljnjim pretraživanjima rangiranje te PDF datoteke će biti niže.

Ubacite linkove

Korisnicima je važno imati jednostavnu interakciju i s lakoćom se snalaziti po stranicama. Dobra unutrašnja struktura stranica od velikog je značaja i za tražilice koje bolje razumiju vaš sadržaj i njihov međusobni odnos. Ovu temu smo više obradili kada smo pisali o važnosti internog linkanja za kvalitetu stranica. Učinite isto to i u PDF dokumentima. Izbjegnite da PDF postane slijepa ulica vašeg korisnika već mu pružite pristup nazad na stranicu a omogućite i tražilicama da proslijede famozni link juice na te druge vaše stranice.

Postavite barem link na početnu stranicu, što bi mu koristilo i ako se dokument preuzme na računalo. Od velikog je značaja ako bi neka druga tvrtka koristila vaše datoteke, tada bi dobili dolazni link. Linkove podesite na one ključne pojmove koji su bitni i relevantni za link.

Slobodno koristite i vanjske linkove na autoritativne domene kako bi korisnicima pružali više mogućnosti za istraživanje.

Optimizacija datoteke

Veličina datoteke može biti od značajnog utjecaja na rangiranje ako je preteška. Što je ona veća, to će korisnicima trebati više vremena da je učitaju. Na desktop računalima to možda nije toliki problem ako nam je internet veza brza ali na mobilnim uređajima može biti velik problem. To može negativno utjecati i na korisničko iskustvo i na poziciju rangiranja.

Kod pisanja sadržaja koristite manje različitih tipova fontova i njihovih stilova (debljina, ukošenost).

Pokrenite Adobe Acrobat, otvorite datoteku i pogledajte pod File > Properties u “Advanced” sekciji stavku “Fast Web View”. Ako je ta opcija uključena znači da je PDF restrukturiran tako da prilikom preuzimanja učitava se po jedna stranica. Korisno ako je datoteka velika jer osoba može početne stranice početi pregledavati prije nego je datoteka posve učitana.

Datoteku je potrebno sažeti kompresijom kako bi se smanjila njezina veličina. Spremite datoteku pomoću File > Save as Other > Optimized PDF. Postoji velik broj mogućnosti no samo ako kliknete “Ok”, program će sam spremiti sve u skladu sa standardnim opcijama. Pripazite jedino da koristite spremanje kompatibilno sa starijim verzijama tako da se izbjegnu potencijalni problemi između novih verzija. Tada provjerite još jednom pod File > Properties, stavka “Fast Web View” će biti potvrdna.

U WordPressu postoje neki pluginovi koji omogućuju sažimanje datoteke, kao što je PDF Compression plugin. Korisno je ako želite velik broj PDF datoteka prenijeti na stranice bez ručnog podešavanja.

Izbjegavajte dvostruki sadržaj

Ako posjetiteljima web stranica nudite PDF datoteku kao alternativu pregleda stranice, ovo je primjer dupliciranog sadržaja. Kako bi izbjegli kaznu od tražilica koje ga ne vole, podesite kanonikal linkove {link}. Ili upotrijebite oznaku rel=”canonical” unutar HTML stranice. Vrlo vjerojatno želite prebaciti sve na web stranicu a PDF koristiti samo kao pomoćnu datoteku.

Linkajte na PDF koristeći dobru praksu

Sa svojih web stranica linkajte na PDF datoteke koristeći dobar usidreni tekst (anchor).

Zaštitite dokument od uređivanja

Kako bi drugima otežali uređivanje dokumenta, zaštite ga. Korisno je ako druga tvrtka preuzme datoteku i želi ih koristiti kao vlastite, a vi u njima imate linkove koji upućuju na vaše stranice. Zaštitom onemogućujete drugima da te linkove obrišu.

Pratite preuzimanje datoteka

Premda se ova stavka ne odnosi na samu optimizaciju, pravilna implementacija praćenja otvaranja PDF datoteka značajna je informacija koju je dobro imati pri ruci u Google Analytics izvještajima. Podesite praćenje eventa i stope otvaranja, pratite kako korisnici preuzimaju PDF datoteke kako bi mogli pratiti angažman svojih korisnika.

Time možemo vidjeti koliko ljudi je pristupilo stranici putem tražilica a potom preuzelo PDF. Možemo također vidjeti preko kojih marketinških strategija korisnici dolaze na putu za preuzimanje datoteke.

Sažetak

Vidjeli smo neke primjere kada bi mogli koristiti PDF datoteke i načine kako ih najprikladnije optimizirati za web tehnologiju. Prije ili poslije gotovo je neizbježno da ćete u nekom trenutku trebati koristiti. Iako ih je lako previdjeti, pobrinite se da ih ne zanemarite.

PODIJELI S PRIJATELJIMA:
Idi  na  vrh