Mimo łatwego dostępu do umieszczenia własnej treści w sieci ‘www’ przez każdego, kto ma dostep do internetu, nie jest łatwe nadanie tej treści formy prezentacji, która będzie naturalna do odczytu, nie wzbudzi intuicyjnej, nienazywalnej odrazy, będzie bliska temu, jak można uformować swobodnie kreśląc na rzeczywistym arkuszu papieru. Każda przeglądarka stron ‘www’ może inaczej wyświetlać tak samo opisaną formę treści, a ponadto nawet najnowsze przeglądarki nie formatują treści w sposób zbliżony do metody kreślenia przez człowieka na arkuszu papieru. Bo strona ‘www’ jest formowana z równoległych do układu współrzędnych prostokątów, w które wpisane są obiekty graficzne, ale nie jest uwzględniana forma zawartości: kształt, kolorystyka, wypełnienie, które decydują wprost o rzeczywistym subiektywnym odbiorze przez umysł człowieka nauczony odbioru obiektów świata trójwymiarowego, które rzutowane na płaszczyznę nie tworzą przyległych prostokątów, lecz dowolne bryły. Więc naturalna forma opisu stron ‘www’ jest formą sztuczną dla człowieka i nie da się utworzyć wprost strony ‘www’, która będzie w formie przyjazna do odbioru. Ale w tym sztucznym standardzie stron ‘www’ można opisać formę strony w taki sposób, by to co ma być widoczne dla człowieka było pocięte na przyległe prostokąty równoległe do układu współrzędnych i w ten sposób składało docelową formę obrazu.
Zwykła strona ‘html’
Strona ‘www’ to jest komputerowy plik tekstowy, w którym znajduje się publikowana treść strony objęta w tekstowe tzw. ‛znaczniki’, które otaczają tę treść jak zagnieżdżane nawiasy (nawias w nawiasie itd.). Ponieważ jest to plik tekstowy, więc tylko treść tekstową umieszcza się w nim wprost ją wpisując, natomiast każdą pozostałą wstawia się przez umieszczenie znacznika odesłania do innego pliku komputerowego, który nie musi być tekstowy, ale zawiera wprost tę umieszczaną treść, np. rysunek, film, program komputerowy wykonywany w prostokącie na stronie ‘www’, itp. Przeglądarka ‘www’ jest zobowiązana do pobierania tych pozostałych plików, które potrafi przetworzyć ze względu na ich rodzaj, i wstawiać ich zawartość. Czyli na pojedynczą stronę ‘www’ widoczną w przeglądarce ‘www’ składają się:
- ⁃ plik tekstowy, którego adres jest ukazywany na pasku adresu przeglądarki ‘www’ oraz
- ⁃ pozostałe pliki, których adresy są umieszczone w tym pliku tekstowym lub we wstawionych plikach tekstowych.
Standard HTML lub inny standard znaczników (np. XHTML, SVG) określa jak się nazywają i jakie mają znaczenie możliwe do zrozumienia przez przeglądarkę ‘www’ znaczniki, ponieważ znaczniki mają nie tylko obejmować bloki tekstu jak nawiasy, ale – obejmować i nadawać znaczenie. Na to znaczenie składa się:
- • Czym jest blok? Mówi o tym nazwa znacznika. Jak należy ten blok tekstu traktować podczas wyświetlania strony ‘www’.
- • Jakie ma właściwości? Mówią o tym parametry znacznika. Jak należy ten blok tekstu traktować dodatkowo specjalnie.
Jednym ze znaczników jest znacznik tzw. komentarza. Znacznikiem tym można obejmować nie tylko komentarze własne twórcy pliku strony ‘www’, ale również wyłączać bloki tekstu strony z użycia przez przeglądarkę ‘www’; omija zawartość znacznika komentarza. Tekstem rozpoczynającym znacznik komentarza jest “<!--”, a kończącym – “-->”; w treści tego znacznika nie wolno umieścić kolejno dwóch znaków ‛-’. Poniżej jest przykład zawartości pliku tekstowego prostej strony w standardzie ‟HTML 5”. W celu łatwego czytania pokolorowano tekst, ale tego formatowania nie ma w pliku.
<!DOCTYPE html> <html lang="pl"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, minimum-scale=1"> <title>tytuł strony ‘www’</title> </head> <body> <!--To zdanie nie będzie interpretowane.--> <p>To zdanie zostanie wyświetlone przez przeglądarkę ‘www’ jako zawartość strony.</p> </body> </html>
Pomijając tutaj szczególną formę znacznika komentarza, znaczniki opisu strony ‘www’ w standardzie ‟HTML” mogą mieć jedną z dwóch form:
- • Obejmującą: “<nazwa></nazwa>”.
- • Wstawiającą: “<nazwa>”. W standardzie XML (i zgodnych: XHTML i większość nowo powstających) ta forma ma postać: “
”. Znaczniki wstawiające obejmują to, co wstawiają.
Dlatego nie wolno używać ·wprost· znaków ‛<’ i ‛>’ do niczego innego niż do zapisu znaczników. Do zapisu tych znaków do innych zastosowań (np. w treści strony) trzeba używać wieloznaków zastępczych “&lt;” oraz “&gt;”. Ze względu na to, że znak ‛&’ jest używany jako początek wieloznaków zastępczych, nie wolno go używać ·wprost· do niczego innego. Do zapisu znaku ‛&’ do wszystkich zastosowań oprócz wieloznaków zastępczych trzeba używać wieloznaku “&”. Przed upowszechnieniem użycia Unicode inne niż wymienione wieloznaki zastępcze umożliwiały zapis znaków niezawartych w stosowanej w pliku tekstowym tzw. ‛stronie kodowej’ (ang. ‘charset’ lub ‘code page’), np. w Polsce ISO-8859-2 lub Windows-1250.
Parametry umieszcza się przez dopisywanie ich nazw wewnątrz znacznika, separując odstępem, w jego części “<nazwa>”. Poniżej wymienione są możliwe rodzaje parametrów w formach zapisu wybranych i polecanych spośród tych alternatywnych form, które definiuje standard HTML:
- • Parametr włączający coś swoim wystąpieniem w znaczniku: “<znacznik parametr>”.
- • Parametr niosący ze sobą zawartość: “<znacznik parametr="zawartość">”; w zawartości do zapisu znaku ‛"’ trzeba używać wieloznaku zastępczego “&quot;”.
Do uzyskania równoważnego efektu wizualnego strony ‘www’ można użyć w pliku tekstowym zamiast opisanego standardu HTML — standard XHTML. Nie różnią się one istotnie listą dostępnych znaczników, jakkolwiek różnią się zasadniczo w ścisłości składania tych znaczników:
- Standard HTML był podstawowym standardem tworzenia stron ‘www’ przez wiele lat i został tak pomyślany, by każda najstarsza przeglądarka ‘www’ potrafiła wyświetlić podstawową zawartość strony ‘www’ bez względu na nieznajomość nowych znaczników, które były dodane w nowych wersjach standardu HTML. Jeśli na stronie ‘www’ w formacie HTML są błędy użycia znaczników, to przeglądarka ‘www’ naprawia je domyślnie, gdzie jest możliwe, a pomija tam, gdzie nie jest, by zachować treść zawartą w tych znacznikach.
- Standard XHTML podpada pod ogólny standard XML (będący podstawą wielu standardów), który został wymyślony do automatycznego i jednoznacznego udostępniania sklasyfikowanych danych. Takimi danymi może być również strona ‘www’, więc stąd standard XHTML pośród wielu innych standardów sklasyfikowanych danych opartych na XML, które można włączyć w treść strony ‘xhtml’. Cała strona ‘www’ w formacie XHTML nie może zawierać ani jednego błędu użycia znacznika, ponieważ nie zostanie wogóle wyświetlona przez przeglądarkę ‘www’, która wtedy zasygnalizuje błąd składni.
Oczywiście strona ‘html’ też nie powinna być tworzona z błędami, ale generalnie nie ma potrzeby używania XHTML, gdy tworzy się zwykłe strony ‘www’, ponieważ można by zapewniać poprawność składni, ale XHTML wymaga jawnych deklaracji użycia określonego standardu, które nie podpadają pod mechanizm ‛wyświetlania tego co przeglądarka potrafi’, który jest stosowany dla HTML, i jeśli dana przeglądarka ‘www’ nie rozpoznaje danego standardu XHTML, to nie sformatuje wyglądu strony. Standard XHTML pociągnął za sobą rozwój samego HTML (czego przykładem jest obecna możliwość modyfikacji przez program uruchomiony w przeglądarce ‘www’ — strony ‘html’ przy użyciu bloków znaczników, a nie ciągłego tekstu) oraz znalazł zastosowanie w programach do tworzenia strukturalnego strony ‘www’ bez oglądania jej tekstowego opisu.
Formowanie
Podczas otwierania strony ‘html’ przeglądarka ‘www’ czyta kolejno deklaracje znaczników i układa wizualnie na stronie ‘www’ ich zawartość zgodnie z ich przeznaczeniem wynikającym z nazwy znacznika rozszerzonym o opis szczegółowy zawarty w parametrach. Prostokąty są układane od górnego lewego rogu strony ‘www’ usiłując zmieścić w prawo, a jeśli się nie da, to poniżej; tak jak maszyny do pisania przesuwały kartkę papieru pod tekst. Każdy znacznik ma zdefiniowany przez standard rodzaj rozlewania go na szerokości. Znacznik akapitu będzie wypełniał całą dostępną szerokość — jeśli starczy mu tekstu — i utworzy prostokąt o maksymalnej szerokości, a wysokości wymaganej przez liczbę powstałych linii tekstu. Znacznik rysunku będzie zajmował prostokąt, który odpowiada wymiarom tego rysunku. Przeglądarka ‘www’ kolejno interpretuje znaczniki, ale wcale nie musi kolejno otrzymywać plików zawartości wstawianej znacznikami (np. rysunków), więc jeśli w parametrach nie zostały zadeklarowane wymiary prostokąta, który ma być wyświetlony z innego pliku, to strona ‘www’ zostanie ponownie zbudowana po otrzymaniu pliku i odczytaniu z niego wymiarów potrzebnego prostokąta, a do tego czasu w takim miejscu jest często wyświetlany symbol zastępczy o małym rozmiarze.
W zamyśle twórców standardu opisu strony HTML miało być układanie elementów dokumentu kolejno, a nie w konkretnych miejscach strony ‘html’, to ostatnie stało się możliwe wprost dopiero od nowych wersji standardów. HTML miał umożliwiać odebranie publikowanego dokumentu bez względu na urządzenie, na którym byłby prezentowany, bez konieczności wiedzy twórcy strony ‘www’ o istnieniu takiego urządzenia i jego ograniczeniach. Dlatego HTML definiował znaczniki nazywające, jaki rodzaj danych zawierają, ale nie określał, jak dokładnie mają być wyświetlone u konkretnego odbiorcy. Obecnie to podejście ewoluowało w nowych wersjach standardów do definiowania, jak ma być prezentowana strona ‘html’ na danym rodzaju urządzenia bez wiedzy o szczegółach konkretnego urządzenia tego rodzaju, np. na monitorze komputerowym, drukarce, w syntezatorze głosu dla osób niepełnosprawnych, itd. Jednak kolejność struktury dokumentu jest nadal podstawą budowy dokumentu ‘html’, mimo że na stronie ‘www’ w prezentacji na monitorze komputerowym ta kolejność byłaby zmieniona (położenie wymuszone parametrami znacznika).
Obecnie do opisu strony ‘www’ używa się standardu HTML, który pozwala umieścić zawartość strony w postaci znaczników, standardu CSS, który pozwala nadać tej zawartości wygląd, oraz skryptów Javascript, które mają naprawiać niedoskonałości prezentacji poprzednimi metodami oraz uzupełniać bądź zastępować zachowania przeglądarki ‘www’ przy użyciu metod dostępu do znaczników strony ‘html’, towarzyszących jej styli ‘css’ i samego programu przeglądarki ‘www’. Niektóre strony ‘www’ są tworzone w całości jako programy uruchamiane w oknie przeglądarki ‘www’ przy pomocy minimalnego pliku ‘html’, który zawiera znacznik wstawienia takiego programu, np. w formacie Flash lub Java.Te formaty zostały już wyłączone w przeglądarkach ‘www’. Jeszcze inne strony są tworzone w całości jako rysunek, który jest pocięty na fragmenty wstawiane znacznikami, podczas gdy określone jego obszary po kliknięciu przenoszą do kolejnej strony ‘www’.
Celem podstawowym jest takie sformatowanie strony ‘www’, by cała była widoczna w oknie przeglądarki i nie wymagała odsłaniania zawartości (np. paskiem przewijania) niczego innego niż dokument, który prezentuje, a ten tylko tak, by odsłaniać jego dalszą zawartość w pionie, nie w obu wymiarach, więc by był płynnie zawijany w kolumnie prezentacji. W wybranych miejscach wokół dokumentu głównego strony ‘www’ umieszcza się panele funkcjonalne, np. logo właściciela strony ‘www’, nawigacja po innych stronach tej samej witryny ‘www’, polecenia w związku z treścią prezentowanego dokumentu (takie jak drukowanie, wysyłanie, dołączanie publicznego komentarza). Są to zabiegi mające na celu zatrzymanie internauty na danej witrynie ‘www’ przez danie mu spisu pożądanych treści i funkcji na niej obecnych w połączeniu z prezentacją marki.
Odsyłacze
Ogólne standardy stron ‘www’: W3C.