L'acronimo HTML significa HyperText Markup Language, cioè un linguaggio che permette la creazione di ipertesti mediante l'uso di marcatori inseriti nel codice del documento.
I marcatori stabiliscono la struttura, la visualizzazione e in alcuni casi la semantica di parti del documento, e sono distinti dal testo normale (l'informazione veicolata dal documento) perché sono delimitati da parentesi angolari. Per esempio, per mettere una parte del testo in grassetto si appone un marcatore (per brevità, un tag) di apertura <b> prima della parte da mettere in grassetto e la sua chiusura </b> nel punto in cui il testo deve tornare normale. Così, l'effetto visivo in grassetto si ottiene con il codice:
<b>in grassetto</b>
Lo HTML è il linguaggio originale che permise lo sviluppo del World Wide Web (WWW), un database distribuito che funziona mediante la rete Internet. Il Web naque al CERN di Ginevra nel 1989, partendo da un'idea di Tim Berners-Lee, e lo stesso Berners-Lee scrisse la prima versione del linguaggio HTML.
Questi "appunti sparsi" intendono fornire una presentazione della struttura di base del linguaggio HTML nella specificazione 4.01 che è, alla data attuale, la più recente. Per coerenza gli appunti non conterranno quelle parti del linguaggio che sono deprecate da tale specificazione, in particolare i tags che si occupano della formattazione del testo (dimensioni, colore, forma dei caratteri...). Tutte queste proprietà di visualizzazione possono meglio essere gestite con l'uso dei fogli di stile a cascata (CSS), che sono illustrati nel documento Appunti sparsi sui CSS.
Ogni documento HTML è costituito da tags e dal testo, che si trovano racchiusi fra i marcatori principali <html> e </html>. All'interno del listato possiamo distinguere due parti principali:
<META NAME="AUTHOR" CONTENT="Redazione del sito del liceo Marconi">definisce che l'autore di questo documento è la redazione del sito del liceo. In questo caso la chiave è author e il valore attribuito è redazione del sito del liceo.
Il codice di seguito riportato rappresenta lo "scheletro" di un documento HTML tipo. Vediamo contornati in due diversi colori la "head" e il "body":
I testi per risultare più chiari e leggibili vengono divisi per argomenti con titoli e sottotitoli, in ordine gerarchico. I titoli si trovano nel body, insieme al resto del testo e per distinguerli gli viene assegnata una formattazione diversa utilizzando i tags <Hn> </Hn> ("n" rappresenta un numero che può andare da 1 a 6).
Partendo dal tag <H1>, che di solito viene usato per il primo titolo, l'argomento generale del documento, fino al tag <H6> la loro formattazione si avvicina via via a quella del testo normale (infatti i primi sono più grandi, centrati e magari scritti maiuscoli). Per esempio:
Ovviamente questo è solo un esempio e possono esserci più o meno argomenti, può non esserci bisogno di suddividerli ulteriormente oppure può servire creare suddivisioni di livello ancora inferiore (<H4>titolo</H4>); in ogni caso è meglio fare in modo di rendere il documento il più semplice e leggibile possibile.
DIV e SPAN sono contenitori generici che servono a suddividere il blocco di testo in diversi modi, in modo che ognuno possa scegliere quello più adatto alla propria circostanza.
Il <DIV> è l'elemento di tipo block per eccellenza e serve per andare a capo senza lasciare spazi tra i blocchi di testo, per esempio:
l'esempio verrebbe visualizzato in questo modo:
Lo <SPAN> invece, è un elemento inline, che quindi non va a capo, ma prosegue sulla linea del tag che lo include, come può essere il DIV. Per esempio:
L'esempio verrebbe visualizzato in questo modo: