Enligt dagens prognoser ligger Webbens framtid i en annan typ av SGML-dokument , nämligen i XML-dokument (Extensible Markup Language).
För att göra övergången från HTML till XML lättare, omformulerade man nyligen HTML 4 och dess tre DTDer till ett annat markeringsspråk, XHTML (Extensible HyperText Markup Language).
XHTML är en applikation av XML och XHTML-dokument överens-stämmer med både HTML och XML och bör kunna läsas, editeras samt valideras med vanliga XML-redskap samtidigt som de behåller bakåt-kompabilitet för att kunna läsas, editeras samt valideras med vanliga HTML-redskap.
Internet Explorer 5.0 är ett exempel på läsare som klarar både HTML och XML. Läsaren försöker t.o.m. hålla sig till regler och vägrar att läsa syntaxfelaktiga XML-dokument. För Netscape och Eudora är XML fortfarande en okänd dokumenttyp.
Rotelementet är detsamma som i HTML, nämligen elementet HTML. Struktureringsreglerna däremot är desamma som i XML. I likhet med XML-dokument måste XHTML-dokument vara välutformade (se avsnitt med samma namn). Dessutom måste taggarna skrivas med små bokstäver.
Den första versionen av XHTML-språket blev W3Cs rekommendation (http://www.w3.org/TR/xhtml1) den 26 januari 2000.
Så småningom kan man förvänta sig en ny version av XHTML. Arbetet pågår med bl a moduliseringen av XHTML så att andra DTD:er eller rekommendationer, t ex MathML Math Markup Language (http://www.w3.org/TR/REC-MathML) och XML-element, kan implementeras.
Välutformade XHTML-dokument brukar börja på detta sätt:
<?xml version="1.0"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
...
</html>
Element i HTML 4 och XHTML
L - endast i loose- versionen
F - endast i frameset-versionen
A, ABBR, ACRONYM, ADDRESS, APPLET (L), AREA, B, BASE, BASEFONT (L), BDO, BIG, BLOCKQUOTE, BODY, BR, BUTTON, CAPTION, CENTER (L), CITE, CODE, COL, COLGROUP, DD, DEL, DFN, DIR (L), DIV, DL, DT, EM, FIELDSET, FONT (L), FORM FRAME (F), FRAMESET (F), H1, H2, H3 H4, H5, H6, HEAD, HR, HTML, I, IFRAME (L), IMG, INPUT, INS, ISINDEX (L), KBD LABEL, LEGEND, LI, LINK, MAP, MENU (L), META, NOFRAMES (F), NOSCRIPT, OBJECT, OL, OPTGROUP, OPTION, P, PARAM, PRE, Q, S (L), SAMP, SCRIPT, SELECT, SMALL, SPAN, STRIKE (L), STRONG, STYLE, SUB, SUP, TABLE, TBODY, TD, TEXTAREA, TFOOT, TH, THEAD, TITLE, TR, TT, U (L), UL, VAR.