diff --git a/html5lib/_tokenizer.py b/html5lib/_tokenizer.py
index 4748a197..d114ddee 100644
--- a/html5lib/_tokenizer.py
+++ b/html5lib/_tokenizer.py
@@ -9,7 +9,6 @@
 from .constants import entities
 from .constants import asciiLetters, asciiUpper2Lower
 from .constants import digits, hexDigits, EOF
-from .constants import tokenTypes, tagTokenTypes
 from .constants import replacementCharacters
 
 from ._inputstream import HTMLInputStream
@@ -24,6 +23,71 @@
     attributeMap = OrderedDict
 
 
+class Token(object):
+    def __init__(self, data=None):
+        self.data = data
+
+
+class Doctype(Token):
+    def __init__(self, name, publicId, systemId, correct):
+        self.name = name.translate(asciiUpper2Lower)
+        self.namespace = None
+        self.publicId = publicId
+        self.systemId = systemId
+        self.correct = correct
+
+
+class Characters(Token):
+    pass
+
+
+class SpaceCharacters(Token):
+    pass
+
+
+class Tag(Token):
+    def __init__(self, name, attributes):
+        self.name = name.translate(asciiUpper2Lower)
+        self.namespace = None
+        self.attributes = attributeMap(attributes or {})
+        self.self_closing = False
+        self.attribute_name = ""
+        self.attribute_value = ""
+
+    def flushAttribute(self):
+        if self.attribute_name and self.attribute_name not in self.attributes:
+            self.attributes[self.attribute_name] = self.attribute_value
+        self.attribute_name = ""
+        self.attribute_value = ""
+
+    def accumulateAttributeName(self, text):
+        self.attribute_name += text.translate(asciiUpper2Lower)
+
+    def accumulateAttributeValue(self, text):
+        self.attribute_value += text
+
+
+class StartTag(Tag):
+    def __init__(self, name, data=None):
+        super(StartTag, self).__init__(name, data)
+        self.self_closing_acknowledged = False
+
+
+class EndTag(Tag):
+    def __init__(self, name, data=None):
+        super(EndTag, self).__init__(name, data)
+
+
+class Comment(Token):
+    pass
+
+
+class ParseError(Token):
+    def __init__(self, data, datavars=None):
+        self.data = data
+        self.datavars = datavars or {}
+
+
 class HTMLTokenizer(object):
     """ This class takes care of tokenizing HTML.
 
@@ -64,14 +128,14 @@ def __iter__(self):
         # instead of True and the loop will terminate.
         while self.state():
             while self.stream.errors:
-                yield {"type": tokenTypes["ParseError"], "data": self.stream.errors.pop(0)}
+                yield ParseError(data=self.stream.errors.pop(0))
             while self.tokenQueue:
                 yield self.tokenQueue.popleft()
 
     def consumeNumberEntity(self, isHex):
         """This function returns either U+FFFD or the character based on the
         decimal or hexadecimal representation. It also discards ";" if present.
-        If not present self.tokenQueue.append({"type": tokenTypes["ParseError"]}) is invoked.
+        If not present self.tokenQueue.append(ParseError) is invoked.
         """
 
         allowed = digits
@@ -95,15 +159,11 @@ def consumeNumberEntity(self, isHex):
         # Certain characters get replaced with others
         if charAsInt in replacementCharacters:
             char = replacementCharacters[charAsInt]
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "illegal-codepoint-for-numeric-entity",
-                                    "datavars": {"charAsInt": charAsInt}})
+            self.tokenQueue.append(ParseError("illegal-codepoint-for-numeric-entity", {"charAsInt": charAsInt}))
         elif ((0xD800 <= charAsInt <= 0xDFFF) or
               (charAsInt > 0x10FFFF)):
             char = "\uFFFD"
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "illegal-codepoint-for-numeric-entity",
-                                    "datavars": {"charAsInt": charAsInt}})
+            self.tokenQueue.append(ParseError("illegal-codepoint-for-numeric-entity", {"charAsInt": charAsInt}))
         else:
             # Should speed up this check somehow (e.g. move the set to a constant)
             if ((0x0001 <= charAsInt <= 0x0008) or
@@ -119,10 +179,7 @@ def consumeNumberEntity(self, isHex):
                                         0xBFFFF, 0xCFFFE, 0xCFFFF, 0xDFFFE,
                                         0xDFFFF, 0xEFFFE, 0xEFFFF, 0xFFFFE,
                                         0xFFFFF, 0x10FFFE, 0x10FFFF])):
-                self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                        "data":
-                                        "illegal-codepoint-for-numeric-entity",
-                                        "datavars": {"charAsInt": charAsInt}})
+                self.tokenQueue.append(ParseError("illegal-codepoint-for-numeric-entity", {"charAsInt": charAsInt}))
             try:
                 # Try/except needed as UCS-2 Python builds' unichar only works
                 # within the BMP.
@@ -134,8 +191,7 @@ def consumeNumberEntity(self, isHex):
         # Discard the ; if present. Otherwise, put it back on the queue and
         # invoke parseError on parser.
         if c != ";":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "numeric-entity-without-semicolon"})
+            self.tokenQueue.append(ParseError("numeric-entity-without-semicolon"))
             self.stream.unget(c)
 
         return char
@@ -165,8 +221,7 @@ def consumeEntity(self, allowedChar=None, fromAttribute=False):
                 output = self.consumeNumberEntity(hex)
             else:
                 # No digits found
-                self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                        "data": "expected-numeric-entity"})
+                self.tokenQueue.append(ParseError("expected-numeric-entity"))
                 self.stream.unget(charStack.pop())
                 output = "&" + "".join(charStack)
 
@@ -193,8 +248,7 @@ def consumeEntity(self, allowedChar=None, fromAttribute=False):
 
             if entityName is not None:
                 if entityName[-1] != ";":
-                    self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                            "named-entity-without-semicolon"})
+                    self.tokenQueue.append(ParseError("named-entity-without-semicolon"))
                 if (entityName[-1] != ";" and fromAttribute and
                     (charStack[entityLength] in asciiLetters or
                      charStack[entityLength] in digits or
@@ -206,19 +260,18 @@ def consumeEntity(self, allowedChar=None, fromAttribute=False):
                     self.stream.unget(charStack.pop())
                     output += "".join(charStack[entityLength:])
             else:
-                self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                        "expected-named-entity"})
+                self.tokenQueue.append(ParseError("expected-named-entity"))
                 self.stream.unget(charStack.pop())
                 output = "&" + "".join(charStack)
 
         if fromAttribute:
-            self.currentToken["data"][-1][1] += output
+            self.currentToken.accumulateAttributeValue(output)
         else:
             if output in spaceCharacters:
-                tokenType = "SpaceCharacters"
+                token = SpaceCharacters(output)
             else:
-                tokenType = "Characters"
-            self.tokenQueue.append({"type": tokenTypes[tokenType], "data": output})
+                token = Characters(output)
+            self.tokenQueue.append(token)
 
     def processEntityInAttribute(self, allowedChar):
         """This method replaces the need for "entityInAttributeValueState".
@@ -232,23 +285,15 @@ def emitCurrentToken(self):
         """
         token = self.currentToken
         # Add token to the queue to be yielded
-        if (token["type"] in tagTokenTypes):
-            token["name"] = token["name"].translate(asciiUpper2Lower)
-            if token["type"] == tokenTypes["StartTag"]:
-                raw = token["data"]
-                data = attributeMap(raw)
-                if len(raw) > len(data):
-                    # we had some duplicated attribute, fix so first wins
-                    data.update(raw[::-1])
-                token["data"] = data
-
-            if token["type"] == tokenTypes["EndTag"]:
-                if token["data"]:
-                    self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                            "data": "attributes-in-end-tag"})
-                if token["selfClosing"]:
-                    self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                            "data": "self-closing-flag-on-end-tag"})
+        if isinstance(token, Tag):
+            if self.currentToken.attribute_name in self.currentToken.attributes:
+                self.tokenQueue.append(ParseError("duplicate-attribute"))
+            token.flushAttribute()
+            if isinstance(token, EndTag):
+                if token.attributes:
+                    self.tokenQueue.append(ParseError("attributes-in-end-tag"))
+                if token.self_closing:
+                    self.tokenQueue.append(ParseError("self-closing-flag-on-end-tag"))
         self.tokenQueue.append(token)
         self.state = self.dataState
 
@@ -260,10 +305,8 @@ def dataState(self):
         elif data == "<":
             self.state = self.tagOpenState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\u0000"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\u0000"))
         elif data is EOF:
             # Tokenization ends.
             return False
@@ -271,15 +314,13 @@ def dataState(self):
             # Directly after emitting a token you switch back to the "data
             # state". At that point spaceCharacters are important so they are
             # emitted separately.
-            self.tokenQueue.append({"type": tokenTypes["SpaceCharacters"], "data":
-                                    data + self.stream.charsUntil(spaceCharacters, True)})
+            self.tokenQueue.append(SpaceCharacters(data + self.stream.charsUntil(spaceCharacters, True)))
             # No need to update lastFourChars here, since the first space will
             # have already been appended to lastFourChars and will have broken
             # any <!-- or --> sequences
         else:
             chars = self.stream.charsUntil(("&", "<", "\u0000"))
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data":
-                                    data + chars})
+            self.tokenQueue.append(Characters(data + chars))
         return True
 
     def entityDataState(self):
@@ -297,23 +338,19 @@ def rcdataState(self):
             # Tokenization ends.
             return False
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
         elif data in spaceCharacters:
             # Directly after emitting a token you switch back to the "data
             # state". At that point spaceCharacters are important so they are
             # emitted separately.
-            self.tokenQueue.append({"type": tokenTypes["SpaceCharacters"], "data":
-                                    data + self.stream.charsUntil(spaceCharacters, True)})
+            self.tokenQueue.append(SpaceCharacters(data + self.stream.charsUntil(spaceCharacters, True)))
             # No need to update lastFourChars here, since the first space will
             # have already been appended to lastFourChars and will have broken
             # any <!-- or --> sequences
         else:
             chars = self.stream.charsUntil(("&", "<", "\u0000"))
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data":
-                                    data + chars})
+            self.tokenQueue.append(Characters(data + chars))
         return True
 
     def characterReferenceInRcdata(self):
@@ -326,17 +363,14 @@ def rawtextState(self):
         if data == "<":
             self.state = self.rawtextLessThanSignState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
         elif data == EOF:
             # Tokenization ends.
             return False
         else:
             chars = self.stream.charsUntil(("<", "\u0000"))
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data":
-                                    data + chars})
+            self.tokenQueue.append(Characters(data + chars))
         return True
 
     def scriptDataState(self):
@@ -344,17 +378,14 @@ def scriptDataState(self):
         if data == "<":
             self.state = self.scriptDataLessThanSignState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
         elif data == EOF:
             # Tokenization ends.
             return False
         else:
             chars = self.stream.charsUntil(("<", "\u0000"))
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data":
-                                    data + chars})
+            self.tokenQueue.append(Characters(data + chars))
         return True
 
     def plaintextState(self):
@@ -363,13 +394,10 @@ def plaintextState(self):
             # Tokenization ends.
             return False
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data":
-                                    data + self.stream.charsUntil("\u0000")})
+            self.tokenQueue.append(Characters(data + self.stream.charsUntil("\u0000")))
         return True
 
     def tagOpenState(self):
@@ -379,30 +407,24 @@ def tagOpenState(self):
         elif data == "/":
             self.state = self.closeTagOpenState
         elif data in asciiLetters:
-            self.currentToken = {"type": tokenTypes["StartTag"],
-                                 "name": data, "data": [],
-                                 "selfClosing": False,
-                                 "selfClosingAcknowledged": False}
+            self.currentToken = StartTag(name=data)
             self.state = self.tagNameState
         elif data == ">":
             # XXX In theory it could be something besides a tag name. But
             # do we really care?
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-tag-name-but-got-right-bracket"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<>"})
+            self.tokenQueue.append(ParseError("expected-tag-name-but-got-right-bracket"))
+            self.tokenQueue.append(Characters("<>"))
             self.state = self.dataState
         elif data == "?":
             # XXX In theory it could be something besides a tag name. But
             # do we really care?
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-tag-name-but-got-question-mark"})
+            self.tokenQueue.append(ParseError("expected-tag-name-but-got-question-mark"))
             self.stream.unget(data)
             self.state = self.bogusCommentState
         else:
             # XXX
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-tag-name"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<"})
+            self.tokenQueue.append(ParseError("expected-tag-name"))
+            self.tokenQueue.append(Characters("<"))
             self.stream.unget(data)
             self.state = self.dataState
         return True
@@ -410,23 +432,18 @@ def tagOpenState(self):
     def closeTagOpenState(self):
         data = self.stream.char()
         if data in asciiLetters:
-            self.currentToken = {"type": tokenTypes["EndTag"], "name": data,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=data)
             self.state = self.tagNameState
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-closing-tag-but-got-right-bracket"})
+            self.tokenQueue.append(ParseError("expected-closing-tag-but-got-right-bracket"))
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-closing-tag-but-got-eof"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "</"})
+            self.tokenQueue.append(ParseError("expected-closing-tag-but-got-eof"))
+            self.tokenQueue.append(Characters("</"))
             self.state = self.dataState
         else:
             # XXX data can be _'_...
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-closing-tag-but-got-char",
-                                    "datavars": {"data": data}})
+            self.tokenQueue.append(ParseError("expected-closing-tag-but-got-char", datavars={"data": data}))
             self.stream.unget(data)
             self.state = self.bogusCommentState
         return True
@@ -438,17 +455,15 @@ def tagNameState(self):
         elif data == ">":
             self.emitCurrentToken()
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-tag-name"})
+            self.tokenQueue.append(ParseError("eof-in-tag-name"))
             self.state = self.dataState
         elif data == "/":
             self.state = self.selfClosingStartTagState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["name"] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.name += "\uFFFD"
         else:
-            self.currentToken["name"] += data
+            self.currentToken.name += data.translate(asciiUpper2Lower)
             # (Don't use charsUntil here, because tag names are
             # very short and it's faster to not do anything fancy)
         return True
@@ -459,7 +474,7 @@ def rcdataLessThanSignState(self):
             self.temporaryBuffer = ""
             self.state = self.rcdataEndTagOpenState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<"})
+            self.tokenQueue.append(Characters("<"))
             self.stream.unget(data)
             self.state = self.rcdataState
         return True
@@ -470,35 +485,29 @@ def rcdataEndTagOpenState(self):
             self.temporaryBuffer += data
             self.state = self.rcdataEndTagNameState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "</"})
+            self.tokenQueue.append(Characters("</"))
             self.stream.unget(data)
             self.state = self.rcdataState
         return True
 
     def rcdataEndTagNameState(self):
-        appropriate = self.currentToken and self.currentToken["name"].lower() == self.temporaryBuffer.lower()
+        name = self.temporaryBuffer.translate(asciiUpper2Lower)
+        appropriate = self.currentToken and self.currentToken.name == name
         data = self.stream.char()
         if data in spaceCharacters and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.state = self.beforeAttributeNameState
         elif data == "/" and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.state = self.selfClosingStartTagState
         elif data == ">" and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.emitCurrentToken()
             self.state = self.dataState
         elif data in asciiLetters:
             self.temporaryBuffer += data
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "</" + self.temporaryBuffer})
+            self.tokenQueue.append(Characters("</" + self.temporaryBuffer))
             self.stream.unget(data)
             self.state = self.rcdataState
         return True
@@ -509,7 +518,7 @@ def rawtextLessThanSignState(self):
             self.temporaryBuffer = ""
             self.state = self.rawtextEndTagOpenState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<"})
+            self.tokenQueue.append(Characters("<"))
             self.stream.unget(data)
             self.state = self.rawtextState
         return True
@@ -520,35 +529,29 @@ def rawtextEndTagOpenState(self):
             self.temporaryBuffer += data
             self.state = self.rawtextEndTagNameState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "</"})
+            self.tokenQueue.append(Characters("</"))
             self.stream.unget(data)
             self.state = self.rawtextState
         return True
 
     def rawtextEndTagNameState(self):
-        appropriate = self.currentToken and self.currentToken["name"].lower() == self.temporaryBuffer.lower()
+        name = self.temporaryBuffer.translate(asciiUpper2Lower)
+        appropriate = self.currentToken and self.currentToken.name == name
         data = self.stream.char()
         if data in spaceCharacters and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.state = self.beforeAttributeNameState
         elif data == "/" and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.state = self.selfClosingStartTagState
         elif data == ">" and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.emitCurrentToken()
             self.state = self.dataState
         elif data in asciiLetters:
             self.temporaryBuffer += data
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "</" + self.temporaryBuffer})
+            self.tokenQueue.append(Characters("</" + self.temporaryBuffer))
             self.stream.unget(data)
             self.state = self.rawtextState
         return True
@@ -559,10 +562,10 @@ def scriptDataLessThanSignState(self):
             self.temporaryBuffer = ""
             self.state = self.scriptDataEndTagOpenState
         elif data == "!":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<!"})
+            self.tokenQueue.append(Characters("<!"))
             self.state = self.scriptDataEscapeStartState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<"})
+            self.tokenQueue.append(Characters("<"))
             self.stream.unget(data)
             self.state = self.scriptDataState
         return True
@@ -573,35 +576,29 @@ def scriptDataEndTagOpenState(self):
             self.temporaryBuffer += data
             self.state = self.scriptDataEndTagNameState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "</"})
+            self.tokenQueue.append(Characters("</"))
             self.stream.unget(data)
             self.state = self.scriptDataState
         return True
 
     def scriptDataEndTagNameState(self):
-        appropriate = self.currentToken and self.currentToken["name"].lower() == self.temporaryBuffer.lower()
+        name = self.temporaryBuffer.translate(asciiUpper2Lower)
+        appropriate = self.currentToken and self.currentToken.name == name
         data = self.stream.char()
         if data in spaceCharacters and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.state = self.beforeAttributeNameState
         elif data == "/" and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.state = self.selfClosingStartTagState
         elif data == ">" and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.emitCurrentToken()
             self.state = self.dataState
         elif data in asciiLetters:
             self.temporaryBuffer += data
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "</" + self.temporaryBuffer})
+            self.tokenQueue.append(Characters("</" + self.temporaryBuffer))
             self.stream.unget(data)
             self.state = self.scriptDataState
         return True
@@ -609,7 +606,7 @@ def scriptDataEndTagNameState(self):
     def scriptDataEscapeStartState(self):
         data = self.stream.char()
         if data == "-":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "-"})
+            self.tokenQueue.append(Characters("-"))
             self.state = self.scriptDataEscapeStartDashState
         else:
             self.stream.unget(data)
@@ -619,7 +616,7 @@ def scriptDataEscapeStartState(self):
     def scriptDataEscapeStartDashState(self):
         data = self.stream.char()
         if data == "-":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "-"})
+            self.tokenQueue.append(Characters("-"))
             self.state = self.scriptDataEscapedDashDashState
         else:
             self.stream.unget(data)
@@ -629,62 +626,55 @@ def scriptDataEscapeStartDashState(self):
     def scriptDataEscapedState(self):
         data = self.stream.char()
         if data == "-":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "-"})
+            self.tokenQueue.append(Characters("-"))
             self.state = self.scriptDataEscapedDashState
         elif data == "<":
             self.state = self.scriptDataEscapedLessThanSignState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
         elif data == EOF:
             self.state = self.dataState
         else:
             chars = self.stream.charsUntil(("<", "-", "\u0000"))
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data":
-                                    data + chars})
+            self.tokenQueue.append(Characters(data + chars))
         return True
 
     def scriptDataEscapedDashState(self):
         data = self.stream.char()
         if data == "-":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "-"})
+            self.tokenQueue.append(Characters("-"))
             self.state = self.scriptDataEscapedDashDashState
         elif data == "<":
             self.state = self.scriptDataEscapedLessThanSignState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
             self.state = self.scriptDataEscapedState
         elif data == EOF:
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
             self.state = self.scriptDataEscapedState
         return True
 
     def scriptDataEscapedDashDashState(self):
         data = self.stream.char()
         if data == "-":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "-"})
+            self.tokenQueue.append(Characters("-"))
         elif data == "<":
             self.state = self.scriptDataEscapedLessThanSignState
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": ">"})
+            self.tokenQueue.append(Characters(">"))
             self.state = self.scriptDataState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
             self.state = self.scriptDataEscapedState
         elif data == EOF:
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
             self.state = self.scriptDataEscapedState
         return True
 
@@ -694,11 +684,11 @@ def scriptDataEscapedLessThanSignState(self):
             self.temporaryBuffer = ""
             self.state = self.scriptDataEscapedEndTagOpenState
         elif data in asciiLetters:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<" + data})
+            self.tokenQueue.append(Characters("<" + data))
             self.temporaryBuffer = data
             self.state = self.scriptDataDoubleEscapeStartState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<"})
+            self.tokenQueue.append(Characters("<"))
             self.stream.unget(data)
             self.state = self.scriptDataEscapedState
         return True
@@ -709,35 +699,29 @@ def scriptDataEscapedEndTagOpenState(self):
             self.temporaryBuffer = data
             self.state = self.scriptDataEscapedEndTagNameState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "</"})
+            self.tokenQueue.append(Characters("</"))
             self.stream.unget(data)
             self.state = self.scriptDataEscapedState
         return True
 
     def scriptDataEscapedEndTagNameState(self):
-        appropriate = self.currentToken and self.currentToken["name"].lower() == self.temporaryBuffer.lower()
+        name = self.temporaryBuffer.translate(asciiUpper2Lower)
+        appropriate = self.currentToken and self.currentToken.name == name
         data = self.stream.char()
         if data in spaceCharacters and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.state = self.beforeAttributeNameState
         elif data == "/" and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.state = self.selfClosingStartTagState
         elif data == ">" and appropriate:
-            self.currentToken = {"type": tokenTypes["EndTag"],
-                                 "name": self.temporaryBuffer,
-                                 "data": [], "selfClosing": False}
+            self.currentToken = EndTag(name=name)
             self.emitCurrentToken()
             self.state = self.dataState
         elif data in asciiLetters:
             self.temporaryBuffer += data
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "</" + self.temporaryBuffer})
+            self.tokenQueue.append(Characters("</" + self.temporaryBuffer))
             self.stream.unget(data)
             self.state = self.scriptDataEscapedState
         return True
@@ -745,13 +729,13 @@ def scriptDataEscapedEndTagNameState(self):
     def scriptDataDoubleEscapeStartState(self):
         data = self.stream.char()
         if data in (spaceCharacters | frozenset(("/", ">"))):
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
             if self.temporaryBuffer.lower() == "script":
                 self.state = self.scriptDataDoubleEscapedState
             else:
                 self.state = self.scriptDataEscapedState
         elif data in asciiLetters:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
             self.temporaryBuffer += data
         else:
             self.stream.unget(data)
@@ -761,76 +745,67 @@ def scriptDataDoubleEscapeStartState(self):
     def scriptDataDoubleEscapedState(self):
         data = self.stream.char()
         if data == "-":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "-"})
+            self.tokenQueue.append(Characters("-"))
             self.state = self.scriptDataDoubleEscapedDashState
         elif data == "<":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<"})
+            self.tokenQueue.append(Characters("<"))
             self.state = self.scriptDataDoubleEscapedLessThanSignState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
         elif data == EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-script-in-script"})
+            self.tokenQueue.append(ParseError("eof-in-script-in-script"))
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
         return True
 
     def scriptDataDoubleEscapedDashState(self):
         data = self.stream.char()
         if data == "-":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "-"})
+            self.tokenQueue.append(Characters("-"))
             self.state = self.scriptDataDoubleEscapedDashDashState
         elif data == "<":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<"})
+            self.tokenQueue.append(Characters("<"))
             self.state = self.scriptDataDoubleEscapedLessThanSignState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
             self.state = self.scriptDataDoubleEscapedState
         elif data == EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-script-in-script"})
+            self.tokenQueue.append(ParseError("eof-in-script-in-script"))
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
             self.state = self.scriptDataDoubleEscapedState
         return True
 
     def scriptDataDoubleEscapedDashDashState(self):
         data = self.stream.char()
         if data == "-":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "-"})
+            self.tokenQueue.append(Characters("-"))
         elif data == "<":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "<"})
+            self.tokenQueue.append(Characters("<"))
             self.state = self.scriptDataDoubleEscapedLessThanSignState
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": ">"})
+            self.tokenQueue.append(Characters(">"))
             self.state = self.scriptDataState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": "\uFFFD"})
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.tokenQueue.append(Characters("\uFFFD"))
             self.state = self.scriptDataDoubleEscapedState
         elif data == EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-script-in-script"})
+            self.tokenQueue.append(ParseError("eof-in-script-in-script"))
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
             self.state = self.scriptDataDoubleEscapedState
         return True
 
     def scriptDataDoubleEscapedLessThanSignState(self):
         data = self.stream.char()
         if data == "/":
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": "/"})
+            self.tokenQueue.append(Characters("/"))
             self.temporaryBuffer = ""
             self.state = self.scriptDataDoubleEscapeEndState
         else:
@@ -841,13 +816,13 @@ def scriptDataDoubleEscapedLessThanSignState(self):
     def scriptDataDoubleEscapeEndState(self):
         data = self.stream.char()
         if data in (spaceCharacters | frozenset(("/", ">"))):
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
             if self.temporaryBuffer.lower() == "script":
                 self.state = self.scriptDataEscapedState
             else:
                 self.state = self.scriptDataDoubleEscapedState
         elif data in asciiLetters:
-            self.tokenQueue.append({"type": tokenTypes["Characters"], "data": data})
+            self.tokenQueue.append(Characters(data))
             self.temporaryBuffer += data
         else:
             self.stream.unget(data)
@@ -859,83 +834,55 @@ def beforeAttributeNameState(self):
         if data in spaceCharacters:
             self.stream.charsUntil(spaceCharacters, True)
         elif data in asciiLetters:
-            self.currentToken["data"].append([data, ""])
+            self.currentToken.flushAttribute()
+            self.currentToken.accumulateAttributeName(data)
             self.state = self.attributeNameState
         elif data == ">":
             self.emitCurrentToken()
         elif data == "/":
             self.state = self.selfClosingStartTagState
         elif data in ("'", '"', "=", "<"):
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "invalid-character-in-attribute-name"})
-            self.currentToken["data"].append([data, ""])
+            self.tokenQueue.append(ParseError("invalid-character-in-attribute-name"))
+            self.currentToken.flushAttribute()
+            self.currentToken.accumulateAttributeName(data)
             self.state = self.attributeNameState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"].append(["\uFFFD", ""])
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.flushAttribute()
+            self.currentToken.accumulateAttributeName("\uFFFD")
             self.state = self.attributeNameState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-attribute-name-but-got-eof"})
+            self.tokenQueue.append(ParseError("expected-attribute-name-but-got-eof"))
             self.state = self.dataState
         else:
-            self.currentToken["data"].append([data, ""])
+            self.currentToken.flushAttribute()
+            self.currentToken.accumulateAttributeName(data)
             self.state = self.attributeNameState
         return True
 
     def attributeNameState(self):
         data = self.stream.char()
-        leavingThisState = True
-        emitToken = False
         if data == "=":
             self.state = self.beforeAttributeValueState
         elif data in asciiLetters:
-            self.currentToken["data"][-1][0] += data +\
-                self.stream.charsUntil(asciiLetters, True)
-            leavingThisState = False
+            self.currentToken.accumulateAttributeName(data)
         elif data == ">":
-            # XXX If we emit here the attributes are converted to a dict
-            # without being checked and when the code below runs we error
-            # because data is a dict not a list
-            emitToken = True
+            self.emitCurrentToken()
         elif data in spaceCharacters:
             self.state = self.afterAttributeNameState
         elif data == "/":
             self.state = self.selfClosingStartTagState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"][-1][0] += "\uFFFD"
-            leavingThisState = False
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.accumulateAttributeName("\uFFFD")
         elif data in ("'", '"', "<"):
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data":
-                                    "invalid-character-in-attribute-name"})
-            self.currentToken["data"][-1][0] += data
-            leavingThisState = False
+            self.tokenQueue.append(ParseError("invalid-character-in-attribute-name"))
+            self.currentToken.accumulateAttributeName(data)
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "eof-in-attribute-name"})
+            self.tokenQueue.append(ParseError("eof-in-attribute-name"))
             self.state = self.dataState
         else:
-            self.currentToken["data"][-1][0] += data
-            leavingThisState = False
-
-        if leavingThisState:
-            # Attributes are not dropped at this stage. That happens when the
-            # start tag token is emitted so values can still be safely appended
-            # to attributes, but we do want to report the parse error in time.
-            self.currentToken["data"][-1][0] = (
-                self.currentToken["data"][-1][0].translate(asciiUpper2Lower))
-            for name, _ in self.currentToken["data"][:-1]:
-                if self.currentToken["data"][-1][0] == name:
-                    self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                            "duplicate-attribute"})
-                    break
-            # XXX Fix for above XXX
-            if emitToken:
-                self.emitCurrentToken()
+            self.currentToken.accumulateAttributeName(data)
         return True
 
     def afterAttributeNameState(self):
@@ -947,26 +894,27 @@ def afterAttributeNameState(self):
         elif data == ">":
             self.emitCurrentToken()
         elif data in asciiLetters:
-            self.currentToken["data"].append([data, ""])
+            self.currentToken.flushAttribute()
+            self.currentToken.accumulateAttributeName(data)
             self.state = self.attributeNameState
         elif data == "/":
             self.state = self.selfClosingStartTagState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"].append(["\uFFFD", ""])
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.flushAttribute()
+            self.currentToken.accumulateAttributeName("\uFFFD")
             self.state = self.attributeNameState
         elif data in ("'", '"', "<"):
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "invalid-character-after-attribute-name"})
-            self.currentToken["data"].append([data, ""])
+            self.tokenQueue.append(ParseError("invalid-character-after-attribute-name"))
+            self.currentToken.flushAttribute()
+            self.currentToken.accumulateAttributeName(data)
             self.state = self.attributeNameState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-end-of-tag-but-got-eof"})
+            self.tokenQueue.append(ParseError("expected-end-of-tag-but-got-eof"))
             self.state = self.dataState
         else:
-            self.currentToken["data"].append([data, ""])
+            self.currentToken.flushAttribute()
+            self.currentToken.accumulateAttributeName(data)
             self.state = self.attributeNameState
         return True
 
@@ -982,25 +930,21 @@ def beforeAttributeValueState(self):
         elif data == "'":
             self.state = self.attributeValueSingleQuotedState
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-attribute-value-but-got-right-bracket"})
+            self.tokenQueue.append(ParseError("expected-attribute-value-but-got-right-bracket"))
             self.emitCurrentToken()
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"][-1][1] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.accumulateAttributeValue("\uFFFD")
             self.state = self.attributeValueUnQuotedState
         elif data in ("=", "<", "`"):
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "equals-in-unquoted-attribute-value"})
-            self.currentToken["data"][-1][1] += data
+            self.tokenQueue.append(ParseError("equals-in-unquoted-attribute-value"))
+            self.currentToken.accumulateAttributeValue(data)
             self.state = self.attributeValueUnQuotedState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-attribute-value-but-got-eof"})
+            self.tokenQueue.append(ParseError("expected-attribute-value-but-got-eof"))
             self.state = self.dataState
         else:
-            self.currentToken["data"][-1][1] += data
+            self.currentToken.accumulateAttributeValue(data)
             self.state = self.attributeValueUnQuotedState
         return True
 
@@ -1011,16 +955,13 @@ def attributeValueDoubleQuotedState(self):
         elif data == "&":
             self.processEntityInAttribute('"')
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"][-1][1] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.accumulateAttributeValue("\uFFFD")
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-attribute-value-double-quote"})
+            self.tokenQueue.append(ParseError("eof-in-attribute-value-double-quote"))
             self.state = self.dataState
         else:
-            self.currentToken["data"][-1][1] += data +\
-                self.stream.charsUntil(("\"", "&", "\u0000"))
+            self.currentToken.accumulateAttributeValue(data + self.stream.charsUntil(("\"", "&", "\u0000")))
         return True
 
     def attributeValueSingleQuotedState(self):
@@ -1030,16 +971,13 @@ def attributeValueSingleQuotedState(self):
         elif data == "&":
             self.processEntityInAttribute("'")
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"][-1][1] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.accumulateAttributeValue("\uFFFD")
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-attribute-value-single-quote"})
+            self.tokenQueue.append(ParseError("eof-in-attribute-value-single-quote"))
             self.state = self.dataState
         else:
-            self.currentToken["data"][-1][1] += data +\
-                self.stream.charsUntil(("'", "&", "\u0000"))
+            self.currentToken.accumulateAttributeValue(data + self.stream.charsUntil(("'", "&", "\u0000")))
         return True
 
     def attributeValueUnQuotedState(self):
@@ -1051,20 +989,17 @@ def attributeValueUnQuotedState(self):
         elif data == ">":
             self.emitCurrentToken()
         elif data in ('"', "'", "=", "<", "`"):
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-character-in-unquoted-attribute-value"})
-            self.currentToken["data"][-1][1] += data
+            self.tokenQueue.append(ParseError("unexpected-character-in-unquoted-attribute-value"))
+            self.currentToken.accumulateAttributeValue(data)
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"][-1][1] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.accumulateAttributeValue("\uFFFD")
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-attribute-value-no-quotes"})
+            self.tokenQueue.append(ParseError("eof-in-attribute-value-no-quotes"))
             self.state = self.dataState
         else:
-            self.currentToken["data"][-1][1] += data + self.stream.charsUntil(
-                frozenset(("&", ">", '"', "'", "=", "<", "`", "\u0000")) | spaceCharacters)
+            self.currentToken.accumulateAttributeValue(data + self.stream.charsUntil(
+                frozenset(("&", ">", '"', "'", "=", "<", "`", "\u0000")) | spaceCharacters))
         return True
 
     def afterAttributeValueState(self):
@@ -1076,13 +1011,11 @@ def afterAttributeValueState(self):
         elif data == "/":
             self.state = self.selfClosingStartTagState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-EOF-after-attribute-value"})
+            self.tokenQueue.append(ParseError("unexpected-EOF-after-attribute-value"))
             self.stream.unget(data)
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-character-after-attribute-value"})
+            self.tokenQueue.append(ParseError("unexpected-character-after-attribute-value"))
             self.stream.unget(data)
             self.state = self.beforeAttributeNameState
         return True
@@ -1090,17 +1023,14 @@ def afterAttributeValueState(self):
     def selfClosingStartTagState(self):
         data = self.stream.char()
         if data == ">":
-            self.currentToken["selfClosing"] = True
+            self.currentToken.self_closing = True
             self.emitCurrentToken()
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data":
-                                    "unexpected-EOF-after-solidus-in-tag"})
+            self.tokenQueue.append(ParseError("unexpected-EOF-after-solidus-in-tag"))
             self.stream.unget(data)
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-character-after-solidus-in-tag"})
+            self.tokenQueue.append(ParseError("unexpected-character-after-solidus-in-tag"))
             self.stream.unget(data)
             self.state = self.beforeAttributeNameState
         return True
@@ -1111,8 +1041,7 @@ def bogusCommentState(self):
         # and emit it.
         data = self.stream.charsUntil(">")
         data = data.replace("\u0000", "\uFFFD")
-        self.tokenQueue.append(
-            {"type": tokenTypes["Comment"], "data": data})
+        self.tokenQueue.append(Comment(data))
 
         # Eat the character directly after the bogus comment which is either a
         # ">" or an EOF.
@@ -1125,7 +1054,7 @@ def markupDeclarationOpenState(self):
         if charStack[-1] == "-":
             charStack.append(self.stream.char())
             if charStack[-1] == "-":
-                self.currentToken = {"type": tokenTypes["Comment"], "data": ""}
+                self.currentToken = Comment("")
                 self.state = self.commentStartState
                 return True
         elif charStack[-1] in ('d', 'D'):
@@ -1137,10 +1066,7 @@ def markupDeclarationOpenState(self):
                     matched = False
                     break
             if matched:
-                self.currentToken = {"type": tokenTypes["Doctype"],
-                                     "name": "",
-                                     "publicId": None, "systemId": None,
-                                     "correct": True}
+                self.currentToken = Doctype(name="", publicId=None, systemId=None, correct=True)
                 self.state = self.doctypeState
                 return True
         elif (charStack[-1] == "[" and
@@ -1157,8 +1083,7 @@ def markupDeclarationOpenState(self):
                 self.state = self.cdataSectionState
                 return True
 
-        self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                "expected-dashes-or-doctype"})
+        self.tokenQueue.append(ParseError("expected-dashes-or-doctype"))
 
         while charStack:
             self.stream.unget(charStack.pop())
@@ -1170,21 +1095,18 @@ def commentStartState(self):
         if data == "-":
             self.state = self.commentStartDashState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.data += "\uFFFD"
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "incorrect-comment"})
+            self.tokenQueue.append(ParseError("incorrect-comment"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-comment"})
+            self.tokenQueue.append(ParseError("eof-in-comment"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["data"] += data
+            self.currentToken.data += data
             self.state = self.commentState
         return True
 
@@ -1193,21 +1115,18 @@ def commentStartDashState(self):
         if data == "-":
             self.state = self.commentEndState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"] += "-\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.data += "-\uFFFD"
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "incorrect-comment"})
+            self.tokenQueue.append(ParseError("incorrect-comment"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-comment"})
+            self.tokenQueue.append(ParseError("eof-in-comment"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["data"] += "-" + data
+            self.currentToken.data += "-" + data
             self.state = self.commentState
         return True
 
@@ -1216,16 +1135,14 @@ def commentState(self):
         if data == "-":
             self.state = self.commentEndDashState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.data += "\uFFFD"
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "eof-in-comment"})
+            self.tokenQueue.append(ParseError("eof-in-comment"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["data"] += data + \
+            self.currentToken.data += data + \
                 self.stream.charsUntil(("-", "\u0000"))
         return True
 
@@ -1234,17 +1151,15 @@ def commentEndDashState(self):
         if data == "-":
             self.state = self.commentEndState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"] += "-\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.data += "-\uFFFD"
             self.state = self.commentState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-comment-end-dash"})
+            self.tokenQueue.append(ParseError("eof-in-comment-end-dash"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["data"] += "-" + data
+            self.currentToken.data += "-" + data
             self.state = self.commentState
         return True
 
@@ -1254,28 +1169,23 @@ def commentEndState(self):
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"] += "--\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.data += "--\uFFFD"
             self.state = self.commentState
         elif data == "!":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-bang-after-double-dash-in-comment"})
+            self.tokenQueue.append(ParseError("unexpected-bang-after-double-dash-in-comment"))
             self.state = self.commentEndBangState
         elif data == "-":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-dash-after-double-dash-in-comment"})
-            self.currentToken["data"] += data
+            self.tokenQueue.append(ParseError("unexpected-dash-after-double-dash-in-comment"))
+            self.currentToken.data += data
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-comment-double-dash"})
+            self.tokenQueue.append(ParseError("eof-in-comment-double-dash"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
             # XXX
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-comment"})
-            self.currentToken["data"] += "--" + data
+            self.tokenQueue.append(ParseError("unexpected-char-in-comment"))
+            self.currentToken.data += "--" + data
             self.state = self.commentState
         return True
 
@@ -1285,20 +1195,18 @@ def commentEndBangState(self):
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data == "-":
-            self.currentToken["data"] += "--!"
+            self.currentToken.data += "--!"
             self.state = self.commentEndDashState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["data"] += "--!\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.data += "--!\uFFFD"
             self.state = self.commentState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-comment-end-bang-state"})
+            self.tokenQueue.append(ParseError("eof-in-comment-end-bang-state"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["data"] += "--!" + data
+            self.currentToken.data += "--!" + data
             self.state = self.commentState
         return True
 
@@ -1307,14 +1215,12 @@ def doctypeState(self):
         if data in spaceCharacters:
             self.state = self.beforeDoctypeNameState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-doctype-name-but-got-eof"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("expected-doctype-name-but-got-eof"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "need-space-after-doctype"})
+            self.tokenQueue.append(ParseError("need-space-after-doctype"))
             self.stream.unget(data)
             self.state = self.beforeDoctypeNameState
         return True
@@ -1324,50 +1230,42 @@ def beforeDoctypeNameState(self):
         if data in spaceCharacters:
             pass
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-doctype-name-but-got-right-bracket"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("expected-doctype-name-but-got-right-bracket"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["name"] = "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.name = "\uFFFD"
             self.state = self.doctypeNameState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-doctype-name-but-got-eof"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("expected-doctype-name-but-got-eof"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["name"] = data
+            self.currentToken.name = data.translate(asciiUpper2Lower)
             self.state = self.doctypeNameState
         return True
 
     def doctypeNameState(self):
         data = self.stream.char()
         if data in spaceCharacters:
-            self.currentToken["name"] = self.currentToken["name"].translate(asciiUpper2Lower)
             self.state = self.afterDoctypeNameState
         elif data == ">":
-            self.currentToken["name"] = self.currentToken["name"].translate(asciiUpper2Lower)
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["name"] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.name += "\uFFFD"
             self.state = self.doctypeNameState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype-name"})
-            self.currentToken["correct"] = False
-            self.currentToken["name"] = self.currentToken["name"].translate(asciiUpper2Lower)
+            self.tokenQueue.append(ParseError("eof-in-doctype-name"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["name"] += data
+            self.currentToken.name += data.translate(asciiUpper2Lower)
         return True
 
     def afterDoctypeNameState(self):
@@ -1378,10 +1276,9 @@ def afterDoctypeNameState(self):
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.currentToken["correct"] = False
+            self.currentToken.correct = False
             self.stream.unget(data)
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
@@ -1413,10 +1310,8 @@ def afterDoctypeNameState(self):
             # discarded; only the latest character might be '>' or EOF
             # and needs to be ungetted
             self.stream.unget(data)
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "expected-space-or-right-bracket-in-doctype", "datavars":
-                                    {"data": data}})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("expected-space-or-right-bracket-in-doctype", datavars={"data": data}))
+            self.currentToken.correct = False
             self.state = self.bogusDoctypeState
 
         return True
@@ -1426,14 +1321,12 @@ def afterDoctypePublicKeywordState(self):
         if data in spaceCharacters:
             self.state = self.beforeDoctypePublicIdentifierState
         elif data in ("'", '"'):
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
             self.stream.unget(data)
             self.state = self.beforeDoctypePublicIdentifierState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
@@ -1446,27 +1339,24 @@ def beforeDoctypePublicIdentifierState(self):
         if data in spaceCharacters:
             pass
         elif data == "\"":
-            self.currentToken["publicId"] = ""
+            self.currentToken.publicId = ""
             self.state = self.doctypePublicIdentifierDoubleQuotedState
         elif data == "'":
-            self.currentToken["publicId"] = ""
+            self.currentToken.publicId = ""
             self.state = self.doctypePublicIdentifierSingleQuotedState
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-end-of-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-end-of-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
+            self.currentToken.correct = False
             self.state = self.bogusDoctypeState
         return True
 
@@ -1475,23 +1365,20 @@ def doctypePublicIdentifierDoubleQuotedState(self):
         if data == "\"":
             self.state = self.afterDoctypePublicIdentifierState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["publicId"] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.publicId += "\uFFFD"
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-end-of-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-end-of-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["publicId"] += data
+            self.currentToken.publicId += data
         return True
 
     def doctypePublicIdentifierSingleQuotedState(self):
@@ -1499,23 +1386,20 @@ def doctypePublicIdentifierSingleQuotedState(self):
         if data == "'":
             self.state = self.afterDoctypePublicIdentifierState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["publicId"] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.publicId += "\uFFFD"
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-end-of-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-end-of-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["publicId"] += data
+            self.currentToken.publicId += data
         return True
 
     def afterDoctypePublicIdentifierState(self):
@@ -1526,25 +1410,21 @@ def afterDoctypePublicIdentifierState(self):
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data == '"':
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
-            self.currentToken["systemId"] = ""
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
+            self.currentToken.systemId = ""
             self.state = self.doctypeSystemIdentifierDoubleQuotedState
         elif data == "'":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
-            self.currentToken["systemId"] = ""
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
+            self.currentToken.systemId = ""
             self.state = self.doctypeSystemIdentifierSingleQuotedState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
+            self.currentToken.correct = False
             self.state = self.bogusDoctypeState
         return True
 
@@ -1556,21 +1436,19 @@ def betweenDoctypePublicAndSystemIdentifiersState(self):
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data == '"':
-            self.currentToken["systemId"] = ""
+            self.currentToken.systemId = ""
             self.state = self.doctypeSystemIdentifierDoubleQuotedState
         elif data == "'":
-            self.currentToken["systemId"] = ""
+            self.currentToken.systemId = ""
             self.state = self.doctypeSystemIdentifierSingleQuotedState
         elif data == EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
+            self.currentToken.correct = False
             self.state = self.bogusDoctypeState
         return True
 
@@ -1579,14 +1457,12 @@ def afterDoctypeSystemKeywordState(self):
         if data in spaceCharacters:
             self.state = self.beforeDoctypeSystemIdentifierState
         elif data in ("'", '"'):
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
             self.stream.unget(data)
             self.state = self.beforeDoctypeSystemIdentifierState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
@@ -1599,27 +1475,24 @@ def beforeDoctypeSystemIdentifierState(self):
         if data in spaceCharacters:
             pass
         elif data == "\"":
-            self.currentToken["systemId"] = ""
+            self.currentToken.systemId = ""
             self.state = self.doctypeSystemIdentifierDoubleQuotedState
         elif data == "'":
-            self.currentToken["systemId"] = ""
+            self.currentToken.systemId = ""
             self.state = self.doctypeSystemIdentifierSingleQuotedState
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
+            self.currentToken.correct = False
             self.state = self.bogusDoctypeState
         return True
 
@@ -1628,23 +1501,20 @@ def doctypeSystemIdentifierDoubleQuotedState(self):
         if data == "\"":
             self.state = self.afterDoctypeSystemIdentifierState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["systemId"] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.systemId += "\uFFFD"
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-end-of-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-end-of-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["systemId"] += data
+            self.currentToken.systemId += data
         return True
 
     def doctypeSystemIdentifierSingleQuotedState(self):
@@ -1652,23 +1522,20 @@ def doctypeSystemIdentifierSingleQuotedState(self):
         if data == "'":
             self.state = self.afterDoctypeSystemIdentifierState
         elif data == "\u0000":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                    "data": "invalid-codepoint"})
-            self.currentToken["systemId"] += "\uFFFD"
+            self.tokenQueue.append(ParseError("invalid-codepoint"))
+            self.currentToken.systemId += "\uFFFD"
         elif data == ">":
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-end-of-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("unexpected-end-of-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.currentToken["systemId"] += data
+            self.currentToken.systemId += data
         return True
 
     def afterDoctypeSystemIdentifierState(self):
@@ -1679,14 +1546,12 @@ def afterDoctypeSystemIdentifierState(self):
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         elif data is EOF:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "eof-in-doctype"})
-            self.currentToken["correct"] = False
+            self.tokenQueue.append(ParseError("eof-in-doctype"))
+            self.currentToken.correct = False
             self.tokenQueue.append(self.currentToken)
             self.state = self.dataState
         else:
-            self.tokenQueue.append({"type": tokenTypes["ParseError"], "data":
-                                    "unexpected-char-in-doctype"})
+            self.tokenQueue.append(ParseError("unexpected-char-in-doctype"))
             self.state = self.bogusDoctypeState
         return True
 
@@ -1725,11 +1590,9 @@ def cdataSectionState(self):
         nullCount = data.count("\u0000")
         if nullCount > 0:
             for _ in range(nullCount):
-                self.tokenQueue.append({"type": tokenTypes["ParseError"],
-                                        "data": "invalid-codepoint"})
+                self.tokenQueue.append(ParseError("invalid-codepoint"))
             data = data.replace("\u0000", "\uFFFD")
         if data:
-            self.tokenQueue.append({"type": tokenTypes["Characters"],
-                                    "data": data})
+            self.tokenQueue.append(Characters(data))
         self.state = self.dataState
         return True
diff --git a/html5lib/constants.py b/html5lib/constants.py
index fe3e237c..9f89d616 100644
--- a/html5lib/constants.py
+++ b/html5lib/constants.py
@@ -2918,20 +2918,6 @@
     0x9F: "\u0178",
 }
 
-tokenTypes = {
-    "Doctype": 0,
-    "Characters": 1,
-    "SpaceCharacters": 2,
-    "StartTag": 3,
-    "EndTag": 4,
-    "EmptyTag": 5,
-    "Comment": 6,
-    "ParseError": 7
-}
-
-tagTokenTypes = frozenset([tokenTypes["StartTag"], tokenTypes["EndTag"],
-                           tokenTypes["EmptyTag"]])
-
 
 prefixes = {v: k for k, v in namespaces.items()}
 prefixes["http://www.w3.org/1998/Math/MathML"] = "math"
diff --git a/html5lib/html5parser.py b/html5lib/html5parser.py
index 74d829d9..159b04cf 100644
--- a/html5lib/html5parser.py
+++ b/html5lib/html5parser.py
@@ -4,7 +4,18 @@
 import types
 
 from . import _inputstream
-from . import _tokenizer
+from ._tokenizer import (
+    attributeMap,
+    HTMLTokenizer,
+    Characters,
+    SpaceCharacters,
+    StartTag,
+    EndTag,
+    Comment,
+    Doctype,
+    ParseError as TokenizerParseError,
+    Tag,
+)
 
 from . import treebuilders
 from .treebuilders.base import Marker
@@ -13,7 +24,6 @@
 from .constants import (
     spaceCharacters, asciiUpper2Lower,
     specialElements, headingElements, cdataElements, rcdataElements,
-    tokenTypes, tagTokenTypes,
     namespaces,
     htmlIntegrationPointElements, mathmlTextIntegrationPointElements,
     adjustForeignAttributes as adjustForeignAttributesMap,
@@ -126,7 +136,7 @@ def _parse(self, stream, innerHTML=False, container="div", scripting=False, **kw
         self.innerHTMLMode = innerHTML
         self.container = container
         self.scripting = scripting
-        self.tokenizer = _tokenizer.HTMLTokenizer(stream, parser=self, **kwargs)
+        self.tokenizer = HTMLTokenizer(stream, parser=self, **kwargs)
         self.reset()
 
         try:
@@ -193,13 +203,6 @@ def isMathMLTextIntegrationPoint(self, element):
         return (element.namespace, element.name) in mathmlTextIntegrationPointElements
 
     def mainLoop(self):
-        CharactersToken = tokenTypes["Characters"]
-        SpaceCharactersToken = tokenTypes["SpaceCharacters"]
-        StartTagToken = tokenTypes["StartTag"]
-        EndTagToken = tokenTypes["EndTag"]
-        CommentToken = tokenTypes["Comment"]
-        DoctypeToken = tokenTypes["Doctype"]
-        ParseErrorToken = tokenTypes["ParseError"]
 
         for token in self.tokenizer:
             prev_token = None
@@ -210,45 +213,43 @@ def mainLoop(self):
                 currentNodeNamespace = currentNode.namespace if currentNode else None
                 currentNodeName = currentNode.name if currentNode else None
 
-                type = new_token["type"]
-
-                if type == ParseErrorToken:
-                    self.parseError(new_token["data"], new_token.get("datavars", {}))
+                if isinstance(new_token, TokenizerParseError):
+                    self.parseError(new_token.data, new_token.datavars)
                     new_token = None
                 else:
                     if (len(self.tree.openElements) == 0 or
                         currentNodeNamespace == self.tree.defaultNamespace or
                         (self.isMathMLTextIntegrationPoint(currentNode) and
-                         ((type == StartTagToken and
-                           token["name"] not in frozenset(["mglyph", "malignmark"])) or
-                          type in (CharactersToken, SpaceCharactersToken))) or
+                         ((token.__class__ == StartTag and
+                           token.name not in frozenset(["mglyph", "malignmark"])) or
+                          token.__class__ in (Characters, SpaceCharacters))) or
                         (currentNodeNamespace == namespaces["mathml"] and
                          currentNodeName == "annotation-xml" and
-                         type == StartTagToken and
-                         token["name"] == "svg") or
+                         token.__class__ == StartTag and
+                         token.name == "svg") or
                         (self.isHTMLIntegrationPoint(currentNode) and
-                         type in (StartTagToken, CharactersToken, SpaceCharactersToken))):
+                         token.__class__ in (StartTag, Characters, SpaceCharacters))):
                         phase = self.phase
                     else:
                         phase = self.phases["inForeignContent"]
 
-                    if type == CharactersToken:
+                    if isinstance(new_token, Characters):
                         new_token = phase.processCharacters(new_token)
-                    elif type == SpaceCharactersToken:
+                    elif isinstance(new_token, SpaceCharacters):
                         new_token = phase.processSpaceCharacters(new_token)
-                    elif type == StartTagToken:
+                    elif isinstance(new_token, StartTag):
                         new_token = phase.processStartTag(new_token)
-                    elif type == EndTagToken:
+                    elif isinstance(new_token, EndTag):
                         new_token = phase.processEndTag(new_token)
-                    elif type == CommentToken:
+                    elif isinstance(new_token, Comment):
                         new_token = phase.processComment(new_token)
-                    elif type == DoctypeToken:
+                    elif isinstance(new_token, Doctype):
                         new_token = phase.processDoctype(new_token)
 
-            if (type == StartTagToken and prev_token["selfClosing"] and
-                    not prev_token["selfClosingAcknowledged"]):
+            if (isinstance(new_token, StartTag) and prev_token.self_closing and
+                    not prev_token.self_closing_acknowledged):
                 self.parseError("non-void-element-with-trailing-solidus",
-                                {"name": prev_token["name"]})
+                                {"name": prev_token.name})
 
         # When the loop finishes it's EOF
         reprocess = True
@@ -397,14 +398,12 @@ def parseRCDataRawtext(self, token, contentType):
 def getPhases(debug):
     def log(function):
         """Logger that records which phase processes each token"""
-        type_names = {value: key for key, value in tokenTypes.items()}
-
         def wrapped(self, *args, **kwargs):
             if function.__name__.startswith("process") and len(args) > 0:
                 token = args[0]
-                info = {"type": type_names[token['type']]}
-                if token['type'] in tagTokenTypes:
-                    info["name"] = token['name']
+                info = {"type": token.__class__.__name__}
+                if isinstance(token, Tag):
+                    info["name"] = token.name
 
                 self.parser.log.append((self.parser.tokenizer.state.__name__,
                                         self.parser.phase.__class__.__name__,
@@ -446,16 +445,16 @@ def processDoctype(self, token):
             self.parser.parseError("unexpected-doctype")
 
         def processCharacters(self, token):
-            self.tree.insertText(token["data"])
+            self.tree.insertText(token.data)
 
         def processSpaceCharacters(self, token):
-            self.tree.insertText(token["data"])
+            self.tree.insertText(token.data)
 
         def processStartTag(self, token):
             # Note the caching is done here rather than BoundMethodDispatcher as doing it there
             # requires a circular reference to the Phase, and this ends up with a significant
             # (CPython 2.7, 3.8) GC cost when parsing many short inputs
-            name = token["name"]
+            name = token.name
             # In Py2, using `in` is quicker in general than try/except KeyError
             # In Py3, `in` is quicker when there are few cache hits (typically short inputs)
             if name in self.__startTagCache:
@@ -469,11 +468,11 @@ def processStartTag(self, token):
             return func(token)
 
         def startTagHtml(self, token):
-            if not self.parser.firstStartTag and token["name"] == "html":
+            if not self.parser.firstStartTag and token.name == "html":
                 self.parser.parseError("non-html-root")
             # XXX Need a check here to see if the first start tag token emitted is
             # this token... If it's not, invoke self.parser.parseError().
-            for attr, value in token["data"].items():
+            for attr, value in token.attributes.items():
                 if attr not in self.tree.openElements[0].attributes:
                     self.tree.openElements[0].attributes[attr] = value
             self.parser.firstStartTag = False
@@ -482,7 +481,7 @@ def processEndTag(self, token):
             # Note the caching is done here rather than BoundMethodDispatcher as doing it there
             # requires a circular reference to the Phase, and this ends up with a significant
             # (CPython 2.7, 3.8) GC cost when parsing many short inputs
-            name = token["name"]
+            name = token.name
             # In Py2, using `in` is quicker in general than try/except KeyError
             # In Py3, `in` is quicker when there are few cache hits (typically short inputs)
             if name in self.__endTagCache:
@@ -505,10 +504,10 @@ def processComment(self, token):
             self.tree.insertComment(token, self.tree.document)
 
         def processDoctype(self, token):
-            name = token["name"]
-            publicId = token["publicId"]
-            systemId = token["systemId"]
-            correct = token["correct"]
+            name = token.name
+            publicId = token.publicId
+            systemId = token.systemId
+            correct = token.correct
 
             if (name != "html" or publicId is not None or
                     systemId is not None and systemId != "about:legacy-compat"):
@@ -522,7 +521,7 @@ def processDoctype(self, token):
             if publicId != "":
                 publicId = publicId.translate(asciiUpper2Lower)
 
-            if (not correct or token["name"] != "html" or
+            if (not correct or token.name != "html" or
                     publicId.startswith(
                         ("+//silmaril//dtd html pro v0r11 19970101//",
                          "-//advasoft ltd//dtd html 3.0 aswedit + extensions//",
@@ -610,13 +609,13 @@ def processCharacters(self, token):
 
         def processStartTag(self, token):
             self.parser.parseError("expected-doctype-but-got-start-tag",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
             self.anythingElse()
             return token
 
         def processEndTag(self, token):
             self.parser.parseError("expected-doctype-but-got-end-tag",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
             self.anythingElse()
             return token
 
@@ -630,7 +629,7 @@ class BeforeHtmlPhase(Phase):
 
         # helper methods
         def insertHtmlElement(self):
-            self.tree.insertRoot(impliedTagToken("html", "StartTag"))
+            self.tree.insertRoot(impliedTagToken("html", StartTag))
             self.parser.phase = self.parser.phases["beforeHead"]
 
         # other
@@ -649,15 +648,15 @@ def processCharacters(self, token):
             return token
 
         def processStartTag(self, token):
-            if token["name"] == "html":
+            if token.name == "html":
                 self.parser.firstStartTag = True
             self.insertHtmlElement()
             return token
 
         def processEndTag(self, token):
-            if token["name"] not in ("head", "body", "html", "br"):
+            if token.name not in ("head", "body", "html", "br"):
                 self.parser.parseError("unexpected-end-tag-before-html",
-                                       {"name": token["name"]})
+                                       {"name": token.name})
             else:
                 self.insertHtmlElement()
                 return token
@@ -666,14 +665,14 @@ class BeforeHeadPhase(Phase):
         __slots__ = tuple()
 
         def processEOF(self):
-            self.startTagHead(impliedTagToken("head", "StartTag"))
+            self.startTagHead(impliedTagToken("head", StartTag))
             return True
 
         def processSpaceCharacters(self, token):
             pass
 
         def processCharacters(self, token):
-            self.startTagHead(impliedTagToken("head", "StartTag"))
+            self.startTagHead(impliedTagToken("head", StartTag))
             return token
 
         def startTagHtml(self, token):
@@ -685,16 +684,16 @@ def startTagHead(self, token):
             self.parser.phase = self.parser.phases["inHead"]
 
         def startTagOther(self, token):
-            self.startTagHead(impliedTagToken("head", "StartTag"))
+            self.startTagHead(impliedTagToken("head", StartTag))
             return token
 
         def endTagImplyHead(self, token):
-            self.startTagHead(impliedTagToken("head", "StartTag"))
+            self.startTagHead(impliedTagToken("head", StartTag))
             return token
 
         def endTagOther(self, token):
             self.parser.parseError("end-tag-after-implied-root",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         startTagHandler = _utils.MethodDispatcher([
             ("html", startTagHtml),
@@ -728,14 +727,14 @@ def startTagHead(self, token):
         def startTagBaseLinkCommand(self, token):
             self.tree.insertElement(token)
             self.tree.openElements.pop()
-            token["selfClosingAcknowledged"] = True
+            token.self_closing_acknowledged = True
 
         def startTagMeta(self, token):
             self.tree.insertElement(token)
             self.tree.openElements.pop()
-            token["selfClosingAcknowledged"] = True
+            token.self_closing_acknowledged = True
 
-            attributes = token["data"]
+            attributes = token.attributes
             if self.parser.tokenizer.stream.charEncoding[1] == "tentative":
                 if "charset" in attributes:
                     self.parser.tokenizer.stream.changeEncoding(attributes["charset"])
@@ -785,7 +784,7 @@ def endTagHtmlBodyBr(self, token):
             return token
 
         def endTagOther(self, token):
-            self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-end-tag", {"name": token.name})
 
         def anythingElse(self):
             self.endTagHead(impliedTagToken("head"))
@@ -835,10 +834,10 @@ def startTagBaseLinkCommand(self, token):
             return self.parser.phases["inHead"].processStartTag(token)
 
         def startTagHeadNoscript(self, token):
-            self.parser.parseError("unexpected-start-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-start-tag", {"name": token.name})
 
         def startTagOther(self, token):
-            self.parser.parseError("unexpected-inhead-noscript-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-inhead-noscript-tag", {"name": token.name})
             self.anythingElse()
             return token
 
@@ -848,12 +847,12 @@ def endTagNoscript(self, token):
             self.parser.phase = self.parser.phases["inHead"]
 
         def endTagBr(self, token):
-            self.parser.parseError("unexpected-inhead-noscript-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-inhead-noscript-tag", {"name": token.name})
             self.anythingElse()
             return token
 
         def endTagOther(self, token):
-            self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-end-tag", {"name": token.name})
 
         def anythingElse(self):
             # Caller must raise parse error first!
@@ -897,7 +896,7 @@ def startTagFrameset(self, token):
 
         def startTagFromHead(self, token):
             self.parser.parseError("unexpected-start-tag-out-of-my-head",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
             self.tree.openElements.append(self.tree.headPointer)
             self.parser.phases["inHead"].processStartTag(token)
             for node in self.tree.openElements[::-1]:
@@ -906,7 +905,7 @@ def startTagFromHead(self, token):
                     break
 
         def startTagHead(self, token):
-            self.parser.parseError("unexpected-start-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-start-tag", {"name": token.name})
 
         def startTagOther(self, token):
             self.anythingElse()
@@ -917,10 +916,10 @@ def endTagHtmlBodyBr(self, token):
             return token
 
         def endTagOther(self, token):
-            self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-end-tag", {"name": token.name})
 
         def anythingElse(self):
-            self.tree.insertElement(impliedTagToken("body", "StartTag"))
+            self.tree.insertElement(impliedTagToken("body", StartTag))
             self.parser.phase = self.parser.phases["inBody"]
             self.parser.framesetOK = True
 
@@ -984,7 +983,7 @@ def processEOF(self):
         def processSpaceCharactersDropNewline(self, token):
             # Sometimes (start of <pre>, <listing>, and <textarea> blocks) we
             # want to drop leading newlines
-            data = token["data"]
+            data = token.data
             self.processSpaceCharacters = self.processSpaceCharactersNonPre
             if (data.startswith("\n") and
                 self.tree.openElements[-1].name in ("pre", "listing", "textarea") and
@@ -995,20 +994,20 @@ def processSpaceCharactersDropNewline(self, token):
                 self.tree.insertText(data)
 
         def processCharacters(self, token):
-            if token["data"] == "\u0000":
+            if token.data == "\u0000":
                 # The tokenizer should always emit null on its own
                 return
             self.tree.reconstructActiveFormattingElements()
-            self.tree.insertText(token["data"])
+            self.tree.insertText(token.data)
             # This must be bad for performance
             if (self.parser.framesetOK and
                 any([char not in spaceCharacters
-                     for char in token["data"]])):
+                     for char in token.data])):
                 self.parser.framesetOK = False
 
         def processSpaceCharactersNonPre(self, token):
             self.tree.reconstructActiveFormattingElements()
-            self.tree.insertText(token["data"])
+            self.tree.insertText(token.data)
 
         def startTagProcessInHead(self, token):
             return self.parser.phases["inHead"].processStartTag(token)
@@ -1020,7 +1019,7 @@ def startTagBody(self, token):
                 assert self.parser.innerHTML
             else:
                 self.parser.framesetOK = False
-                for attr, value in token["data"].items():
+                for attr, value in token.attributes.items():
                     if attr not in self.tree.openElements[1].attributes:
                         self.tree.openElements[1].attributes[attr] = value
 
@@ -1065,11 +1064,11 @@ def startTagListItem(self, token):
             stopNamesMap = {"li": ["li"],
                             "dt": ["dt", "dd"],
                             "dd": ["dt", "dd"]}
-            stopNames = stopNamesMap[token["name"]]
+            stopNames = stopNamesMap[token.name]
             for node in reversed(self.tree.openElements):
                 if node.name in stopNames:
                     self.parser.phase.processEndTag(
-                        impliedTagToken(node.name, "EndTag"))
+                        impliedTagToken(node.name))
                     break
                 if (node.nameTuple in specialElements and
                         node.name not in ("address", "div", "p")):
@@ -1077,7 +1076,7 @@ def startTagListItem(self, token):
 
             if self.tree.elementInScope("p", variant="button"):
                 self.parser.phase.processEndTag(
-                    impliedTagToken("p", "EndTag"))
+                    impliedTagToken("p"))
 
             self.tree.insertElement(token)
 
@@ -1091,7 +1090,7 @@ def startTagHeading(self, token):
             if self.tree.elementInScope("p", variant="button"):
                 self.endTagP(impliedTagToken("p"))
             if self.tree.openElements[-1].name in headingElements:
-                self.parser.parseError("unexpected-start-tag", {"name": token["name"]})
+                self.parser.parseError("unexpected-start-tag", {"name": token.name})
                 self.tree.openElements.pop()
             self.tree.insertElement(token)
 
@@ -1158,67 +1157,61 @@ def startTagVoidFormatting(self, token):
             self.tree.reconstructActiveFormattingElements()
             self.tree.insertElement(token)
             self.tree.openElements.pop()
-            token["selfClosingAcknowledged"] = True
+            token.self_closing_acknowledged = True
             self.parser.framesetOK = False
 
         def startTagInput(self, token):
             framesetOK = self.parser.framesetOK
             self.startTagVoidFormatting(token)
-            if ("type" in token["data"] and
-                    token["data"]["type"].translate(asciiUpper2Lower) == "hidden"):
+            token_type = token.attributes.get('type', '')
+            if token_type.translate(asciiUpper2Lower) == "hidden":
                 # input type=hidden doesn't change framesetOK
                 self.parser.framesetOK = framesetOK
 
         def startTagParamSource(self, token):
             self.tree.insertElement(token)
             self.tree.openElements.pop()
-            token["selfClosingAcknowledged"] = True
+            token.self_closing_acknowledged = True
 
         def startTagHr(self, token):
             if self.tree.elementInScope("p", variant="button"):
                 self.endTagP(impliedTagToken("p"))
             self.tree.insertElement(token)
             self.tree.openElements.pop()
-            token["selfClosingAcknowledged"] = True
+            token.self_closing_acknowledged = True
             self.parser.framesetOK = False
 
         def startTagImage(self, token):
             # No really...
             self.parser.parseError("unexpected-start-tag-treated-as",
                                    {"originalName": "image", "newName": "img"})
-            self.processStartTag(impliedTagToken("img", "StartTag",
-                                                 attributes=token["data"],
-                                                 selfClosing=token["selfClosing"]))
+            self.processStartTag(impliedTagToken("img", StartTag, attributes=token.attributes))
 
         def startTagIsIndex(self, token):
             self.parser.parseError("deprecated-tag", {"name": "isindex"})
             if self.tree.formPointer:
                 return
             form_attrs = {}
-            if "action" in token["data"]:
-                form_attrs["action"] = token["data"]["action"]
-            self.processStartTag(impliedTagToken("form", "StartTag",
+            if "action" in token.attributes:
+                form_attrs["action"] = token.attributes["action"]
+            self.processStartTag(impliedTagToken("form", StartTag,
                                                  attributes=form_attrs))
-            self.processStartTag(impliedTagToken("hr", "StartTag"))
-            self.processStartTag(impliedTagToken("label", "StartTag"))
+            self.processStartTag(impliedTagToken("hr", StartTag))
+            self.processStartTag(impliedTagToken("label", StartTag))
             # XXX Localization ...
-            if "prompt" in token["data"]:
-                prompt = token["data"]["prompt"]
-            else:
-                prompt = "This is a searchable index. Enter search keywords: "
-            self.processCharacters(
-                {"type": tokenTypes["Characters"], "data": prompt})
-            attributes = token["data"].copy()
+            prompt = token.attributes.get("prompt", "This is a searchable index. Enter search keywords: ")
+            self.processCharacters(Characters(prompt))
+            attributes = token.attributes.copy()
             if "action" in attributes:
                 del attributes["action"]
             if "prompt" in attributes:
                 del attributes["prompt"]
             attributes["name"] = "isindex"
-            self.processStartTag(impliedTagToken("input", "StartTag",
+            self.processStartTag(impliedTagToken("input", StartTag,
                                                  attributes=attributes,
-                                                 selfClosing=token["selfClosing"]))
+                                                 selfClosing=token.self_closing))
             self.processEndTag(impliedTagToken("label"))
-            self.processStartTag(impliedTagToken("hr", "StartTag"))
+            self.processStartTag(impliedTagToken("hr", StartTag))
             self.processEndTag(impliedTagToken("form"))
 
         def startTagTextarea(self, token):
@@ -1272,25 +1265,25 @@ def startTagMath(self, token):
             self.tree.reconstructActiveFormattingElements()
             self.parser.adjustMathMLAttributes(token)
             self.parser.adjustForeignAttributes(token)
-            token["namespace"] = namespaces["mathml"]
+            token.namespace = namespaces["mathml"]
             self.tree.insertElement(token)
             # Need to get the parse error right for the case where the token
             # has a namespace not equal to the xmlns attribute
-            if token["selfClosing"]:
+            if token.self_closing:
                 self.tree.openElements.pop()
-                token["selfClosingAcknowledged"] = True
+                token.self_closing_acknowledged = True
 
         def startTagSvg(self, token):
             self.tree.reconstructActiveFormattingElements()
             self.parser.adjustSVGAttributes(token)
             self.parser.adjustForeignAttributes(token)
-            token["namespace"] = namespaces["svg"]
+            token.namespace = namespaces["svg"]
             self.tree.insertElement(token)
             # Need to get the parse error right for the case where the token
             # has a namespace not equal to the xmlns attribute
-            if token["selfClosing"]:
+            if token.self_closing:
                 self.tree.openElements.pop()
-                token["selfClosingAcknowledged"] = True
+                token.self_closing_acknowledged = True
 
         def startTagMisplaced(self, token):
             """ Elements that should be children of other elements that have a
@@ -1299,7 +1292,7 @@ def startTagMisplaced(self, token):
             "option", "optgroup", "tbody", "td", "tfoot", "th", "thead",
             "tr", "noscript"
             """
-            self.parser.parseError("unexpected-start-tag-ignored", {"name": token["name"]})
+            self.parser.parseError("unexpected-start-tag-ignored", {"name": token.name})
 
         def startTagOther(self, token):
             self.tree.reconstructActiveFormattingElements()
@@ -1307,9 +1300,9 @@ def startTagOther(self, token):
 
         def endTagP(self, token):
             if not self.tree.elementInScope("p", variant="button"):
-                self.startTagCloseP(impliedTagToken("p", "StartTag"))
+                self.startTagCloseP(impliedTagToken("p", StartTag))
                 self.parser.parseError("unexpected-end-tag", {"name": "p"})
-                self.endTagP(impliedTagToken("p", "EndTag"))
+                self.endTagP(impliedTagToken("p"))
             else:
                 self.tree.generateImpliedEndTags("p")
                 if self.tree.openElements[-1].name != "p":
@@ -1344,16 +1337,16 @@ def endTagHtml(self, token):
 
         def endTagBlock(self, token):
             # Put us back in the right whitespace handling mode
-            if token["name"] == "pre":
+            if token.name == "pre":
                 self.processSpaceCharacters = self.processSpaceCharactersNonPre
-            inScope = self.tree.elementInScope(token["name"])
+            inScope = self.tree.elementInScope(token.name)
             if inScope:
                 self.tree.generateImpliedEndTags()
-            if self.tree.openElements[-1].name != token["name"]:
-                self.parser.parseError("end-tag-too-early", {"name": token["name"]})
+            if self.tree.openElements[-1].name != token.name:
+                self.parser.parseError("end-tag-too-early", {"name": token.name})
             if inScope:
                 node = self.tree.openElements.pop()
-                while node.name != token["name"]:
+                while node.name != token.name:
                     node = self.tree.openElements.pop()
 
         def endTagForm(self, token):
@@ -1370,20 +1363,20 @@ def endTagForm(self, token):
                 self.tree.openElements.remove(node)
 
         def endTagListItem(self, token):
-            if token["name"] == "li":
+            if token.name == "li":
                 variant = "list"
             else:
                 variant = None
-            if not self.tree.elementInScope(token["name"], variant=variant):
-                self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+            if not self.tree.elementInScope(token.name, variant=variant):
+                self.parser.parseError("unexpected-end-tag", {"name": token.name})
             else:
-                self.tree.generateImpliedEndTags(exclude=token["name"])
-                if self.tree.openElements[-1].name != token["name"]:
+                self.tree.generateImpliedEndTags(exclude=token.name)
+                if self.tree.openElements[-1].name != token.name:
                     self.parser.parseError(
                         "end-tag-too-early",
-                        {"name": token["name"]})
+                        {"name": token.name})
                 node = self.tree.openElements.pop()
-                while node.name != token["name"]:
+                while node.name != token.name:
                     node = self.tree.openElements.pop()
 
         def endTagHeading(self, token):
@@ -1391,8 +1384,8 @@ def endTagHeading(self, token):
                 if self.tree.elementInScope(item):
                     self.tree.generateImpliedEndTags()
                     break
-            if self.tree.openElements[-1].name != token["name"]:
-                self.parser.parseError("end-tag-too-early", {"name": token["name"]})
+            if self.tree.openElements[-1].name != token.name:
+                self.parser.parseError("end-tag-too-early", {"name": token.name})
 
             for item in headingElements:
                 if self.tree.elementInScope(item):
@@ -1424,7 +1417,7 @@ def endTagFormatting(self, token):
                 # otherwise, and
                 # - has the same tag name as the token.
                 formattingElement = self.tree.elementInActiveFormattingElements(
-                    token["name"])
+                    token.name)
                 if (not formattingElement or
                     (formattingElement in self.tree.openElements and
                      not self.tree.elementInScope(formattingElement.name))):
@@ -1439,7 +1432,7 @@ def endTagFormatting(self, token):
                 # parse error; remove the element from the list, and
                 # abort these steps.
                 elif formattingElement not in self.tree.openElements:
-                    self.parser.parseError("adoption-agency-1.2", {"name": token["name"]})
+                    self.parser.parseError("adoption-agency-1.2", {"name": token.name})
                     self.tree.activeFormattingElements.remove(formattingElement)
                     return
 
@@ -1448,7 +1441,7 @@ def endTagFormatting(self, token):
                 # is not in scope, then this is a parse error; ignore
                 # the token, and abort these steps.
                 elif not self.tree.elementInScope(formattingElement.name):
-                    self.parser.parseError("adoption-agency-4.4", {"name": token["name"]})
+                    self.parser.parseError("adoption-agency-4.4", {"name": token.name})
                     return
 
                 # Otherwise, there is a formatting element and that
@@ -1458,7 +1451,7 @@ def endTagFormatting(self, token):
                 # written in the following steps.
                 else:
                     if formattingElement != self.tree.openElements[-1]:
-                        self.parser.parseError("adoption-agency-1.3", {"name": token["name"]})
+                        self.parser.parseError("adoption-agency-1.3", {"name": token.name})
 
                 # Step 5:
 
@@ -1565,14 +1558,14 @@ def endTagFormatting(self, token):
                     self.tree.openElements.index(furthestBlock) + 1, clone)
 
         def endTagAppletMarqueeObject(self, token):
-            if self.tree.elementInScope(token["name"]):
+            if self.tree.elementInScope(token.name):
                 self.tree.generateImpliedEndTags()
-            if self.tree.openElements[-1].name != token["name"]:
-                self.parser.parseError("end-tag-too-early", {"name": token["name"]})
+            if self.tree.openElements[-1].name != token.name:
+                self.parser.parseError("end-tag-too-early", {"name": token.name})
 
-            if self.tree.elementInScope(token["name"]):
+            if self.tree.elementInScope(token.name):
                 element = self.tree.openElements.pop()
-                while element.name != token["name"]:
+                while element.name != token.name:
                     element = self.tree.openElements.pop()
                 self.tree.clearActiveFormattingElements()
 
@@ -1580,21 +1573,21 @@ def endTagBr(self, token):
             self.parser.parseError("unexpected-end-tag-treated-as",
                                    {"originalName": "br", "newName": "br element"})
             self.tree.reconstructActiveFormattingElements()
-            self.tree.insertElement(impliedTagToken("br", "StartTag"))
+            self.tree.insertElement(impliedTagToken("br", StartTag))
             self.tree.openElements.pop()
 
         def endTagOther(self, token):
             for node in self.tree.openElements[::-1]:
-                if node.name == token["name"]:
-                    self.tree.generateImpliedEndTags(exclude=token["name"])
-                    if self.tree.openElements[-1].name != token["name"]:
-                        self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+                if node.name == token.name:
+                    self.tree.generateImpliedEndTags(exclude=token.name)
+                    if self.tree.openElements[-1].name != token.name:
+                        self.parser.parseError("unexpected-end-tag", {"name": token.name})
                     while self.tree.openElements.pop() != node:
                         pass
                     break
                 else:
                     if node.nameTuple in specialElements:
-                        self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+                        self.parser.parseError("unexpected-end-tag", {"name": token.name})
                         break
 
         startTagHandler = _utils.MethodDispatcher([
@@ -1666,7 +1659,7 @@ class TextPhase(Phase):
         __slots__ = tuple()
 
         def processCharacters(self, token):
-            self.tree.insertText(token["data"])
+            self.tree.insertText(token.data)
 
         def processEOF(self):
             self.parser.parseError("expected-named-closing-tag-but-got-eof",
@@ -1676,7 +1669,7 @@ def processEOF(self):
             return True
 
         def startTagOther(self, token):
-            assert False, "Tried to process start tag %s in RCDATA/RAWTEXT mode" % token['name']
+            assert False, "Tried to process start tag %s in RCDATA/RAWTEXT mode" % token.name
 
         def endTagScript(self, token):
             node = self.tree.openElements.pop()
@@ -1747,7 +1740,7 @@ def startTagColgroup(self, token):
             self.parser.phase = self.parser.phases["inColumnGroup"]
 
         def startTagCol(self, token):
-            self.startTagColgroup(impliedTagToken("colgroup", "StartTag"))
+            self.startTagColgroup(impliedTagToken("colgroup", StartTag))
             return token
 
         def startTagRowGroup(self, token):
@@ -1756,7 +1749,7 @@ def startTagRowGroup(self, token):
             self.parser.phase = self.parser.phases["inTableBody"]
 
         def startTagImplyTbody(self, token):
-            self.startTagRowGroup(impliedTagToken("tbody", "StartTag"))
+            self.startTagRowGroup(impliedTagToken("tbody", StartTag))
             return token
 
         def startTagTable(self, token):
@@ -1770,8 +1763,8 @@ def startTagStyleScript(self, token):
             return self.parser.phases["inHead"].processStartTag(token)
 
         def startTagInput(self, token):
-            if ("type" in token["data"] and
-                    token["data"]["type"].translate(asciiUpper2Lower) == "hidden"):
+            token_type = token.attributes.get('type', '')
+            if token_type.translate(asciiUpper2Lower) == "hidden":
                 self.parser.parseError("unexpected-hidden-input-in-table")
                 self.tree.insertElement(token)
                 # XXX associate with form
@@ -1787,7 +1780,7 @@ def startTagForm(self, token):
                 self.tree.openElements.pop()
 
         def startTagOther(self, token):
-            self.parser.parseError("unexpected-start-tag-implies-table-voodoo", {"name": token["name"]})
+            self.parser.parseError("unexpected-start-tag-implies-table-voodoo", {"name": token.name})
             # Do the table magic!
             self.tree.insertFromTable = True
             self.parser.phases["inBody"].processStartTag(token)
@@ -1810,10 +1803,10 @@ def endTagTable(self, token):
                 self.parser.parseError()
 
         def endTagIgnore(self, token):
-            self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-end-tag", {"name": token.name})
 
         def endTagOther(self, token):
-            self.parser.parseError("unexpected-end-tag-implies-table-voodoo", {"name": token["name"]})
+            self.parser.parseError("unexpected-end-tag-implies-table-voodoo", {"name": token.name})
             # Do the table magic!
             self.tree.insertFromTable = True
             self.parser.phases["inBody"].processEndTag(token)
@@ -1849,9 +1842,9 @@ def __init__(self, *args, **kwargs):
             self.characterTokens = []
 
         def flushCharacters(self):
-            data = "".join([item["data"] for item in self.characterTokens])
+            data = "".join([item.data for item in self.characterTokens])
             if any([item not in spaceCharacters for item in data]):
-                token = {"type": tokenTypes["Characters"], "data": data}
+                token = Characters(data)
                 self.parser.phases["inTable"].insertText(token)
             elif data:
                 self.tree.insertText(data)
@@ -1868,7 +1861,7 @@ def processEOF(self):
             return True
 
         def processCharacters(self, token):
-            if token["data"] == "\u0000":
+            if token.data == "\u0000":
                 return
             self.characterTokens.append(token)
 
@@ -1937,7 +1930,7 @@ def endTagTable(self, token):
                 return token
 
         def endTagIgnore(self, token):
-            self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-end-tag", {"name": token.name})
 
         def endTagOther(self, token):
             return self.parser.phases["inBody"].processEndTag(token)
@@ -1983,7 +1976,7 @@ def processCharacters(self, token):
         def startTagCol(self, token):
             self.tree.insertElement(token)
             self.tree.openElements.pop()
-            token["selfClosingAcknowledged"] = True
+            token.self_closing_acknowledged = True
 
         def startTagOther(self, token):
             ignoreEndTag = self.ignoreEndTagColgroup()
@@ -2052,8 +2045,8 @@ def startTagTr(self, token):
 
         def startTagTableCell(self, token):
             self.parser.parseError("unexpected-cell-in-table-body",
-                                   {"name": token["name"]})
-            self.startTagTr(impliedTagToken("tr", "StartTag"))
+                                   {"name": token.name})
+            self.startTagTr(impliedTagToken("tr", StartTag))
             return token
 
         def startTagTableOther(self, token):
@@ -2074,13 +2067,13 @@ def startTagOther(self, token):
             return self.parser.phases["inTable"].processStartTag(token)
 
         def endTagTableRowGroup(self, token):
-            if self.tree.elementInScope(token["name"], variant="table"):
+            if self.tree.elementInScope(token.name, variant="table"):
                 self.clearStackToTableBodyContext()
                 self.tree.openElements.pop()
                 self.parser.phase = self.parser.phases["inTable"]
             else:
                 self.parser.parseError("unexpected-end-tag-in-table-body",
-                                       {"name": token["name"]})
+                                       {"name": token.name})
 
         def endTagTable(self, token):
             if (self.tree.elementInScope("tbody", variant="table") or
@@ -2097,7 +2090,7 @@ def endTagTable(self, token):
 
         def endTagIgnore(self, token):
             self.parser.parseError("unexpected-end-tag-in-table-body",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         def endTagOther(self, token):
             return self.parser.phases["inTable"].processEndTag(token)
@@ -2178,7 +2171,7 @@ def endTagTable(self, token):
                 return token
 
         def endTagTableRowGroup(self, token):
-            if self.tree.elementInScope(token["name"], variant="table"):
+            if self.tree.elementInScope(token.name, variant="table"):
                 self.endTagTr(impliedTagToken("tr"))
                 return token
             else:
@@ -2186,7 +2179,7 @@ def endTagTableRowGroup(self, token):
 
         def endTagIgnore(self, token):
             self.parser.parseError("unexpected-end-tag-in-table-row",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         def endTagOther(self, token):
             return self.parser.phases["inTable"].processEndTag(token)
@@ -2240,27 +2233,27 @@ def startTagOther(self, token):
             return self.parser.phases["inBody"].processStartTag(token)
 
         def endTagTableCell(self, token):
-            if self.tree.elementInScope(token["name"], variant="table"):
-                self.tree.generateImpliedEndTags(token["name"])
-                if self.tree.openElements[-1].name != token["name"]:
+            if self.tree.elementInScope(token.name, variant="table"):
+                self.tree.generateImpliedEndTags(token.name)
+                if self.tree.openElements[-1].name != token.name:
                     self.parser.parseError("unexpected-cell-end-tag",
-                                           {"name": token["name"]})
+                                           {"name": token.name})
                     while True:
                         node = self.tree.openElements.pop()
-                        if node.name == token["name"]:
+                        if node.name == token.name:
                             break
                 else:
                     self.tree.openElements.pop()
                 self.tree.clearActiveFormattingElements()
                 self.parser.phase = self.parser.phases["inRow"]
             else:
-                self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+                self.parser.parseError("unexpected-end-tag", {"name": token.name})
 
         def endTagIgnore(self, token):
-            self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+            self.parser.parseError("unexpected-end-tag", {"name": token.name})
 
         def endTagImply(self, token):
-            if self.tree.elementInScope(token["name"], variant="table"):
+            if self.tree.elementInScope(token.name, variant="table"):
                 self.closeCell()
                 return token
             else:
@@ -2295,9 +2288,9 @@ def processEOF(self):
                 assert self.parser.innerHTML
 
         def processCharacters(self, token):
-            if token["data"] == "\u0000":
+            if token.data == "\u0000":
                 return
-            self.tree.insertText(token["data"])
+            self.tree.insertText(token.data)
 
         def startTagOption(self, token):
             # We need to imply </option> if <option> is the current node.
@@ -2329,7 +2322,7 @@ def startTagScript(self, token):
 
         def startTagOther(self, token):
             self.parser.parseError("unexpected-start-tag-in-select",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         def endTagOption(self, token):
             if self.tree.openElements[-1].name == "option":
@@ -2364,7 +2357,7 @@ def endTagSelect(self, token):
 
         def endTagOther(self, token):
             self.parser.parseError("unexpected-end-tag-in-select",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         startTagHandler = _utils.MethodDispatcher([
             ("html", Phase.startTagHtml),
@@ -2393,7 +2386,7 @@ def processCharacters(self, token):
             return self.parser.phases["inSelect"].processCharacters(token)
 
         def startTagTable(self, token):
-            self.parser.parseError("unexpected-table-element-start-tag-in-select-in-table", {"name": token["name"]})
+            self.parser.parseError("unexpected-table-element-start-tag-in-select-in-table", {"name": token.name})
             self.endTagOther(impliedTagToken("select"))
             return token
 
@@ -2401,8 +2394,8 @@ def startTagOther(self, token):
             return self.parser.phases["inSelect"].processStartTag(token)
 
         def endTagTable(self, token):
-            self.parser.parseError("unexpected-table-element-end-tag-in-select-in-table", {"name": token["name"]})
-            if self.tree.elementInScope(token["name"], variant="table"):
+            self.parser.parseError("unexpected-table-element-end-tag-in-select-in-table", {"name": token.name})
+            if self.tree.elementInScope(token.name, variant="table"):
                 self.endTagOther(impliedTagToken("select"))
                 return token
 
@@ -2471,24 +2464,24 @@ def adjustSVGTagNames(self, token):
                             "radialgradient": "radialGradient",
                             "textpath": "textPath"}
 
-            if token["name"] in replacements:
-                token["name"] = replacements[token["name"]]
+            if token.name in replacements:
+                token.name = replacements[token.name]
 
         def processCharacters(self, token):
-            if token["data"] == "\u0000":
-                token["data"] = "\uFFFD"
+            if token.data == "\u0000":
+                token.data = "\uFFFD"
             elif (self.parser.framesetOK and
-                  any(char not in spaceCharacters for char in token["data"])):
+                  any(char not in spaceCharacters for char in token.data)):
                 self.parser.framesetOK = False
             Phase.processCharacters(self, token)
 
         def processStartTag(self, token):
             currentNode = self.tree.openElements[-1]
-            if (token["name"] in self.breakoutElements or
-                (token["name"] == "font" and
-                 set(token["data"].keys()) & {"color", "face", "size"})):
+            if (token.name in self.breakoutElements or
+                (token.name == "font" and
+                 set(token.attributes.keys()) & {"color", "face", "size"})):
                 self.parser.parseError("unexpected-html-element-in-foreign-content",
-                                       {"name": token["name"]})
+                                       {"name": token.name})
                 while (self.tree.openElements[-1].namespace !=
                        self.tree.defaultNamespace and
                        not self.parser.isHTMLIntegrationPoint(self.tree.openElements[-1]) and
@@ -2503,20 +2496,20 @@ def processStartTag(self, token):
                     self.adjustSVGTagNames(token)
                     self.parser.adjustSVGAttributes(token)
                 self.parser.adjustForeignAttributes(token)
-                token["namespace"] = currentNode.namespace
+                token.namespace = currentNode.namespace
                 self.tree.insertElement(token)
-                if token["selfClosing"]:
+                if token.self_closing:
                     self.tree.openElements.pop()
-                    token["selfClosingAcknowledged"] = True
+                    token.self_closing_acknowledged = True
 
         def processEndTag(self, token):
             nodeIndex = len(self.tree.openElements) - 1
             node = self.tree.openElements[-1]
-            if node.name.translate(asciiUpper2Lower) != token["name"]:
-                self.parser.parseError("unexpected-end-tag", {"name": token["name"]})
+            if node.name.translate(asciiUpper2Lower) != token.name:
+                self.parser.parseError("unexpected-end-tag", {"name": token.name})
 
             while True:
-                if node.name.translate(asciiUpper2Lower) == token["name"]:
+                if node.name.translate(asciiUpper2Lower) == token.name:
                     # XXX this isn't in the spec but it seems necessary
                     if self.parser.phase == self.parser.phases["inTableText"]:
                         self.parser.phase.flushCharacters()
@@ -2557,7 +2550,7 @@ def startTagHtml(self, token):
 
         def startTagOther(self, token):
             self.parser.parseError("unexpected-start-tag-after-body",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
             self.parser.phase = self.parser.phases["inBody"]
             return token
 
@@ -2569,7 +2562,7 @@ def endTagHtml(self, name):
 
         def endTagOther(self, token):
             self.parser.parseError("unexpected-end-tag-after-body",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
             self.parser.phase = self.parser.phases["inBody"]
             return token
 
@@ -2606,7 +2599,7 @@ def startTagNoframes(self, token):
 
         def startTagOther(self, token):
             self.parser.parseError("unexpected-start-tag-in-frameset",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         def endTagFrameset(self, token):
             if self.tree.openElements[-1].name == "html":
@@ -2622,7 +2615,7 @@ def endTagFrameset(self, token):
 
         def endTagOther(self, token):
             self.parser.parseError("unexpected-end-tag-in-frameset",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         startTagHandler = _utils.MethodDispatcher([
             ("html", Phase.startTagHtml),
@@ -2653,14 +2646,14 @@ def startTagNoframes(self, token):
 
         def startTagOther(self, token):
             self.parser.parseError("unexpected-start-tag-after-frameset",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         def endTagHtml(self, token):
             self.parser.phase = self.parser.phases["afterAfterFrameset"]
 
         def endTagOther(self, token):
             self.parser.parseError("unexpected-end-tag-after-frameset",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         startTagHandler = _utils.MethodDispatcher([
             ("html", Phase.startTagHtml),
@@ -2695,13 +2688,13 @@ def startTagHtml(self, token):
 
         def startTagOther(self, token):
             self.parser.parseError("expected-eof-but-got-start-tag",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
             self.parser.phase = self.parser.phases["inBody"]
             return token
 
         def processEndTag(self, token):
             self.parser.parseError("expected-eof-but-got-end-tag",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
             self.parser.phase = self.parser.phases["inBody"]
             return token
 
@@ -2733,11 +2726,11 @@ def startTagNoFrames(self, token):
 
         def startTagOther(self, token):
             self.parser.parseError("expected-eof-but-got-start-tag",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         def processEndTag(self, token):
             self.parser.parseError("expected-eof-but-got-end-tag",
-                                   {"name": token["name"]})
+                                   {"name": token.name})
 
         startTagHandler = _utils.MethodDispatcher([
             ("html", startTagHtml),
@@ -2776,18 +2769,15 @@ def processEndTag(self, token):
 
 
 def adjust_attributes(token, replacements):
-    needs_adjustment = viewkeys(token['data']) & viewkeys(replacements)
-    if needs_adjustment:
-        token['data'] = type(token['data'])((replacements.get(k, k), v)
-                                            for k, v in token['data'].items())
+    if viewkeys(token.attributes) & viewkeys(replacements):
+        token.attributes = attributeMap((replacements.get(k, k), v) for k, v in token.attributes.items())
 
 
-def impliedTagToken(name, type="EndTag", attributes=None,
+def impliedTagToken(name, type=EndTag, attributes=None,
                     selfClosing=False):
     if attributes is None:
         attributes = {}
-    return {"type": tokenTypes[type], "name": name, "data": attributes,
-            "selfClosing": selfClosing}
+    return type(name=name, data=attributes)
 
 
 class ParseError(Exception):
diff --git a/html5lib/tests/test_tokenizer2.py b/html5lib/tests/test_tokenizer2.py
index 158d847a..9a54d286 100644
--- a/html5lib/tests/test_tokenizer2.py
+++ b/html5lib/tests/test_tokenizer2.py
@@ -4,13 +4,12 @@
 
 from six import unichr, text_type
 
-from html5lib._tokenizer import HTMLTokenizer
-from html5lib.constants import tokenTypes
+from html5lib._tokenizer import HTMLTokenizer, ParseError, StartTag
 
 
 def ignore_parse_errors(toks):
     for tok in toks:
-        if tok['type'] != tokenTypes['ParseError']:
+        if not isinstance(tok, ParseError):
             yield tok
 
 
@@ -23,9 +22,9 @@ def test_maintain_attribute_order():
     out = list(ignore_parse_errors(toks))
 
     assert len(out) == 1
-    assert out[0]['type'] == tokenTypes['StartTag']
+    assert isinstance(out[0], StartTag)
 
-    attrs_tok = out[0]['data']
+    attrs_tok = out[0].attributes
     assert len(attrs_tok) == len(attrs)
 
     for (in_name, in_value), (out_name, out_value) in zip(attrs, attrs_tok.items()):
@@ -40,9 +39,9 @@ def test_duplicate_attribute():
     out = list(ignore_parse_errors(toks))
 
     assert len(out) == 1
-    assert out[0]['type'] == tokenTypes['StartTag']
+    assert isinstance(out[0], StartTag)
 
-    attrs_tok = out[0]['data']
+    attrs_tok = out[0].attributes
     assert len(attrs_tok) == 1
     assert list(attrs_tok.items()) == [('a', '1')]
 
@@ -56,9 +55,9 @@ def test_maintain_duplicate_attribute_order():
     out = list(ignore_parse_errors(toks))
 
     assert len(out) == 1
-    assert out[0]['type'] == tokenTypes['StartTag']
+    assert isinstance(out[0], StartTag)
 
-    attrs_tok = out[0]['data']
+    attrs_tok = out[0].attributes
     assert len(attrs_tok) == len(attrs)
 
     for (in_name, in_value), (out_name, out_value) in zip(attrs, attrs_tok.items()):
diff --git a/html5lib/tests/tokenizer.py b/html5lib/tests/tokenizer.py
index cc9897a4..00171b76 100644
--- a/html5lib/tests/tokenizer.py
+++ b/html5lib/tests/tokenizer.py
@@ -8,7 +8,7 @@
 import pytest
 from six import unichr
 
-from html5lib._tokenizer import HTMLTokenizer
+from html5lib._tokenizer import HTMLTokenizer, StartTag
 from html5lib import constants, _utils
 
 
@@ -25,47 +25,44 @@ def parse(self, stream, encoding=None, innerHTML=False):
 
         tokenizer.state = getattr(tokenizer, self._state)
         if self._lastStartTag is not None:
-            tokenizer.currentToken = {"type": "startTag",
-                                      "name": self._lastStartTag}
+            tokenizer.currentToken = StartTag(name=self._lastStartTag)
 
-        types = {v: k for k, v in constants.tokenTypes.items()}
         for token in tokenizer:
-            getattr(self, 'process%s' % types[token["type"]])(token)
+            getattr(self, 'process%s' % token.__class__.__name__)(token)
 
         return self.outputTokens
 
     def processDoctype(self, token):
-        self.outputTokens.append(["DOCTYPE", token["name"], token["publicId"],
-                                  token["systemId"], token["correct"]])
+        self.outputTokens.append(["DOCTYPE", token.name, token.publicId,
+                                  token.systemId, token.correct])
 
     def processStartTag(self, token):
-        self.outputTokens.append(["StartTag", token["name"],
-                                  token["data"], token["selfClosing"]])
+        self.outputTokens.append(["StartTag", token.name,
+                                  token.attributes, token.self_closing])
 
     def processEmptyTag(self, token):
-        if token["name"] not in constants.voidElements:
+        if token.name not in constants.voidElements:
             self.outputTokens.append("ParseError")
-        self.outputTokens.append(["StartTag", token["name"], dict(token["data"][::-1])])
+        self.outputTokens.append(["StartTag", token.name, token.attributes])
 
     def processEndTag(self, token):
-        self.outputTokens.append(["EndTag", token["name"],
-                                  token["selfClosing"]])
+        self.outputTokens.append(["EndTag", token.name, token.self_closing])
 
     def processComment(self, token):
-        self.outputTokens.append(["Comment", token["data"]])
+        self.outputTokens.append(["Comment", token.data])
 
     def processSpaceCharacters(self, token):
-        self.outputTokens.append(["Character", token["data"]])
+        self.outputTokens.append(["Character", token.data])
         self.processSpaceCharacters = self.processCharacters
 
     def processCharacters(self, token):
-        self.outputTokens.append(["Character", token["data"]])
+        self.outputTokens.append(["Character", token.data])
 
     def processEOF(self, token):
         pass
 
     def processParseError(self, token):
-        self.outputTokens.append(["ParseError", token["data"]])
+        self.outputTokens.append(["ParseError", token.data])
 
 
 def concatenateCharacterTokens(tokens):
diff --git a/html5lib/treebuilders/base.py b/html5lib/treebuilders/base.py
index e4a3d710..84b69dc1 100644
--- a/html5lib/treebuilders/base.py
+++ b/html5lib/treebuilders/base.py
@@ -2,6 +2,7 @@
 from six import text_type
 
 from ..constants import scopingElements, tableInsertModeElements, namespaces
+from .._tokenizer import StartTag
 
 # The scope markers are inserted when entering object elements,
 # marquees, table cells, and table captions, and are used to prevent formatting
@@ -249,10 +250,9 @@ def reconstructActiveFormattingElements(self):
             clone = entry.cloneNode()  # Mainly to get a new copy of the attributes
 
             # Step 9
-            element = self.insertElement({"type": "StartTag",
-                                          "name": clone.name,
-                                          "namespace": clone.namespace,
-                                          "data": clone.attributes})
+            tag = StartTag(name=clone.name, data=clone.attributes)
+            tag.namespace = clone.namespace
+            element = self.insertElement(tag)
 
             # Step 10
             self.activeFormattingElements[i] = element
@@ -286,9 +286,9 @@ def insertRoot(self, token):
         self.document.appendChild(element)
 
     def insertDoctype(self, token):
-        name = token["name"]
-        publicId = token["publicId"]
-        systemId = token["systemId"]
+        name = token.name
+        publicId = token.publicId
+        systemId = token.systemId
 
         doctype = self.doctypeClass(name, publicId, systemId)
         self.document.appendChild(doctype)
@@ -296,14 +296,14 @@ def insertDoctype(self, token):
     def insertComment(self, token, parent=None):
         if parent is None:
             parent = self.openElements[-1]
-        parent.appendChild(self.commentClass(token["data"]))
+        parent.appendChild(self.commentClass(token.data))
 
     def createElement(self, token):
         """Create an element but don't insert it anywhere"""
-        name = token["name"]
-        namespace = token.get("namespace", self.defaultNamespace)
+        name = token.name
+        namespace = token.namespace or self.defaultNamespace
         element = self.elementClass(name, namespace)
-        element.attributes = token["data"]
+        element.attributes = token.attributes
         return element
 
     def _getInsertFromTable(self):
@@ -321,11 +321,11 @@ def _setInsertFromTable(self, value):
     insertFromTable = property(_getInsertFromTable, _setInsertFromTable)
 
     def insertElementNormal(self, token):
-        name = token["name"]
+        name = token.name
         assert isinstance(name, text_type), "Element %s not unicode" % name
-        namespace = token.get("namespace", self.defaultNamespace)
+        namespace = token.namespace or self.defaultNamespace
         element = self.elementClass(name, namespace)
-        element.attributes = token["data"]
+        element.attributes = token.attributes
         self.openElements[-1].appendChild(element)
         self.openElements.append(element)
         return element
diff --git a/html5lib/treebuilders/dom.py b/html5lib/treebuilders/dom.py
index d8b53004..8e489046 100644
--- a/html5lib/treebuilders/dom.py
+++ b/html5lib/treebuilders/dom.py
@@ -126,9 +126,9 @@ def documentClass(self):
             return weakref.proxy(self)
 
         def insertDoctype(self, token):
-            name = token["name"]
-            publicId = token["publicId"]
-            systemId = token["systemId"]
+            name = token.name
+            publicId = token.publicId
+            systemId = token.systemId
 
             domimpl = Dom.getDOMImplementation()
             doctype = domimpl.createDocumentType(name, publicId, systemId)
diff --git a/html5lib/treebuilders/etree_lxml.py b/html5lib/treebuilders/etree_lxml.py
index e73de61a..30861e4d 100644
--- a/html5lib/treebuilders/etree_lxml.py
+++ b/html5lib/treebuilders/etree_lxml.py
@@ -308,9 +308,9 @@ def getFragment(self):
         return fragment
 
     def insertDoctype(self, token):
-        name = token["name"]
-        publicId = token["publicId"]
-        systemId = token["systemId"]
+        name = token.name
+        publicId = token.publicId
+        systemId = token.systemId
 
         if not name:
             warnings.warn("lxml cannot represent empty doctype", DataLossWarning)
@@ -359,14 +359,14 @@ def insertRoot(self, token):
                 else:
                     docStr += "''"
             docStr += ">"
-            if self.doctype.name != token["name"]:
+            if self.doctype.name != token.name:
                 warnings.warn("lxml cannot represent doctype with a different name to the root element", DataLossWarning)
         docStr += "<THIS_SHOULD_NEVER_APPEAR_PUBLICLY/>"
         root = etree.fromstring(docStr)
 
         # Append the initial comments:
         for comment_token in self.initial_comments:
-            comment = self.commentClass(comment_token["data"])
+            comment = self.commentClass(comment_token.data)
             root.addprevious(comment._element)
 
         # Create the root document and add the ElementTree to it
@@ -374,8 +374,8 @@ def insertRoot(self, token):
         self.document._elementTree = root.getroottree()
 
         # Give the root element the right name
-        name = token["name"]
-        namespace = token.get("namespace", self.defaultNamespace)
+        name = token.name
+        namespace = token.namespace or self.defaultNamespace
         if namespace is None:
             etree_tag = name
         else: