[ { "tokens": [ "EU", "re", "##jects", "German", "call", "to", "boy", "##cott", "British", "la", "##mb", "." ], "ids": [ 17751, 11639, 93376, 12026, 20575, 10114, 26905, 48426, 11160, 10109, 27012, 119 ], "entity": [ "B-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Peter", "Blackburn" ], "ids": [ 10979, 46006 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "22" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "European", "Commission", "said", "on", "Thursday", "it", "disa", "##gree", "##d", "with", "German", "advice", "to", "consumers", "to", "shu", "##n", "British", "la", "##mb", "until", "scientists", "determine", "whether", "ma", "##d", "co", "##w", "disease", "can", "be", "trans", "##mitted", "to", "sheep", "." ], "ids": [ 10117, 11914, 14941, 12415, 10135, 67067, 10271, 36474, 91479, 10162, 10169, 12026, 53426, 10114, 97129, 10114, 73495, 10115, 11160, 10109, 27012, 11444, 49871, 37284, 21883, 10824, 10162, 11170, 10874, 21911, 10944, 10347, 37241, 89157, 10114, 83650, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Germany", "'", "s", "representative", "to", "the", "European", "Union", "'", "s", "vet", "##erina", "##ry", "committee", "Werner", "Z", "##wing", "##mann", "said", "on", "Wednesday", "consumers", "should", "buy", "sheep", "##mea", "##t", "from", "countries", "other", "than", "Britain", "until", "the", "scientific", "advice", "was", "clear", "##er", "." ], "ids": [ 12775, 112, 187, 33786, 10114, 10105, 11914, 11457, 112, 187, 56975, 90643, 10908, 27634, 12646, 163, 25649, 12350, 12415, 10135, 57611, 97129, 14819, 47715, 83650, 41947, 10123, 10188, 15911, 10684, 11084, 16032, 11444, 10105, 23301, 53426, 10134, 24866, 10165, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "do", "n", "'", "t", "support", "any", "such", "re", "##com", "##mend", "##ation", "because", "we", "do", "n", "'", "t", "see", "any", "grounds", "for", "it", ",", "\"", "the", "Commission", "'", "s", "chief", "spoke", "##sman", "Nikolaus", "van", "der", "Pas", "told", "a", "news", "brief", "##ing", "." ], "ids": [ 107, 12865, 10149, 182, 112, 188, 13145, 11178, 11049, 11639, 22530, 101480, 11809, 12373, 11951, 10149, 182, 112, 188, 12888, 11178, 38190, 10142, 10271, 117, 107, 10105, 14941, 112, 187, 19421, 50005, 24305, 44057, 10145, 10118, 17779, 21937, 169, 14424, 29040, 10230, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "further", "scientific", "study", "was", "required", "and", "if", "it", "was", "found", "that", "action", "was", "needed", "it", "should", "be", "taken", "by", "the", "European", "Union", "." ], "ids": [ 10357, 12415, 14586, 23301, 14687, 10134, 17468, 10111, 12277, 10271, 10134, 11823, 10189, 14204, 10134, 23794, 10271, 14819, 10347, 15109, 10155, 10105, 11914, 11457, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "He", "said", "a", "proposal", "last", "month", "by", "EU", "Farm", "Commissioner", "Franz", "Fisch", "##ler", "to", "ban", "sheep", "brain", "##s", ",", "sp", "##leen", "##s", "and", "spin", "##al", "cor", "##ds", "from", "the", "human", "and", "animal", "food", "chains", "was", "a", "highly", "specific", "and", "pre", "##ca", "##ution", "##ary", "move", "to", "protect", "human", "health", "." ], "ids": [ 10357, 12415, 169, 43542, 12469, 14064, 10155, 17751, 30837, 24366, 13752, 100295, 10815, 10114, 11915, 83650, 34467, 10107, 117, 32650, 51675, 10107, 10111, 30428, 10415, 29162, 13268, 10188, 10105, 14179, 10111, 18882, 18301, 110504, 10134, 169, 22625, 19182, 10111, 12229, 10425, 30861, 14926, 18577, 10114, 32949, 14179, 17004, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fisch", "##ler", "proposed", "EU", "-", "wide", "measures", "after", "reports", "from", "Britain", "and", "France", "that", "under", "laboratory", "conditions", "sheep", "could", "contract", "Bo", "##vine", "Sp", "##ong", "##if", "##or", "##m", "En", "##ce", "##pha", "##lop", "##ath", "##y", "(", "BS", "##E", ")", "-", "-", "ma", "##d", "co", "##w", "disease", "." ], "ids": [ 100295, 10815, 21622, 17751, 118, 18064, 38606, 10662, 26610, 10188, 16032, 10111, 10688, 10189, 10571, 67047, 17315, 83650, 12174, 16108, 27622, 30396, 46361, 13891, 13918, 10667, 10147, 10243, 10419, 37590, 101908, 44196, 10157, 113, 43436, 11259, 114, 118, 118, 10824, 10162, 11170, 10874, 21911, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 2, 6, 6, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Fisch", "##ler", "agreed", "to", "review", "his", "proposal", "after", "the", "EU", "'", "s", "standing", "vet", "##erina", "##ry", "committee", ",", "mati", "##onal", "animal", "health", "officials", ",", "questioned", "if", "such", "action", "was", "just", "##ified", "as", "there", "was", "only", "a", "sl", "##ight", "risk", "to", "human", "health", "." ], "ids": [ 16976, 100295, 10815, 25577, 10114, 17030, 10226, 43542, 10662, 10105, 17751, 112, 187, 32173, 56975, 90643, 10908, 27634, 117, 43358, 21051, 18882, 17004, 27730, 117, 101173, 12277, 11049, 14204, 10134, 12820, 31825, 10146, 11155, 10134, 10893, 169, 38523, 27521, 24179, 10114, 14179, 17004, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spanish", "Farm", "Minister", "Loyola", "de", "Palacio", "had", "earlier", "accused", "Fisch", "##ler", "at", "an", "EU", "farm", "ministers", "'", "meeting", "of", "causing", "un", "##just", "##ified", "ala", "##rm", "through", "\"", "dangerous", "generali", "##sation", ".", "\"" ], "ids": [ 14661, 30837, 14355, 95663, 10104, 35915, 10374, 18905, 37303, 100295, 10815, 10160, 10151, 17751, 30568, 66281, 112, 19822, 10108, 34705, 10119, 106670, 31825, 21739, 19341, 11222, 107, 57195, 89644, 21603, 119, 107 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "." ], "ids": [ 119 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Only", "France", "and", "Britain", "backed", "Fisch", "##ler", "'", "s", "proposal", "." ], "ids": [ 18740, 10688, 10111, 16032, 61010, 100295, 10815, 112, 187, 43542, 119 ], "entity": [ "O", "B-LOC", "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 1, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "The", "EU", "'", "s", "scientific", "vet", "##erina", "##ry", "and", "multi", "##dis", "##ci", "##plin", "##ary", "committees", "are", "due", "to", "re", "-", "ex", "##amine", "the", "issue", "early", "next", "month", "and", "make", "recommendations", "to", "the", "senior", "vet", "##erina", "##ry", "officials", "." ], "ids": [ 10117, 17751, 112, 187, 23301, 56975, 90643, 10908, 10111, 21247, 17442, 10598, 54425, 14926, 100212, 10301, 10850, 10114, 11639, 118, 11419, 45980, 10105, 15557, 11732, 13451, 14064, 10111, 13086, 102499, 10114, 10105, 17843, 56975, 90643, 10908, 27730, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "##ep", "have", "long", "been", "known", "to", "contract", "s", "##cra", "##pie", ",", "a", "brain", "-", "was", "##ting", "disease", "similar", "to", "BS", "##E", "which", "is", "believed", "to", "have", "been", "transferred", "to", "cattle", "through", "feed", "containing", "animal", "waste", "." ], "ids": [ 11149, 19986, 10529, 11695, 10590, 11053, 10114, 16108, 187, 40333, 19237, 117, 169, 34467, 118, 10134, 12141, 21911, 13213, 10114, 43436, 11259, 10319, 10124, 20718, 10114, 10529, 10590, 23192, 10114, 56980, 11222, 44988, 27248, 18882, 59158, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "British", "farmers", "denied", "on", "Thursday", "there", "was", "any", "danger", "to", "human", "health", "from", "their", "sheep", ",", "but", "expressed", "concern", "that", "German", "government", "advice", "to", "consumers", "to", "avoid", "British", "la", "##mb", "might", "influence", "consumers", "across", "Europe", "." ], "ids": [ 11160, 55543, 47467, 10135, 67067, 11155, 10134, 11178, 45882, 10114, 14179, 17004, 10188, 10455, 83650, 117, 10473, 31685, 43607, 10189, 12026, 12047, 53426, 10114, 97129, 10114, 33253, 11160, 10109, 27012, 20970, 17306, 97129, 15130, 11767, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "What", "we", "have", "to", "be", "extremely", "care", "##ful", "of", "is", "how", "other", "countries", "are", "going", "to", "take", "Germany", "'", "s", "lead", ",", "\"", "Welsh", "National", "Farmer", "##s", "'", "Union", "(", "NF", "##U", ")", "chairman", "John", "Lloyd", "Jones", "said", "on", "BBC", "radio", "." ], "ids": [ 107, 12489, 11951, 10529, 10114, 10347, 38136, 11131, 14446, 10108, 10124, 14796, 10684, 15911, 10301, 19090, 10114, 13574, 12775, 112, 187, 14107, 117, 107, 27474, 10655, 57316, 10107, 112, 11457, 113, 89829, 12022, 114, 27627, 10421, 19345, 12298, 12415, 10135, 11721, 12429, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Bonn", "has", "led", "efforts", "to", "protect", "public", "health", "after", "consumer", "confidence", "collapsed", "in", "March", "after", "a", "British", "report", "suggested", "humans", "could", "contract", "an", "illness", "similar", "to", "ma", "##d", "co", "##w", "disease", "by", "eating", "conta", "##minated", "be", "##ef", "." ], "ids": [ 21982, 10393, 12857, 22116, 10114, 32949, 11683, 17004, 10662, 64580, 74187, 93621, 10106, 11144, 10662, 169, 11160, 17553, 27675, 26058, 12174, 16108, 10151, 56507, 13213, 10114, 10824, 10162, 11170, 10874, 21911, 10155, 77596, 23020, 91284, 10347, 16822, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Germany", "imported", "47", ",", "600", "sheep", "from", "Britain", "last", "year", ",", "nearly", "half", "of", "total", "import", "##s", "." ], "ids": [ 12775, 100591, 11413, 117, 11796, 83650, 10188, 16032, 12469, 10924, 117, 21377, 13877, 10108, 11339, 67622, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "brought", "in", "4", ",", "275", "tonnes", "of", "British", "mu", "##tton", ",", "some", "10", "percent", "of", "overall", "import", "##s", "." ], "ids": [ 10377, 17327, 10106, 125, 117, 23896, 39435, 10108, 11160, 12361, 70000, 117, 11152, 10150, 22362, 10108, 20947, 67622, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rare", "Hendrix", "song", "draft", "sell", "##s", "for", "almost", "$", "17", ",", "000", "." ], "ids": [ 87523, 59523, 12011, 28447, 36300, 10107, 10142, 17122, 109, 10273, 117, 10259, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "rare", "early", "hand", "##wr", "##itten", "draft", "of", "a", "song", "by", "U", ".", "S", ".", "guitar", "legend", "Jimi", "Hendrix", "was", "sold", "for", "almost", "$", "17", ",", "000", "on", "Thursday", "at", "an", "auction", "of", "some", "of", "the", "late", "musician", "'", "s", "favourite", "possessions", "." ], "ids": [ 138, 23902, 11732, 15230, 21428, 99483, 28447, 10108, 169, 12011, 10155, 158, 119, 156, 119, 15228, 48285, 76735, 59523, 10134, 15337, 10142, 17122, 109, 10273, 117, 10259, 10135, 67067, 10160, 10151, 106733, 10108, 11152, 10108, 10105, 13002, 35041, 112, 187, 80494, 75034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Florida", "restaurant", "paid", "10", ",", "925", "pounds", "(", "$", "16", ",", "935", ")", "for", "the", "draft", "of", "\"", "Ai", "n", "'", "t", "no", "telling", "\"", ",", "which", "Hendrix", "penn", "##ed", "on", "a", "piece", "of", "London", "hotel", "station", "##ery", "in", "late", "1966", "." ], "ids": [ 138, 13668, 26234, 25938, 10150, 117, 59384, 61982, 113, 109, 10250, 117, 67713, 114, 10142, 10105, 28447, 10108, 107, 19672, 182, 112, 188, 10192, 61758, 107, 117, 10319, 59523, 62603, 10336, 10135, 169, 26767, 10108, 10829, 19157, 11825, 23131, 10106, 13002, 10857, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "the", "end", "of", "a", "January", "1967", "concert", "in", "the", "English", "city", "of", "Nottingham", "he", "threw", "the", "sheet", "of", "paper", "into", "the", "audience", ",", "where", "it", "was", "retrieved", "by", "a", "fan", "." ], "ids": [ 11699, 10105, 11572, 10108, 169, 11238, 10800, 19418, 10106, 10105, 11616, 11584, 10108, 43396, 10261, 80516, 10105, 55030, 10108, 17895, 10708, 10105, 26070, 117, 10940, 10271, 10134, 50697, 10155, 169, 10862, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Buy", "##ers", "also", "sna", "##pped", "up", "16", "other", "items", "that", "were", "put", "up", "for", "auction", "by", "Hendrix", "'", "s", "former", "girlfriend", "Kathy", "Et", "##ching", "##ham", ",", "who", "lived", "with", "him", "from", "1966", "to", "1969", "." ], "ids": [ 109211, 10901, 10379, 62541, 44357, 10741, 10250, 10684, 34109, 10189, 10309, 14499, 10741, 10142, 106733, 10155, 59523, 112, 187, 11775, 77877, 67888, 16232, 41247, 13196, 117, 10479, 17603, 10169, 10957, 10188, 10857, 10114, 10764, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "included", "a", "black", "lac", "##quer", "and", "mother", "of", "pe", "##ar", "##l", "in", "##lai", "##d", "box", "used", "by", "Hendrix", "to", "store", "his", "drugs", ",", "which", "an", "ano", "##nymous", "Australian", "purchase", "##r", "bought", "for", "5", ",", "060", "pounds", "(", "$", "7", ",", "845", ")", "." ], "ids": [ 11696, 12742, 169, 15045, 23455, 28531, 10111, 15293, 10108, 11161, 10354, 10161, 10106, 31181, 10162, 21509, 11031, 10155, 59523, 10114, 13708, 10226, 40421, 117, 10319, 10151, 12797, 66615, 12829, 37891, 10129, 28870, 10142, 126, 117, 84350, 61982, 113, 109, 128, 117, 60558, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "guitarist", "died", "of", "a", "drugs", "over", "##dose", "in", "1970", "aged", "27", "." ], "ids": [ 10117, 38169, 12482, 10108, 169, 40421, 10491, 37675, 10106, 10607, 30262, 10365, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "says", "Taiwan", "sp", "##oi", "##ls", "atmosphere", "for", "talks", "." ], "ids": [ 11593, 22153, 19449, 32650, 14638, 11747, 59043, 10142, 56672, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "22" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "on", "Thursday", "accused", "Taipei", "of", "sp", "##oi", "##ling", "the", "atmosphere", "for", "a", "res", "##umption", "of", "talks", "across", "the", "Taiwan", "Strait", "with", "a", "visit", "to", "Ukraine", "by", "Taiwan", "##ese", "Vice", "President", "Lie", "##n", "Chan", "this", "week", "that", "in", "##fur", "##iated", "Beijing", "." ], "ids": [ 11593, 10135, 67067, 37303, 50291, 10108, 32650, 14638, 11945, 10105, 59043, 10142, 169, 39429, 94118, 10108, 56672, 15130, 10105, 19449, 74916, 10169, 169, 27541, 10114, 19883, 10155, 19449, 13565, 19214, 12811, 39710, 10115, 27602, 10531, 16118, 10189, 10106, 33874, 89771, 23824, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 9, 2, 6, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Speak", "##ing", "only", "hours", "after", "Chinese", "state", "media", "said", "the", "time", "was", "right", "to", "engage", "in", "political", "talks", "with", "Taiwan", ",", "Foreign", "Ministry", "spoke", "##sman", "Shen", "Guo", "##fang", "told", "Reuters", ":", "\"", "The", "necessary", "atmosphere", "for", "the", "opening", "of", "the", "talks", "has", "been", "dis", "##rupted", "by", "the", "Taiwan", "authorities", ".", "\"" ], "ids": [ 104326, 10230, 10893, 19573, 10662, 13299, 11388, 12518, 12415, 10105, 10635, 10134, 13448, 10114, 38391, 10106, 13736, 56672, 10169, 19449, 117, 20277, 19170, 50005, 24305, 85324, 85034, 68781, 21937, 46617, 131, 107, 10117, 27039, 59043, 10142, 10105, 17975, 10108, 10105, 56672, 10393, 10590, 27920, 63133, 10155, 10105, 19449, 28308, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 3, 7, 9, 9, 4, 8, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "State", "media", "quoted", "China", "'", "s", "top", "nego", "##tia", "##tor", "with", "Taipei", ",", "Tang", "Shu", "##bei", ",", "as", "telling", "a", "visiting", "group", "from", "Taiwan", "on", "Wednesday", "that", "it", "was", "time", "for", "the", "rivals", "to", "hold", "political", "talks", "." ], "ids": [ 11104, 12518, 70676, 11593, 112, 187, 12364, 21134, 16180, 11813, 10169, 50291, 117, 26603, 56448, 40946, 117, 10146, 61758, 169, 48780, 11795, 10188, 19449, 10135, 57611, 10189, 10271, 10134, 10635, 10142, 10105, 71908, 10114, 18500, 13736, 56672, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Now", "is", "the", "time", "for", "the", "two", "sides", "to", "engage", "in", "political", "talks", ".", ".", "." ], "ids": [ 107, 17121, 10124, 10105, 10635, 10142, 10105, 10551, 27263, 10114, 38391, 10106, 13736, 56672, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "that", "is", "to", "end", "the", "state", "of", "host", "##ility", ",", "\"", "Thursday", "'", "s", "overseas", "edition", "of", "the", "People", "'", "s", "Daily", "quoted", "Tang", "as", "saying", "." ], "ids": [ 10189, 10124, 10114, 11572, 10105, 11388, 10108, 19317, 44704, 117, 107, 67067, 112, 187, 59391, 14372, 10108, 10105, 14235, 112, 187, 17252, 70676, 26603, 10146, 22807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 4, 9, 9, 9 ] }, { "tokens": [ "The", "foreign", "ministry", "'", "s", "Shen", "told", "Reuters", "Television", "in", "an", "interview", "he", "had", "read", "reports", "of", "Tang", "'", "s", "comments", "but", "gave", "no", "details", "of", "why", "the", "nego", "##tia", "##tor", "had", "considered", "the", "time", "right", "for", "talks", "with", "Taiwan", ",", "which", "Beijing", "considers", "a", "ren", "##ega", "##de", "province", "." ], "ids": [ 10117, 20796, 65338, 112, 187, 85324, 21937, 46617, 18535, 10106, 10151, 21213, 10261, 10374, 24944, 26610, 10108, 26603, 112, 187, 61565, 10473, 15362, 10192, 29500, 10108, 31237, 10105, 21134, 16180, 11813, 10374, 14289, 10105, 10635, 13448, 10142, 56672, 10169, 19449, 117, 10319, 23824, 96008, 169, 63256, 19172, 10253, 14342, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", ",", "which", "has", "long", "opposed", "all", "Taipei", "efforts", "to", "gain", "greater", "international", "recognition", ",", "was", "in", "##fur", "##iated", "by", "a", "visit", "to", "Ukraine", "this", "week", "by", "Taiwan", "##ese", "Vice", "President", "Lie", "##n", "." ], "ids": [ 11593, 117, 10319, 10393, 11695, 30488, 10435, 50291, 22116, 10114, 25881, 25722, 12533, 31477, 117, 10134, 10106, 33874, 89771, 10155, 169, 27541, 10114, 19883, 10531, 16118, 10155, 19449, 13565, 19214, 12811, 39710, 10115, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9, 9, 4, 8, 9 ] }, { "tokens": [ "China", "says", "time", "right", "for", "Taiwan", "talks", "." ], "ids": [ 11593, 22153, 10635, 13448, 10142, 19449, 56672, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "22" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "has", "said", "it", "was", "time", "for", "political", "talks", "with", "Taiwan", "and", "that", "the", "rival", "island", "should", "take", "practical", "steps", "towards", "that", "goal", "." ], "ids": [ 11593, 10393, 12415, 10271, 10134, 10635, 10142, 13736, 56672, 10169, 19449, 10111, 10189, 10105, 24792, 17354, 14819, 13574, 52940, 50879, 18095, 10189, 16586, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Consulta", "##tions", "should", "be", "held", "to", "set", "the", "time", "and", "format", "of", "the", "talks", ",", "the", "official", "Xi", "##nh", "##ua", "news", "agency", "quoted", "Tang", "Shu", "##bei", ",", "executive", "vice", "chairman", "of", "the", "Association", "for", "Relations", "Across", "the", "Taiwan", "Straits", ",", "as", "saying", "late", "on", "Wednesday", "." ], "ids": [ 65456, 15024, 14819, 10347, 11991, 10114, 11847, 10105, 10635, 10111, 15620, 10108, 10105, 56672, 117, 10105, 14731, 59876, 16317, 11908, 14424, 34649, 70676, 26603, 56448, 40946, 117, 22676, 16543, 27627, 10108, 10105, 11751, 10142, 36503, 78031, 10105, 19449, 88820, 117, 10146, 22807, 13002, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "July", "car", "registration", "##s", "up", "14", ".", "2", "p", "##ct", "yr", "/", "yr", "." ], "ids": [ 12026, 11112, 13000, 80315, 10107, 10741, 10247, 119, 123, 184, 14526, 12590, 120, 12590, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##AN", "##K", "##F", "##UR", "##T", "1996", "-", "08", "-", "22" ], "ids": [ 64655, 41275, 11733, 11565, 98348, 11090, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "first", "-", "time", "registration", "##s", "of", "motor", "vehicles", "jump", "##ed", "14", ".", "2", "percent", "in", "July", "this", "year", "from", "the", "year", "-", "earlier", "period", ",", "the", "Federal", "office", "for", "motor", "vehicles", "said", "on", "Thursday", "." ], "ids": [ 12026, 10422, 118, 10635, 80315, 10107, 10108, 15257, 27237, 54941, 10336, 10247, 119, 123, 22362, 10106, 11112, 10531, 10924, 10188, 10105, 10924, 118, 18905, 13127, 117, 10105, 14492, 14301, 10142, 15257, 27237, 12415, 10135, 67067, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "office", "said", "356", ",", "725", "new", "cars", "were", "registered", "in", "July", "1996", "-", "-", "304", ",", "850", "passenger", "cars", "and", "15", ",", "613", "trucks", "." ], "ids": [ 10117, 14301, 12415, 33303, 117, 47318, 10751, 24602, 10309, 33712, 10106, 11112, 10389, 118, 118, 26263, 117, 24934, 33155, 24602, 10111, 10208, 117, 52305, 99669, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "figures", "represent", "a", "13", ".", "6", "percent", "increase", "for", "passenger", "cars", "and", "a", "2", ".", "2", "percent", "decline", "for", "trucks", "from", "July", "1995", "." ], "ids": [ 10117, 21068, 30382, 169, 10249, 119, 127, 22362, 20299, 10142, 33155, 24602, 10111, 169, 123, 119, 123, 22362, 46695, 10142, 99669, 10188, 11112, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Motor", "-", "bike", "registration", "rose", "32", ".", "7", "percent", "in", "the", "period", "." ], "ids": [ 19440, 118, 99345, 80315, 29467, 10842, 119, 128, 22362, 10106, 10105, 13127, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "growth", "was", "partly", "due", "to", "an", "increased", "number", "of", "Germans", "buy", "##ing", "German", "cars", "abroad", ",", "while", "manufacturers", "said", "that", "domestic", "demand", "was", "weak", ",", "the", "federal", "office", "said", "." ], "ids": [ 10117, 14609, 10134, 50686, 10850, 10114, 10151, 19299, 11487, 10108, 46269, 47715, 10230, 12026, 24602, 50901, 117, 11371, 77256, 12415, 10189, 31084, 34394, 10134, 61285, 117, 10105, 16293, 14301, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Almost", "all", "German", "car", "manufacturers", "posted", "gains", "in", "registration", "numbers", "in", "the", "period", "." ], "ids": [ 64435, 10435, 12026, 13000, 77256, 51232, 92193, 10106, 80315, 20953, 10106, 10105, 13127, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Volkswagen", "AG", "won", "77", ",", "719", "registration", "##s", ",", "slightly", "more", "than", "a", "quarter", "of", "the", "total", "." ], "ids": [ 37787, 17935, 11367, 12527, 117, 67375, 80315, 10107, 117, 31603, 10798, 11084, 169, 28330, 10108, 10105, 11339, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Opel", "AG", "together", "with", "General", "Motors", "came", "in", "second", "place", "with", "49", ",", "269", "registration", "##s", ",", "16", ".", "4", "percent", "of", "the", "overall", "figure", "." ], "ids": [ 55721, 17935, 14229, 10169, 11220, 34658, 13383, 10106, 11132, 11192, 10169, 11580, 117, 29745, 80315, 10107, 117, 10250, 119, 125, 22362, 10108, 10105, 20947, 17527, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Third", "was", "Ford", "with", "35", ",", "563", "registration", "##s", ",", "or", "11", ".", "7", "percent", "." ], "ids": [ 16788, 10134, 14255, 10169, 10803, 117, 50724, 80315, 10107, 117, 10345, 10193, 119, 128, 22362, 119 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Only", "Seat", "and", "Porsche", "had", "fewer", "registration", "##s", "in", "July", "1996", "compared", "to", "last", "year", "'", "s", "July", "." ], "ids": [ 18740, 102777, 10111, 34722, 10374, 74139, 80315, 10107, 10106, 11112, 10389, 25626, 10114, 12469, 10924, 112, 187, 11112, 119 ], "entity": [ "O", "B-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Seat", "posted", "3", ",", "420", "registration", "##s", "compared", "with", "552", "##2", "registration", "##s", "in", "July", "a", "year", "earlier", "." ], "ids": [ 102777, 51232, 124, 117, 24253, 80315, 10107, 25626, 10169, 44809, 10729, 80315, 10107, 10106, 11112, 169, 10924, 18905, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Porsche", "'", "s", "registration", "##s", "fell", "to", "554", "from", "643", "." ], "ids": [ 34722, 112, 187, 80315, 10107, 25194, 10114, 54142, 10188, 59425, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GR", "##EE", "##K", "SO", "##CI", "##AL", "##IS", "##TS", "G", "##IV", "##E", "GR", "##EE", "##N", "L", "##IG", "##HT", "TO", "PM", "FOR", "EL", "##EC", "##TION", "##S", "." ], "ids": [ 58787, 95825, 11733, 71020, 89955, 32002, 19088, 36545, 144, 91238, 11259, 58787, 95825, 11537, 149, 89696, 81012, 58573, 46161, 109544, 69765, 35826, 98207, 10731, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "22" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Greek", "socialist", "party", "'", "s", "executive", "bureau", "gave", "the", "green", "light", "to", "Prime", "Minister", "Costa", "##s", "Sim", "##itis", "to", "call", "sna", "##p", "elections", ",", "its", "general", "secretary", "Costa", "##s", "S", "##kan", "##dali", "##dis", "told", "reporter", "##s", "." ], "ids": [ 10117, 15286, 79456, 14039, 112, 187, 22676, 32340, 15362, 10105, 23320, 15765, 10114, 19924, 14355, 13902, 10107, 103695, 36967, 10114, 20575, 62541, 10410, 22054, 117, 10474, 11389, 37664, 13902, 10107, 156, 10706, 52662, 17442, 21937, 41408, 10107, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Prime", "Minister", "Costa", "##s", "Sim", "##itis", "is", "going", "to", "make", "an", "official", "announcement", "after", "a", "cabinet", "meeting", "later", "on", "Thursday", ",", "said", "S", "##kan", "##dali", "##dis", "." ], "ids": [ 19924, 14355, 13902, 10107, 103695, 36967, 10124, 19090, 10114, 13086, 10151, 14731, 76557, 10662, 169, 33801, 19822, 10873, 10135, 67067, 117, 12415, 156, 10706, 52662, 17442, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "-", "-", "Dimitri", "##s", "Ko", "##nto", "##gian", "##nis", ",", "Athens", "News", "##room", "+", "301", "331", "##18", "##12", "-", "4" ], "ids": [ 118, 118, 73589, 10107, 30186, 15088, 38531, 12597, 117, 33765, 12219, 25525, 116, 26224, 30690, 45987, 24747, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayer", "##V", "##B", "sets", "C", "$", "100", "million", "six", "-", "year", "bond", "." ], "ids": [ 42806, 11779, 11274, 23597, 140, 109, 10407, 12473, 12449, 118, 10924, 55185, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "following", "bond", "was", "announced", "by", "lead", "manager", "Toronto", "Dominion", "." ], "ids": [ 10117, 11901, 55185, 10134, 13854, 10155, 14107, 16935, 15256, 93469, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "B", "##OR", "##RO", "##W", "##ER", "BA", "##Y", "##ER", "##IS", "##CH", "##E", "V", "##ER", "##E", "##IN", "##S", "##BA", "##NK" ], "ids": [ 139, 42622, 35066, 13034, 24093, 39999, 14703, 24093, 19088, 86448, 11259, 159, 24093, 11259, 27128, 10731, 35999, 78043 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "AM", "##T", "C", "$", "100", "ML", "##N", "CO", "##UP", "##ON", "6", ".", "625", "MA", "##T", "##UR", "##IT", "##Y", "24", ".", "SE", "##P", ".", "02" ], "ids": [ 24339, 11090, 140, 109, 10407, 75920, 11537, 32992, 57487, 30118, 127, 119, 35354, 27277, 11090, 98348, 37611, 14703, 10233, 119, 23056, 11127, 119, 10983 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##YP", "##E", "ST", "##RA", "##IG", "##HT", "ISS", "PR", "##IC", "##E", "100", ".", "92", "PA", "##Y", "DA", "##TE", "24", ".", "SE", "##P", ".", "96" ], "ids": [ 157, 98904, 11259, 53317, 29990, 89696, 81012, 58915, 23837, 30889, 11259, 10407, 119, 12458, 32349, 14703, 47855, 29833, 10233, 119, 23056, 11127, 119, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##UL", "##L", "F", "##EE", "##S", "1", ".", "875", "RE", "##O", "##FF", "##ER", "99", ".", "32", "SP", "##RE", "##AD", "+", "20", "BP" ], "ids": [ 143, 100673, 11369, 143, 95825, 10731, 122, 119, 45949, 71033, 11403, 82678, 24093, 12187, 119, 10842, 22570, 66014, 55538, 116, 10197, 50950 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##OD", "##Y", "AA", "##1", "L", "##IS", "##TI", "##NG", "L", "##U", "##X", "PA", "##Y", "FR", "##E", "##Q", "=" ], "ids": [ 102059, 77836, 14703, 30369, 10759, 149, 19088, 72286, 34065, 149, 12022, 12674, 32349, 14703, 64655, 11259, 19282, 134 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "&", "P", "=", "DE", "##NO", "##MS", "(", "K", ")", "1", "-", "10", "-", "100", "SA", "##LE", "L", "##IM", "##IT", "##S", "US", "/", "UK", "/", "CA" ], "ids": [ 156, 111, 153, 134, 25067, 67292, 53355, 113, 148, 114, 122, 118, 10150, 118, 10407, 21318, 51036, 149, 42031, 37611, 10731, 10808, 120, 10523, 120, 24707 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1 ] }, { "tokens": [ "NE", "##G", "PL", "##G", "NO", "CR", "##S", "DE", "##FL", "##T", "NO", "FOR", "##CE", "MA", "##J", "=" ], "ids": [ 86607, 11447, 71341, 11447, 49307, 44912, 10731, 25067, 90772, 11090, 49307, 109544, 43161, 27277, 15417, 134 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##V", "LA", "##W", "GE", "##R", "##MA", "##N", "H", "##OM", "##E", "CT", "##R", "##Y", "=", "TA", "##X", "PR", "##O", "##V", "##S", "ST", "##AN", "##DA", "##RD" ], "ids": [ 41525, 11779, 29079, 13034, 62997, 11273, 30696, 11537, 145, 37079, 11259, 45513, 11273, 14703, 134, 91075, 12674, 23837, 11403, 11779, 10731, 53317, 41275, 36382, 84444 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MG", "##T", "/", "UN", "##D", "0", ".", "275", "SE", "##LL", "CO", "##NC", "1", ".", "60", "PR", "##A", "##EC", "##IP", "=" ], "ids": [ 38668, 11090, 120, 26578, 11490, 121, 119, 23896, 23056, 82834, 32992, 100230, 122, 119, 10709, 23837, 10738, 35826, 30331, 134 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "UN", "##DE", "##R", "##L", "##Y", "##ING", "GO", "##V", "##T", "B", "##ON", "##D", "7", ".", "0", "PC", "##T", "SE", "##P", "##T", "2001" ], "ids": [ 26578, 60675, 11273, 11369, 14703, 50183, 41525, 11779, 11090, 139, 30118, 11490, 128, 119, 121, 16355, 11090, 23056, 11127, 11090, 10272 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "##S", "BA", "##Y", "##ER", "##IS", "##CH", "##E", "V", "##ER", "##E", "##IN", "##S", "##BA", "##NK", "IS", "J", "##O", "##IN", "##T", "LE", "##AD", "MAN", "##AG", "##ER" ], "ids": [ 49307, 29833, 10731, 39999, 14703, 24093, 19088, 86448, 11259, 159, 24093, 11259, 27128, 10731, 35999, 78043, 40214, 147, 11403, 27128, 11090, 84977, 55538, 73020, 109865, 24093 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "London", "News", "##room", "+", "44", "171", "542", "765", "##8" ], "ids": [ 118, 118, 10829, 12219, 25525, 116, 11126, 22478, 51620, 65222, 11396 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ve", "##nant", "##ius", "sets", "$", "300", "million", "January", "1999", "FR", "##N", "." ], "ids": [ 19561, 18847, 11827, 23597, 109, 11093, 12473, 11238, 10324, 64655, 11537, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "following", "floating", "-", "rate", "issue", "was", "announced", "by", "lead", "manager", "Le", "##hman", "Brothers", "International", "." ], "ids": [ 10117, 11901, 106720, 118, 18344, 15557, 10134, 13854, 10155, 14107, 16935, 10281, 49811, 18274, 10771, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "B", "##OR", "##RO", "##W", "##ER", "V", "##EN", "##AN", "##TI", "##US", "AB", "(", "SW", "##ED", "##IS", "##H", "NA", "##TION", "##AL", "MO", "##RT", "##GA", "##GE", "AG", "##EN", "##C", "##Y", ")" ], "ids": [ 139, 42622, 35066, 13034, 24093, 159, 50655, 41275, 72286, 32612, 21644, 113, 92438, 33809, 19088, 12396, 56586, 98207, 32002, 102059, 46935, 39061, 58719, 17935, 50655, 10858, 14703, 114 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##T", "$", "300", "ML", "##N", "SP", "##RE", "##AD", "-", "12", ".", "5", "BP", "MA", "##T", "##UR", "##IT", "##Y", "21", ".", "JA", "##N", ".", "99" ], "ids": [ 24339, 11090, 109, 11093, 75920, 11537, 22570, 66014, 55538, 118, 10186, 119, 126, 50950, 27277, 11090, 98348, 37611, 14703, 10296, 119, 53399, 11537, 119, 12187 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##YP", "##E", "FR", "##N", "BA", "##SE", "3", "##M", "L", "##IB", "##OR", "PA", "##Y", "DA", "##TE", "S2", "##3", ".", "SE", "##P", ".", "96" ], "ids": [ 157, 98904, 11259, 64655, 11537, 39999, 39039, 124, 11517, 149, 72918, 42622, 32349, 14703, 47855, 29833, 100649, 10884, 119, 23056, 11127, 119, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##ST", "MO", "##OD", "##Y", "AA", "##3", "ISS", "PR", "##IC", "##E", "99", ".", "956", "F", "##UL", "##L", "F", "##EE", "##S", "10", "BP" ], "ids": [ 29079, 32995, 102059, 77836, 14703, 30369, 10884, 58915, 23837, 30889, 11259, 12187, 119, 71019, 143, 100673, 11369, 143, 95825, 10731, 10150, 50950 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##ST", "S", "&", "P", "AA", "+", "RE", "##O", "##FF", "##ER", "=" ], "ids": [ 29079, 32995, 156, 111, 153, 30369, 116, 71033, 11403, 82678, 24093, 134 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "##S", "S", "SH", "##OR", "##T", "F", "##IR", "##ST", "CO", "##UP", "##ON" ], "ids": [ 49307, 29833, 10731, 156, 38702, 42622, 11090, 143, 73522, 32995, 32992, 57487, 30118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##TI", "##NG", "L", "##ON", "##DO", "##N", "DE", "##NO", "##MS", "(", "K", ")", "1", "-", "10", "-", "100", "SA", "##LE", "L", "##IM", "##IT", "##S", "US", "/", "UK", "/", "JP", "/", "FR" ], "ids": [ 149, 19088, 72286, 34065, 149, 30118, 104847, 11537, 25067, 67292, 53355, 113, 148, 114, 122, 118, 10150, 118, 10407, 21318, 51036, 149, 42031, 37611, 10731, 10808, 120, 10523, 120, 45657, 120, 64655 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 9, 1 ] }, { "tokens": [ "NE", "##G", "PL", "##G", "Y", "##ES", "CR", "##S", "DE", "##FL", "##T", "NO", "FOR", "##CE", "MA", "##J", "IP", "##MA", "2" ], "ids": [ 86607, 11447, 71341, 11447, 162, 25054, 44912, 10731, 25067, 90772, 11090, 49307, 109544, 43161, 27277, 15417, 24124, 30696, 123 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##V", "LA", "##W", "EN", "##GL", "##IS", "##H", "H", "##OM", "##E", "CT", "##R", "##Y", "SW", "##ED", "##EN", "TA", "##X", "PR", "##O", "##V", "##S", "ST", "##AN", "##DA", "##RD" ], "ids": [ 41525, 11779, 29079, 13034, 31278, 104780, 19088, 12396, 145, 37079, 11259, 45513, 11273, 14703, 92438, 33809, 50655, 91075, 12674, 23837, 11403, 11779, 10731, 53317, 41275, 36382, 84444 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MG", "##T", "/", "UN", "##D", "5", "BP", "SE", "##LL", "CO", "##NC", "5", "BP", "PR", "##A", "##EC", "##IP", "=" ], "ids": [ 38668, 11090, 120, 26578, 11490, 126, 50950, 23056, 82834, 32992, 100230, 126, 50950, 23837, 10738, 35826, 30331, 134 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "##S", "ISS", "##UE", "##D", "OF", "##F", "EM", "##T", "##N", "PR", "##O", "##G", "##RA", "##MM", "##E" ], "ids": [ 49307, 29833, 10731, 58915, 62674, 11490, 23240, 11565, 20569, 11090, 11537, 23837, 11403, 11447, 29990, 93252, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "London", "News", "##room", "+", "44", "171", "542", "886", "##3" ], "ids": [ 118, 118, 10829, 12219, 25525, 116, 11126, 22478, 51620, 57644, 10884 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Port", "conditions", "update", "-", "Syria", "-", "Lloyd", "##s", "Ship", "##ping", "." ], "ids": [ 14734, 17315, 35896, 118, 25612, 118, 19345, 10107, 51776, 15398, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Port", "conditions", "from", "Lloyd", "##s", "Ship", "##ping", "Intelligence", "Service", "-", "-" ], "ids": [ 14734, 17315, 10188, 19345, 10107, 51776, 15398, 28854, 13489, 118, 118 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "LA", "##T", "##TA", "##KI", "##A", ",", "Aug", "10", "-", "waiting", "time", "at", "La", "##tta", "##kia", "and", "Ta", "##rto", "##us", "present", "##ly", "24", "hours", "." ], "ids": [ 29079, 11090, 24951, 59879, 10738, 117, 53012, 10150, 118, 62052, 10635, 10160, 10159, 12201, 23483, 10111, 14248, 36396, 10251, 12254, 10454, 10233, 19573, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israel", "plays", "down", "fear", "##s", "of", "war", "with", "Syria", "." ], "ids": [ 12991, 17724, 12935, 44929, 10107, 10108, 10338, 10169, 25612, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Colle", "##en", "Siegel" ], "ids": [ 97461, 10136, 71706 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "22" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israel", "'", "s", "out", "##going", "peace", "nego", "##tia", "##tor", "with", "Syria", "said", "on", "Thursday", "current", "tensions", "between", "the", "two", "countries", "appeared", "to", "be", "a", "storm", "in", "a", "tea", "##cup", "." ], "ids": [ 12991, 112, 187, 10950, 92037, 28101, 21134, 16180, 11813, 10169, 25612, 12415, 10135, 67067, 14978, 69545, 10948, 10105, 10551, 15911, 14565, 10114, 10347, 169, 31642, 10106, 169, 57675, 41739, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "##amar", "Ra", "##bino", "##vich", ",", "who", "as", "Israel", "'", "s", "ambassador", "to", "Washington", "conducted", "un", "##fr", "##uit", "##ful", "negotiations", "with", "Syria", ",", "told", "Israel", "Radio", "it", "looked", "like", "Damascus", "wanted", "to", "talk", "rather", "than", "fight", "." ], "ids": [ 10377, 93196, 38571, 61328, 48190, 117, 10479, 10146, 12991, 112, 187, 74853, 10114, 11586, 23736, 10119, 71843, 15971, 14446, 61946, 10169, 25612, 117, 21937, 12991, 12083, 10271, 59822, 11850, 100002, 22591, 10114, 31311, 16863, 11084, 20780, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "appears", "to", "me", "the", "Syrian", "priority", "is", "still", "to", "nego", "##tia", "##te", "." ], "ids": [ 107, 10377, 20296, 10114, 10911, 10105, 44152, 92602, 10124, 12647, 10114, 21134, 16180, 10216, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Syrian", "##s", "are", "confused", ",", "they", "are", "def", "##inite", "##ly", "ten", "##se", ",", "but", "the", "general", "assessment", "here", "in", "Washington", "is", "that", "this", "is", "essentially", "a", "storm", "in", "a", "tea", "##cup", ",", "\"", "he", "said", "." ], "ids": [ 10117, 44152, 10107, 10301, 73173, 117, 10689, 10301, 100745, 100240, 10454, 11769, 10341, 117, 10473, 10105, 11389, 62492, 19353, 10106, 11586, 10124, 10189, 10531, 10124, 63719, 169, 31642, 10106, 169, 57675, 41739, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ra", "##bino", "##vich", "is", "wind", "##ing", "up", "his", "term", "as", "ambassador", "." ], "ids": [ 38571, 61328, 48190, 10124, 31346, 10230, 10741, 10226, 13719, 10146, 74853, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "will", "be", "replaced", "by", "Elia", "##hu", "Ben", "-", "Eli", "##ssar", ",", "a", "former", "Israeli", "en", "##voy", "to", "Egypt", "and", "right", "-", "wing", "Li", "##kud", "party", "politician", "." ], "ids": [ 10357, 11337, 10347, 16478, 10155, 85030, 13723, 13304, 118, 51243, 70911, 117, 169, 11775, 28446, 10110, 81843, 10114, 20440, 10111, 13448, 118, 22571, 13258, 52813, 14039, 20354, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Israel", "on", "Wednesday", "sent", "Syria", "a", "message", ",", "via", "Washington", ",", "saying", "it", "was", "committed", "to", "peace", "and", "wanted", "to", "open", "negotiations", "without", "pre", "##con", "##ditions", "." ], "ids": [ 12991, 10135, 57611, 14541, 25612, 169, 30514, 117, 11406, 11586, 117, 22807, 10271, 10134, 38184, 10114, 28101, 10111, 22591, 10114, 14087, 61946, 13663, 12229, 23486, 91936, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "it", "sl", "##am", "##med", "Damascus", "for", "creating", "what", "it", "called", "a", "dangerous", "atmosphere", "." ], "ids": [ 16976, 10271, 38523, 11008, 21986, 100002, 10142, 29132, 12976, 10271, 11552, 169, 57195, 59043, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Syria", "accused", "Israel", "on", "Wednesday", "of", "launch", "##ing", "a", "hy", "##ster", "##ical", "campaign", "against", "it", "after", "Israeli", "television", "reported", "that", "Damascus", "had", "recently", "test", "fired", "a", "missile", "." ], "ids": [ 25612, 37303, 12991, 10135, 57611, 10108, 29227, 10230, 169, 15165, 12765, 17616, 17323, 11327, 10271, 10662, 28446, 14162, 15943, 10189, 100002, 10374, 23746, 15839, 38903, 169, 45174, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "its", "arms", "purchase", "##s", "were", "for", "defensive", "purposes", "." ], "ids": [ 10377, 12415, 10474, 28150, 37891, 10107, 10309, 10142, 38385, 36740, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "message", "that", "we", "sent", "to", "(", "Syrian", "President", "Ha", "##fe", "##z", "al", "-", ")", "Assad", "is", "that", "Israel", "is", "ready", "at", "any", "time", "without", "pre", "##con", "##ditions", "to", "enter", "peace", "negotiations", ",", "\"", "Israeli", "Foreign", "Minister", "David", "Levy", "told", "Israel", "Radio", "in", "an", "interview", "." ], "ids": [ 107, 10117, 30514, 10189, 11951, 14541, 10114, 113, 44152, 12811, 13740, 14601, 10305, 10164, 118, 114, 110182, 10124, 10189, 12991, 10124, 42374, 10160, 11178, 10635, 13663, 12229, 23486, 91936, 10114, 31006, 28101, 61946, 117, 107, 28446, 20277, 14355, 10804, 16608, 21937, 12991, 12083, 10106, 10151, 21213, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 8, 9, 4, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Ten", "##sion", "has", "mounted", "since", "Israeli", "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", "took", "office", "in", "June", "vo", "##wing", "to", "retain", "the", "Gol", "##an", "Heights", "Israel", "captured", "from", "Syria", "in", "the", "1967", "Middle", "East", "war", "." ], "ids": [ 16411, 17467, 10393, 44709, 11764, 28446, 19924, 14355, 16810, 32577, 36027, 13723, 12149, 14301, 10106, 11120, 12556, 25649, 10114, 76863, 10105, 67669, 10206, 34528, 12991, 25030, 10188, 25612, 10106, 10105, 10800, 15441, 11830, 10338, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 1, 9, 9, 1, 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "Israeli", "-", "Syrian", "peace", "talks", "have", "been", "dead", "##locke", "##d", "over", "the", "Gol", "##an", "since", "1991", "despite", "the", "previous", "government", "'", "s", "willing", "##ness", "to", "make", "Gol", "##an", "concession", "##s", "." ], "ids": [ 28446, 118, 44152, 28101, 56672, 10529, 10590, 23457, 93986, 10162, 10491, 10105, 67669, 10206, 11764, 10442, 22087, 10105, 16741, 12047, 112, 187, 87615, 14010, 10114, 13086, 67669, 10206, 99599, 10107, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Peace", "talks", "between", "the", "two", "sides", "were", "last", "held", "in", "February", "." ], "ids": [ 20705, 56672, 10948, 10105, 10551, 27263, 10309, 12469, 11991, 10106, 11508, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "voices", "coming", "out", "of", "Damascus", "are", "bad", ",", "not", "good", "." ], "ids": [ 107, 10117, 77314, 23959, 10950, 10108, 100002, 10301, 15838, 117, 10472, 15198, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "media", ".", ".", "." ], "ids": [ 10117, 12518, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "are", "full", "of", "expressions", "and", "declaration", "##s", "that", "must", "be", "wo", "##rry", "##ing", ".", ".", "." ], "ids": [ 10301, 13375, 10108, 87621, 10111, 105108, 10107, 10189, 14982, 10347, 12796, 31862, 10230, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "this", "artificial", "atmosphere", "is", "very", "dangerous", "because", "those", "who", "spread", "it", "could", "become", "its", "prisoners", ",", "\"", "Levy", "said", "." ], "ids": [ 10531, 36866, 59043, 10124, 12558, 57195, 12373, 12676, 10479, 25609, 10271, 12174, 13461, 10474, 44094, 117, 107, 16608, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "\"", "We", "ex", "##pect", "from", "Syria", ",", "if", "its", "face", "is", "to", "peace", ",", "that", "it", "will", "answer", "Israel", "'", "s", "message", "to", "enter", "peace", "negotiations", "because", "that", "is", "our", "goal", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 12865, 11419, 51511, 10188, 25612, 117, 12277, 10474, 13295, 10124, 10114, 28101, 117, 10189, 10271, 11337, 57085, 12991, 112, 187, 30514, 10114, 31006, 28101, 61946, 12373, 10189, 10124, 17446, 16586, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "do", "not", "want", "a", "war", ",", "God", "for", "##bid", "." ], "ids": [ 12865, 10149, 10472, 21528, 169, 10338, 117, 14015, 10142, 78489, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "No", "one", "benefits", "from", "wars", ".", "\"" ], "ids": [ 10657, 10464, 48297, 10188, 68756, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israel", "'", "s", "Channel", "Two", "television", "said", "Damascus", "had", "sent", "a", "\"", "cal", "##ming", "signal", "\"", "to", "Israel", "." ], "ids": [ 12991, 112, 187, 16558, 13214, 14162, 12415, 100002, 10374, 14541, 169, 107, 25923, 16405, 25495, 107, 10114, 12991, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "It", "gave", "no", "source", "for", "the", "report", "." ], "ids": [ 10377, 15362, 10192, 15247, 10142, 10105, 17553, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "##anya", "##hu", "and", "Levy", "'", "s", "spoke", "##smen", "said", "they", "could", "not", "con", "##fir", "##m", "it", "." ], "ids": [ 32577, 36027, 13723, 10111, 16608, 112, 187, 50005, 60785, 12415, 10689, 12174, 10472, 10173, 61644, 10147, 10271, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "television", "also", "said", "that", "Net", "##anya", "##hu", "had", "sent", "messages", "to", "reas", "##sure", "Syria", "via", "Cairo", ",", "the", "United", "States", "and", "Moscow", "." ], "ids": [ 10117, 14162, 10379, 12415, 10189, 32577, 36027, 13723, 10374, 14541, 58945, 10114, 36120, 47394, 25612, 11406, 37580, 117, 10105, 10609, 10859, 10111, 18744, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ "Polish", "diplomat", "den", "##ies", "nurse", "##s", "strand", "##ed", "in", "Libya", "." ], "ids": [ 19870, 45652, 10140, 11624, 108470, 10107, 65803, 10336, 10106, 50720, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "TU", "##NI", "##S", "1996", "-", "08", "-", "22" ], "ids": [ 94747, 52898, 10731, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Polish", "diplomat", "on", "Thursday", "denied", "a", "Polish", "tab", "##lo", "##id", "report", "this", "week", "that", "Libya", "was", "ref", "##using", "exit", "visas", "to", "100", "Polish", "nurse", "##s", "trying", "to", "return", "home", "after", "working", "in", "the", "North", "African", "country", "." ], "ids": [ 138, 19870, 45652, 10135, 67067, 47467, 169, 19870, 100781, 10715, 11249, 17553, 10531, 16118, 10189, 50720, 10134, 48056, 95179, 63827, 62665, 10114, 10407, 19870, 108470, 10107, 32862, 10114, 15079, 11816, 10662, 14616, 10106, 10105, 11225, 13839, 12723, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "\"", "This", "is", "not", "true", "." ], "ids": [ 107, 10747, 10124, 10472, 22024, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Up", "to", "today", ",", "we", "have", "no", "knowledge", "of", "any", "nurse", "strand", "##ed", "or", "kept", "in", "Libya", "without", "her", "will", ",", "and", "we", "have", "not", "received", "any", "com", "##plain", "##t", ",", "\"", "the", "Polish", "em", "##bas", "##sy", "'", "s", "charge", "d", "'", "affaires", "in", "Tripoli", ",", "Tadeusz", "A", "##wd", "##ank", "##ie", "##wicz", ",", "told", "Reuters", "by", "telephone", "." ], "ids": [ 13656, 10114, 18745, 117, 11951, 10529, 10192, 22975, 10108, 11178, 108470, 65803, 10336, 10345, 26546, 10106, 50720, 13663, 10485, 11337, 117, 10111, 11951, 10529, 10472, 12296, 11178, 10212, 88975, 10123, 117, 107, 10105, 19870, 10266, 21322, 16105, 112, 187, 18163, 172, 112, 31133, 10106, 60946, 117, 42737, 138, 44466, 30022, 10400, 38147, 117, 21937, 46617, 10155, 69009, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 8, 8, 8, 8, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "Poland", "'", "s", "labour", "ministry", "said", "this", "week", "it", "would", "send", "a", "team", "to", "Libya", "to", "investigate", ",", "but", "A", "##wd", "##ank", "##ie", "##wicz", "said", "the", "probe", "was", "prompted", "by", "some", "nurse", "##s", "com", "##plain", "##ing", "about", "their", "work", "conditions", "such", "as", "non", "-", "payment", "of", "their", "sala", "##ries", "." ], "ids": [ 17879, 112, 187, 40763, 65338, 12415, 10531, 16118, 10271, 10894, 45567, 169, 11121, 10114, 50720, 10114, 78189, 117, 10473, 138, 44466, 30022, 10400, 38147, 12415, 10105, 110239, 10134, 93003, 10155, 11152, 108470, 10107, 10212, 88975, 10230, 10978, 10455, 11424, 17315, 11049, 10146, 10446, 118, 67701, 10108, 10455, 20509, 15388, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "that", "there", "are", "an", "estimated", "800", "Polish", "nurse", "##s", "working", "in", "Libya", "." ], "ids": [ 10357, 12415, 10189, 11155, 10301, 10151, 25267, 11900, 19870, 108470, 10107, 14616, 10106, 50720, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Two", "Iranian", "opposition", "leaders", "meet", "in", "Baghdad", "." ], "ids": [ 13214, 41768, 21227, 24155, 23267, 10106, 73055, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Hassan", "Ha", "##fi", "##dh" ], "ids": [ 35004, 13740, 14403, 20193 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "BA", "##G", "##HD", "##AD", "1996", "-", "08", "-", "22" ], "ids": [ 39999, 11447, 99997, 55538, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Iranian", "exile", "group", "based", "in", "Iraq", "vo", "##wed", "on", "Thursday", "to", "extend", "support", "to", "Iran", "'", "s", "Kur", "##dish", "rebels", "after", "they", "were", "attacked", "by", "Iranian", "troops", "deep", "inside", "Iraq", "last", "month", "." ], "ids": [ 10313, 41768, 67696, 11795, 11610, 10106, 21455, 12556, 48854, 10135, 67067, 10114, 62504, 13145, 10114, 12901, 112, 187, 61912, 67522, 57545, 10662, 10689, 10309, 30272, 10155, 41768, 20836, 26591, 22978, 21455, 12469, 14064, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "A", "Mu", "##jah", "##ide", "##en", "K", "##hal", "##q", "statement", "said", "its", "leader", "Mass", "##oud", "Raja", "##vi", "met", "in", "Baghdad", "the", "Secretary", "-", "General", "of", "the", "Kurdistan", "Democratic", "Party", "of", "Iran", "(", "K", "##DP", "##I", ")", "Hassan", "Ras", "##tega", "##r", "on", "Wednesday", "and", "voiced", "his", "support", "to", "Iran", "'", "s", "rebel", "Kur", "##ds", "." ], "ids": [ 138, 49056, 27494, 13315, 10136, 148, 18453, 11703, 33311, 12415, 10474, 15014, 28957, 50555, 19452, 11310, 10428, 10106, 73055, 10105, 19382, 118, 11220, 10108, 10105, 86246, 19281, 12529, 10108, 12901, 113, 148, 54714, 11281, 114, 35004, 57908, 57989, 10129, 10135, 57611, 10111, 59900, 10226, 13145, 10114, 12901, 112, 187, 56696, 61912, 13268, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "\"", "Raja", "##vi", "emphasis", "##ed", "that", "the", "Iranian", "Resistance", "would", "continue", "to", "stand", "side", "by", "side", "with", "their", "Kur", "##dish", "com", "##pat", "##riot", "##s", "and", "the", "resistance", "movement", "in", "Iranian", "Kurdistan", ",", "\"", "it", "said", "." ], "ids": [ 107, 19452, 11310, 60848, 10336, 10189, 10105, 41768, 72732, 10894, 17734, 10114, 14603, 12250, 10155, 12250, 10169, 10455, 61912, 67522, 10212, 18115, 92113, 10107, 10111, 10105, 33823, 17123, 10106, 41768, 86246, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 2, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "spoke", "##sman", "for", "the", "group", "said", "the", "meeting", "\"", "signals", "a", "new", "level", "of", "cooperation", "between", "Mu", "##jah", "##ide", "##en", "K", "##hal", "##q", "and", "the", "Iranian", "Kur", "##dish", "opposition", "##s", "\"", "." ], "ids": [ 138, 50005, 24305, 10142, 10105, 11795, 12415, 10105, 19822, 107, 65037, 169, 10751, 13277, 10108, 56547, 10948, 49056, 27494, 13315, 10136, 148, 18453, 11703, 10111, 10105, 41768, 61912, 67522, 21227, 10107, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "heavily", "bomba", "##rde", "##d", "targets", "in", "northern", "Iraq", "in", "July", "in", "pursuit", "of", "K", "##DP", "##I", "guerrilla", "##s", "based", "in", "Iraqi", "Kur", "##dish", "areas", "outside", "the", "control", "of", "the", "government", "in", "Baghdad", "." ], "ids": [ 12901, 33556, 39889, 17229, 10162, 56996, 10106, 17335, 21455, 10106, 11112, 10106, 93910, 10108, 148, 54714, 11281, 106552, 10107, 11610, 10106, 57806, 61912, 67522, 14544, 17555, 10105, 12608, 10108, 10105, 12047, 10106, 73055, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Iraqi", "Kur", "##dish", "areas", "border", "##ing", "Iran", "are", "under", "the", "control", "of", "guerrilla", "##s", "of", "the", "Iraqi", "Kur", "##dish", "Patriot", "##ic", "Union", "of", "Kurdistan", "(", "P", "##U", "##K", ")", "group", "." ], "ids": [ 57806, 61912, 67522, 14544, 20949, 10230, 12901, 10301, 10571, 10105, 12608, 10108, 106552, 10107, 10108, 10105, 57806, 61912, 67522, 107222, 11130, 11457, 10108, 86246, 113, 153, 12022, 11733, 114, 11795, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "P", "##U", "##K", "and", "Iraq", "'", "s", "Kurdistan", "Democratic", "Party", "(", "K", "##DP", ")", "the", "two", "main", "Iraqi", "Kur", "##dish", "faction", "##s", ",", "have", "had", "northern", "Iraq", "under", "their", "control", "since", "Iraqi", "forces", "were", "ou", "##sted", "from", "Kuwait", "in", "the", "1991", "Gulf", "War", "." ], "ids": [ 153, 12022, 11733, 10111, 21455, 112, 187, 86246, 19281, 12529, 113, 148, 54714, 114, 10105, 10551, 12126, 57806, 61912, 67522, 84395, 10107, 117, 10529, 10374, 17335, 21455, 10571, 10455, 12608, 11764, 57806, 13729, 10309, 10431, 36018, 10188, 44892, 10106, 10105, 10442, 28239, 11277, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 3, 7, 7, 9, 1, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Clash", "##es", "between", "the", "two", "parties", "broke", "out", "at", "the", "weekend", "in", "the", "most", "serious", "fighting", "since", "a", "U", ".", "S", ".", "-", "sponsored", "cea", "##sef", "##ire", "last", "year", "." ], "ids": [ 72852, 10171, 10948, 10105, 10551, 18708, 30500, 10950, 10160, 10105, 43440, 10106, 10105, 10992, 32342, 27535, 11764, 169, 158, 119, 156, 119, 118, 44747, 25578, 107749, 11627, 12469, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mu", "##jah", "##ide", "##en", "K", "##hal", "##q", "said", "Iranian", "troops", "had", "also", "been", "shell", "##ing", "K", "##DP", "positions", "in", "Q", "##as", "##ri", "region", "in", "Sul", "##eim", "##aniya", "province", "near", "the", "Iranian", "border", "over", "the", "last", "two", "days", "." ], "ids": [ 49056, 27494, 13315, 10136, 148, 18453, 11703, 12415, 41768, 20836, 10374, 10379, 10590, 43332, 10230, 148, 54714, 23188, 10106, 154, 10403, 10401, 12220, 10106, 16049, 35812, 84931, 14342, 12883, 10105, 41768, 20949, 10491, 10105, 12469, 10551, 13990, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 2, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 5, 5, 9, 9, 1, 5, 5, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "about", "100", "Iraqi", "Kur", "##ds", "were", "killed", "or", "wounded", "in", "the", "attack", "." ], "ids": [ 10377, 12415, 10978, 10407, 57806, 61912, 13268, 10309, 15875, 10345, 39127, 10106, 10105, 16342, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "Iran", "and", "Turkey", "moun", "##t", "air", "and", "land", "strikes", "at", "targets", "in", "northern", "Iraq", "in", "pursuit", "of", "their", "own", "Kur", "##dish", "rebels", "." ], "ids": [ 20973, 12901, 10111, 22519, 19834, 10123, 12566, 10111, 11773, 86206, 10160, 56996, 10106, 17335, 21455, 10106, 93910, 10108, 10455, 12542, 61912, 67522, 57545, 119 ], "entity": [ "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "A", "U", ".", "S", ".", "-", "led", "air", "force", "in", "southern", "Turkey", "protect", "##s", "Iraqi", "Kur", "##ds", "from", "possible", "attacks", "by", "Baghdad", "troops", "." ], "ids": [ 138, 158, 119, 156, 119, 118, 12857, 12566, 15031, 10106, 17156, 22519, 32949, 10107, 57806, 61912, 13268, 10188, 14128, 26483, 10155, 73055, 20836, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 1, 9, 9, 2, 6, 6, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Saudi", "ri", "##yal", "rates", "st", "##eady", "in", "quiet", "summer", "trade", "." ], "ids": [ 26598, 29956, 30024, 38200, 28780, 61973, 10106, 104951, 17995, 18908, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##AM", "##A", "1996", "-", "08", "-", "22" ], "ids": [ 73020, 36535, 10738, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "spot", "Saudi", "ri", "##yal", "against", "the", "dollar", "and", "ri", "##yal", "inter", "##bank", "de", "##posit", "rates", "were", "mainly", "st", "##eady", "this", "week", "in", "quiet", "summer", "trade", ",", "deal", "##ers", "in", "the", "kingdom", "said", "." ], "ids": [ 10117, 28504, 26598, 29956, 30024, 11327, 10105, 34807, 10111, 29956, 30024, 22021, 20583, 10104, 106185, 38200, 10309, 20827, 28780, 61973, 10531, 16118, 10106, 104951, 17995, 18908, 117, 19918, 10901, 10106, 10105, 12293, 12415, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "were", "no", "changes", "in", "Saudi", "ri", "##yal", "rates", "." ], "ids": [ 107, 11723, 10309, 10192, 19010, 10106, 26598, 29956, 30024, 38200, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "The", "market", "was", "very", "quiet", "because", "of", "summer", "holiday", "##s", ",", "\"", "one", "deal", "##er", "said", "." ], "ids": [ 10117, 17313, 10134, 12558, 104951, 12373, 10108, 17995, 71806, 10107, 117, 107, 10464, 19918, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "spot", "ri", "##yal", "was", "put", "at", "3", ".", "750", "##4", "/", "06", "to", "the", "dollar", "." ], "ids": [ 10117, 28504, 29956, 30024, 10134, 14499, 10160, 124, 119, 17052, 11011, 120, 10719, 10114, 10105, 34807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "-", "month", "inter", "##bank", "deposits", "were", "at", "5", "-", "1", "/", "2", ",", "3", "/", "8", "percent", ",", "three", "months", "were", "5", "-", "5", "/", "8", ",", "1", "/", "2", "percent", "and", "six", "months", "were", "5", "-", "3", "/", "4", ",", "5", "/", "8", "percent", "." ], "ids": [ 11340, 118, 14064, 22021, 20583, 82662, 10309, 10160, 126, 118, 122, 120, 123, 117, 124, 120, 129, 22362, 117, 11003, 15555, 10309, 126, 118, 126, 120, 129, 117, 122, 120, 123, 22362, 10111, 12449, 15555, 10309, 126, 118, 124, 120, 125, 117, 126, 120, 129, 22362, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "-", "year", "funds", "were", "at", "six", ",", "5", "-", "7", "/", "8", "percent", "." ], "ids": [ 11340, 118, 10924, 32067, 10309, 10160, 12449, 117, 126, 118, 128, 120, 129, 22362, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israel", "app", "##rove", "##s", "Ara", "##fat", "'", "s", "flight", "to", "West", "Bank", "." ], "ids": [ 12991, 72894, 75662, 10107, 54789, 25616, 112, 187, 23578, 10114, 11164, 13533, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 4, 8, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "22" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israel", "gave", "Palestinian", "President", "Ya", "##sser", "Ara", "##fat", "permission", "on", "Thursday", "to", "fly", "over", "its", "territory", "to", "the", "West", "Bank", ",", "ending", "a", "brief", "Israeli", "-", "PL", "##O", "crisis", ",", "an", "Ara", "##fat", "ad", "##viser", "said", "." ], "ids": [ 12991, 15362, 56119, 12811, 25148, 33519, 54789, 25616, 52389, 10135, 67067, 10114, 26155, 10491, 10474, 24399, 10114, 10105, 11164, 13533, 117, 29077, 169, 29040, 28446, 118, 71341, 11403, 22859, 117, 10151, 54789, 25616, 10840, 54478, 12415, 119 ], "entity": [ "B-LOC", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "problem", "is", "over", "." ], "ids": [ 107, 10117, 18077, 10124, 10491, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "president", "'", "s", "aircraft", "has", "received", "permission", "to", "pass", "through", "Israeli", "airs", "##pace", "but", "the", "president", "is", "not", "expected", "to", "travel", "to", "the", "West", "Bank", "before", "Monday", ",", "\"", "Nabi", "##l", "Abu", "R", "##dai", "##nah", "told", "Reuters", "." ], "ids": [ 10117, 12931, 112, 187, 16167, 10393, 12296, 52389, 10114, 23392, 11222, 28446, 104816, 50957, 10473, 10105, 12931, 10124, 10472, 25973, 10114, 23595, 10114, 10105, 11164, 13533, 11360, 40714, 117, 107, 69733, 10161, 18332, 155, 33738, 53907, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 9 ] }, { "tokens": [ "Ara", "##fat", "had", "been", "scheduled", "to", "meet", "former", "Israeli", "prime", "minister", "Shi", "##mon", "Pere", "##s", "in", "the", "West", "Bank", "town", "of", "Rama", "##llah", "on", "Thursday", "but", "the", "venue", "was", "changed", "to", "Gaza", "after", "Israel", "denied", "flight", "clear", "##ance", "to", "the", "Palestinian", "leader", "'", "s", "helicopter", "##s", "." ], "ids": [ 54789, 25616, 10374, 10590, 34081, 10114, 23267, 11775, 28446, 19287, 16930, 44795, 16278, 33511, 10107, 10106, 10105, 11164, 13533, 12221, 10108, 42746, 98134, 10135, 67067, 10473, 10105, 39975, 10134, 17695, 10114, 42434, 10662, 12991, 47467, 23578, 24866, 16460, 10114, 10105, 56119, 15014, 112, 187, 80634, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "officials", "accused", "right", "-", "wing", "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", "of", "trying", "to", "stop", "the", "Rama", "##llah", "meeting", "by", "keeping", "Ara", "##fat", "ground", "##ed", "." ], "ids": [ 56119, 27730, 37303, 13448, 118, 22571, 19924, 14355, 16810, 32577, 36027, 13723, 10108, 32862, 10114, 20517, 10105, 42746, 98134, 19822, 10155, 51318, 54789, 25616, 16912, 10336, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Ara", "##fat", "subsequently", "cancelled", "a", "meeting", "between", "Israeli", "and", "PL", "##O", "officials", ",", "on", "civilian", "affairs", ",", "at", "the", "Allen", "##by", "Bridge", "crossing", "between", "Jordan", "and", "the", "West", "Bank", "." ], "ids": [ 54789, 25616, 20961, 60557, 169, 19822, 10948, 28446, 10111, 71341, 11403, 27730, 117, 10135, 53653, 43417, 117, 10160, 10105, 15101, 11530, 17426, 41031, 10948, 16366, 10111, 10105, 11164, 13533, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 2, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Abu", "R", "##dai", "##nah", "said", "Ara", "##fat", "had", "decided", "against", "flying", "to", "the", "West", "Bank", "on", "Thursday", ",", "after", "Israel", "lift", "##ed", "the", "ban", ",", "because", "he", "had", "a", "bus", "##y", "schedule", "in", "Gaza", "and", "would", "not", "be", "free", "until", "Monday", "." ], "ids": [ 18332, 155, 33738, 53907, 12415, 54789, 25616, 10374, 17270, 11327, 34676, 10114, 10105, 11164, 13533, 10135, 67067, 117, 10662, 12991, 63376, 10336, 10105, 11915, 117, 12373, 10261, 10374, 169, 19369, 10157, 52561, 10106, 42434, 10111, 10894, 10472, 10347, 13961, 11444, 40714, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ara", "##fat", "to", "meet", "Pere", "##s", "in", "Gaza", "after", "flight", "ban", "." ], "ids": [ 54789, 25616, 10114, 23267, 33511, 10107, 10106, 42434, 10662, 23578, 11915, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "22" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ya", "##sser", "Ara", "##fat", "will", "meet", "Shi", "##mon", "Pere", "##s", "in", "Gaza", "on", "Thursday", "after", "Palestinian", "##s", "said", "the", "right", "-", "wing", "Israeli", "government", "had", "barre", "##d", "the", "Palestinian", "leader", "from", "flying", "to", "the", "West", "Bank", "for", "talks", "with", "the", "former", "prime", "minister", "." ], "ids": [ 25148, 33519, 54789, 25616, 11337, 23267, 44795, 16278, 33511, 10107, 10106, 42434, 10135, 67067, 10662, 56119, 10107, 12415, 10105, 13448, 118, 22571, 28446, 12047, 10374, 107553, 10162, 10105, 56119, 15014, 10188, 34676, 10114, 10105, 11164, 13533, 10142, 56672, 10169, 10105, 11775, 19287, 16930, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "meeting", "between", "Pere", "##s", "and", "Ara", "##fat", "will", "take", "place", "at", "Er", "##ez", "check", "##point", "in", "Gaza", "and", "not", "in", "Rama", "##llah", "as", "planned", ",", "\"", "Pere", "##s", "'", "office", "said", "." ], "ids": [ 107, 10117, 19822, 10948, 33511, 10107, 10111, 54789, 25616, 11337, 13574, 11192, 10160, 10915, 12715, 43662, 45676, 10106, 42434, 10111, 10472, 10106, 42746, 98134, 10146, 24292, 117, 107, 33511, 10107, 112, 14301, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 9, 9, 9, 1, 5, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "officials", "said", "the", "Israeli", "government", "had", "barre", "##d", "Ara", "##fat", "from", "over", "##fly", "##ing", "Israel", "in", "a", "Palestinian", "helicopter", "to", "the", "West", "Bank", "in", "an", "attempt", "to", "bar", "the", "meeting", "with", "Pere", "##s", "." ], "ids": [ 56119, 27730, 12415, 10105, 28446, 12047, 10374, 107553, 10162, 54789, 25616, 10188, 10491, 41863, 10230, 12991, 10106, 169, 56119, 80634, 10114, 10105, 11164, 13533, 10106, 10151, 21395, 10114, 18121, 10105, 19822, 10169, 33511, 10107, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 2, 9, 9, 9, 2, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 1, 9, 9, 2, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Israeli", "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", "has", "accused", "opposition", "leader", "Pere", "##s", ",", "who", "he", "defeated", "in", "May", "elections", ",", "of", "trying", "to", "under", "##mine", "his", "Li", "##kud", "government", "'", "s", "authority", "to", "conduct", "peace", "talks", "." ], "ids": [ 28446, 19924, 14355, 16810, 32577, 36027, 13723, 10393, 37303, 21227, 15014, 33511, 10107, 117, 10479, 10261, 18058, 10106, 10725, 22054, 117, 10108, 32862, 10114, 10571, 18333, 10226, 13258, 52813, 12047, 112, 187, 26772, 10114, 45541, 28101, 56672, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Afghan", "UAE", "em", "##bas", "##sy", "says", "Tale", "##ban", "guards", "going", "home", "." ], "ids": [ 82228, 93528, 10266, 21322, 16105, 22153, 27632, 10927, 99024, 19090, 11816, 119 ], "entity": [ "B-MISC", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Hilary", "Gus", "##h" ], "ids": [ 75334, 61067, 10237 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "D", "##UB", "##A", "##I", "1996", "-", "08", "-", "22" ], "ids": [ 141, 82439, 10738, 11281, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Three", "Afghan", "guards", "brought", "to", "the", "United", "Arab", "Emirates", "last", "week", "by", "Russian", "host", "##ages", "who", "escaped", "from", "the", "Tale", "##ban", "militia", "will", "return", "to", "Afghanistan", "in", "a", "few", "days", ",", "the", "Afghan", "em", "##bas", "##sy", "in", "Abu", "Dhabi", "said", "on", "Thursday", "." ], "ids": [ 15139, 82228, 99024, 17327, 10114, 10105, 10609, 17365, 66967, 12469, 16118, 10155, 13463, 19317, 24115, 10479, 65602, 10188, 10105, 27632, 10927, 86957, 11337, 15079, 10114, 18776, 10106, 169, 13824, 13990, 117, 10105, 82228, 10266, 21322, 16105, 10106, 18332, 76550, 12415, 10135, 67067, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Our", "ambassador", "is", "in", "touch", "with", "the", "UAE", "foreign", "ministry", "." ], "ids": [ 107, 18465, 74853, 10124, 10106, 54981, 10169, 10105, 93528, 20796, 65338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Their", "return", "to", "Afghanistan", "will", "take", "place", "in", "two", "or", "three", "days", ",", "\"", "an", "em", "##bas", "##sy", "official", "said", "." ], "ids": [ 17551, 15079, 10114, 18776, 11337, 13574, 11192, 10106, 10551, 10345, 11003, 13990, 117, 107, 10151, 10266, 21322, 16105, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "em", "##bas", "##sy", "is", "issu", "##ing", "them", "travel", "documents", "for", "their", "return", "to", "their", "home", "##land", "." ], "ids": [ 107, 10117, 10266, 21322, 16105, 10124, 28815, 10230, 11345, 23595, 21784, 10142, 10455, 15079, 10114, 10455, 11816, 11080, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "is", "no", "object", "##ion", "to", "their", "travel", ",", "\"", "he", "added", "." ], "ids": [ 11723, 10124, 10192, 29331, 11046, 10114, 10455, 23595, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "three", "Islamic", "Tale", "##ban", "guards", "were", "over", "##power", "##ed", "by", "seven", "Russian", "air", "##cre", "##w", "who", "escaped", "to", "UAE", "state", "Sha", "##rja", "##h", "last", "Friday", "on", "board", "their", "own", "aircraft", "after", "a", "year", "in", "the", "cap", "##tivi", "##ty", "of", "Tale", "##ban", "militia", "in", "Kan", "##dah", "##ar", "in", "southern", "Afghanistan", "." ], "ids": [ 10117, 11003, 22150, 27632, 10927, 99024, 10309, 10491, 65211, 10336, 10155, 15767, 13463, 12566, 27794, 10874, 10479, 65602, 10114, 93528, 11388, 106583, 26914, 10237, 12469, 30767, 10135, 17936, 10455, 12542, 16167, 10662, 169, 10924, 10106, 10105, 13337, 30878, 11195, 10108, 27632, 10927, 86957, 10106, 57528, 30942, 10354, 10106, 17156, 18776, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 5, 9, 9, 1, 9 ] }, { "tokens": [ "The", "UAE", "said", "on", "Monday", "it", "would", "hand", "over", "the", "three", "to", "the", "International", "Red", "Crescent", ",", "possibly", "last", "Tuesday", "." ], "ids": [ 10117, 93528, 12415, 10135, 40714, 10271, 10894, 15230, 10491, 10105, 11003, 10114, 10105, 10771, 11641, 100864, 117, 33370, 12469, 70245, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "has", "since", "been", "silent", "on", "the", "issue", "." ], "ids": [ 10377, 10393, 11764, 10590, 66720, 10135, 10105, 15557, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "asked", "whether", "the", "three", "guards", "would", "travel", "back", "to", "Kan", "##dah", "##ar", "or", "the", "Afghan", "capital", "Kabul", ",", "the", "em", "##bas", "##sy", "official", "said", ":", "\"", "That", "has", "not", "been", "decided", ",", "but", "possibly", "Kan", "##dah", "##ar", ".", "\"" ], "ids": [ 12242, 22151, 21883, 10105, 11003, 99024, 10894, 23595, 12014, 10114, 57528, 30942, 10354, 10345, 10105, 82228, 12185, 33716, 117, 10105, 10266, 21322, 16105, 14731, 12415, 131, 107, 13646, 10393, 10472, 10590, 17270, 117, 10473, 33370, 57528, 30942, 10354, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 2, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "Kan", "##dah", "##ar", "is", "the", "headquarters", "of", "the", "opposition", "Tale", "##ban", "militia", "." ], "ids": [ 57528, 30942, 10354, 10124, 10105, 28245, 10108, 10105, 21227, 27632, 10927, 86957, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Kabul", "is", "controlled", "by", "President", "Bu", "##r", "##han", "##uddin", "Ra", "##bban", "##i", "'", "s", "government", ",", "which", "Tale", "##ban", "is", "fighting", "to", "over", "##th", "##row", "." ], "ids": [ 33716, 10124, 29050, 10155, 12811, 11916, 10129, 11781, 76170, 38571, 88901, 10116, 112, 187, 12047, 117, 10319, 27632, 10927, 10124, 27535, 10114, 10491, 11143, 21454, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "em", "##bas", "##sy", "official", "said", "the", "three", "men", ",", "believed", "to", "be", "in", "their", "20", "##s", ",", "were", "currently", "in", "Abu", "Dhabi", "." ], "ids": [ 10117, 10266, 21322, 16105, 14731, 12415, 10105, 11003, 10588, 117, 20718, 10114, 10347, 10106, 10455, 10197, 10107, 117, 10309, 15313, 10106, 18332, 76550, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "He", "did", "not", "elaborate", "." ], "ids": [ 10357, 12172, 10472, 90052, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Russian", "##s", ",", "working", "for", "the", "Aero", "##stan", "firm", "in", "the", "Russian", "republic", "of", "Tata", "##rst", "##an", ",", "were", "taken", "host", "##age", "after", "a", "Tale", "##ban", "MiG", "-", "19", "fighter", "forced", "their", "cargo", "plane", "to", "land", "in", "August", "1995", "." ], "ids": [ 10117, 13463, 10107, 117, 14616, 10142, 10105, 62420, 17414, 23410, 10106, 10105, 13463, 108499, 10108, 58711, 21328, 10206, 117, 10309, 15109, 19317, 12276, 10662, 169, 27632, 10927, 36546, 118, 10270, 49422, 20054, 10455, 15856, 35007, 10114, 11773, 10106, 10735, 10436, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 3, 7, 9, 9, 9, 2, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 2, 6, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tale", "##ban", "said", "its", "ship", "##ment", "of", "ammunition", "from", "Albania", "was", "evidence", "of", "Russian", "military", "support", "for", "Ra", "##bban", "##i", "'", "s", "government", "." ], "ids": [ 27632, 10927, 12415, 10474, 17309, 10426, 10108, 77036, 10188, 28931, 10134, 18713, 10108, 13463, 14041, 13145, 10142, 38571, 88901, 10116, 112, 187, 12047, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Moscow", "said", "the", "crew", "'", "s", "nationality", "was", "coincide", "##ntal", "." ], "ids": [ 18744, 12415, 10105, 24032, 112, 187, 91282, 10134, 81860, 54739, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nu", "##mero", "##us", "diplomatic", "attempts", "to", "free", "the", "seven", "failed", "." ], "ids": [ 28336, 93817, 10251, 64838, 30406, 10114, 13961, 10105, 15767, 20775, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Russian", "##s", ",", "who", "said", "they", "over", "##power", "##ed", "the", "guards", "-", "-", "two", "armed", "with", "Ka", "##lash", "##nikov", "automatic", "rifle", "##s", "-", "-", "while", "doing", "regular", "maintenance", "work", "on", "their", "Il", "##yu", "##shin", "76", "cargo", "plane", "last", "Friday", ",", "left", "the", "UAE", "capital", "Abu", "Dhabi", "for", "home", "on", "Sunday", "." ], "ids": [ 10117, 13463, 10107, 117, 10479, 12415, 10689, 10491, 65211, 10336, 10105, 99024, 118, 118, 10551, 34174, 10169, 25444, 25297, 52574, 57472, 59116, 10107, 118, 118, 11371, 30918, 15670, 40347, 11424, 10135, 10455, 10282, 25285, 63840, 12428, 15856, 35007, 12469, 30767, 117, 12153, 10105, 93528, 12185, 18332, 76550, 10142, 11816, 10135, 19731, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraq", "'", "s", "Saddam", "meets", "Russia", "'", "s", "Z", "##hir", "##ino", "##vsky", "." ], "ids": [ 21455, 112, 187, 85431, 40427, 14664, 112, 187, 163, 21840, 12349, 69702, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 9, 4, 9, 1, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "BA", "##G", "##HD", "##AD", "1996", "-", "08", "-", "22" ], "ids": [ 39999, 11447, 99997, 55538, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraqi", "President", "Saddam", "Hussein", "has", "told", "visiting", "Russian", "ultra", "-", "nationalist", "Vladimir", "Z", "##hir", "##ino", "##vsky", "that", "Baghdad", "wanted", "to", "maintain", "\"", "friendship", "and", "cooperation", "\"", "with", "Moscow", ",", "official", "Iraqi", "newspapers", "said", "on", "Thursday", "." ], "ids": [ 57806, 12811, 85431, 49053, 10393, 21937, 48780, 13463, 71560, 118, 99451, 18124, 163, 21840, 12349, 69702, 10189, 73055, 22591, 10114, 37215, 107, 74447, 10111, 56547, 107, 10169, 18744, 117, 14731, 57806, 48473, 12415, 10135, 67067, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "President", "Saddam", "Hussein", "stress", "##ed", "during", "the", "meeting", "Iraq", "'", "s", "keen", "##ness", "to", "maintain", "friendship", "and", "cooperation", "with", "Russia", ",", "\"", "the", "papers", "said", "." ], "ids": [ 107, 12811, 85431, 49053, 39608, 10336, 10939, 10105, 19822, 21455, 112, 187, 67605, 14010, 10114, 37215, 74447, 10111, 56547, 10169, 14664, 117, 107, 10105, 34546, 12415, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "Z", "##hir", "##ino", "##vsky", "told", "Saddam", "before", "he", "left", "Baghdad", "on", "Wednesday", "that", "his", "Liberal", "Democratic", "party", "and", "the", "Russian", "Dum", "##a", "(", "parliament", ")", "\"", "are", "calling", "for", "an", "immediate", "lift", "##ing", "of", "the", "embargo", "\"", "imposed", "on", "Iraq", "after", "its", "1990", "invasion", "of", "Kuwait", "." ], "ids": [ 11696, 12415, 163, 21840, 12349, 69702, 21937, 85431, 11360, 10261, 12153, 73055, 10135, 57611, 10189, 10226, 22285, 19281, 14039, 10111, 10105, 13463, 94566, 10113, 113, 40519, 114, 107, 10301, 37023, 10142, 10151, 46938, 63376, 10230, 10108, 10105, 14668, 107, 83358, 10135, 21455, 10662, 10474, 10420, 26866, 10108, 44892, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 4, 9, 9, 9, 1, 9, 9, 9, 9, 3, 7, 7, 9, 9, 2, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Z", "##hir", "##ino", "##vsky", "said", "on", "Tuesday", "he", "would", "press", "the", "Russian", "government", "to", "help", "end", "U", ".", "N", ".", "trade", "san", "##ctions", "on", "Iraq", "and", "bl", "##amed", "Moscow", "for", "delay", "##ing", "establishment", "of", "good", "ties", "with", "Baghdad", "." ], "ids": [ 163, 21840, 12349, 69702, 12415, 10135, 70245, 10261, 10894, 21040, 10105, 13463, 12047, 10114, 15217, 11572, 158, 119, 151, 119, 18908, 14608, 42068, 10135, 21455, 10111, 21484, 83865, 18744, 10142, 76497, 10230, 31989, 10108, 15198, 45169, 10169, 73055, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "Our", "stand", "is", "firm", ",", "namely", "we", "are", "calling", "on", "(", "the", "Russian", ")", "government", "to", "end", "the", "economic", "embargo", "on", "Iraq", "and", "res", "##ume", "trade", "ties", "between", "Russia", "and", "Iraq", ",", "\"", "he", "told", "reporter", "##s", "." ], "ids": [ 107, 18465, 14603, 10124, 23410, 117, 66093, 11951, 10301, 37023, 10135, 113, 10105, 13463, 114, 12047, 10114, 11572, 10105, 13925, 14668, 10135, 21455, 10111, 39429, 20467, 18908, 45169, 10948, 14664, 10111, 21455, 117, 107, 10261, 21937, 41408, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Z", "##hir", "##ino", "##vsky", "visited", "Iraq", "twice", "in", "1995", "." ], "ids": [ 163, 21840, 12349, 69702, 30270, 21455, 26261, 10106, 10436, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "October", "he", "was", "invited", "to", "attend", "the", "referendum", "held", "on", "Iraq", "'", "s", "presidency", ",", "which", "extended", "Saddam", "'", "s", "term", "for", "seven", "more", "years", "." ], "ids": [ 14812, 11212, 10261, 10134, 33392, 10114, 34465, 10105, 39697, 11991, 10135, 21455, 112, 187, 97059, 117, 10319, 21777, 85431, 112, 187, 13719, 10142, 15767, 10798, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Iraq", "-", "Aug", "22", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 21455, 118, 53012, 10306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##G", "##HD", "##AD", "1996", "-", "08", "-", "22" ], "ids": [ 39999, 11447, 99997, 55538, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "some", "of", "the", "leading", "stories", "in", "the", "official", "Iraqi", "press", "on", "Thursday", "." ], "ids": [ 13252, 10301, 11152, 10108, 10105, 16018, 21158, 10106, 10105, 14731, 57806, 21040, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##HA", "##WR", "##A" ], "ids": [ 157, 58132, 105016, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Iraq", "'", "s", "President", "Saddam", "Hussein", "meets", "with", "chairman", "of", "the", "Russian", "liberal", "democratic", "party", "Vladimir", "Z", "##hir", "##ino", "##vsky", "." ], "ids": [ 118, 21455, 112, 187, 12811, 85431, 49053, 40427, 10169, 27627, 10108, 10105, 13463, 28950, 72209, 14039, 18124, 163, 21840, 12349, 69702, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "-", "Turkish", "foreign", "minister", "says", "Turkey", "will", "take", "part", "in", "the", "Baghdad", "trade", "fair", "that", "will", "be", "held", "in", "November", "." ], "ids": [ 118, 22814, 20796, 16930, 22153, 22519, 11337, 13574, 10668, 10106, 10105, 73055, 18908, 45122, 10189, 11337, 10347, 11991, 10106, 10819, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IRA", "##Q" ], "ids": [ 64107, 19282 ], "entity": [ "B-LOC", "I-LOC" ], "entity_ids": [ 1, 5 ] }, { "tokens": [ "-", "A", "ship", "##load", "of", "12", "tonnes", "of", "rice", "arrives", "in", "Umm", "Q", "##as", "##r", "port", "in", "the", "Gulf", "." ], "ids": [ 118, 138, 17309, 64312, 10108, 10186, 39435, 10108, 59039, 69631, 10106, 93545, 154, 10403, 10129, 16874, 10106, 10105, 28239, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 1, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Lebanon", "-", "Aug", "22", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 40037, 118, 53012, 10306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##IR", "##UT", "1996", "-", "08", "-", "22" ], "ids": [ 46291, 73522, 65729, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "the", "leading", "stories", "in", "the", "Beirut", "press", "on", "Thursday", "." ], "ids": [ 13252, 10301, 10105, 16018, 21158, 10106, 10105, 43822, 21040, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "-", "NA", "##HA", "##R" ], "ids": [ 50972, 118, 56586, 58132, 11273 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Con", "##frontation", "is", "escala", "##ting", "between", "Hi", "##z", "##bollah", "and", "the", "government", "." ], "ids": [ 118, 12845, 85437, 10124, 28461, 12141, 10948, 20065, 10305, 109901, 10111, 10105, 12047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Prime", "Minister", "Hari", "##ri", ":", "Israeli", "threats", "do", "no", "serve", "peace", "." ], "ids": [ 118, 19924, 14355, 39769, 10401, 131, 28446, 85186, 10149, 10192, 19430, 28101, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AS", "-", "SA", "##F", "##IR" ], "ids": [ 17421, 118, 21318, 11565, 73522 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Parliament", "Speaker", "Be", "##rri", ":", "Israel", "is", "preparing", "for", "war", "against", "Syria", "and", "Lebanon", "." ], "ids": [ 118, 19173, 64844, 14321, 24874, 131, 12991, 10124, 90798, 10142, 10338, 11327, 25612, 10111, 40037, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "-", "Parliamentary", "battle", "in", "Beirut", ".", "." ], "ids": [ 118, 65671, 18758, 10106, 43822, 119, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "The", "three", "main", "lists", "have", "been", "prepared", "." ], "ids": [ 10117, 11003, 12126, 44644, 10529, 10590, 39837, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AL", "-", "AN", "##WA", "##R" ], "ids": [ 47271, 118, 50972, 42196, 11273 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Conti", "##nue", "##d", "criticism", "of", "law", "violation", "incidents", "-", "-", "which", "occurred", "in", "the", "Mount", "Lebanon", "elections", "last", "Sunday", "." ], "ids": [ 118, 68918, 84709, 10162, 43291, 10108, 13255, 88993, 73451, 118, 118, 10319, 25738, 10106, 10105, 14287, 40037, 22054, 12469, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "AD", "-", "DI", "##Y", "##AR" ], "ids": [ 22992, 118, 110014, 14703, 52188 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Financial", "negotiations", "between", "Lebanon", "and", "Pakistan", "." ], "ids": [ 118, 30738, 61946, 10948, 40037, 10111, 15437, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "-", "Hari", "##ri", "to", "step", "into", "the", "election", "battle", "with", "an", "in", "##com", "##plete", "list", "." ], "ids": [ 118, 39769, 10401, 10114, 31877, 10708, 10105, 13685, 18758, 10169, 10151, 10106, 22530, 97598, 13416, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "N", "##ID", "##A", "'", "A", "AL", "-", "W", "##AT", "##AN" ], "ids": [ 151, 28895, 10738, 112, 138, 47271, 118, 160, 32071, 41275 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Mar", "##oni", "##te", "Patria", "##rch", "Sf", "##eir", "expressed", "sor", "##row", "over", "the", "violation", "##s", "in", "Sunday", "'", "elections", "." ], "ids": [ 118, 15734, 14639, 10216, 65330, 24030, 95278, 50705, 31685, 56011, 21454, 10491, 10105, 88993, 10107, 10106, 19731, 112, 22054, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CM", "##E", "live", "and", "feed", "##er", "cattle", "calls", "range", "mixed", "." ], "ids": [ 42741, 11259, 12962, 10111, 44988, 10165, 56980, 31886, 15601, 23742, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Early", "calls", "on", "CM", "##E", "live", "and", "feed", "##er", "cattle", "future", "##s", "range", "##d", "from", "0", ".", "200", "cent", "higher", "to", "0", ".", "100", "lower", ",", "lives", "##tock", "anal", "##yst", "##s", "said", "." ], "ids": [ 18610, 31886, 10135, 42741, 11259, 12962, 10111, 44988, 10165, 56980, 16711, 10107, 15601, 10162, 10188, 121, 119, 10777, 32882, 17981, 10114, 121, 119, 10407, 18165, 117, 21418, 60458, 106615, 62769, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "continued", "strong", "tone", "to", "cash", "cattle", "and", "be", "##ef", "markets", "should", "pro", "##mpt", "further", "support", "." ], "ids": [ 10117, 14278, 18093, 43619, 10114, 52828, 56980, 10111, 10347, 16822, 42893, 14819, 11284, 109361, 14586, 13145, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Outlook", "for", "a", "bu", "##llis", "##h", "cattle", "-", "on", "-", "feed", "report", "is", "also", "expected", "to", "len", "##d", "support", "and", "pro", "##mpt", "some", "bu", "##ll", "spread", "##ing", ",", "anal", "##yst", "##s", "said", "." ], "ids": [ 103777, 10142, 169, 11499, 44417, 10237, 56980, 118, 10135, 118, 44988, 17553, 10124, 10379, 25973, 10114, 28859, 10162, 13145, 10111, 11284, 109361, 11152, 11499, 11231, 25609, 10230, 117, 106615, 62769, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "However", ",", "trade", "will", "likely", "be", "light", "and", "prices", "could", "drift", "on", "evening", "up", "ahead", "of", "the", "report", "." ], "ids": [ 12209, 117, 18908, 11337, 22497, 10347, 15765, 10111, 57476, 12174, 60246, 10135, 42135, 10741, 35629, 10108, 10105, 17553, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cash", "markets", "are", "also", "expected", "to", "be", "quiet", "after", "the", "record", "amount", "of", "feed", "##lot", "cattle", "traded", "this", "week", ",", "they", "said", "." ], "ids": [ 41286, 42893, 10301, 10379, 25973, 10114, 10347, 104951, 10662, 10105, 12410, 24074, 10108, 44988, 20288, 56980, 52696, 10531, 16118, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kinder", "##care", "says", "debt", "buy", "to", "hit", "Q", "##1", "results", "." ], "ids": [ 18056, 22277, 22153, 55869, 47715, 10114, 14946, 154, 10759, 17466, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##GO", "##ME", "##R", "##Y", ",", "Ala", "." ], "ids": [ 102059, 77261, 83821, 42424, 11273, 14703, 117, 56500, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "22" ], "ids": [ 10389, 118, 11052, 118, 10306 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kinder", "##C", "##are", "Learning", "Centers", "Inc", "said", "on", "Thursday", "that", "a", "debt", "buy", "##back", "would", "mean", "an", "extraordinary", "loss", "of", "$", "1", ".", "2", "million", "in", "its", "fiscal", "1997", "first", "quarter", "." ], "ids": [ 18056, 10858, 11591, 36639, 105070, 13604, 12415, 10135, 67067, 10189, 169, 55869, 47715, 18666, 10894, 36110, 10151, 105509, 18576, 10108, 109, 122, 119, 123, 12473, 10106, 10474, 43645, 10391, 10422, 28330, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "said", "that", "during", "the", "quarter", ",", "which", "began", "June", "1", ",", "it", "bought", "$", "30", "million", "par", "value", "of", "its", "outstanding", "10", "-", "3", "/", "8", "percent", "senior", "notes", "due", "2001", "." ], "ids": [ 10117, 12100, 12415, 10189, 10939, 10105, 28330, 117, 10319, 11941, 11120, 122, 117, 10271, 28870, 109, 10244, 12473, 10248, 19211, 10108, 10474, 53933, 10150, 118, 124, 120, 129, 22362, 17843, 19899, 10850, 10272, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "notes", "were", "bought", "for", "$", "31", ".", "5", "million", "." ], "ids": [ 10117, 19899, 10309, 28870, 10142, 109, 10413, 119, 126, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Philip", "Mas", "##lowe", ",", "chief", "financial", "officer", "of", "the", "pre", "##school", "and", "child", "care", "company", ",", "said", "the", "buy", "##back", "\"", "offered", "an", "opportunity", "to", "reduce", "the", "company", "'", "s", "weight", "##ed", "average", "interest", "costs", "and", "improve", "future", "cash", "flows", "and", "earning", "##s", ".", "\"" ], "ids": [ 13324, 16423, 78494, 117, 19421, 20570, 19288, 10108, 10105, 12229, 46196, 10111, 18048, 11131, 12100, 117, 12415, 10105, 47715, 18666, 107, 20841, 10151, 34468, 10114, 29888, 10105, 12100, 112, 187, 25512, 10336, 13551, 17644, 34495, 10111, 33992, 16711, 52828, 41271, 10111, 56981, 10107, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RE", "##SE", "##AR", "##CH", "AL", "##ER", "##T", "-", "Le", "##hman", "starts", "SN", "##ET", "." ], "ids": [ 71033, 39039, 52188, 86448, 47271, 24093, 11090, 118, 10281, 49811, 33039, 62342, 52338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "-", "-", "Le", "##hman", "anal", "##yst", "Blake", "Bath", "started", "Southern", "New", "England", "Telecom", "##mun", "##ciations", "Corp", "with", "an", "out", "##per", "##form", "rating", ",", "his", "office", "said", "." ], "ids": [ 118, 118, 10281, 49811, 106615, 62769, 24321, 44895, 13457, 15120, 10287, 11701, 79642, 34326, 106673, 44687, 10169, 10151, 10950, 12713, 19757, 31035, 117, 10226, 14301, 12415, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 4, 8, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "The", "anal", "##yst", "set", "a", "12", "-", "month", "price", "target", "of", "$", "45", "and", "a", "fiscal", "1996", "year", "earning", "##s", "estimate", "of", "$", "3", ".", "09", "per", "share", ",", "his", "office", "said", "." ], "ids": [ 118, 118, 10117, 106615, 62769, 11847, 169, 10186, 118, 14064, 30839, 28564, 10108, 109, 10827, 10111, 169, 43645, 10389, 10924, 56981, 10107, 78059, 10108, 109, 124, 119, 11035, 10178, 23867, 117, 10226, 14301, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "The", "anal", "##yst", "also", "set", "an", "earning", "##s", "estimate", "for", "the", "1997", "year", ",", "but", "the", "figure", "was", "not", "immediately", "available", "." ], "ids": [ 118, 118, 10117, 106615, 62769, 10379, 11847, 10151, 56981, 10107, 78059, 10142, 10105, 10391, 10924, 117, 10473, 10105, 17527, 10134, 10472, 24029, 14579, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Southern", "New", "England", "closed", "at", "38", "-", "1", "/", "2", "Wednesday", "." ], "ids": [ 118, 118, 15120, 10287, 11701, 18440, 10160, 11171, 118, 122, 120, 123, 57611, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "E", ".", "Auch", "##ard", ",", "Wall", "Street", "bureau", ",", "212", "-", "859", "-", "1736" ], "ids": [ 118, 118, 142, 119, 14427, 13167, 117, 19523, 11962, 32340, 117, 22023, 118, 80786, 118, 36862 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gateway", "Data", "Sciences", "Q", "##2", "net", "rises", "." ], "ids": [ 87250, 12159, 12982, 154, 10729, 11988, 91144, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##H", "##O", "##EN", "##IX", "1996", "-", "08", "-", "22" ], "ids": [ 153, 12396, 11403, 50655, 67403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "Con", "##solidated", "Financial", "Data" ], "ids": [ 42027, 10108, 12845, 69302, 30738, 12159 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 3, 7, 7, 7 ] }, { "tokens": [ "(", "In", "Thousand", "##s", ",", "except", "per", "share", "data", ")" ], "ids": [ 113, 10167, 61795, 10107, 117, 23423, 10178, 23867, 11165, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Six", "Month", "##s", "Ende", "##d", "Quarter", "Ende", "##d" ], "ids": [ 20615, 88633, 10107, 12862, 10162, 75820, 12862, 10162 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jul", "31", ",", "Jul", "31", ",", "Jul", "31", ",", "Jul", "31", "," ], "ids": [ 65855, 10413, 117, 65855, 10413, 117, 65855, 10413, 117, 65855, 10413, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1996", "1995", "1996", "1995" ], "ids": [ 10389, 10436, 10389, 10436 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Inc", "##ome", "State", "##ment", "Data", ":" ], "ids": [ 13604, 22451, 11104, 10426, 12159, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "Revenue", "$", "10", ",", "756", "$", "13", ",", "102", "$", "7", ",", "961", "$", "5", ",", "507" ], "ids": [ 25220, 69092, 109, 10150, 117, 65821, 109, 10249, 117, 14818, 109, 128, 117, 72488, 109, 126, 117, 45204 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Software", "Revenue", "2", ",", "383", "1", ",", "558", "1", ",", "08", "##6", "1", ",", "074" ], "ids": [ 21176, 69092, 123, 117, 35663, 122, 117, 54558, 122, 117, 11052, 11211, 122, 117, 101649 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Services", "Revenue", "1", ",", "154", "692", "624", "465" ], "ids": [ 20228, 69092, 122, 117, 20481, 67414, 53983, 36307 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Opera", "##ting", "Inc", "##ome", "906", "962", "599", "515" ], "ids": [ 16836, 12141, 13604, 22451, 77452, 61393, 53296, 41211 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "Inc", "##ome", "821", "512", "565", "301" ], "ids": [ 32577, 13604, 22451, 71949, 29957, 44522, 26224 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ea", "##rni", "##ngs", "Per", "Sha", "##re", "0", ".", "31", "0", ".", "34", "0", ".", "19", "0", ".", "20" ], "ids": [ 47132, 21941, 34876, 11982, 106583, 10246, 121, 119, 10413, 121, 119, 11069, 121, 119, 10270, 121, 119, 10197 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jul", "31", ",", "1996", "Jan", "31", ",", "1996" ], "ids": [ 65855, 10413, 117, 10389, 11806, 10413, 117, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Balance", "She", "##et", "Data", ":" ], "ids": [ 100777, 11149, 10308, 12159, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Working", "Capital", "$", "5", ",", "755", "(", "$", "881", ")" ], "ids": [ 38194, 21433, 109, 126, 117, 59300, 113, 109, 79386, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cash", "and", "Cash", "E", "##qui", "##valent", "##s", "2", ",", "386", "93" ], "ids": [ 41286, 10111, 41286, 142, 39639, 74598, 10107, 123, 117, 37194, 12479 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "Ass", "##ets", "14", ",", "196", "7", ",", "138" ], "ids": [ 25220, 77014, 17137, 10247, 117, 23674, 128, 117, 19462 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##re", "##holders", "'", "E", "##quity", "5", ",", "951", "(", "1", ",", "461", ")" ], "ids": [ 106583, 10246, 75111, 112, 142, 58144, 126, 117, 34173, 113, 122, 117, 45705, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Greek", "socialist", "##s", "give", "PM", "green", "light", "for", "election", "." ], "ids": [ 15286, 79456, 10107, 18090, 46161, 23320, 15765, 10142, 13685, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "22" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Greek", "socialist", "party", "'", "s", "executive", "bureau", "gave", "Prime", "Minister", "Costa", "##s", "Sim", "##itis", "its", "backing", "if", "he", "choose", "##s", "to", "call", "sna", "##p", "elections", ",", "its", "general", "secretary", "Costa", "##s", "S", "##kan", "##dali", "##dis", "told", "reporter", "##s", "on", "Thursday", "." ], "ids": [ 10117, 15286, 79456, 14039, 112, 187, 22676, 32340, 15362, 19924, 14355, 13902, 10107, 103695, 36967, 10474, 31962, 12277, 10261, 48089, 10107, 10114, 20575, 62541, 10410, 22054, 117, 10474, 11389, 37664, 13902, 10107, 156, 10706, 52662, 17442, 21937, 41408, 10107, 10135, 67067, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Prime", "Minister", "Costa", "##s", "Sim", "##itis", "will", "make", "an", "official", "announcement", "after", "a", "cabinet", "meeting", "later", "on", "Thursday", ",", "said", "S", "##kan", "##dali", "##dis", "." ], "ids": [ 19924, 14355, 13902, 10107, 103695, 36967, 11337, 13086, 10151, 14731, 76557, 10662, 169, 33801, 19822, 10873, 10135, 67067, 117, 12415, 156, 10706, 52662, 17442, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "-", "-", "Dimitri", "##s", "Ko", "##nto", "##gian", "##nis", ",", "Athens", "News", "##room", "+", "301", "331", "##18", "##12", "-", "4" ], "ids": [ 118, 118, 73589, 10107, 30186, 15088, 38531, 12597, 117, 33765, 12219, 25525, 116, 26224, 30690, 45987, 24747, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "France", "-", "Le", "Monde", "Aug", "22", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 10688, 118, 10281, 33074, 53012, 10306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "22" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "leading", "stories", "in", "Thursday", "'", "s", "afternoon", "daily", "Le", "Monde", ",", "dated", "Aug", "23", "." ], "ids": [ 13252, 10301, 16018, 21158, 10106, 67067, 112, 187, 73213, 27636, 10281, 33074, 117, 39724, 53012, 10328, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##ON", "##T", "PA", "##GE" ], "ids": [ 64655, 30118, 11090, 32349, 58719 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "African", "##s", "seeking", "to", "ren", "##ew", "or", "obtain", "work", "and", "residence", "rights", "say", "Prime", "Minister", "Alain", "Ju", "##ppe", "'", "s", "proposals", "are", "ins", "##uff", "##icient", "as", "hung", "##er", "strike", "enters", "49", "##th", "day", "in", "Paris", "church", "and", "Wednesday", "rally", "attract", "##s", "8", ",", "000", "sy", "##mpa", "##thi", "##sers", "." ], "ids": [ 118, 118, 13839, 10107, 51285, 10114, 63256, 26127, 10345, 47361, 11424, 10111, 33879, 16691, 23763, 19924, 14355, 20444, 45031, 21092, 112, 187, 93646, 10301, 15498, 45726, 60765, 10146, 68971, 10165, 37456, 58379, 11580, 11143, 11940, 10106, 10728, 14201, 10111, 57611, 58575, 96721, 10107, 129, 117, 10259, 12261, 31285, 53504, 64671, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "FL", "##NC", "Corsica", "##n", "nationalist", "movement", "anno", "##unces", "end", "of", "tr", "##uce", "after", "last", "night", "'", "s", "attacks", "." ], "ids": [ 118, 118, 83243, 100230, 101208, 10115, 99451, 17123, 11671, 79603, 11572, 10108, 32221, 24075, 10662, 12469, 16903, 112, 187, 26483, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##US", "##INE", "##SS", "PAGES" ], "ids": [ 139, 32612, 83198, 49248, 36127 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Shu", "##t", "##down", "of", "Ball", "##y", "'", "s", "French", "factories", "points", "up", "sh", "##oe", "industry", "crisis", ",", "with", "French", "manufacturers", "under", "##cut", "by", "low", "-", "wa", "##ge", "country", "competition", "and", "failure", "to", "keep", "abre", "##ast", "of", "trends", "." ], "ids": [ 118, 118, 56448, 10123, 27160, 10108, 19479, 10157, 112, 187, 11894, 102443, 12789, 10741, 48201, 20085, 17425, 22859, 117, 10169, 11894, 77256, 10571, 29738, 10155, 15626, 118, 11471, 10525, 12723, 16622, 10111, 31562, 10114, 23819, 83724, 15171, 10108, 109086, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Secretary", "general", "of", "the", "Sud", "-", "PTT", "trade", "union", "at", "France", "Telecom", "all", "the", "elements", "are", "in", "place", "for", "social", "un", "##rest", "in", "the", "next", "few", "weeks", "." ], "ids": [ 118, 118, 19382, 11389, 10108, 10105, 13352, 118, 26227, 18908, 20763, 10160, 10688, 79642, 10435, 10105, 17464, 10301, 10106, 11192, 10142, 12142, 10119, 34189, 10106, 10105, 13451, 13824, 20750, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Paris", "News", "##room", "+", "33", "1", "42", "21", "53", "81" ], "ids": [ 118, 118, 10728, 12219, 25525, 116, 11000, 122, 11276, 10296, 11756, 12324 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Well", "repairs", "to", "lift", "He", "##id", "##run", "oil", "output", "-", "Stato", "##il", "." ], "ids": [ 37025, 98543, 10114, 63376, 10357, 11249, 35794, 21073, 37131, 118, 21786, 11030, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "OS", "##L", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 18398, 11369, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Three", "plu", "##gged", "water", "injection", "well", "##s", "on", "the", "He", "##id", "##run", "oil", "##field", "off", "mid", "-", "Norway", "will", "be", "re", "##open", "##ed", "over", "the", "next", "month", ",", "operator", "Den", "Norske", "Stat", "##s", "Ol", "##jes", "##els", "##kap", "AS", "(", "Stato", "##il", ")", "said", "on", "Thursday", "." ], "ids": [ 15139, 13651, 91518, 12286, 91879, 11206, 10107, 10135, 10105, 10357, 11249, 35794, 21073, 13408, 11898, 15607, 118, 22582, 11337, 10347, 11639, 47656, 10336, 10491, 10105, 13451, 14064, 117, 36935, 10235, 47595, 68875, 10107, 60160, 15716, 18338, 20793, 17421, 113, 21786, 11030, 114, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "plu", "##gged", "well", "##s", "have", "account", "##ed", "for", "a", "di", "##p", "of", "30", ",", "000", "barrel", "##s", "per", "day", "(", "b", "##p", "##d", ")", "in", "He", "##id", "##run", "output", "to", "roughly", "220", ",", "000", "b", "##p", "##d", ",", "according", "to", "the", "company", "'", "s", "Status", "Weekly", "news", "##lette", "##r", "." ], "ids": [ 10117, 13651, 91518, 11206, 10107, 10529, 23200, 10336, 10142, 169, 10120, 10410, 10108, 10244, 117, 10259, 93397, 10107, 10178, 11940, 113, 170, 10410, 10162, 114, 10106, 10357, 11249, 35794, 37131, 10114, 40540, 15817, 117, 10259, 170, 10410, 10162, 117, 18071, 10114, 10105, 12100, 112, 187, 29287, 24192, 14424, 76875, 10129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "well", "##s", "will", "be", "rep", "##er", "##fora", "##ted", "and", "grave", "##l", "will", "be", "pump", "##ed", "into", "the", "reservoir", "through", "one", "of", "the", "well", "##s", "to", "avoid", "plu", "##gging", "problems", "in", "the", "future", ",", "it", "said", "." ], "ids": [ 10117, 11206, 10107, 11337, 10347, 76456, 10165, 83443, 11912, 10111, 23570, 10161, 11337, 10347, 106392, 10336, 10708, 10105, 83777, 11222, 10464, 10108, 10105, 11206, 10107, 10114, 33253, 13651, 54468, 20390, 10106, 10105, 16711, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Oslo", "news", "##room", "+", "47", "22", "42", "50", "41" ], "ids": [ 118, 118, 14138, 14424, 25525, 116, 11413, 10306, 11276, 10462, 11349 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finnish", "April", "trade", "sur", "##plus", "3", ".", "8", "billion", "mark", "##ka", "-", "NC", "##B", "." ], "ids": [ 37268, 10780, 18908, 10326, 70413, 124, 119, 129, 25848, 29221, 10371, 118, 55838, 11274, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "H", "##EL", "##SI", "##NK", "##I", "1996", "-", "08", "-", "22" ], "ids": [ 145, 68999, 44802, 78043, 11281, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finland", "'", "s", "trade", "sur", "##plus", "rose", "to", "3", ".", "83", "billion", "mark", "##ka", "in", "April", "from", "3", ".", "43", "billion", "in", "March", ",", "the", "National", "Custom", "##s", "Board", "(", "NC", "##B", ")", "said", "in", "a", "statement", "on", "Thursday", "." ], "ids": [ 15497, 112, 187, 18908, 10326, 70413, 29467, 10114, 124, 119, 12408, 25848, 29221, 10371, 10106, 10780, 10188, 124, 119, 11370, 25848, 10106, 11144, 117, 10105, 10655, 101590, 10107, 14743, 113, 55838, 11274, 114, 12415, 10106, 169, 33311, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "value", "of", "export", "##s", "fell", "one", "percent", "year", "-", "on", "-", "year", "in", "April", "and", "the", "value", "of", "import", "##s", "fell", "two", "percent", ",", "NC", "##B", "said", "." ], "ids": [ 10117, 19211, 10108, 59220, 10107, 25194, 10464, 22362, 10924, 118, 10135, 118, 10924, 10106, 10780, 10111, 10105, 19211, 10108, 67622, 10107, 25194, 10551, 22362, 117, 55838, 11274, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Trade", "balance", "(", "million", "mark", "##ka", ")", ":" ], "ids": [ 15006, 40162, 113, 12473, 29221, 10371, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "April", "'", "96", "March", "'", "96", "Jan", "-", "April", "'", "96", "Jan", "-", "April", "'", "95" ], "ids": [ 10780, 112, 12308, 11144, 112, 12308, 11806, 118, 10780, 112, 12308, 11806, 118, 10780, 112, 11978 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Im", "##ports", "10", ",", "663", "10", ",", "725", "43", ",", "430", "40", ",", "989" ], "ids": [ 10796, 60036, 10150, 117, 66760, 10150, 117, 47318, 11370, 117, 26262, 10533, 117, 84019 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Export", "##s", "14", ",", "494", "14", ",", "153", "56", ",", "126", "56", ",", "261" ], "ids": [ 108268, 10107, 10247, 117, 50238, 10247, 117, 19032, 11628, 117, 17813, 11628, 117, 29084 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Balance", "+", "3", ",", "831", "+", "3", ",", "428", "+", "12", ",", "696", "+", "15", ",", "272" ], "ids": [ 100777, 116, 124, 117, 83552, 116, 124, 117, 31509, 116, 10186, 117, 68865, 116, 10208, 117, 26728 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "January", "-", "April", "1995", "import", "figure", "was", "revised", "from", "39", ",", "584", "million", "mark", "##ka", "and", "the", "export", "figure", "from", "55", ",", "627", "million", "mark", "##ka", "." ], "ids": [ 10117, 11238, 118, 10780, 10436, 67622, 17527, 10134, 41226, 10188, 11303, 117, 48322, 12473, 29221, 10371, 10111, 10105, 59220, 17527, 10188, 11358, 117, 56948, 12473, 29221, 10371, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Bank", "of", "Finland", "earlier", "estimated", "the", "April", "trade", "sur", "##plus", "at", "3", ".", "2", "billion", "mark", "##ka", "with", "export", "##s", "projecte", "##d", "at", "14", ".", "5", "billion", "and", "import", "##s", "at", "11", ".", "3", "billion", "." ], "ids": [ 10117, 13533, 10108, 15497, 18905, 25267, 10105, 10780, 18908, 10326, 70413, 10160, 124, 119, 123, 25848, 29221, 10371, 10169, 59220, 10107, 52452, 10162, 10160, 10247, 119, 126, 25848, 10111, 67622, 10107, 10160, 10193, 119, 124, 25848, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "NC", "##B", "'", "s", "official", "monthly", "trade", "statistics", "are", "lag", "##ging", "behind", "due", "to", "changes", "in", "customs", "procedures", "when", "Finland", "joined", "the", "European", "Union", "at", "the", "start", "of", "1995", "." ], "ids": [ 10117, 55838, 11274, 112, 187, 14731, 61673, 18908, 36730, 10301, 14587, 13808, 17155, 10850, 10114, 19010, 10106, 89907, 70176, 10841, 15497, 13914, 10105, 11914, 11457, 10160, 10105, 15148, 10108, 10436, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Helsinki", "News", "##room", "+", "358", "-", "0", "-", "680", "50", "245" ], "ids": [ 118, 118, 18179, 12219, 25525, 116, 37702, 118, 121, 118, 35922, 10462, 25853 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "state", "raise", "##s", "tap", "sale", "price", "to", "99", ".", "95", "." ], "ids": [ 17693, 11388, 42439, 10107, 66956, 15488, 30839, 10114, 12187, 119, 11978, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "22" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Finance", "Ministry", "raised", "the", "price", "for", "tap", "sales", "of", "the", "Dutch", "government", "'", "s", "new", "5", ".", "75", "percent", "bond", "due", "September", "2002", "to", "99", ".", "95", "from", "99", ".", "90", "." ], "ids": [ 10117, 38533, 19170, 20526, 10105, 30839, 10142, 66956, 23857, 10108, 10105, 17693, 12047, 112, 187, 10751, 126, 119, 11417, 22362, 55185, 10850, 10596, 10276, 10114, 12187, 119, 11978, 10188, 12187, 119, 10919, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##p", "sales", "began", "on", "Monday", "and", "are", "being", "held", "daily", "from", "07", ".", "00", "GMT", "to", "15", ".", "00", "GMT", "until", "further", "notice", "." ], "ids": [ 14248, 10410, 23857, 11941, 10135, 40714, 10111, 10301, 11223, 11991, 27636, 10188, 10878, 119, 11025, 20362, 10114, 10208, 119, 11025, 20362, 11444, 14586, 48323, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ministry", "had", "raised", "2", ".", "3", "billion", "gu", "##ild", "##ers", "from", "sales", "of", "the", "new", "bond", "by", "the", "close", "of", "trade", "on", "Wednesday", "." ], "ids": [ 10117, 65338, 10374, 20526, 123, 119, 124, 25848, 75980, 65820, 10901, 10188, 23857, 10108, 10105, 10751, 55185, 10155, 10105, 16065, 10108, 18908, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Amsterdam", "news", "##room", "+", "31", "20", "504", "5000" ], "ids": [ 118, 118, 14017, 14424, 25525, 116, 10413, 10197, 43098, 17436 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "farm", "ministry", "tells", "consumers", "to", "avoid", "British", "mu", "##tton", "." ], "ids": [ 12026, 30568, 65338, 27024, 97129, 10114, 33253, 11160, 12361, 70000, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Germany", "'", "s", "Agriculture", "Ministry", "suggested", "on", "Wednesday", "that", "consumers", "avoid", "eating", "meat", "from", "British", "sheep", "until", "scientists", "determine", "whether", "ma", "##d", "co", "##w", "disease", "can", "be", "trans", "##mitted", "to", "the", "animals", "." ], "ids": [ 12775, 112, 187, 30954, 19170, 27675, 10135, 57611, 10189, 97129, 33253, 77596, 64080, 10188, 11160, 83650, 11444, 49871, 37284, 21883, 10824, 10162, 11170, 10874, 21911, 10944, 10347, 37241, 89157, 10114, 10105, 22528, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Until", "this", "is", "cleared", "up", "by", "the", "European", "Union", "'", "s", "scientific", "panels", "-", "-", "and", "we", "have", "asked", "this", "to", "be", "done", "as", "quickly", "as", "possible", "-", "-", "(", "consumers", ")", "should", "if", "at", "all", "possible", "give", "pre", "##ference", "to", "sheep", "##mea", "##t", "from", "other", "countries", ",", "\"", "ministry", "official", "Werner", "Z", "##wing", "##mann", "told", "ZDF", "television", "." ], "ids": [ 107, 41956, 10531, 10124, 90076, 10741, 10155, 10105, 11914, 11457, 112, 187, 23301, 82365, 118, 118, 10111, 11951, 10529, 22151, 10531, 10114, 10347, 20378, 10146, 23590, 10146, 14128, 118, 118, 113, 97129, 114, 14819, 12277, 10160, 10435, 14128, 18090, 12229, 52790, 10114, 83650, 41947, 10123, 10188, 10684, 15911, 117, 107, 65338, 14731, 12646, 163, 25649, 12350, 21937, 61746, 14162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "not", "want", "to", "say", "that", "there", "is", "a", "concrete", "danger", "for", "consumers", ",", "\"", "he", "added", ".", "\"" ], "ids": [ 107, 146, 10149, 10472, 21528, 10114, 23763, 10189, 11155, 10124, 169, 41651, 45882, 10142, 97129, 117, 107, 10261, 16288, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "are", "too", "many", "holes", "in", "what", "we", "know", ",", "and", "these", "must", "be", "filled", "very", "quickly", ".", "\"" ], "ids": [ 11723, 10301, 16683, 11299, 76956, 10106, 12976, 11951, 21852, 117, 10111, 11762, 14982, 10347, 39287, 12558, 23590, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bonn", "has", "led", "efforts", "to", "ensure", "consumer", "protection", "top", "##s", "the", "list", "of", "prior", "##ities", "in", "dealing", "with", "the", "ma", "##d", "co", "##w", "crisis", ",", "which", "eru", "##pted", "in", "March", "when", "Britain", "acknowledged", "humans", "could", "contract", "a", "similar", "illness", "by", "eating", "conta", "##minated", "be", "##ef", "." ], "ids": [ 21982, 10393, 12857, 22116, 10114, 40781, 64580, 20344, 12364, 10107, 10105, 13416, 10108, 20972, 17285, 10106, 73082, 10169, 10105, 10824, 10162, 11170, 10874, 22859, 117, 10319, 18098, 64471, 10106, 11144, 10841, 16032, 87215, 26058, 12174, 16108, 169, 13213, 56507, 10155, 77596, 23020, 91284, 10347, 16822, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "European", "Commission", "agreed", "this", "month", "to", "ret", "##hin", "##k", "a", "proposal", "to", "ban", "the", "use", "of", "suspect", "sheep", "tissue", "after", "some", "EU", "vet", "##erina", "##ry", "experts", "questioned", "whether", "it", "was", "just", "##ified", "." ], "ids": [ 10117, 11914, 14941, 25577, 10531, 14064, 10114, 62893, 14383, 10174, 169, 43542, 10114, 11915, 10105, 11760, 10108, 97881, 83650, 63329, 10662, 11152, 17751, 56975, 90643, 10908, 47306, 101173, 21883, 10271, 10134, 12820, 31825, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EU", "Farm", "Commissioner", "Franz", "Fisch", "##ler", "had", "proposed", "ban", "##ning", "sheep", "brain", "##s", ",", "sp", "##leen", "##s", "and", "spin", "##al", "cor", "##ds", "from", "the", "human", "and", "animal", "food", "chains", "after", "reports", "from", "Britain", "and", "France", "that", "under", "laboratory", "conditions", "sheep", "could", "contract", "Bo", "##vine", "Sp", "##ong", "##if", "##or", "##m", "En", "##ce", "##pha", "##lop", "##ath", "##y", "(", "BS", "##E", ")", "-", "-", "ma", "##d", "co", "##w", "disease", "." ], "ids": [ 17751, 30837, 24366, 13752, 100295, 10815, 10374, 21622, 11915, 11269, 83650, 34467, 10107, 117, 32650, 51675, 10107, 10111, 30428, 10415, 29162, 13268, 10188, 10105, 14179, 10111, 18882, 18301, 110504, 10662, 26610, 10188, 16032, 10111, 10688, 10189, 10571, 67047, 17315, 83650, 12174, 16108, 27622, 30396, 46361, 13891, 13918, 10667, 10147, 10243, 10419, 37590, 101908, 44196, 10157, 113, 43436, 11259, 114, 118, 118, 10824, 10162, 11170, 10874, 21911, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "some", "members", "of", "the", "EU", "'", "s", "standing", "vet", "##erina", "##ry", "committee", "questioned", "whether", "the", "action", "was", "necessary", "given", "the", "sl", "##ight", "risk", "to", "human", "health", "." ], "ids": [ 16976, 11152, 12464, 10108, 10105, 17751, 112, 187, 32173, 56975, 90643, 10908, 27634, 101173, 21883, 10105, 14204, 10134, 27039, 13507, 10105, 38523, 27521, 24179, 10114, 14179, 17004, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "question", "is", "being", "studied", "separately", "by", "two", "EU", "scientific", "committees", "." ], "ids": [ 10117, 20210, 10124, 11223, 19549, 91614, 10155, 10551, 17751, 23301, 100212, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "She", "##ep", "have", "long", "been", "known", "to", "contract", "s", "##cra", "##pie", ",", "a", "similar", "brain", "-", "was", "##ting", "disease", "to", "BS", "##E", "which", "is", "believed", "to", "have", "been", "transferred", "to", "cattle", "through", "feed", "containing", "animal", "waste", "." ], "ids": [ 11149, 19986, 10529, 11695, 10590, 11053, 10114, 16108, 187, 40333, 19237, 117, 169, 13213, 34467, 118, 10134, 12141, 21911, 10114, 43436, 11259, 10319, 10124, 20718, 10114, 10529, 10590, 23192, 10114, 56980, 11222, 44988, 27248, 18882, 59158, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "British", "officials", "say", "sheep", "meat", "is", "perfect", "##ly", "safe", "to", "eat", "." ], "ids": [ 11160, 27730, 23763, 83650, 64080, 10124, 43477, 10454, 43966, 10114, 69110, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ZDF", "said", "Germany", "imported", "47", ",", "600", "sheep", "from", "Britain", "last", "year", ",", "nearly", "half", "of", "total", "import", "##s", "." ], "ids": [ 61746, 12415, 12775, 100591, 11413, 117, 11796, 83650, 10188, 16032, 12469, 10924, 117, 21377, 13877, 10108, 11339, 67622, 10107, 119 ], "entity": [ "B-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "brought", "in", "4", ",", "275", "tonnes", "of", "British", "mu", "##tton", ",", "some", "10", "percent", "of", "overall", "import", "##s", "." ], "ids": [ 10377, 17327, 10106, 125, 117, 23896, 39435, 10108, 11160, 12361, 70000, 117, 11152, 10150, 22362, 10108, 20947, 67622, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "the", "British", "government", "admitted", "a", "possible", "link", "between", "ma", "##d", "co", "##w", "disease", "and", "its", "fatal", "human", "equivalent", ",", "the", "EU", "imposed", "a", "worldwide", "ban", "on", "British", "be", "##ef", "export", "##s", "." ], "ids": [ 11301, 10105, 11160, 12047, 40345, 169, 14128, 26192, 10948, 10824, 10162, 11170, 10874, 21911, 10111, 10474, 71126, 14179, 30647, 117, 10105, 17751, 83358, 169, 31197, 11915, 10135, 11160, 10347, 16822, 59220, 10107, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EU", "leaders", "agreed", "at", "a", "summit", "in", "June", "to", "a", "progressive", "lift", "##ing", "of", "the", "ban", "as", "Britain", "takes", "parallel", "measures", "to", "era", "##dicate", "the", "disease", "." ], "ids": [ 17751, 24155, 25577, 10160, 169, 60531, 10106, 11120, 10114, 169, 45194, 63376, 10230, 10108, 10105, 11915, 10146, 16032, 19135, 26280, 38606, 10114, 10411, 76299, 10105, 21911, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "SC", "##OR", "##ES", "AT", "WORLD", "SE", "##RI", "##ES", "OF", "GO", "##L", "##F", "." ], "ids": [ 41525, 11369, 11565, 118, 18137, 42622, 25054, 30554, 67376, 23056, 46876, 25054, 23240, 41525, 11369, 11565, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "AK", "##RO", "##N", ",", "Ohio", "1996", "-", "08", "-", "22" ], "ids": [ 36723, 35066, 11537, 117, 13608, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", "from", "the", "$", "2", ".", "1" ], "ids": [ 66875, 10107, 10188, 10105, 109, 123, 119, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "million", "NEC", "World", "Series", "of", "Golf", "after", "the", "first", "round" ], "ids": [ 12473, 97104, 10315, 13239, 10108, 23870, 10662, 10105, 10422, 13569 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Thursday", "at", "the", "7", ",", "149", "yard", ",", "par", "70", "Fire", "##stone", "C", ".", "C", "course" ], "ids": [ 67067, 10160, 10105, 128, 117, 19438, 27238, 117, 10248, 10923, 16011, 23314, 140, 119, 140, 15348 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9 ] }, { "tokens": [ "(", "players", "U", ".", "S", ".", "unless", "stated", ")", ":" ], "ids": [ 113, 16021, 158, 119, 156, 119, 60015, 17067, 114, 131 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "66", "Paul", "Go", "##yd", "##os", ",", "Billy", "May", "##fair", ",", "Hi", "##demi", "##chi", "Tanaka", "(", "Japan", ")" ], "ids": [ 12215, 10772, 14439, 18659, 10310, 117, 15894, 10725, 82198, 117, 20065, 108986, 12806, 59616, 113, 11891, 114 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "68", "Steve", "St", "##rick", "##er" ], "ids": [ 12370, 13308, 10838, 35906, 10165 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 8 ] }, { "tokens": [ "69", "Justin", "Leonard", ",", "Mark", "Brooks" ], "ids": [ 12573, 21823, 20318, 117, 11997, 27625 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 4, 8 ] }, { "tokens": [ "70", "Tim", "Herr", "##on", ",", "Duffy", "Wald", "##orf", ",", "Davis", "Love", ",", "Anders", "For", "##s", "##brand" ], "ids": [ 10923, 15318, 38000, 10263, 117, 85837, 33903, 43920, 117, 14281, 11248, 117, 20751, 11399, 10107, 55520 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "Sweden", ")", ",", "Nick", "Fa", "##ldo", "(", "Britain", ")", ",", "John", "Cook", ",", "Steve", "Jones", ",", "Phil" ], "ids": [ 113, 20937, 114, 117, 16126, 44271, 44750, 113, 16032, 114, 117, 10421, 21115, 117, 13308, 12298, 117, 18144 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 4, 8, 9, 4 ] }, { "tokens": [ "Mick", "##els", "##on", ",", "Greg", "Norman", "(", "Australia", ")" ], "ids": [ 34847, 18338, 10263, 117, 22438, 15332, 113, 11729, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "71", "Ernie", "Els", "(", "South", "Africa", ")", ",", "Scott", "Ho", "##ch" ], "ids": [ 12513, 76063, 13075, 113, 11056, 12880, 114, 117, 12812, 20220, 10269 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 1, 5, 9, 9, 4, 8, 8 ] }, { "tokens": [ "72", "Clarence", "Rose", ",", "Lor", "##en", "Roberts", ",", "Fred", "Funk", ",", "Sven", "St", "##ru", "##ver" ], "ids": [ 12120, 40653, 14873, 117, 91473, 10136, 18468, 117, 16887, 47185, 117, 33559, 10838, 11680, 12563 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "Germany", ")", ",", "Alexander", "Ce", "##jka", "(", "Germany", ")", ",", "Hal", "Sutton", ",", "Tom", "Le", "##hman" ], "ids": [ 113, 12775, 114, 117, 12063, 13338, 42978, 113, 12775, 114, 117, 21699, 49913, 117, 12275, 10281, 49811 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 4, 8, 8 ] }, { "tokens": [ "73", "D", ".", "A", ".", "Wei", "##bring", ",", "Brad", "Bryant", ",", "Craig", "Parry", "(", "Australia", ")", "," ], "ids": [ 12545, 141, 119, 138, 119, 37343, 109720, 117, 29382, 29451, 117, 21703, 81320, 113, 11729, 114, 117 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "Stewart", "G", "##inn", "(", "Australia", ")", ",", "Corey", "Pa", "##vin", ",", "Craig", "Stad", "##ler", ",", "Mark" ], "ids": [ 17493, 144, 24488, 113, 11729, 114, 117, 72262, 26907, 15478, 117, 21703, 36841, 10815, 117, 11997 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4 ] }, { "tokens": [ "O", "'", "Me", "##ara", ",", "Fred", "Co", "##up", "##les" ], "ids": [ 152, 112, 11589, 12677, 117, 16887, 13098, 14590, 11268 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 8 ] }, { "tokens": [ "74", "Paul", "Stan", "##kowski", ",", "Costa", "##ntino", "Rocca", "(", "Italy", ")" ], "ids": [ 12535, 10772, 26637, 36567, 117, 13902, 44878, 63718, 113, 11619, 114 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "75", "Jim", "Fury", "##k", ",", "Sato", "##shi", "Hi", "##gas", "##hi", "(", "Japan", ")", ",", "Willie", "Wood", ",", "Shi", "##ge", "##ki" ], "ids": [ 11417, 14178, 49286, 10174, 117, 85266, 16119, 20065, 14644, 11924, 113, 11891, 114, 117, 34085, 18315, 117, 44795, 10525, 10506 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 4, 8, 8 ] }, { "tokens": [ "Mar", "##uya", "##ma", "(", "Japan", ")" ], "ids": [ 15734, 105066, 10369, 113, 11891, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "76", "Scott", "M", "##c", "##C", "##ar", "##ron" ], "ids": [ 12428, 12812, 150, 10350, 10858, 10354, 11620 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "77", "Wayne", "West", "##ner", "(", "South", "Africa", ")", ",", "Steve", "Sc", "##hne", "##iter" ], "ids": [ 12527, 18547, 11164, 11129, 113, 11056, 12880, 114, 117, 13308, 55260, 37893, 27295 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "79", "Tom", "Watson" ], "ids": [ 12791, 12275, 19229 ], "entity": [ "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 4, 8 ] }, { "tokens": [ "81", "Sei", "##ki", "Ok", "##uda", "(", "Japan", ")" ], "ids": [ 12324, 58901, 10506, 84591, 18497, 113, 11891, 114 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GL", "##OR", "##IA", "B", "##IS", "##T", "##RI", "##TA", "BE", "##AT", "2", "-", "1", "F", ".", "C", ".", "VA", "##LL", "##ET", "##TA", "." ], "ids": [ 71020, 65622, 24093, 118, 108755, 42622, 35976, 139, 19088, 11090, 46876, 24951, 46291, 32071, 123, 118, 122, 143, 119, 140, 119, 69342, 82834, 52338, 24951, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "B", "##IS", "##T", "##RI", "##TA", "1996", "-", "08", "-", "22" ], "ids": [ 139, 19088, 11090, 46876, 24951, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gloria", "Bis", "##tri", "##ta", "(", "Romania", ")", "beat", "2", "-", "1", "(", "half", "##time", "1", "-", "1", ")", "F", ".", "C", ".", "Valle", "##tta", "(", "Malta", ")", "in", "their", "Cup", "winners", "Cup", "match", ",", "second", "leg", "of", "the", "preliminary", "round", ",", "on", "Thursday", "." ], "ids": [ 26209, 18516, 21570, 10213, 113, 13927, 114, 27868, 123, 118, 122, 113, 13877, 18086, 122, 118, 122, 114, 143, 119, 140, 119, 19159, 12201, 113, 23259, 114, 10106, 10455, 11544, 33525, 11544, 12356, 117, 11132, 33810, 10108, 10105, 68097, 13569, 117, 10135, 67067, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 1, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Gloria", "Bis", "##tri", "##ta", "-", "Il", "##ie", "La", "##zar", "(", "32", "##nd", ")", ",", "Eugen", "Vo", "##ica", "(", "84", "##th", ")" ], "ids": [ 26209, 18516, 21570, 10213, 118, 10282, 10400, 10159, 15803, 113, 10842, 11534, 114, 117, 32439, 59482, 11043, 113, 11761, 11143, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "F", ".", "C", ".", "La", "Valle", "##tta", "-", "Gilbert", "A", "##giu", "##s", "(", "24", "##th", ")" ], "ids": [ 143, 119, 140, 119, 10159, 19159, 12201, 118, 18608, 138, 50510, 10107, 113, 10233, 11143, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "8", ",", "000" ], "ids": [ 46080, 131, 129, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gloria", "Bis", "##tri", "##ta", "won", "4", "-", "2", "on", "aggregate", "and", "qualified", "for", "the", "first", "round", "of", "the", "Cup", "winners", "Cup", "." ], "ids": [ 26209, 18516, 21570, 10213, 11367, 125, 118, 123, 10135, 75063, 10111, 32244, 10142, 10105, 10422, 13569, 10108, 10105, 11544, 33525, 11544, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "RE", "##UT", "##ER" ], "ids": [ 71033, 65729, 24093 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "H", "##OR", "##SE", "RA", "##CI", "##NG", "-", "P", "##IV", "##OT", "##AL", "EN", "##DS", "25", "-", "Y", "##EA", "##R", "W", "##A", "##IT", "FOR", "TR", "##A", "##INE", "##R", "PR", "##ES", "##CO", "##T", "##T", "." ], "ids": [ 145, 42622, 39039, 64007, 89955, 34065, 118, 153, 91238, 62146, 32002, 31278, 33953, 10258, 118, 162, 36789, 11273, 160, 10738, 37611, 109544, 80047, 10738, 83198, 11273, 23837, 25054, 82272, 11090, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Y", "##OR", "##K", ",", "England", "1996", "-", "08", "-", "22" ], "ids": [ 162, 42622, 11733, 117, 11701, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sir", "Mark", "Prescott", "landed", "his", "first", "group", "one", "victory", "in", "25", "years", "as", "a", "trainer", "when", "his", "top", "sprint", "##er", "Pi", "##vot", "##al", ",", "a", "100", "-", "30", "chance", ",", "won", "the", "Nun", "##th", "##orp", "##e", "Stakes", "on", "Thursday", "." ], "ids": [ 12852, 11997, 101421, 58961, 10226, 10422, 11795, 10464, 19735, 10106, 10258, 10855, 10146, 169, 47840, 10841, 10226, 12364, 42707, 10165, 38329, 63129, 10415, 117, 169, 10407, 118, 10244, 27893, 117, 11367, 10105, 34289, 11143, 72504, 10112, 59353, 10135, 67067, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "The", "three", "-", "year", "-", "old", ",", "partner", "##ed", "by", "veteran", "George", "Duff", "##ield", ",", "sna", "##tch", "##ed", "a", "short", "head", "verdi", "##ct", "in", "the", "last", "strid", "##e", "to", "den", "##y", "Evening", "##per", "##forma", "##nce", "(", "16", "-", "1", ")", ",", "trained", "by", "Henry", "Candy", "and", "ri", "##dden", "by", "Chris", "R", "##utt", "##er", "." ], "ids": [ 10117, 11003, 118, 10924, 118, 12898, 117, 22825, 10336, 10155, 55669, 10955, 75278, 60685, 117, 62541, 38732, 10336, 169, 13716, 13578, 37922, 14526, 10106, 10105, 12469, 106743, 10112, 10114, 10140, 10157, 43906, 12713, 44010, 12150, 113, 10250, 118, 122, 114, 117, 33626, 10155, 11601, 50577, 10111, 29956, 71339, 10155, 13151, 155, 66117, 10165, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "He", "##ver", "Golf", "Rose", "(", "11", "-", "4", ")", ",", "last", "year", "'", "s", "Prix", "de", "l", "'", "Abbaye", "winner", "at", "Longchamp", ",", "finished", "third", ",", "a", "further", "one", "and", "a", "quarter", "lengths", "away", "with", "the", "7", "-", "4", "favourite", "Mind", "Games", "in", "fourth", "." ], "ids": [ 10357, 12563, 23870, 14873, 113, 10193, 118, 125, 114, 117, 12469, 10924, 112, 187, 12835, 10104, 180, 112, 92858, 20826, 10160, 45585, 117, 15972, 12628, 117, 169, 14586, 10464, 10111, 169, 28330, 104986, 14942, 10169, 10105, 128, 118, 125, 80494, 22810, 14501, 10106, 16918, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Pi", "##vot", "##al", ",", "a", "Royal", "As", "##cot", "winner", "in", "June", ",", "may", "now", "be", "aimed", "at", "this", "season", "'", "s", "Abbaye", ",", "Europe", "'", "s", "top", "sprint", "race", "." ], "ids": [ 38329, 63129, 10415, 117, 169, 11596, 10882, 41746, 20826, 10106, 11120, 117, 11387, 11858, 10347, 53004, 10160, 10531, 11226, 112, 187, 92858, 117, 11767, 112, 187, 12364, 42707, 14025, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Prescott", ",", "re", "##lu", "##cta", "##nt", "to", "go", "into", "the", "winner", "'", "s", "en", "##clo", "##sure", "until", "the", "result", "of", "the", "photo", "-", "finish", "was", "announced", ",", "said", ":", "\"", "Twenty", "-", "five", "years", "and", "I", "have", "never", "been", "there", "so", "I", "thought", "I", "had", "better", "wait", "a", "bit", "longer", ".", "\"" ], "ids": [ 101421, 117, 11639, 11435, 24290, 10368, 10114, 11783, 10708, 10105, 20826, 112, 187, 10110, 63143, 47394, 11444, 10105, 14493, 10108, 10105, 38171, 118, 26282, 10134, 13854, 117, 12415, 131, 107, 51521, 118, 12403, 10855, 10111, 146, 10529, 14794, 10590, 11155, 10380, 146, 18957, 146, 10374, 18322, 83279, 169, 17684, 20165, 119, 107 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "added", ":", "\"", "It", "'", "s", "very", "sad", "to", "beat", "Henry", "Candy", "because", "I", "am", "god", "##father", "to", "his", "daughter", ".", "\"" ], "ids": [ 10357, 16288, 131, 107, 10377, 112, 187, 12558, 81708, 10114, 27868, 11601, 50577, 12373, 146, 10392, 22009, 90089, 10114, 10226, 15243, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Like", "Prescott", ",", "Jack", "Berry", ",", "trainer", "of", "Mind", "Games", ",", "had", "gone", "into", "Thursday", "'", "s", "race", "in", "search", "of", "a", "first", "group", "one", "success", "after", "many", "years", "around", "the", "top", "of", "his", "profession", "." ], "ids": [ 15105, 101421, 117, 12342, 28692, 117, 47840, 10108, 22810, 14501, 117, 10374, 45041, 10708, 67067, 112, 187, 14025, 10106, 22419, 10108, 169, 10422, 11795, 10464, 17001, 10662, 11299, 10855, 12166, 10105, 12364, 10108, 10226, 56401, 119 ], "entity": [ "O", "B-PER", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Berry", "said", ":", "\"", "I", "[UNK]", "m", "disa", "##ppo", "##inted", "but", "I", "do", "n", "'", "t", "feel", "sui", "##cida", "##l", "." ], "ids": [ 28692, 12415, 131, 107, 146, 100, 181, 36474, 45565, 107583, 10473, 146, 10149, 182, 112, 188, 38008, 21053, 17483, 10161, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "(", "Mind", "Games", ")", "was", "going", "as", "well", "as", "any", "of", "them", "one", "and", "a", "half", "fur", "##long", "##s", "(", "300", "metres", ")", "out", "but", "he", "just", "did", "n", "'", "t", "quick", "##en", ".", "\"" ], "ids": [ 10357, 113, 22810, 14501, 114, 10134, 19090, 10146, 11206, 10146, 11178, 10108, 11345, 10464, 10111, 169, 13877, 61001, 31508, 10107, 113, 11093, 16393, 114, 10950, 10473, 10261, 12820, 12172, 182, 112, 188, 69609, 10136, 119, 107 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##OR", "##SE", "RA", "##CI", "##NG", "-", "N", "##UN", "##TH", "##OR", "##P", "##E", "ST", "##A", "##K", "##ES", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 145, 42622, 39039, 64007, 89955, 34065, 118, 151, 69849, 109166, 42622, 11127, 11259, 53317, 10738, 11733, 25054, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Y", "##OR", "##K", ",", "England", "1996", "-", "08", "-", "22" ], "ids": [ 162, 42622, 11733, 117, 11701, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "the", "Nun", "##th", "##orp", "##e", "Stakes", ",", "a", "group", "one", "race", "for", "two", "-", "year", "-", "old", "##s", "and", "up", "##wards", ",", "run", "over", "five", "fur", "##long", "##s", "(", "1", "km", ")", "on", "Thursday", ":" ], "ids": [ 32070, 16203, 10108, 10105, 34289, 11143, 72504, 10112, 59353, 117, 169, 11795, 10464, 14025, 10142, 10551, 118, 10924, 118, 12898, 10107, 10111, 10741, 30086, 117, 14095, 10491, 12403, 61001, 31508, 10107, 113, 122, 10204, 114, 10135, 67067, 131 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Pi", "##vot", "##al", "100", "-", "30", "(", "ri", "##dden", "by", "George", "Duff", "##ield", ")" ], "ids": [ 122, 119, 38329, 63129, 10415, 10407, 118, 10244, 113, 29956, 71339, 10155, 10955, 75278, 60685, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "2", ".", "Evening", "##per", "##forma", "##nce", "16", "-", "1", "(", "Chris", "R", "##utt", "##er", ")" ], "ids": [ 123, 119, 43906, 12713, 44010, 12150, 10250, 118, 122, 113, 13151, 155, 66117, 10165, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "3", ".", "He", "##ver", "Golf", "Rose", "11", "-", "4", "(", "Jason", "Weaver", ")" ], "ids": [ 124, 119, 10357, 12563, 23870, 14873, 10193, 118, 125, 113, 16796, 63417, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Eight", "ran", "." ], "ids": [ 43788, 17044, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Fa", "##vour", "##ite", ":", "Mind", "Games", "(", "7", "-", "4", ")", "finished", "4th" ], "ids": [ 44271, 92713, 12704, 131, 22810, 14501, 113, 128, 118, 125, 114, 15972, 20393 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Distance", "##s", ":", "a", "short", "head", ",", "1", "-", "1", "/", "4", "lengths", "." ], "ids": [ 90882, 10107, 131, 169, 13716, 13578, 117, 122, 118, 122, 120, 125, 104986, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Winner", "owned", "by", "the", "Che", "##vel", "##ey", "Park", "St", "##ud", "and", "trained", "by", "Sir" ], "ids": [ 40815, 17012, 10155, 10105, 44131, 13128, 13005, 11239, 10838, 11679, 10111, 33626, 10155, 12852 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Prescott", "at", "New", "##market", "." ], "ids": [ 11997, 101421, 10160, 10287, 60336, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9 ] }, { "tokens": [ "Value", "to", "winner", ":", "72", ",", "464", "pounds", "ster", "##ling", "(", "$", "112", ",", "200", ")" ], "ids": [ 83513, 10114, 20826, 131, 12120, 117, 40289, 61982, 78342, 11945, 113, 109, 16129, 117, 10777, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "TO", "##SH", "##IB", "##A", "CL", "##AS", "##SI", "##C", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 58573, 64091, 72918, 10738, 75151, 38025, 44802, 10858, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "CA", "##R", "##LS", "##BA", "##D", ",", "California", "1996", "-", "08", "-", "21" ], "ids": [ 24707, 11273, 66934, 35999, 11490, 117, 11621, 10389, 118, 11052, 118, 10296 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the" ], "ids": [ 33036, 10188, 10105 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "$", "450", ",", "000", "To", "##shi", "##ba", "Classic", "tennis", "tournament", "on", "Wednesday" ], "ids": [ 109, 16718, 117, 10259, 11469, 16119, 10537, 20542, 20944, 17390, 10135, 57611 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "(", "pre", "##fix", "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 113, 12229, 57014, 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "round" ], "ids": [ 14181, 13569 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", "-", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", "(", "Spain", ")", "beat", "Na", "##oko", "Ki", "##jim", "##uta", "(", "Japan", ")" ], "ids": [ 122, 118, 54789, 10368, 14220, 66007, 39574, 16780, 113, 16149, 114, 27868, 10685, 20954, 28941, 60911, 14118, 113, 11891, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "1", "-", "6", "6", "-", "4", "6", "-", "3" ], "ids": [ 122, 118, 127, 127, 118, 125, 127, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Kimi", "##ko", "Date", "(", "Japan", ")", "beat", "Yon", "##e", "Kami", "##o", "(", "Japan", ")", "6", "-", "2", "7", "-", "5" ], "ids": [ 125, 118, 63038, 10440, 29897, 113, 11891, 114, 27868, 94712, 10112, 87966, 10133, 113, 11891, 114, 127, 118, 123, 128, 118, 126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sand", "##rine", "Test", "##ud", "(", "France", ")", "beat", "7", "-", "Ai", "Su", "##gi", "##yama", "(", "Japan", ")", "6", "-", "3", "4", "-", "6" ], "ids": [ 35071, 28728, 22495, 11679, 113, 10688, 114, 27868, 128, 118, 19672, 12271, 11210, 32529, 113, 11891, 114, 127, 118, 124, 125, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "4" ], "ids": [ 127, 118, 125 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "8", "-", "Nathalie", "Tau", "##zia", "##t", "(", "France", ")", "beat", "Shi", "-", "Tin", "##g", "Wang", "(", "Taiwan", ")", "6", "-", "4" ], "ids": [ 129, 118, 64682, 88233, 14767, 10123, 113, 10688, 114, 27868, 44795, 118, 48800, 10240, 17250, 113, 19449, 114, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "2" ], "ids": [ 127, 118, 123 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "H", "##AM", "##LE", "##T", "C", "##UP", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 145, 36535, 51036, 11090, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "COM", "##MA", "##C", "##K", ",", "New", "York", "1996", "-", "08", "-", "21" ], "ids": [ 80645, 30696, 10858, 11733, 117, 10287, 10482, 10389, 118, 11052, 118, 10296 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the" ], "ids": [ 33036, 10188, 10105 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Wald", "##baum", "Hamlet", "Cup", "tennis", "tournament", "on", "Wednesday", "(", "pre", "##fix" ], "ids": [ 33903, 39687, 48334, 11544, 20944, 17390, 10135, 57611, 113, 12229, 57014 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "round" ], "ids": [ 14181, 13569 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", "-", "Michael", "Chang", "(", "U", ".", "S", ".", ")", "beat", "Ser", "##gi", "Br", "##ugu", "##era", "(", "Spain", ")", "6", "-", "3", "6", "-", "2" ], "ids": [ 122, 118, 10631, 28545, 113, 158, 119, 156, 119, 114, 27868, 39759, 11210, 38508, 47630, 12015, 113, 16149, 114, 127, 118, 124, 127, 118, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "Joyce", "(", "U", ".", "S", ".", ")", "beat", "3", "-", "Rich", "##ey", "Rene", "##berg", "(", "U", ".", "S", ".", ")", "3", "-", "6", "6", "-", "4" ], "ids": [ 10631, 35088, 113, 158, 119, 156, 119, 114, 27868, 124, 118, 27948, 13005, 91790, 11348, 113, 158, 119, 156, 119, 114, 124, 118, 127, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "3" ], "ids": [ 127, 118, 124 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Martin", "Damm", "(", "Czech", "Republic", ")", "beat", "6", "-", "You", "##nes", "El", "Ayn", "##ao", "##ui" ], "ids": [ 11235, 104698, 113, 22148, 13681, 114, 27868, 127, 118, 11065, 11496, 10224, 79011, 14875, 11990 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Morocco", ")", "5", "-", "7", "6", "-", "3", "3", "-", "0", "retired" ], "ids": [ 113, 57295, 114, 126, 118, 128, 127, 118, 124, 124, 118, 121, 18675 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karol", "Ku", "##cera", "(", "Slovakia", ")", "beat", "Hi", "##cha", "##m", "Ara", "##zi", "(", "Morocco", ")", "7", "-", "6", "(", "7", "-", "4", ")" ], "ids": [ 40129, 49869, 28568, 113, 43031, 114, 27868, 20065, 12964, 10147, 54789, 11282, 113, 57295, 114, 128, 118, 127, 113, 128, 118, 125, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "5" ], "ids": [ 128, 118, 126 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "DA", "##L", "##GL", "##IS", "##H", "SAD", "O", "##VE", "##R", "BL", "##AC", "##K", "##BU", "##RN", "PA", "##RT", "##ING", "." ], "ids": [ 71020, 65622, 24093, 118, 47855, 11369, 104780, 19088, 12396, 16145, 152, 68560, 11273, 102549, 30340, 11733, 108865, 90412, 32349, 46935, 50183, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kenny", "Dal", "##gli", "##sh", "spoke", "on", "Thursday", "of", "his", "sad", "##ness", "at", "leaving", "Blackburn", ",", "the", "club", "he", "led", "to", "the", "English", "premier", "league", "title", "in", "1994", "-", "95", "." ], "ids": [ 30002, 18205, 20986, 13264, 50005, 10135, 67067, 10108, 10226, 81708, 14010, 10160, 21005, 46006, 117, 10105, 11111, 10261, 12857, 10114, 10105, 11616, 11913, 15616, 12887, 10106, 10444, 118, 11978, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Blackburn", "announced", "on", "Wednesday", "they", "and", "Dal", "##gli", "##sh", "had", "parte", "##d", "by", "mutual", "consent", "." ], "ids": [ 46006, 13854, 10135, 57611, 10689, 10111, 18205, 20986, 13264, 10374, 10552, 10162, 10155, 85412, 84278, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "ex", "-", "manager", "con", "##fes", "##sed", "on", "Thursday", "to", "being", "\"", "sad", "\"", "at", "leaving", "after", "taking", "Blackburn", "from", "the", "second", "division", "to", "the", "premier", "league", "title", "inside", "three", "and", "a", "half", "years", "." ], "ids": [ 16976, 10105, 11419, 118, 16935, 10173, 58058, 16219, 10135, 67067, 10114, 11223, 107, 81708, 107, 10160, 21005, 10662, 18084, 46006, 10188, 10105, 11132, 13751, 10114, 10105, 11913, 15616, 12887, 22978, 11003, 10111, 169, 13877, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "telephone", "call", "to", "a", "local", "newspaper", "from", "his", "holiday", "home", "in", "Spain", ",", "Dal", "##gli", "##sh", "said", ":", "\"", "We", "came", "to", "the", "same", "opinion", ",", "alb", "##eit", "the", "club", "came", "to", "it", "a", "little", "bit", "earlier", "than", "me", ".", "\"" ], "ids": [ 10167, 169, 69009, 20575, 10114, 169, 11436, 22047, 10188, 10226, 71806, 11816, 10106, 16149, 117, 18205, 20986, 13264, 12415, 131, 107, 12865, 13383, 10114, 10105, 11561, 32282, 117, 98892, 22235, 10105, 11111, 13383, 10114, 10271, 169, 16745, 17684, 18905, 11084, 10911, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "added", ":", "\"", "If", "no", "one", "asked", ",", "I", "never", "opened", "my", "mouth", "." ], "ids": [ 10357, 16288, 131, 107, 14535, 10192, 10464, 22151, 117, 146, 14794, 14377, 15127, 42213, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "have", "stayed", "out", "of", "the", "way", "and", "let", "them", "get", "on", "with", "the", "job", "." ], "ids": [ 146, 10529, 42296, 10950, 10108, 10105, 13170, 10111, 13595, 11345, 15329, 10135, 10169, 10105, 23627, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "club", "thought", "it", "(", "the", "job", ")", "had", "run", "its", "course", "and", "I", "came", "to", "the", "same", "conclusion", ".", "\"" ], "ids": [ 10117, 11111, 18957, 10271, 113, 10105, 23627, 114, 10374, 14095, 10474, 15348, 10111, 146, 13383, 10114, 10105, 11561, 47775, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dal", "##gli", "##sh", "had", "been", "with", "Blackburn", "for", "nearly", "five", "years", ",", "first", "as", "manager", "and", "then", ",", "for", "the", "past", "15", "months", ",", "as", "director", "of", "football", "." ], "ids": [ 18205, 20986, 13264, 10374, 10590, 10169, 46006, 10142, 21377, 12403, 10855, 117, 10422, 10146, 16935, 10111, 11059, 117, 10142, 10105, 17781, 10208, 15555, 117, 10146, 12461, 10108, 12485, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##IS", "##H", "CO", "##UN", "##T", "##Y", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "SC", "##OR", "##ES", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 19088, 12396, 32992, 69849, 11090, 14703, 39774, 36535, 11127, 52980, 64091, 30331, 18137, 42622, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Close", "of", "play", "scores", "in", "four", "-", "day" ], "ids": [ 39981, 10108, 12253, 49931, 10106, 11598, 118, 11940 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "County", "Championship", "cricket", "matches", "on", "Thursday", ":" ], "ids": [ 11616, 10886, 12341, 32289, 18258, 10135, 67067, 131 ], "entity": [ "B-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "day" ], "ids": [ 14181, 11940 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "At", "Weston", "-", "super", "-", "Mare", ":", "Durham", "326", "(", "D", ".", "Cox", "95", "not", "out", "," ], "ids": [ 11699, 62676, 118, 25212, 118, 20754, 131, 37499, 32558, 113, 141, 119, 30927, 11978, 10472, 10950, 117 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "S", ".", "Campbell", "69", ";", "G", ".", "Rose", "7", "-", "73", ")", "." ], "ids": [ 156, 119, 18172, 12573, 132, 144, 119, 14873, 128, 118, 12545, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Somerset", "236", "-", "4", "(", "M", ".", "La", "##th", "##well", "85", ")", "." ], "ids": [ 35434, 26318, 118, 125, 113, 150, 119, 10159, 11143, 15862, 12017, 114, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Fi", "##rs", "##y", "day" ], "ids": [ 36448, 10943, 10157, 11940 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "At", "Col", "##chester", ":", "Gloucestershire", "280", "(", "J", ".", "Russell", "63", ",", "A", ".", "Sy", "##monds" ], "ids": [ 11699, 24927, 38540, 131, 91183, 17859, 113, 147, 119, 13481, 12256, 117, 138, 119, 32879, 97369 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 5, 9, 3, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "52", ";", "A", ".", "Co", "##wan", "5", "-", "68", ")", "." ], "ids": [ 11525, 132, 138, 119, 13098, 14394, 126, 118, 12370, 114, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essex", "72", "-", "0", "." ], "ids": [ 33634, 12120, 118, 121, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Cardiff", ":", "Kent", "128", "-", "1", "(", "M", ".", "Walker", "59", ",", "D", ".", "Fulton", "53", "not", "out", ")", "v" ], "ids": [ 11699, 39136, 131, 19393, 16196, 118, 122, 113, 150, 119, 15432, 11867, 117, 141, 119, 80454, 11756, 10472, 10950, 114, 190 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##lam", "##organ", "." ], "ids": [ 144, 21114, 100807, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9 ] }, { "tokens": [ "At", "Leicester", ":", "Leicester", "##shire", "343", "-", "8", "(", "P", ".", "Simmons", "108", ",", "P", ".", "Nixon" ], "ids": [ 11699, 38789, 131, 38789, 19684, 32007, 118, 129, 113, 153, 119, 44190, 15845, 117, 153, 119, 36507 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8 ] }, { "tokens": [ "67", "not", "out", ")", "v", "Hampshire", "." ], "ids": [ 12316, 10472, 10950, 114, 190, 26036, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "At", "Northampton", ":", "Sussex", "368", "-", "7", "(", "N", ".", "Len", "##ham", "145", ",", "V", ".", "Drake", "##s", "59", "not" ], "ids": [ 11699, 79445, 131, 38426, 34034, 118, 128, 113, 151, 119, 97413, 13196, 17862, 117, 159, 119, 30852, 10107, 11867, 10472 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "out", ",", "A", ".", "Wells", "51", ")", "v", "Northampton", "##shire", "." ], "ids": [ 10950, 117, 138, 119, 25325, 11524, 114, 190, 79445, 19684, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "At", "Trent", "Bridge", ":", "Nottingham", "##shire", "392", "-", "6", "(", "G", ".", "Archer", "143", "not" ], "ids": [ 11699, 47528, 17426, 131, 43396, 19684, 37956, 118, 127, 113, 144, 119, 53446, 19510, 10472 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "out", ",", "M", ".", "Dow", "##man", "107", ")", "v", "Surrey", "." ], "ids": [ 10950, 117, 150, 119, 106035, 10589, 15844, 114, 190, 42858, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 3, 9 ] }, { "tokens": [ "At", "Worcester", ":", "Warwick", "##shire", "255", "-", "9", "(", "A", ".", "Giles", "57", "not", "out", ",", "W", ".", "Khan" ], "ids": [ 11699, 55518, 131, 48234, 19684, 24024, 118, 130, 113, 138, 119, 49355, 11817, 10472, 10950, 117, 160, 119, 16324 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "52", ")", "v", "Worcester", "##shire", "." ], "ids": [ 11525, 114, 190, 55518, 19684, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "At", "Head", "##ing", "##ley", ":", "Yorkshire", "305", "-", "5", "(", "C", ".", "White", "66", "not", "out", ",", "M", ".", "Mo", "##xon" ], "ids": [ 11699, 16830, 10230, 12105, 131, 27577, 25112, 118, 126, 113, 140, 119, 12136, 12215, 10472, 10950, 117, 150, 119, 34987, 55251 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 5, 5, 9, 3, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "66", ",", "M", ".", "Vaughan", "57", ")", "v", "Lancashire", "." ], "ids": [ 12215, 117, 150, 119, 54864, 11817, 114, 190, 48487, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 3, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "V", "PA", "##KI", "##ST", "##AN", "F", "##IN", "##AL", "T", "##ES", "##T", "SC", "##OR", "##EB", "##O", "##AR", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 159, 32349, 59879, 32995, 41275, 143, 27128, 32002, 157, 25054, 11090, 18137, 42622, 89922, 11403, 52188, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##board", "on", "the", "first", "day", "of", "the" ], "ids": [ 66875, 25690, 10135, 10105, 10422, 11940, 10108, 10105 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "third", "and", "final", "test", "between", "England", "and", "Pakistan", "at", "The", "Oval", "on" ], "ids": [ 12628, 10111, 11070, 15839, 10948, 11701, 10111, 15437, 10160, 10117, 98765, 10135 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 5, 9 ] }, { "tokens": [ "Thursday", ":" ], "ids": [ 67067, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "England", "first", "innings" ], "ids": [ 11701, 10422, 48974 ], "entity": [ "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9 ] }, { "tokens": [ "M", ".", "At", "##hert", "##on", "b", "W", "##aq", "##ar", "You", "##nis", "31" ], "ids": [ 150, 119, 11699, 102855, 10263, 170, 160, 49277, 10354, 11065, 12597, 10413 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "A", ".", "Stewart", "b", "Mus", "##hta", "##q", "Ahmed", "44" ], "ids": [ 138, 119, 17493, 170, 31013, 32493, 11703, 25530, 11126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "N", ".", "Hus", "##sain", "c", "Sa", "##eed", "Anwar", "b", "W", "##aq", "##ar", "You", "##nis", "12" ], "ids": [ 151, 119, 109022, 82083, 171, 12404, 40154, 92168, 170, 160, 49277, 10354, 11065, 12597, 10186 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "G", ".", "Thorpe", "lb", "##w", "b", "Mohammad", "Ak", "##ram", "54" ], "ids": [ 144, 119, 84855, 23989, 10874, 170, 40036, 71275, 13845, 11653 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "J", ".", "C", "##ra", "##wley", "not", "out", "94" ], "ids": [ 147, 119, 140, 10288, 62381, 10472, 10950, 12749 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "N", ".", "Knight", "b", "Mus", "##hta", "##q", "Ahmed", "17" ], "ids": [ 151, 119, 19848, 170, 31013, 32493, 11703, 25530, 10273 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "C", ".", "Lewis", "b", "Was", "##im", "Ak", "##ram", "5" ], "ids": [ 140, 119, 13759, 170, 22034, 11759, 71275, 13845, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "I", ".", "Salisbury", "not", "out", "1" ], "ids": [ 146, 119, 55933, 10472, 10950, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "lb", "-", "11", "w", "-", "1", "n", "##b", "-", "8", ")", "20" ], "ids": [ 50821, 10107, 113, 23989, 118, 10193, 191, 118, 122, 182, 10457, 118, 129, 114, 10197 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "six", "wickets", ")", "278" ], "ids": [ 25220, 113, 10142, 12449, 83839, 114, 29417 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "64", "2", "-", "85", "3", "-", "116", "4", "-", "205", "5", "-", "248", "6", "-", "273" ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 11295, 123, 118, 12017, 124, 118, 17095, 125, 118, 20862, 126, 118, 24889, 127, 118, 28414 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "bat", ":", "R", ".", "C", "##roft", ",", "D", ".", "Cork", ",", "A", ".", "Mu", "##lla", "##lly" ], "ids": [ 11469, 11519, 131, 155, 119, 140, 101860, 117, 141, 119, 42049, 117, 138, 119, 49056, 11083, 17903 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "Bowling", "(", "to", "date", ")", ":", "Was", "##im", "Ak", "##ram", "25", "-", "8", "-", "61", "-", "1", ",", "W", "##aq", "##ar", "You", "##nis" ], "ids": [ 100017, 113, 10114, 13664, 114, 131, 22034, 11759, 71275, 13845, 10258, 118, 129, 118, 12314, 118, 122, 117, 160, 49277, 10354, 11065, 12597 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "20", "-", "6", "-", "70", "-", "2", ",", "Mohammad", "Ak", "##ram", "12", "-", "1", "-", "41", "-", "1", ",", "Mus", "##hta", "##q", "Ahmed", "27", "-", "5", "-", "78", "-", "2", "," ], "ids": [ 10197, 118, 127, 118, 10923, 118, 123, 117, 40036, 71275, 13845, 10186, 118, 122, 118, 11349, 118, 122, 117, 31013, 32493, 11703, 25530, 10365, 118, 126, 118, 12492, 118, 123, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "6", "-", "1", "-", "17", "-", "0" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 127, 118, 122, 118, 10273, 118, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", ":", "Aa", "##mir", "So", "##hai", "##l", ",", "Sa", "##eed", "Anwar", ",", "I", "##ja", "##z", "Ahmed", "," ], "ids": [ 15437, 131, 80131, 20825, 12882, 37821, 10161, 117, 12404, 40154, 92168, 117, 146, 10320, 10305, 25530, 117 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", ",", "Salim", "Malik", ",", "As", "##if", "Mu", "##jta", "##ba", ",", "Was", "##im", "Ak", "##ram", ",", "Moi", "##n" ], "ids": [ 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 117, 98284, 45783, 117, 10882, 13918, 49056, 51465, 10537, 117, 22034, 11759, 71275, 13845, 117, 82447, 10115 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8 ] }, { "tokens": [ "Khan", ",", "Mus", "##hta", "##q", "Ahmed", ",", "W", "##aq", "##ar", "You", "##nis", ",", "Mohammad", "Ak", "##am" ], "ids": [ 16324, 117, 31013, 32493, 11703, 25530, 117, 160, 49277, 10354, 11065, 12597, 117, 40036, 71275, 11008 ], "entity": [ "B-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "F", "##ER", "##G", "##US", "##ON", "BA", "##C", "##K", "IN", "SC", "##OT", "##TI", "##SH", "S", "##Q", "##U", "##AD", "AF", "##TER", "20", "MO", "##NT", "##HS", "." ], "ids": [ 71020, 65622, 24093, 118, 143, 24093, 11447, 32612, 30118, 39999, 10858, 11733, 36351, 18137, 62146, 72286, 64091, 156, 19282, 12022, 55538, 55640, 99552, 10197, 102059, 77261, 62181, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GL", "##AS", "##GO", "##W", "1996", "-", "08", "-", "22" ], "ids": [ 108755, 38025, 83821, 13034, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Everton", "'", "s", "Duncan", "Ferguson", ",", "who", "scored", "twice", "against", "Manchester", "United", "on", "Wednesday", ",", "was", "picked", "on", "Thursday", "for", "the", "Scottish", "squad", "after", "a", "20", "-", "month", "exile", "." ], "ids": [ 57936, 112, 187, 27964, 36401, 117, 10479, 17233, 26261, 11327, 15349, 10609, 10135, 57611, 117, 10134, 52289, 10135, 67067, 10142, 10105, 18879, 30580, 10662, 169, 10197, 118, 14064, 67696, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Glasgow", "Rangers", "striker", "All", "##y", "M", "##c", "##C", "##ois", "##t", ",", "another", "man", "in", "form", "after", "two", "hat", "-", "trick", "##s", "in", "four", "days", ",", "was", "also", "named", "for", "the", "August", "31", "World", "Cup", "qualifier", "against", "Austria", "in", "Vienna", "." ], "ids": [ 22145, 23042, 103325, 11101, 10157, 150, 10350, 10858, 19636, 10123, 117, 12864, 10817, 10106, 12188, 10662, 10551, 11250, 118, 71662, 10107, 10106, 11598, 13990, 117, 10134, 10379, 12038, 10142, 10105, 10735, 10413, 10315, 11544, 96076, 11327, 14479, 10106, 20590, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Ferguson", ",", "who", "served", "six", "weeks", "in", "jail", "in", "late", "1995", "for", "head", "-", "but", "##ting", "an", "opponent", ",", "won", "the", "last", "of", "his", "five", "Scotland", "caps", "in", "December", "1994", "." ], "ids": [ 36401, 117, 10479, 12325, 12449, 20750, 10106, 75934, 10106, 13002, 10436, 10142, 13578, 118, 10473, 12141, 10151, 53610, 117, 11367, 10105, 12469, 10108, 10226, 12403, 16901, 52036, 10106, 11288, 10444, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Scotland", "manager", "Craig", "Brown", "said", "on", "Thursday", ":", "\"", "I", "'", "ve", "watched", "Duncan", "Ferguson", "in", "action", "twice", "recently", "and", "he", "'", "s", "bang", "in", "form", "." ], "ids": [ 16901, 16935, 21703, 12623, 12415, 10135, 67067, 131, 107, 146, 112, 10323, 92147, 27964, 36401, 10106, 14204, 26261, 23746, 10111, 10261, 112, 187, 17937, 10106, 12188, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "##y", "M", "##c", "##C", "##ois", "##t", "is", "also", "in", "great", "scoring", "form", "at", "the", "moment", ".", "\"" ], "ids": [ 11101, 10157, 150, 10350, 10858, 19636, 10123, 10124, 10379, 10106, 14772, 27346, 12188, 10160, 10105, 14316, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Celtic", "'", "s", "Jackie", "M", "##c", "##N", "##amar", "##a", ",", "who", "did", "well", "with", "last", "season", "'", "s", "successful", "under", "-", "21", "team", ",", "earn", "##s", "a", "call", "-", "up", "to", "the", "senior", "squad", "." ], "ids": [ 30948, 112, 187, 30567, 150, 10350, 11537, 93196, 10113, 117, 10479, 12172, 11206, 10169, 12469, 11226, 112, 187, 17330, 10571, 118, 10296, 11121, 117, 65065, 10107, 169, 20575, 118, 10741, 10114, 10105, 17843, 30580, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "100", "-", "2", "AT", "L", "##UN", "##CH", "ON", "F", "##IR", "##ST", "DA", "##Y", "OF", "T", "##HI", "##RD", "T", "##ES", "##T", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 10407, 118, 123, 30554, 149, 69849, 86448, 49339, 143, 73522, 32995, 47855, 14703, 23240, 157, 108880, 84444, 157, 25054, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "were", "100", "for", "two", "at", "lu", "##nch", "on", "the", "first", "day", "of", "the", "third", "and", "final", "test", "against", "Pakistan", "at", "The", "Oval", "on", "Thursday", "." ], "ids": [ 11701, 10309, 10407, 10142, 10551, 10160, 14657, 31215, 10135, 10105, 10422, 11940, 10108, 10105, 12628, 10111, 11070, 15839, 11327, 15437, 10160, 10117, 98765, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "K", "##EA", "##NE", "SI", "##G", "##NS", "F", "##O", "##UR", "-", "Y", "##EA", "##R", "CO", "##NT", "##RA", "##CT", "W", "##IT", "##H", "MAN", "##CH", "##ES", "##TER", "UN", "##IT", "##ED", "." ], "ids": [ 71020, 65622, 24093, 118, 148, 36789, 93280, 39675, 11447, 69196, 143, 11403, 98348, 118, 162, 36789, 11273, 32992, 77261, 29990, 91995, 160, 37611, 12396, 73020, 86448, 25054, 99552, 26578, 37611, 33809, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 5, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ireland", "midfielder", "Roy", "Keane", "has", "signed", "a", "new", "four", "-", "year", "contract", "with", "English", "league", "and", "F", ".", "A", ".", "Cup", "champions", "Manchester", "United", "." ], "ids": [ 14637, 68049, 14521, 109464, 10393, 14775, 169, 10751, 11598, 118, 10924, 16108, 10169, 11616, 15616, 10111, 143, 119, 138, 119, 11544, 27745, 15349, 10609, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 6, 6, 6, 6, 9, 3, 7, 9 ] }, { "tokens": [ "\"", "Roy", "agreed", "a", "new", "deal", "before", "last", "night", "'", "s", "game", "against", "Everton", "and", "we", "are", "del", "##ight", "##ed", ",", "\"", "said", "United", "manager", "Alex", "Ferguson", "on", "Thursday", "." ], "ids": [ 107, 14521, 25577, 169, 10751, 19918, 11360, 12469, 16903, 112, 187, 11661, 11327, 57936, 10111, 11951, 10301, 10127, 27521, 10336, 117, 107, 12415, 10609, 16935, 14728, 36401, 10135, 67067, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "CAN", "##AD", "##IA", "##N", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 98038, 55538, 35976, 11537, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "21" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10296 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the", "Canadian", "Open" ], "ids": [ 33036, 10188, 10105, 14023, 11919 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 2, 6 ] }, { "tokens": [ "tennis", "tournament", "on", "Wednesday", "(", "pre", "##fix", "number", "den", "##otes" ], "ids": [ 20944, 17390, 10135, 57611, 113, 12229, 57014, 11487, 10140, 54989 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "seed", "##ing", ")", ":" ], "ids": [ 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Second", "round" ], "ids": [ 14181, 13569 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Daniel", "Nestor", "(", "Canada", ")", "beat", "1", "-", "Thomas", "Must", "##er", "(", "Austria", ")", "6", "-", "3", "7", "-", "5" ], "ids": [ 11792, 78424, 113, 11635, 114, 27868, 122, 118, 11096, 54690, 10165, 113, 14479, 114, 127, 118, 124, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mikael", "Till", "##strom", "(", "Sweden", ")", "beat", "2", "-", "Goran", "Ivan", "##ise", "##vic", "(", "Croatia", ")" ], "ids": [ 54671, 32259, 83474, 113, 20937, 114, 27868, 123, 118, 84658, 15631, 13041, 48175, 113, 34993, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", "-", "7", "(", "3", "-", "7", ")", "6", "-", "4", "6", "-", "4" ], "ids": [ 127, 118, 128, 113, 124, 118, 128, 114, 127, 118, 125, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "Wayne", "Ferreira", "(", "South", "Africa", ")", "beat", "Ji", "##ri", "Novak", "(", "Czech" ], "ids": [ 124, 118, 18547, 39227, 113, 11056, 12880, 114, 27868, 30822, 10401, 63458, 113, 22148 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 9, 4, 8, 8, 9, 1 ] }, { "tokens": [ "Republic", ")", "7", "-", "5", "6", "-", "3" ], "ids": [ 13681, 114, 128, 118, 126, 127, 118, 124 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Marcelo", "Rio", "##s", "(", "Chile", ")", "beat", "Kenneth", "Carl", "##sen", "(", "Denmark", ")", "6", "-", "3", "6", "-", "2" ], "ids": [ 125, 118, 38165, 12109, 10107, 113, 13218, 114, 27868, 22369, 12225, 10917, 113, 25854, 114, 127, 118, 124, 127, 118, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "Mali", "##V", "##ai", "Washington", "(", "U", ".", "S", ".", ")", "beat", "Alex", "Cor", "##ret", "##ja", "(", "Spain", ")", "6", "-", "4" ], "ids": [ 127, 118, 24427, 11779, 11542, 11586, 113, 158, 119, 156, 119, 114, 27868, 14728, 93495, 12785, 10320, 113, 16149, 114, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "2" ], "ids": [ 127, 118, 123 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "7", "-", "Todd", "Martin", "(", "U", ".", "S", ".", ")", "beat", "Renzo", "Fu", "##rla", "##n", "(", "Italy", ")", "7", "-", "6", "(", "7", "-", "3", ")", "6", "-", "3" ], "ids": [ 128, 118, 24708, 11235, 113, 158, 119, 156, 119, 114, 27868, 103493, 17056, 28050, 10115, 113, 11619, 114, 128, 118, 127, 113, 128, 118, 124, 114, 127, 118, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Philipp", "##ous", "##sis", "(", "Australia", ")", "beat", "8", "-", "Marc", "Ross", "##et" ], "ids": [ 11997, 23293, 13499, 13109, 113, 11729, 114, 27868, 129, 118, 15254, 16690, 10308 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Switzerland", ")", "6", "-", "3", "3", "-", "6", "7", "-", "6", "(", "8", "-", "6", ")" ], "ids": [ 113, 26002, 114, 127, 118, 124, 124, 118, 127, 128, 118, 127, 113, 129, 118, 127, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", "-", "Cedric", "Pio", "##line", "(", "France", ")", "beat", "Gregory", "Carr", "##az", "(", "France", ")", "7", "-", "6" ], "ids": [ 130, 118, 107799, 42712, 12953, 113, 10688, 114, 27868, 22392, 45332, 16724, 113, 10688, 114, 128, 118, 127 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "(", "7", "-", "1", ")", "6", "-", "4" ], "ids": [ 113, 128, 118, 122, 114, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Patrick", "Ra", "##fter", "(", "Australia", ")", "beat", "11", "-", "Alberto", "Be", "##ras", "##ate", "##gui" ], "ids": [ 13867, 38571, 33163, 113, 11729, 114, 27868, 10193, 118, 15796, 14321, 12783, 12436, 55818 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Spain", ")", "6", "-", "1", "6", "-", "2" ], "ids": [ 113, 16149, 114, 127, 118, 122, 127, 118, 123 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Petr", "Ko", "##rda", "(", "Czech", "Republic", ")", "beat", "12", "-", "Francisco", "Cl", "##ave", "##t", "(", "Spain", ")" ], "ids": [ 40986, 30186, 21285, 113, 22148, 13681, 114, 27868, 10186, 118, 11798, 101989, 23641, 10123, 113, 16149, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", "-", "3", "6", "-", "4" ], "ids": [ 127, 118, 124, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Daniel", "Va", "##cek", "(", "Czech", "Republic", ")", "beat", "13", "-", "Jason", "St", "##olt", "##enberg" ], "ids": [ 11792, 14723, 37239, 113, 22148, 13681, 114, 27868, 10249, 118, 16796, 10838, 27667, 24304 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "Australia", ")", "5", "-", "7", "7", "-", "6", "(", "7", "-", "1", ")", "7", "-", "6", "(", "13", "-", "11", ")" ], "ids": [ 113, 11729, 114, 126, 118, 128, 128, 118, 127, 113, 128, 118, 122, 114, 128, 118, 127, 113, 10249, 118, 10193, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Todd", "Wood", "##bridge", "(", "Australia", "beat", "Se", "##bas", "##tien", "La", "##reau", "(", "Canada", ")", "6", "-", "3" ], "ids": [ 24708, 18315, 29273, 113, 11729, 27868, 11045, 21322, 20322, 10159, 50496, 113, 11635, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "6", "6", "-", "3" ], "ids": [ 122, 118, 127, 127, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alex", "O", "'", "Brien", "(", "U", ".", "S", ".", ")", "beat", "Byron", "Black", "(", "Zimbabwe", ")", "7", "-", "6", "(", "7", "-", "2", ")", "6", "-", "2" ], "ids": [ 14728, 152, 112, 33629, 113, 158, 119, 156, 119, 114, 27868, 42657, 11750, 113, 34577, 114, 128, 118, 127, 113, 128, 118, 123, 114, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bo", "##hda", "##n", "U", "##lih", "##rach", "(", "Czech", "Republic", ")", "beat", "Andrea", "Ga", "##uden", "##zi", "(", "Italy", ")" ], "ids": [ 27622, 109788, 10115, 158, 53614, 36185, 113, 22148, 13681, 114, 27868, 16101, 69699, 23280, 11282, 113, 11619, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", "-", "3", "4", "-", "6", "6", "-", "1" ], "ids": [ 127, 118, 124, 125, 118, 127, 127, 118, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tim", "Hen", "##man", "(", "Britain", ")", "beat", "Chris", "Wood", "##ruf", "##f", "(", "U", ".", "S", ".", ")", ",", "walk", "##over" ], "ids": [ 15318, 86362, 10589, 113, 16032, 114, 27868, 13151, 18315, 59459, 10575, 113, 158, 119, 156, 119, 114, 117, 33734, 16666 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "MI", "##LL", "##NS", "SI", "##G", "##NS", "FOR", "B", "##OL", "##AN", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 75416, 82834, 69196, 39675, 11447, 69196, 109544, 139, 39272, 41275, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "CA", "##P", "##E", "TO", "##WN", "1996", "-", "08", "-", "22" ], "ids": [ 24707, 11127, 11259, 58573, 105844, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "African", "provincial", "side", "Bola", "##nd", "said", "on", "Thursday", "they", "had", "signed", "Leicester", "##shire", "fast", "bowl", "##er", "David", "Mill", "##ns", "on", "a", "one", "year", "contract", "." ], "ids": [ 11056, 13839, 24900, 12250, 51565, 11534, 12415, 10135, 67067, 10689, 10374, 14775, 38789, 19684, 15040, 99380, 10165, 10804, 28639, 10891, 10135, 169, 10464, 10924, 16108, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mill", "##ns", ",", "who", "toured", "Australia", "with", "England", "A", "in", "1992", "/", "93", ",", "replace", "##s", "former", "England", "all", "-", "round", "##er", "Phillip", "De", "##F", "##rei", "##tas", "as", "Bola", "##nd", "'", "s", "overseas", "professional", "." ], "ids": [ 28639, 10891, 117, 10479, 51876, 11729, 10169, 11701, 138, 10106, 10450, 120, 12479, 117, 37156, 10107, 11775, 11701, 10435, 118, 13569, 10165, 44368, 10190, 11565, 31510, 11390, 10146, 51565, 11534, 112, 187, 59391, 14054, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EU", "##RO", "##P", "##EA", "##N", "C", "##UP", "W", "##IN", "##NE", "##RS", "'", "C", "##UP", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 17751, 35066, 11127, 36789, 11537, 140, 57487, 160, 27128, 93280, 39469, 112, 140, 57487, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##IR", "##AN", "##A", "1996", "-", "08", "-", "22" ], "ids": [ 157, 73522, 41275, 10738, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "European", "Cup", "Winners", "'" ], "ids": [ 33036, 10108, 11914, 11544, 34686, 112 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6, 6, 6 ] }, { "tokens": [ "Cup", "qualifying", "round", ",", "second", "leg", "soccer", "matches", "on", "Thursday", ":" ], "ids": [ 11544, 43631, 13569, 117, 11132, 33810, 41356, 18258, 10135, 67067, 131 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Tirana", ":", "Fl", "##am", "##urt", "##ari", "V", "##lore", "(", "Albania", ")", "0", "Chem", "##lon", "Hume", "##nne" ], "ids": [ 10167, 59272, 131, 29981, 11008, 30546, 12476, 159, 42895, 113, 28931, 114, 121, 26609, 15709, 64495, 15490 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 1, 9, 3, 7, 7, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 7 ] }, { "tokens": [ "(", "Slovakia", ")", "2", "(", "half", "##time", "0", "-", "0", ")" ], "ids": [ 113, 43031, 114, 123, 113, 13877, 18086, 121, 118, 121, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":", "Lu", "##bar", "##skij", "(", "50th", "minute", ")", ",", "Val", "##ku", "##cak", "(", "54", "##th", ")" ], "ids": [ 66875, 10943, 131, 23859, 12867, 102122, 113, 98105, 21760, 114, 117, 16190, 10853, 31273, 113, 11653, 11143, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "5", ",", "000" ], "ids": [ 46080, 131, 126, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chem", "##lon", "Hume", "##nne", "win", "3", "-", "0", "on", "aggregate" ], "ids": [ 26609, 15709, 64495, 15490, 14125, 124, 118, 121, 10135, 75063 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Bis", "##tri", "##ta", ":", "Gloria", "Bis", "##tri", "##ta", "(", "Romania", ")", "2", "Valle", "##tta", "(", "Malta", ")", "1" ], "ids": [ 10167, 18516, 21570, 10213, 131, 26209, 18516, 21570, 10213, 113, 13927, 114, 123, 19159, 12201, 113, 23259, 114, 122 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 3, 7, 7, 7, 9, 1, 9, 9, 1, 5, 9, 1, 9, 9 ] }, { "tokens": [ "(", "1", "-", "1", ")" ], "ids": [ 113, 122, 118, 122, 114 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Gloria", "Bis", "##tri", "##ta", "-", "Il", "##ie", "La", "##zar", "(", "32", "##nd", ")", ",", "Eugen", "Vo", "##ica", "(", "84", "##th", ")" ], "ids": [ 26209, 18516, 21570, 10213, 118, 10282, 10400, 10159, 15803, 113, 10842, 11534, 114, 117, 32439, 59482, 11043, 113, 11761, 11143, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Valle", "##tta", "-", "Gilbert", "A", "##giu", "##s", "(", "24", "##th", ")" ], "ids": [ 19159, 12201, 118, 18608, 138, 50510, 10107, 113, 10233, 11143, 114 ], "entity": [ "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "8", ",", "000" ], "ids": [ 46080, 131, 129, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gloria", "Bis", "##tri", "##ta", "win", "4", "-", "2", "on", "aggregate", "." ], "ids": [ 26209, 18516, 21570, 10213, 14125, 125, 118, 123, 10135, 75063, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Chor", "##zo", "##w", ":", "R", "##uch", "Chor", "##zo", "##w", "(", "Poland", ")", "5", "L", "##lans", "##ant", "##ff", "##raid", "(", "Wales", ")", "0" ], "ids": [ 10167, 38955, 12096, 10874, 131, 155, 20591, 38955, 12096, 10874, 113, 17879, 114, 126, 149, 95753, 11236, 13820, 89025, 113, 14137, 114, 121 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 3, 7, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 7, 7, 9, 1, 9, 9 ] }, { "tokens": [ "(", "1", "-", "0", ")" ], "ids": [ 113, 122, 118, 121, 114 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":", "Ark", "##adi", "##usz", "Ba", "##k", "(", "1st", "and", "55", "##th", ")", ",", "Ar", "##wel", "Jones", "(", "47", "##th", "," ], "ids": [ 66875, 10943, 131, 67552, 18974, 39131, 21333, 10174, 113, 13510, 10111, 11358, 11143, 114, 117, 18484, 20706, 12298, 113, 11413, 11143, 117 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "own", "goal", ")", ",", "Miroslav", "Ba", "##k", "(", "62", "##nd", "and", "63", "##rd", ")" ], "ids": [ 12542, 16586, 114, 117, 46707, 21333, 10174, 113, 12066, 11534, 10111, 12256, 12023, 114 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "6", ",", "500" ], "ids": [ 46080, 131, 127, 117, 10757 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##uch", "Chor", "##zo", "##w", "win", "6", "-", "1", "on", "aggregate" ], "ids": [ 155, 20591, 38955, 12096, 10874, 14125, 127, 118, 122, 10135, 75063 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "La", "##rna", "##ca", ":", "AE", "##K", "La", "##rna", "##ca", "(", "Cyprus", ")", "5", "Kota", "##ik", "Ab", "##ovy", "##an", "(", "Armenia", ")" ], "ids": [ 10167, 10159, 13471, 10425, 131, 35060, 11733, 10159, 13471, 10425, 113, 45639, 114, 126, 19336, 10896, 15595, 64067, 10206, 113, 24719, 114 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 3, 7, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 7, 7, 9, 1, 9 ] }, { "tokens": [ "0", "(", "2", "-", "0", ")" ], "ids": [ 121, 113, 123, 118, 121, 114 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":", "Zoran", "Kun", "##dic", "(", "28", "##th", ")", ",", "K", "##limi", "##s", "Alexa", "##ndro", "##u", "(", "41", "##st", ")", "," ], "ids": [ 66875, 10943, 131, 54146, 29184, 55170, 113, 10348, 11143, 114, 117, 148, 89337, 10107, 94720, 78908, 10138, 113, 11349, 10562, 114, 117 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mile", "##nko", "Ko", "##vas", "##evi", "##c", "(", "60", "##th", ",", "penalty", ")", ",", "Goran", "Ko", "##pri", "##novi", "##c", "(", "82", "##nd", ")", "," ], "ids": [ 45756, 38967, 30186, 14139, 44082, 10350, 113, 10709, 11143, 117, 40924, 114, 117, 84658, 30186, 101319, 55080, 10350, 113, 12180, 11534, 114, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pa", "##v", "##los", "Marko", "##u", "(", "84", "##th", ")" ], "ids": [ 26907, 10477, 13788, 41337, 10138, 113, 11761, 11143, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "5", ",", "000" ], "ids": [ 46080, 131, 126, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AE", "##K", "La", "##rna", "##ca", "win", "5", "-", "1", "on", "aggregate" ], "ids": [ 35060, 11733, 10159, 13471, 10425, 14125, 126, 118, 122, 10135, 75063 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Sia", "##uli", "##ai", ":", "Kar", "##eda", "Sia", "##uli", "##ai", "(", "Lithuania", ")", "0", "Sion" ], "ids": [ 10167, 88468, 24207, 11542, 131, 90233, 20244, 88468, 24207, 11542, 113, 57377, 114, 121, 82683 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG" ], "entity_ids": [ 9, 1, 5, 5, 9, 3, 7, 7, 7, 7, 9, 1, 9, 9, 3 ] }, { "tokens": [ "(", "Switzerland", ")", "0" ], "ids": [ 113, 26002, 114, 121 ], "entity": [ "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 1, 9, 9 ] }, { "tokens": [ "Attendance", ":", "5", ",", "000" ], "ids": [ 46080, 131, 126, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sion", "win", "4", "-", "2", "on", "ag", "##rrega", "##te", "." ], "ids": [ 82683, 14125, 125, 118, 123, 10135, 16942, 91918, 10216, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Vi", "##nny", "##ts", "##ya", ":" ], "ids": [ 10167, 31826, 58916, 10806, 10679, 131 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Ny", "##va", "Vi", "##nny", "##ts", "##ya", "(", "Ukraine", ")", "1", "Tallinna", "Sada", "##m", "(", "Estonia", ")", "0", "(", "0", "-", "0", ")" ], "ids": [ 11459, 10362, 31826, 58916, 10806, 10679, 113, 19883, 114, 122, 27701, 100090, 10147, 113, 31475, 114, 121, 113, 121, 118, 121, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "3", ",", "000" ], "ids": [ 46080, 131, 124, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##gg", "##regat", "##e", "score", "2", "-", "2", "." ], "ids": [ 138, 21127, 100232, 10112, 17704, 123, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ny", "##va", "qualified", "on", "away", "goals", "rule", "." ], "ids": [ 11459, 10362, 32244, 10135, 14942, 18173, 21983, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Bergen", ":", "Br", "##ann", "(", "Norway", ")", "2", "She", "##lb", "##our", "##ne", "(", "Ireland", ")", "1", "(", "1", "-", "1", ")" ], "ids": [ 10167, 19511, 131, 38508, 20801, 113, 22582, 114, 123, 11149, 70832, 17964, 10238, 113, 14637, 114, 122, 113, 122, 118, 122, 114 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 1, 9, 9, 3, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Br", "##ann", "-", "Mons", "Ivar", "M", "##jel", "##de", "(", "10th", ")", ",", "Jan", "Ove", "Pedersen", "(", "72", "##nd", ")" ], "ids": [ 38508, 20801, 118, 37870, 63808, 150, 35372, 10253, 113, 31004, 114, 117, 11806, 68710, 54063, 113, 12120, 11534, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "She", "##lb", "##our", "##ne", "-", "Mark", "Rutherford", "(", "5th", ")" ], "ids": [ 11149, 70832, 17964, 10238, 118, 11997, 59773, 113, 23255, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "2", ",", "189" ], "ids": [ 46080, 131, 123, 117, 23535 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Br", "##ann", "win", "5", "-", "2", "on", "aggregate" ], "ids": [ 38508, 20801, 14125, 126, 118, 123, 10135, 75063 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Sofia", ":", "Lev", "##ski", "Sofia", "(", "Bulgaria", ")", "1", "Ol", "##im", "##pija", "(", "Slovenia", ")", "0" ], "ids": [ 10167, 21416, 131, 51644, 11401, 21416, 113, 21935, 114, 122, 60160, 11759, 85367, 113, 34583, 114, 121 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 7, 7, 9, 1, 9, 9, 3, 7, 7, 9, 1, 9, 9 ] }, { "tokens": [ "(", "0", "-", "0", ")" ], "ids": [ 113, 121, 118, 121, 114 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##r", ":", "Il", "##ian", "Simeon", "##ov", "(", "58", "##th", ")" ], "ids": [ 66875, 10129, 131, 10282, 11630, 102425, 11024, 113, 11824, 11143, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "25", ",", "000" ], "ids": [ 46080, 131, 10258, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##gg", "##regat", "##e", "1", "-", "1", "." ], "ids": [ 138, 21127, 100232, 10112, 122, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ol", "##im", "##pija", "won", "4", "-", "3", "on", "penal", "##ties", "." ], "ids": [ 60160, 11759, 85367, 11367, 125, 118, 124, 10135, 69270, 14197, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Va", "##duz", ":", "Va", "##duz", "(", "Liechtenstein", ")", "1", "RAF", "Riga", "(", "Latvia", ")", "1", "(", "0", "-", "0", ")" ], "ids": [ 10167, 14723, 79546, 131, 14723, 79546, 113, 49693, 114, 122, 25828, 34466, 113, 55926, 114, 122, 113, 121, 118, 121, 114 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 1, 5, 9, 1, 9, 9, 3, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Va", "##duz", "-", "Daniele", "Pol", "##veri", "##no", "(", "90", "##th", ")" ], "ids": [ 14723, 79546, 118, 58463, 38432, 52019, 10343, 113, 10919, 11143, 114 ], "entity": [ "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "RAF", "Riga", "-", "A", "##gri", "##ns", "Za", "##rins", "(", "47", "##th", ")" ], "ids": [ 25828, 34466, 118, 138, 59497, 10891, 14074, 69746, 113, 11413, 11143, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##gg", "##regat", "##e", "2", "-", "2", "." ], "ids": [ 138, 21127, 100232, 10112, 123, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Va", "##duz", "won", "4", "-", "2", "on", "penal", "##ties", "." ], "ids": [ 14723, 79546, 11367, 125, 118, 123, 10135, 69270, 14197, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Luxembourg", ":", "US", "Luxembourg", "(", "Luxembourg", ")", "0", "Var", "##tek", "##s", "Var", "##az", "##din" ], "ids": [ 10167, 23903, 131, 10808, 23903, 113, 23903, 114, 121, 48725, 15186, 10107, 48725, 16724, 15612 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 1, 9, 9, 3, 7, 7, 7, 7, 7 ] }, { "tokens": [ "(", "Croatia", ")", "3", "(", "0", "-", "0", ")" ], "ids": [ 113, 34993, 114, 124, 113, 121, 118, 121, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":", "Dr", "##azen", "Be", "##ser", "(", "63", "##rd", ")", ",", "Mil", "##jen", "##ko", "Mu", "##mler", "(", "penalty", "," ], "ids": [ 66875, 10943, 131, 11612, 71307, 14321, 12754, 113, 12256, 12023, 114, 117, 75311, 12414, 10440, 49056, 80903, 113, 40924, 117 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "78", "##th", ")", ",", "Jam", "##ir", "C", "##vet", "##ko", "(", "87", "##th", ")" ], "ids": [ 12492, 11143, 114, 117, 30660, 10835, 140, 15028, 10440, 113, 12581, 11143, 114 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "800" ], "ids": [ 46080, 131, 11900 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Var", "##tek", "##s", "Var", "##az", "##din", "win", "5", "-", "1", "on", "aggregate", "." ], "ids": [ 48725, 15186, 10107, 48725, 16724, 15612, 14125, 126, 118, 122, 10135, 75063, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Tor", "##shavn", ":", "Ha", "##vna", "##r", "Bolt", "##fel", "##ag", "(", "Faro", "##e", "Islands", ")", "0", "Dynamo" ], "ids": [ 10167, 24446, 89785, 131, 13740, 28492, 10129, 101539, 22086, 14520, 113, 91182, 10112, 16872, 114, 121, 49013 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG" ], "entity_ids": [ 9, 1, 5, 9, 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 9, 9, 3 ] }, { "tokens": [ "Batu", "##mi", "(", "Georgia", ")", "3", "(", "0", "-", "2", ")" ], "ids": [ 43063, 10500, 113, 15234, 114, 124, 113, 121, 118, 123, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dynamo", "Batu", "##mi", "win", "9", "-", "0", "on", "aggregate", "." ], "ids": [ 49013, 43063, 10500, 14125, 130, 118, 121, 10135, 75063, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Prague", ":", "Sparta", "Prague", "(", "Czech", "Republic", ")", "8", "Glen", "##tora", "##n" ], "ids": [ 10167, 33745, 131, 36354, 33745, 113, 22148, 13681, 114, 129, 30729, 42761, 10115 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 1, 5, 9, 9, 3, 7, 7 ] }, { "tokens": [ "(", "Northern", "Ireland", ")", "0", "(", "4", "-", "0", ")" ], "ids": [ 113, 15352, 14637, 114, 121, 113, 125, 118, 121, 114 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":", "Petr", "Gun", "##da", "(", "1st", "and", "26", "##th", ")", ",", "Lu", "##mir", "Mis", "##tr", "(", "19th", ")", "," ], "ids": [ 66875, 10943, 131, 40986, 31328, 10229, 113, 13510, 10111, 10314, 11143, 114, 117, 23859, 20825, 99946, 26382, 113, 19794, 114, 117 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Horst", "Sieg", "##l", "(", "24", "##th", ",", "48", "##th", ",", "80", "##th", ")", ",", "Zde", "##nek", "Sv", "##ob", "##oda", "(", "76", "##th", ")", ",", "Petr" ], "ids": [ 36424, 27581, 10161, 113, 10233, 11143, 117, 11300, 11143, 117, 10832, 11143, 114, 117, 86894, 12354, 53068, 31165, 18220, 113, 12428, 11143, 114, 117, 40986 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 4 ] }, { "tokens": [ "Gabriel", "(", "86", "##th", ")" ], "ids": [ 15447, 113, 12224, 11143, 114 ], "entity": [ "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9 ] }, { "tokens": [ "Sparta", "win", "10", "-", "1", "on", "aggregate", "." ], "ids": [ 36354, 14125, 10150, 118, 122, 10135, 75063, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Edinburgh", ":", "Hearts", "(", "Scotland", ")", "1", "Red", "Star", "Belgrade" ], "ids": [ 10167, 21372, 131, 33385, 113, 16901, 114, 122, 11641, 11836, 48084 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 1, 9, 3, 9, 1, 9, 9, 3, 7, 7 ] }, { "tokens": [ "(", "Yugoslavia", ")", "1", "(", "1", "-", "0", ")" ], "ids": [ 113, 38168, 114, 122, 113, 122, 118, 121, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Hearts", "-", "Dave", "M", "##c", "##Pherson", "(", "44", "##th", ")" ], "ids": [ 33385, 118, 16073, 150, 10350, 95893, 113, 11126, 11143, 114 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Red", "Star", "-", "Vi", "##nko", "Marino", "##vic", "(", "59", "##th", ")" ], "ids": [ 11641, 11836, 118, 31826, 38967, 29719, 48175, 113, 11867, 11143, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "15", ",", "06", "##2" ], "ids": [ 46080, 131, 10208, 117, 10719, 10729 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##gg", "##regat", "##e", "1", "-", "1", "." ], "ids": [ 138, 21127, 100232, 10112, 122, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Red", "Star", "win", "on", "away", "goals", "rule", "." ], "ids": [ 11641, 11836, 14125, 10135, 14942, 18173, 21983, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "R", "##ish", "##on", "-", "Le", "##zion", ":", "Ha", "##po", "##el", "Iron", "##i", "(", "Israel", ")", "3", "Con", "##stru", "##ctor", "##ul" ], "ids": [ 10167, 155, 15529, 10263, 118, 10281, 40307, 131, 13740, 13520, 10570, 19247, 10116, 113, 12991, 114, 124, 12845, 42461, 21038, 10604 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 5, 9, 3, 7, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 7 ] }, { "tokens": [ "Chi", "##sina", "##u", "(", "Moldova", ")", "2", "(", "2", "-", "1", ")" ], "ids": [ 21946, 36663, 10138, 113, 29733, 114, 123, 113, 123, 118, 122, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##gg", "##regat", "##e", "3", "-", "3", "." ], "ids": [ 138, 21127, 100232, 10112, 124, 118, 124, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##stru", "##ctor", "##ul", "win", "on", "away", "goals", "rule", "." ], "ids": [ 12845, 42461, 21038, 10604, 14125, 10135, 14942, 18173, 21983, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "An", "##jalo", "##nko", "##ski", ":", "My", "##Pa", "-", "47", "(", "Finland", ")", "1", "Kara", "##bach", "A", "##gda", "##m" ], "ids": [ 10167, 10313, 107349, 38967, 11401, 131, 11590, 89525, 118, 11413, 113, 15497, 114, 122, 34635, 14135, 138, 88348, 10147 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 2, 6, 6, 6, 9, 3, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 7, 7 ] }, { "tokens": [ "(", "Azerbaijan", ")", "1", "(", "0", "-", "0", ")" ], "ids": [ 113, 28810, 114, 122, 113, 121, 118, 121, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "My", "##pa", "-", "47", "win", "2", "-", "1", "on", "aggregate", "." ], "ids": [ 11590, 11359, 118, 11413, 14125, 123, 118, 122, 10135, 75063, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Skopje", ":", "S", "##loga", "Ju", "##gom", "##agna", "##t", "(", "Macedonia", ")", "0", "Kis", "##pest", "Hon", "##ved" ], "ids": [ 10167, 54454, 131, 156, 54291, 45031, 72757, 87929, 10123, 113, 34840, 114, 121, 82441, 60737, 19431, 20709 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 1, 9, 3, 7, 7, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 7 ] }, { "tokens": [ "(", "Hungary", "1", "(", "0", "-", "0", ")" ], "ids": [ 113, 24601, 122, 113, 121, 118, 121, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kis", "##pest", "Hon", "##ved", "win", "2", "-", "0", "on", "aggregate", "." ], "ids": [ 82441, 60737, 19431, 20709, 14125, 123, 118, 121, 10135, 75063, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ad", "##d", "Ha", "##po", "##el", "Iron", "##i", "v", "Con", "##stru", "##ctor", "##ul", "Chi", "##sina", "##u" ], "ids": [ 25474, 10162, 13740, 13520, 10570, 19247, 10116, 190, 12845, 42461, 21038, 10604, 21946, 36663, 10138 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "R", "##ish", "##on", "-", "Mo", "##she", "Saba", "##g", "(", "10th", "minute", ")", ",", "Nissan", "Kap", "##eta", "(", "26", "##th", ")", "," ], "ids": [ 155, 15529, 10263, 118, 34987, 70098, 86627, 10240, 113, 31004, 21760, 114, 117, 41650, 68634, 14724, 113, 10314, 11143, 114, 117 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tomas", "Ci", "##bola", "(", "58", "##th", ")", "." ], "ids": [ 41889, 51457, 46260, 113, 11824, 11143, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##stru", "##ctor", "##ol", "-", "Sergei", "R", "##oga", "##chev", "(", "42", "##nd", ")", ",", "Gen", "##nadi", "Ski", "##dan" ], "ids": [ 12845, 42461, 21038, 11481, 118, 42794, 155, 25201, 99462, 113, 11276, 11534, 114, 117, 32560, 56293, 51874, 12146 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 3, 7, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "87", "##th", ")", "." ], "ids": [ 113, 12581, 11143, 114, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "1", ",", "500", "." ], "ids": [ 46080, 131, 122, 117, 10757, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GO", "##TH", "##EN", "##BU", "##R", "##G", "P", "##UT", "F", "##ER", "##EN", "##C", "##VA", "##RO", "##S", "O", "##UT", "OF", "EU", "##RO", "C", "##UP", "." ], "ids": [ 71020, 65622, 24093, 118, 41525, 109166, 50655, 108865, 11273, 11447, 153, 65729, 143, 24093, 50655, 10858, 47172, 35066, 10731, 152, 65729, 23240, 17751, 35066, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "B", "##UD", "##AP", "##ES", "##T", "1996", "-", "08", "-", "21" ], "ids": [ 139, 86888, 38423, 25054, 11090, 10389, 118, 11052, 118, 10296 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IFK", "Got", "##hen", "##burg", "of", "Sweden", "drew", "1", "-", "1", "(", "1", "-", "0", ")", "with", "Ferenc", "##varo", "##s", "of", "Hungary", "in", "the", "second", "leg", "of", "their", "European", "Champions", "Cup", "preliminary", "round", "tie", "played", "on", "Wednesday", "." ], "ids": [ 68861, 24291, 14786, 12248, 10108, 20937, 49098, 122, 118, 122, 113, 122, 118, 121, 114, 10169, 24932, 77640, 10107, 10108, 24601, 10106, 10105, 11132, 33810, 10108, 10455, 11914, 17441, 11544, 68097, 13569, 27916, 11553, 10135, 57611, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Got", "##hen", "##burg", "go", "through", "4", "-", "1", "on", "aggregate", "." ], "ids": [ 24291, 14786, 12248, 11783, 11222, 125, 118, 122, 10135, 75063, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Ferenc", "##varo", "##s", ":" ], "ids": [ 24932, 77640, 10107, 131 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9 ] }, { "tokens": [ "Ferenc", "Ho", "##rva", "##th", "(", "15th", ")" ], "ids": [ 24932, 20220, 36017, 11143, 113, 36293, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "IFK", "Got", "##hen", "##burg", ":" ], "ids": [ 68861, 24291, 14786, 12248, 131 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9 ] }, { "tokens": [ "Andreas", "Andersson", "(", "87", "##th", ")" ], "ids": [ 17336, 36303, 113, 12581, 11143, 114 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "9", ",", "000" ], "ids": [ 46080, 131, 130, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "BR", "##A", "##Z", "##IL", "##IA", "##N", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 49351, 10738, 13966, 38850, 35976, 11537, 39774, 36535, 11127, 52980, 64091, 30331, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RI", "##O", "DE", "JA", "##NE", "##IR", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 56658, 11403, 25067, 53399, 93280, 73522, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "mid", "##week" ], "ids": [ 33036, 10108, 15607, 84805 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "matches", "in", "the", "Brazilian", "soccer", "championship", "." ], "ids": [ 18258, 10106, 10105, 32818, 41356, 20755, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Bahia", "2", "At", "##leti", "##co", "Para", "##nae", "##nse", "0" ], "ids": [ 34566, 123, 11699, 42136, 10812, 13497, 25589, 19051, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Corinthians", "1", "G", "##uara", "##ni", "0" ], "ids": [ 74615, 122, 144, 66567, 10342, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Cor", "##iti", "##ba", "1", "At", "##leti", "##co", "Mineiro", "0" ], "ids": [ 93495, 13903, 10537, 122, 11699, 42136, 10812, 102945, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Cruzeiro", "2", "Vitoria", "1" ], "ids": [ 89539, 123, 88838, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Flamengo", "0", "Juventud", "##e", "1" ], "ids": [ 77383, 121, 99284, 10112, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Go", "##ias", "3", "Sport", "Recife", "1" ], "ids": [ 14439, 15465, 124, 15062, 75526, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "G", "##rem", "##io", "6", "Braga", "##ntino", "1" ], "ids": [ 144, 19786, 10638, 127, 55045, 44878, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Palmeiras", "3", "Vasco", "da", "Gama", "1" ], "ids": [ 95567, 124, 31402, 10143, 55829, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Portuguesa", "2", "Para", "##na", "0" ], "ids": [ 52788, 123, 13497, 10219, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "NE", "##WC", "##OM", "##B", "##E", "P", "##ON", "##DE", "##RS", "H", "##IS", "DA", "##VI", "##S", "C", "##UP", "F", "##UT", "##UR", "##E", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 86607, 80539, 37079, 11274, 11259, 153, 30118, 60675, 39469, 145, 19088, 47855, 90939, 10731, 140, 57487, 143, 65729, 98348, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "22" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australian", "Davis", "Cup", "captain", "John", "New", "##combe", "on", "Thursday", "signal", "##led", "his", "possible", "resignation", "if", "his", "team", "lose", "##s", "an", "away", "tie", "against", "Croatia", "next", "month", "." ], "ids": [ 12829, 14281, 11544, 28157, 10421, 10287, 87041, 10135, 67067, 25495, 16376, 10226, 14128, 66129, 12277, 10226, 11121, 48742, 10107, 10151, 14942, 27916, 11327, 34993, 13451, 14064, 119 ], "entity": [ "B-MISC", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 2, 2, 6, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "The", "former", "Wimbledon", "champion", "said", "the", "immediate", "future", "of", "Australia", "'", "s", "Davis", "Cup", "coach", "Tony", "Roche", "could", "also", "be", "determined", "by", "events", "in", "Split", "." ], "ids": [ 10117, 11775, 37932, 17689, 12415, 10105, 46938, 16711, 10108, 11729, 112, 187, 14281, 11544, 15701, 13749, 38580, 12174, 10379, 10347, 30706, 10155, 15284, 10106, 33094, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "If", "we", "lose", "this", "one", ",", "Tony", "and", "I", "will", "have", "to", "have", "a", "good", "look", "at", "giving", "someone", "else", "a", "go", ",", "\"", "New", "##combe", "was", "quoted", "as", "saying", "in", "Sydney", "'", "s", "Daily", "Telegraph", "newspaper", "." ], "ids": [ 107, 14535, 11951, 48742, 10531, 10464, 117, 13749, 10111, 146, 11337, 10529, 10114, 10529, 169, 15198, 25157, 10160, 24426, 30455, 40843, 169, 11783, 117, 107, 10287, 87041, 10134, 70676, 10146, 22807, 10106, 14470, 112, 187, 17252, 30786, 22047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Australia", "face", "Croatia", "in", "the", "world", "group", "qualifying", "tie", "on", "clay", "from", "September", "20", "-", "22", "." ], "ids": [ 11729, 13295, 34993, 10106, 10105, 11356, 11795, 43631, 27916, 10135, 77057, 10188, 10596, 10197, 118, 10306, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Under", "New", "##combe", "'", "s", "leadership", ",", "Australia", "were", "relegated", "from", "the", "elite", "world", "group", "last", "year", ",", "the", "first", "time", "the", "26", "-", "time", "Davis", "Cup", "winners", "had", "sl", "##ip", "##ped", "from", "the", "top", "rank", "." ], "ids": [ 12594, 10287, 87041, 112, 187, 25121, 117, 11729, 10309, 62212, 10188, 10105, 43163, 11356, 11795, 12469, 10924, 117, 10105, 10422, 10635, 10105, 10314, 118, 10635, 14281, 11544, 33525, 10374, 38523, 17437, 16898, 10188, 10105, 12364, 27908, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Since", "taking", "over", "as", "captain", "from", "Neal", "##e", "Fraser", "in", "1994", ",", "New", "##combe", "'", "s", "record", "in", "tan", "##dem", "with", "Roche", ",", "his", "former", "doubles", "partner", ",", "has", "been", "three", "wins", "and", "three", "losses", "." ], "ids": [ 15591, 18084, 10491, 10146, 28157, 10188, 29147, 10112, 30677, 10106, 10444, 117, 10287, 87041, 112, 187, 12410, 10106, 15176, 16050, 10169, 38580, 117, 10226, 11775, 46255, 22825, 117, 10393, 10590, 11003, 27279, 10111, 11003, 45353, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "##combe", "has", "selected", "Wimbledon", "semifinali", "##st", "Jason", "St", "##olt", "##enberg", ",", "Patrick", "Ra", "##fter", ",", "Mark", "Philipp", "##ous", "##sis", ",", "and", "Olympic", "doubles", "champions", "Todd", "Wood", "##bridge", "and", "Mark", "Wood", "##ford", "##e", "to", "face", "the", "Croatian", "##s", "." ], "ids": [ 10287, 87041, 10393, 19546, 37932, 71380, 10562, 16796, 10838, 27667, 24304, 117, 13867, 38571, 33163, 117, 11997, 23293, 13499, 13109, 117, 10111, 17952, 46255, 27745, 24708, 18315, 29273, 10111, 11997, 18315, 13387, 10112, 10114, 13295, 10105, 48963, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 2, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "The", "home", "side", "boa", "##sts", "world", "number", "six", "Goran", "Ivan", "##ise", "##vic", ",", "and", "New", "##combe", "con", "##ceded", "his", "players", "would", "be", "hard", "-", "presse", "##d", "to", "beat", "the", "Croatian", "number", "one", "." ], "ids": [ 10117, 11816, 12250, 47071, 28036, 11356, 11487, 12449, 84658, 15631, 13041, 48175, 117, 10111, 10287, 87041, 10173, 75214, 10226, 16021, 10894, 10347, 19118, 118, 33834, 10162, 10114, 27868, 10105, 48963, 11487, 10464, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "are", "ready", "to", "fight", "to", "our", "last", "br", "##eath", "-", "-", "Australia", "must", "play", "at", "its", "absolute", "best", "to", "win", ",", "\"", "said", "New", "##combe", ",", "who", "described", "the", "tie", "as", "the", "tou", "##ghe", "##st", "he", "has", "faced", "as", "captain", "." ], "ids": [ 107, 12865, 10301, 42374, 10114, 20780, 10114, 17446, 12469, 33989, 54006, 118, 118, 11729, 14982, 12253, 10160, 10474, 48573, 12504, 10114, 14125, 117, 107, 12415, 10287, 87041, 117, 10479, 13010, 10105, 27916, 10146, 10105, 52586, 61069, 10562, 10261, 10393, 31952, 10146, 28157, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", "last", "won", "the", "Davis", "Cup", "in", "1986", ",", "but", "they", "were", "beaten", "finalist", "##s", "against", "Germany", "three", "years", "ago", "under", "Fraser", "'", "s", "guidance", "." ], "ids": [ 11729, 12469, 11367, 10105, 14281, 11544, 10106, 10578, 117, 10473, 10689, 10309, 74075, 78096, 10107, 11327, 12775, 11003, 10855, 36390, 10571, 30677, 112, 187, 78112, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##DM", "##IN", "##TO", "##N", "-", "MA", "##LA", "##YS", "##IA", "##N", "OP", "##EN", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 39999, 94138, 27128, 60493, 11537, 118, 27277, 44376, 93202, 35976, 11537, 55355, 50655, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##U", "##AL", "##A", "L", "##UM", "##P", "##UR", "1996", "-", "08", "-", "22" ], "ids": [ 148, 12022, 32002, 10738, 149, 72679, 11127, 98348, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "in", "the", "Malaysian" ], "ids": [ 33036, 10106, 10105, 72413 ], "entity": [ "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 2 ] }, { "tokens": [ "Open", "badminton", "tournament", "on", "Thursday", "(", "pre", "##fix", "number", "den", "##otes" ], "ids": [ 11919, 109973, 17390, 10135, 67067, 113, 12229, 57014, 11487, 10140, 54989 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "seed", "##ing", ")", ":" ], "ids": [ 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "third", "round" ], "ids": [ 13026, 112, 187, 20527, 117, 12628, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", "/", "16", "-", "Lu", "##o", "Yi", "##gang", "(", "China", ")", "beat", "H", "##wang", "Sun", "-", "ho", "(", "South", "Korea", ")", "15", "-", "3" ], "ids": [ 130, 120, 10250, 118, 23859, 10133, 40512, 13755, 113, 11593, 114, 27868, 145, 24238, 13967, 118, 13173, 113, 11056, 14096, 114, 10208, 118, 124 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "B-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 2, 6, 6, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "7" ], "ids": [ 10208, 118, 128 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Jason", "Wong", "(", "Malaysia", ")", "beat", "Abdul", "Sama", "##d", "Ismail", "(", "Malaysia", ")", "16", "-", "18" ], "ids": [ 16796, 35572, 113, 13625, 114, 27868, 23642, 55927, 10162, 43441, 113, 13625, 114, 10250, 118, 10218 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "2", "17", "-", "14" ], "ids": [ 10208, 118, 123, 10273, 118, 10247 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", ".", "Kant", "##har", "##oop", "##an", "(", "Malaysia", ")", "beat", "3", "/", "4", "-", "Je", "##roen", "Van", "Di", "##jk" ], "ids": [ 153, 119, 45879, 18387, 53005, 10206, 113, 13625, 114, 27868, 124, 120, 125, 118, 13796, 77321, 11474, 12944, 26960 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Netherlands", ")", "15", "-", "11", "18", "-", "14" ], "ids": [ 113, 22043, 114, 10208, 118, 10193, 10218, 118, 10247 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wi", "##jaya", "Indra", "(", "Indonesia", ")", "beat", "5", "/", "8", "-", "Pan", "##g", "Chen", "(", "Malaysia", ")", "15", "-", "6" ], "ids": [ 52742, 58471, 102937, 113, 11658, 114, 27868, 126, 120, 129, 118, 18661, 10240, 22177, 113, 13625, 114, 10208, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "15", "15", "-", "7" ], "ids": [ 127, 118, 10208, 10208, 118, 128 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", "/", "4", "-", "Hu", "Z", "##hil", "##an", "(", "China", ")", "beat", "Nun", "##ung", "Suba", "##ndor", "##o", "(", "Indonesia", ")", "5", "-", "15" ], "ids": [ 124, 120, 125, 118, 43707, 163, 53543, 10206, 113, 11593, 114, 27868, 34289, 10716, 28094, 57261, 10133, 113, 11658, 114, 126, 118, 10208 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "18", "-", "15", "15", "-", "6" ], "ids": [ 10218, 118, 10208, 10208, 118, 127 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", "/", "16", "-", "Her", "##ma", "##wan", "Susan", "##to", "(", "Indonesia", ")", "beat", "1", "-", "Fun", "##g", "Perm", "##adi", "(", "Taiwan", ")" ], "ids": [ 130, 120, 10250, 118, 13229, 10369, 14394, 14476, 10340, 113, 11658, 114, 27868, 122, 118, 47989, 10240, 67222, 18974, 113, 19449, 114 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "15", "-", "8", "15", "-", "12" ], "ids": [ 10208, 118, 129, 10208, 118, 10186 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", "2nd", "round" ], "ids": [ 13536, 112, 187, 20527, 14105, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "Wang", "Chen", "(", "China", ")", "beat", "Ci", "##ndan", "##a", "(", "Indonesia", ")", "11", "-", "3", "1a", "##ma", "(", "Japan", ")", "beat", "Margit", "Borg", "(", "Sweden", ")", "11", "-", "6", "11", "-", "6" ], "ids": [ 122, 118, 17250, 22177, 113, 11593, 114, 27868, 51457, 18285, 10113, 113, 11658, 114, 10193, 118, 124, 64582, 10369, 113, 11891, 114, 27868, 89274, 65791, 113, 20937, 114, 10193, 118, 127, 10193, 118, 127 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sun", "Ji", "##an", "(", "China", ")", "beat", "Marina", "And", "##rie", "##vska", "##q", "##ya", "(", "Sweden", ")", "11", "-", "8", "11", "-", "2" ], "ids": [ 13967, 30822, 10206, 113, 11593, 114, 27868, 18753, 12689, 12904, 88558, 11703, 10679, 113, 20937, 114, 10193, 118, 129, 10193, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", "/", "8", "-", "Mel", "##ua", "##wati", "(", "Indonesia", ")", "beat", "Chan", "Chi", "##a", "F", "##ong", "(", "Malaysia", ")", "11", "-", "6" ], "ids": [ 126, 120, 129, 118, 40060, 11908, 66790, 113, 11658, 114, 27868, 27602, 21946, 10113, 143, 13891, 113, 13625, 114, 10193, 118, 127 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "11", "-", "1" ], "ids": [ 10193, 118, 122 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Gong", "Z", "##hic", "##ha", "##o", "(", "China", ")", "beat", "Liu", "Lu", "##fung", "(", "China", ")", "6", "-", "11", "11", "-", "7", "11", "-", "3" ], "ids": [ 57594, 163, 39187, 10921, 10133, 113, 11593, 114, 27868, 23456, 23859, 47513, 113, 11593, 114, 127, 118, 10193, 10193, 118, 128, 10193, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zen", "##g", "Ya", "##qi", "##ong", "(", "China", ")", "beat", "Li", "Feng", "(", "New", "Zealand", ")", "11", "-", "9", "11", "-", "6" ], "ids": [ 61916, 10240, 25148, 27132, 13891, 113, 11593, 114, 27868, 13258, 80147, 113, 10287, 14451, 114, 10193, 118, 130, 10193, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", "/", "8", "-", "Christine", "Magnus", "##son", "(", "Sweden", ")", "beat", "Is", "##hwa", "##ri", "Boo", "##pat", "##hy" ], "ids": [ 126, 120, 129, 118, 23588, 22940, 11599, 113, 20937, 114, 27868, 12034, 77155, 10401, 102498, 18115, 19275 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Malaysia", ")", "11", "-", "1", "10", "-", "12", "11", "-", "4" ], "ids": [ 113, 13625, 114, 10193, 118, 122, 10150, 118, 10186, 10193, 118, 125 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "Zhang", "Ni", "##ng", "(", "China", ")", "beat", "Olivia", "(", "Indonesia", ")", "11", "-", "8", "11", "-", "6" ], "ids": [ 123, 118, 24551, 30409, 10376, 113, 11593, 114, 27868, 38137, 113, 11658, 114, 10193, 118, 129, 10193, 118, 127 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##VI", "##SE", "##D", "ME", "##N", "'", "S", "DR", "##A", "##W", "FOR", "U", ".", "S", ".", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 90939, 39039, 11490, 47430, 11537, 112, 156, 45457, 10738, 13034, 109544, 158, 119, 156, 119, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "22" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Revised", "singles", "draw", "for", "the" ], "ids": [ 63697, 20527, 25974, 10142, 10105 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Open", "tennis", "championships", "beginning", "Monday", "at", "the", "U", ".", "S", "." ], "ids": [ 158, 119, 156, 119, 11919, 20944, 47211, 17967, 40714, 10160, 10105, 158, 119, 156, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "National", "Tennis", "Centre", "(", "pre", "##fix", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 10655, 27380, 12838, 113, 12229, 57014, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "Dr", "##aw" ], "ids": [ 13026, 112, 187, 11612, 26426 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "Pete", "Sam", "##pra", "##s", "(", "U", ".", "S", ".", ")", "vs", ".", "Adrian", "Vo", "##inea", "(", "Romania", ")" ], "ids": [ 122, 118, 23107, 14268, 30631, 10107, 113, 158, 119, 156, 119, 114, 14987, 119, 23928, 59482, 78209, 113, 13927, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Ji", "##ri", "Novak", "(", "Czech", "Republic", ")", "vs", ".", "qualifier" ], "ids": [ 30822, 10401, 63458, 113, 22148, 13681, 114, 14987, 119, 96076 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Magnus", "Larsson", "(", "Sweden", ")", "vs", ".", "Alexander", "Volk", "##ov", "(", "Russia", ")" ], "ids": [ 22940, 59396, 113, 20937, 114, 14987, 119, 12063, 44613, 11024, 113, 14664, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Mikael", "Till", "##strom", "(", "Sweden", ")", "vs", "qualifier" ], "ids": [ 54671, 32259, 83474, 113, 20937, 114, 14987, 96076 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "Andrei", "Ol", "##hov", "##ski", "##y", "(", "Russia", ")" ], "ids": [ 109291, 14987, 119, 40594, 60160, 67238, 11401, 10157, 113, 14664, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Mark", "Wood", "##ford", "##e", "(", "Australia", ")", "vs", ".", "Mark", "Philipp", "##ous", "##sis", "(", "Australia", ")" ], "ids": [ 11997, 18315, 13387, 10112, 113, 11729, 114, 14987, 119, 11997, 23293, 13499, 13109, 113, 11729, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Roberto", "Carr", "##eter", "##o", "(", "Spain", ")", "vs", ".", "Jordi", "Bu", "##rillo", "(", "Spain", ")" ], "ids": [ 14948, 45332, 28647, 10133, 113, 16149, 114, 14987, 119, 40928, 11916, 96382, 113, 16149, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Francisco", "Cl", "##ave", "##t", "(", "Spain", ")", "vs", ".", "16", "-", "Cedric", "Pio", "##line", "(", "France", ")" ], "ids": [ 11798, 101989, 23641, 10123, 113, 16149, 114, 14987, 119, 10250, 118, 107799, 42712, 12953, 113, 10688, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", "-", "Wayne", "Ferreira", "(", "South", "Africa", ")", "vs", ".", "qualifier" ], "ids": [ 130, 118, 18547, 39227, 113, 11056, 12880, 114, 14987, 119, 96076 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Karol", "Ku", "##cera", "(", "Slovakia", ")", "vs", ".", "Jonas", "B", "##jor", "##km", "##an", "(", "Sweden", ")" ], "ids": [ 40129, 49869, 28568, 113, 43031, 114, 14987, 119, 22653, 139, 100248, 23440, 10206, 113, 20937, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "Christian", "R", "##udd", "(", "Norway", ")" ], "ids": [ 109291, 14987, 119, 11757, 155, 75385, 113, 22582, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Alex", "Cor", "##ret", "##ja", "(", "Spain", ")", "vs", ".", "Byron", "Black", "(", "Zimbabwe", ")" ], "ids": [ 14728, 93495, 12785, 10320, 113, 16149, 114, 14987, 119, 42657, 11750, 113, 34577, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "David", "R", "##ik", "##l", "(", "Czech", "Republic", ")", "vs", ".", "Hi", "##cha", "##m", "Ara", "##zi", "(", "Morocco", ")" ], "ids": [ 10804, 155, 10896, 10161, 113, 22148, 13681, 114, 14987, 119, 20065, 12964, 10147, 54789, 11282, 113, 57295, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "S", "##jeng", "Schalke", "##n", "(", "Netherlands", ")", "vs", ".", "Gilbert", "Sc", "##halle", "##r", "(", "Austria", ")" ], "ids": [ 156, 85159, 87909, 10115, 113, 22043, 114, 14987, 119, 18608, 55260, 47371, 10129, 113, 14479, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Grant", "Stafford", "(", "South", "Africa", ")", "vs", ".", "Guy", "Forget", "(", "France", ")" ], "ids": [ 17606, 68463, 113, 11056, 12880, 114, 14987, 119, 16358, 90179, 113, 10688, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "Fernando", "Mel", "##igen", "##i", "(", "Brazil", ")", "vs", ".", "7", "-", "Ye", "##v", "##gen", "##y", "Ka", "##feln", "##iko", "##v", "(", "Russia", ")" ], "ids": [ 14022, 40060, 13741, 10116, 113, 16765, 114, 14987, 119, 128, 118, 20567, 10477, 11280, 10157, 25444, 79650, 18924, 10477, 113, 14664, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Goran", "Ivan", "##ise", "##vic", "(", "Croatia", ")", "vs", ".", "Andrei", "Che", "##sno", "##kov", "(", "Russia", ")" ], "ids": [ 125, 118, 84658, 15631, 13041, 48175, 113, 34993, 114, 14987, 119, 40594, 44131, 108455, 16433, 113, 14664, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Scott", "Dr", "##aper", "(", "Australia", ")", "vs", ".", "Gal", "##o", "Blanco", "(", "Spain", ")" ], "ids": [ 12812, 11612, 59445, 113, 11729, 114, 14987, 119, 66676, 10133, 30235, 113, 16149, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Renzo", "Fu", "##rla", "##n", "(", "Italy", ")", "vs", ".", "Thomas", "Johansson", "(", "Sweden", ")" ], "ids": [ 103493, 17056, 28050, 10115, 113, 11619, 114, 14987, 119, 11096, 40211, 113, 20937, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "Hendrik", "Dre", "##ek", "##man", "(", "Germany", ")", "vs", ".", "Greg", "Rus", "##eds", "##ki", "(", "Britain", ")" ], "ids": [ 29090, 72531, 10707, 10589, 113, 12775, 114, 14987, 119, 22438, 30796, 57000, 10506, 113, 16032, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Andrei", "Medvedev", "(", "Ukraine", ")", "vs", ".", "Jean", "-", "Philippe", "Fl", "##eur", "##ian", "(", "France", ")" ], "ids": [ 40594, 91681, 113, 19883, 114, 14987, 119, 10766, 118, 15408, 29981, 12986, 11630, 113, 10688, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Jan", "Kr", "##os", "##lak", "(", "Slovakia", ")", "vs", ".", "Chris", "Wood", "##ruf", "##f", "(", "U", ".", "S", ".", ")" ], "ids": [ 11806, 17640, 10310, 21995, 113, 43031, 114, 14987, 119, 13151, 18315, 59459, 10575, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "Petr", "Ko", "##rda", "(", "Czech", "Republic", ")" ], "ids": [ 109291, 14987, 119, 40986, 30186, 21285, 113, 22148, 13681, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 5, 9 ] }, { "tokens": [ "Bo", "##hda", "##n", "U", "##lih", "##rach", "(", "Czech", "Republic", ")", "vs", ".", "14", "-", "Alberto", "Costa" ], "ids": [ 27622, 109788, 10115, 158, 53614, 36185, 113, 22148, 13681, 114, 14987, 119, 10247, 118, 15796, 13902 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "(", "Spain", ")" ], "ids": [ 113, 16149, 114 ], "entity": [ "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "12", "-", "Todd", "Martin", "(", "U", ".", "S", ".", ")", "vs", ".", "You", "##nnes", "El", "Ayn", "##ao", "##ui", "(", "Morocco", ")" ], "ids": [ 10186, 118, 24708, 11235, 113, 158, 119, 156, 119, 114, 14987, 119, 11065, 47943, 10224, 79011, 14875, 11990, 113, 57295, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Andrea", "Ga", "##uden", "##zi", "(", "Italy", ")", "vs", ".", "Shu", "##zo", "Mats", "##uo", "##ka", "(", "Japan", ")" ], "ids": [ 16101, 69699, 23280, 11282, 113, 11619, 114, 14987, 119, 56448, 12096, 86768, 21187, 10371, 113, 11891, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Doug", "Fl", "##ach", "(", "U", ".", "S", ".", ")", "vs", ".", "qualifier" ], "ids": [ 34008, 29981, 11587, 113, 158, 119, 156, 119, 114, 14987, 119, 96076 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Mats", "Wi", "##lander", "(", "Sweden", ")", "vs", ".", "Tim", "Hen", "##man", "(", "Britain", ")" ], "ids": [ 86768, 52742, 73795, 113, 20937, 114, 14987, 119, 15318, 86362, 10589, 113, 16032, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Paul", "Haar", "##huis", "(", "Netherlands", ")", "vs", ".", "Michael", "Joyce", "(", "U", ".", "S", ".", ")" ], "ids": [ 10772, 41005, 31280, 113, 22043, 114, 14987, 119, 10631, 35088, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Michael", "Te", "##bb", "##utt", "(", "Australia", ")", "vs", ".", "Rich", "##ey", "Rene", "##berg", "(", "U", ".", "S", ".", ")" ], "ids": [ 10631, 21452, 14496, 66117, 113, 11729, 114, 14987, 119, 27948, 13005, 91790, 11348, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Jonathan", "Stark", "(", "U", ".", "S", ".", ")", "vs", ".", "Bernd", "Kar", "##bacher", "(", "Germany", ")" ], "ids": [ 16395, 39923, 113, 158, 119, 156, 119, 114, 14987, 119, 49554, 90233, 75544, 113, 12775, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Stefan", "Ed", "##berg", "(", "Sweden", ")", "vs", ".", "5", "-", "Richard", "Kraj", "##ice", "##k", "(", "Netherlands", ")" ], "ids": [ 17399, 13114, 11348, 113, 20937, 114, 14987, 119, 126, 118, 11118, 98619, 11918, 10174, 113, 22043, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "Andre", "Aga", "##ssi", "(", "U", ".", "S", ".", ")", "vs", ".", "Mauricio", "Had", "##ad", "(", "Colombia", ")" ], "ids": [ 127, 118, 25188, 103721, 28377, 113, 158, 119, 156, 119, 114, 14987, 119, 59647, 66434, 11488, 113, 15223, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Marcos", "On", "##dru", "##ska", "(", "South", "Africa", ")", "vs", ".", "Felix", "Man", "##til", "##la", "(", "Spain", ")" ], "ids": [ 24936, 10576, 57672, 11485, 113, 11056, 12880, 114, 14987, 119, 21683, 11343, 19156, 10330, 113, 16149, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Carlos", "Mo", "##ya", "(", "Spain", ")", "vs", ".", "Scott", "Hum", "##ph", "##ries", "(", "U", ".", "S", ".", ")" ], "ids": [ 12050, 34987, 10679, 113, 16149, 114, 14987, 119, 12812, 91636, 28088, 15388, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Jan", "Sie", "##meri", "##nk", "(", "Netherlands", ")", "vs", ".", "Carl", "-", "Uwe", "St", "##ee", "##b", "(", "Germany", ")" ], "ids": [ 11806, 11583, 85137, 17761, 113, 22043, 114, 14987, 119, 12225, 118, 62100, 10838, 13321, 10457, 113, 12775, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "qualifier" ], "ids": [ 109291, 14987, 119, 96076 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "David", "W", "##hea", "##ton", "(", "U", ".", "S", ".", ")", "vs", ".", "Kevin", "Kim", "(", "U", ".", "S", ".", ")" ], "ids": [ 10804, 160, 45546, 11183, 113, 158, 119, 156, 119, 114, 14987, 119, 15377, 13539, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Nicolas", "La", "##pent", "##ti", "(", "Ecuador", ")", "vs", ".", "Alex", "O", "'", "Brien", "(", "U", ".", "S", ".", ")" ], "ids": [ 16443, 10159, 55939, 10325, 113, 20475, 114, 14987, 119, 14728, 152, 112, 33629, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Karim", "Alam", "##i", "(", "Morocco", ")", "vs", ".", "11", "-", "Mali", "##V", "##ai", "Washington", "(", "U", ".", "S", ".", ")" ], "ids": [ 71139, 51255, 10116, 113, 57295, 114, 14987, 119, 10193, 118, 24427, 11779, 11542, 11586, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "13", "-", "Thomas", "En", "##qvist", "(", "Sweden", ")", "vs", ".", "Stephan", "##e", "Sim", "##ian", "(", "France", ")" ], "ids": [ 10249, 118, 11096, 10243, 47780, 113, 20937, 114, 14987, 119, 31556, 10112, 103695, 11630, 113, 10688, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Guillaume", "Rao", "##ux", "(", "France", ")", "vs", ".", "Filip", "De", "##wu", "##lf", "(", "Belgium", ")" ], "ids": [ 20619, 44776, 11855, 113, 10688, 114, 14987, 119, 31445, 10190, 40054, 35173, 113, 26519, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Mark", "Knowles", "(", "Bahamas", ")", "vs", ".", "Marcelo", "Filip", "##pini", "(", "Uruguay", ")" ], "ids": [ 11997, 69382, 113, 64534, 114, 14987, 119, 38165, 31445, 103479, 113, 20541, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Todd", "Wood", "##bridge", "(", "Australia", ")", "vs", ".", "qualifier" ], "ids": [ 24708, 18315, 29273, 113, 11729, 114, 14987, 119, 96076 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Kris", "Go", "##ossen", "##s", "(", "Belgium", ")", "vs", ".", "Ser", "##gi", "Br", "##ugu", "##era", "(", "Spain", ")" ], "ids": [ 69041, 14439, 65614, 10107, 113, 26519, 114, 14987, 119, 39759, 11210, 38508, 47630, 12015, 113, 16149, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "Michael", "St", "##ich", "(", "Germany", ")" ], "ids": [ 109291, 14987, 119, 10631, 10838, 14401, 113, 12775, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "Chuck", "Adams", "(", "U", ".", "S", ".", ")" ], "ids": [ 109291, 14987, 119, 26865, 16955, 113, 158, 119, 156, 119, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Javier", "Fran", "##a", "(", "Argentina", ")", "vs", ".", "3", "-", "Thomas", "Must", "##er", "(", "Austria", ")" ], "ids": [ 22856, 89447, 10113, 113, 12853, 114, 14987, 119, 124, 118, 11096, 54690, 10165, 113, 14479, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", "-", "Jim", "Cour", "##ier", "(", "U", ".", "S", ".", ")", "vs", ".", "Javier", "Sanchez", "(", "Spain", ")" ], "ids": [ 129, 118, 14178, 44347, 11709, 113, 158, 119, 156, 119, 114, 14987, 119, 22856, 66007, 113, 16149, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "Jim", "Grab", "##b", "(", "U", ".", "S", ".", ")", "vs", ".", "Sand", "##on", "St", "##olle", "(", "Australia", ")" ], "ids": [ 14178, 61020, 10457, 113, 158, 119, 156, 119, 114, 14987, 119, 35071, 10263, 10838, 47951, 113, 11729, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Patrick", "Ra", "##fter", "(", "Australia", ")", "vs", ".", "Kenneth", "Carl", "##sen", "(", "Denmark", ")" ], "ids": [ 13867, 38571, 33163, 113, 11729, 114, 14987, 119, 22369, 12225, 10917, 113, 25854, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Jason", "St", "##olt", "##enberg", "(", "Australia", ")", "vs", ".", "Stefano", "Pe", "##sco", "##sol", "##ido", "(", "Italy", ")" ], "ids": [ 16796, 10838, 27667, 24304, 113, 11729, 114, 14987, 119, 26381, 29005, 22402, 43115, 12306, 113, 11619, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Arnaud", "Bo", "##ets", "##ch", "(", "France", ")", "vs", ".", "Nicolas", "Pereira", "(", "Venezuela", ")" ], "ids": [ 56856, 27622, 17137, 10269, 113, 10688, 114, 14987, 119, 16443, 32610, 113, 15693, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "Carlos", "Costa", "(", "Spain", ")", "vs", ".", "Magnus", "Gustaf", "##sson", "(", "Sweden", ")" ], "ids": [ 12050, 13902, 113, 16149, 114, 14987, 119, 22940, 36183, 14650, 113, 20937, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Jeff", "Tara", "##ngo", "(", "U", ".", "S", ".", ")", "vs", ".", "Alex", "Radu", "##les", "##cu", "(", "Germany", ")" ], "ids": [ 17218, 51806, 32448, 113, 158, 119, 156, 119, 114, 14987, 119, 14728, 75583, 11268, 12352, 113, 12775, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "10", "-", "Marcelo", "Rio", "##s", "(", "Chile", ")" ], "ids": [ 109291, 14987, 119, 10150, 118, 38165, 12109, 10107, 113, 13218, 114 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "Marc", "Ross", "##et", "(", "Switzerland", "vs", ".", "Jared", "Palmer", "(", "U", ".", "S", ".", ")" ], "ids": [ 10208, 118, 15254, 16690, 10308, 113, 26002, 14987, 119, 77741, 26161, 113, 158, 119, 156, 119, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Martin", "Damm", "(", "Czech", "Republic", ")", "vs", ".", "Her", "##nan", "G", "##um", "##y", "(", "Argentina", ")" ], "ids": [ 11235, 104698, 113, 22148, 13681, 114, 14987, 119, 13229, 13470, 144, 10465, 10157, 113, 12853, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Nick", "##las", "Ku", "##lti", "(", "Sweden", ")", "vs", ".", "Jakob", "H", "##lase", "##k", "(", "Switzerland", ")" ], "ids": [ 16126, 13983, 49869, 45505, 113, 20937, 114, 14987, 119, 22110, 145, 77031, 10174, 113, 26002, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Cecil", "Ma", "##mii", "##t", "(", "U", ".", "S", ".", ")", "vs", ".", "Alberto", "Be", "##ras", "##ate", "##gui", "(", "Spain", ")" ], "ids": [ 37440, 13744, 52025, 10123, 113, 158, 119, 156, 119, 114, 14987, 119, 15796, 14321, 12783, 12436, 55818, 113, 16149, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Vince", "Spa", "##dea", "(", "U", ".", "S", ".", ")", "vs", ".", "Daniel", "Va", "##cek", "(", "Czech", "Republic", ")" ], "ids": [ 42807, 64766, 20042, 113, 158, 119, 156, 119, 114, 14987, 119, 11792, 14723, 37239, 113, 22148, 13681, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 9, 1, 5, 9 ] }, { "tokens": [ "David", "Prin", "##osi", "##l", "(", "Germany", ")", "vs", ".", "qualifier" ], "ids": [ 10804, 86525, 20316, 10161, 113, 12775, 114, 14987, 119, 96076 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "Tomas", "Carbon", "##ell", "(", "Spain", ")" ], "ids": [ 109291, 14987, 119, 41889, 77315, 13503, 113, 16149, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Qualifier", "vs", ".", "2", "-", "Michael", "Chang", "(", "U", ".", "S", ".", ")" ], "ids": [ 109291, 14987, 119, 123, 118, 10631, 28545, 113, 158, 119, 156, 119, 114 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "OR", "##IO", "##LE", "##S", "'", "MAN", "##AG", "##ER", "DA", "##VE", "##Y", "J", "##OH", "##NS", "##ON", "H", "##OS", "##P", "##IT", "##AL", "##I", "##Z", "##ED", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 69308, 37174, 51036, 10731, 112, 73020, 109865, 24093, 47855, 68560, 14703, 147, 55859, 69196, 30118, 145, 21793, 11127, 37611, 32002, 11281, 13966, 33809, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "1996", "-", "08", "-", "22" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Baltimore", "Or", "##iol", "##es", "manager", "Dave", "##y", "Johnson", "will", "miss", "Thursday", "night", "'", "s", "game", "against", "the", "Seattle", "Marine", "##rs", "after", "being", "admitted", "to", "a", "hospital", "with", "an", "irregular", "heart", "##beat", "." ], "ids": [ 21413, 19372, 35493, 10171, 16935, 16073, 10157, 13241, 11337, 88237, 67067, 16903, 112, 187, 11661, 11327, 10105, 20902, 12425, 10943, 10662, 11223, 40345, 10114, 169, 18141, 10169, 10151, 55143, 21736, 68939, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "53", "-", "year", "-", "old", "Johnson", "was", "hospital", "##ized", "after", "ex", "##peri", "##en", "##cing", "diz", "##zine", "##ss", "." ], "ids": [ 10117, 11756, 118, 10924, 118, 12898, 13241, 10134, 18141, 16589, 10662, 11419, 69692, 10136, 19113, 36897, 51703, 13420, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "is", "in", "no", "danger", "and", "will", "be", "treated", "and", "observed", "this", "evening", ",", "\"", "said", "Or", "##iol", "##es", "team", "physician", "Dr", ".", "William", "Gold", "##iner", ",", "adding", "that", "Johnson", "is", "expected", "to", "be", "released", "on", "Friday", "." ], "ids": [ 107, 10357, 10124, 10106, 10192, 45882, 10111, 11337, 10347, 45369, 10111, 34148, 10531, 42135, 117, 107, 12415, 19372, 35493, 10171, 11121, 60930, 11612, 119, 10694, 14363, 33488, 117, 44841, 10189, 13241, 10124, 25973, 10114, 10347, 11539, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Or", "##iol", "##es", "'", "bench", "coach", "Andy", "Et", "##che", "##bar", "##ren", "will", "manage", "the", "club", "in", "Johnson", "'", "s", "absence", "." ], "ids": [ 19372, 35493, 10171, 112, 86696, 15701, 16802, 16232, 11119, 12867, 10969, 11337, 59251, 10105, 11111, 10106, 13241, 112, 187, 28589, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "Johnson", "is", "the", "second", "manager", "to", "be", "hospital", "##ized", "this", "week", "after", "California", "Angels", "skip", "##per", "John", "M", "##c", "##N", "##amar", "##a", "was", "admitted", "to", "New", "York", "'", "s", "Columbia", "Presbyterian", "Hospital", "on", "Wednesday", "with", "a", "blood", "c", "##lot", "in", "his", "left", "cal", "##f", "." ], "ids": [ 13241, 10124, 10105, 11132, 16935, 10114, 10347, 18141, 16589, 10531, 16118, 10662, 11621, 28132, 52124, 12713, 10421, 150, 10350, 11537, 93196, 10113, 10134, 40345, 10114, 10287, 10482, 112, 187, 13469, 72661, 16025, 10135, 57611, 10169, 169, 24911, 171, 20288, 10106, 10226, 12153, 25923, 10575, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 1, 5, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Johnson", ",", "who", "played", "eight", "seasons", "in", "Baltimore", ",", "was", "named", "Or", "##iol", "##es", "manager", "in", "the", "off", "-", "season", "replacing", "Phil", "Regan", "." ], "ids": [ 13241, 117, 10479, 11553, 16222, 21396, 10106, 21413, 117, 10134, 12038, 19372, 35493, 10171, 16935, 10106, 10105, 11898, 118, 11226, 45857, 18144, 83392, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "He", "led", "the", "Cincinnati", "Reds", "to", "the", "National", "League", "Championship", "Series", "last", "year", "and", "guided", "the", "New", "York", "Mets", "to", "a", "World", "Series", "championship", "in", "1986", "." ], "ids": [ 10357, 12857, 10105, 31257, 74652, 10114, 10105, 10655, 11074, 12341, 13239, 12469, 10924, 10111, 92486, 10105, 10287, 10482, 90707, 10114, 169, 10315, 13239, 20755, 10106, 10578, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Baltimore", "has", "won", "16", "of", "its", "last", "22", "games", "to", "pull", "within", "five", "games", "of", "the", "sl", "##ump", "##ing", "New", "York", "Yankees", "in", "the", "American", "League", "East", "Division", "." ], "ids": [ 21413, 10393, 11367, 10250, 10108, 10474, 12469, 10306, 13332, 10114, 80870, 12381, 12403, 13332, 10108, 10105, 38523, 67299, 10230, 10287, 10482, 60799, 10106, 10105, 10536, 11074, 11830, 11987, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "AF", "##TER", "W", "##ED", "##NE", "##SD", "##A", "##Y", "'", "S", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 55640, 99552, 160, 33809, 93280, 83452, 10738, 14703, 112, 156, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "22" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "League", "Baseball" ], "ids": [ 14988, 11074, 27084 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "standing", "##s", "after", "games", "played", "on", "Wednesday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 32173, 10107, 10662, 13332, 11553, 10135, 57611, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "winning", "percentage", "and", "games", "behind", ")", ":" ], "ids": [ 14172, 117, 16542, 46971, 10111, 13332, 17155, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ER", "##IC", "##AN", "LE", "##AG", "##UE" ], "ids": [ 24339, 24093, 30889, 41275, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "72", "53", ".", "576", "-" ], "ids": [ 86607, 13034, 162, 42622, 11733, 12120, 11756, 119, 44332, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "67", "58", ".", "536", "5" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 12316, 11824, 119, 45913, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "63", "64", ".", "496", "10" ], "ids": [ 139, 21793, 60493, 11537, 12256, 11295, 119, 42498, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "58", "69", ".", "457", "15" ], "ids": [ 58573, 35066, 77261, 11403, 11824, 12573, 119, 42950, 10208 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "44", "82", ".", "349", "28", "1", "/", "2" ], "ids": [ 25067, 11090, 35066, 37611, 11126, 12180, 119, 37633, 10348, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "76", "51", ".", "598", "-" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 12428, 11524, 119, 59066, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "69", "59", ".", "539", "7", "1", "/", "2" ], "ids": [ 39774, 30889, 109865, 11403, 12573, 11867, 119, 52194, 128, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "63", "63", ".", "500", "12", "1", "/", "2" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 12256, 12256, 119, 10757, 10186, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "60", "68", ".", "469", "16", "1", "/", "2" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 10709, 12370, 119, 39731, 10250, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "58", "70", ".", "453", "18", "1", "/", "2" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 11824, 10923, 119, 38213, 10218, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "73", "54", ".", "575", "-" ], "ids": [ 157, 11259, 12674, 38025, 12545, 11653, 119, 42813, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "64", "61", ".", "512", "8" ], "ids": [ 23056, 32071, 11090, 51036, 11295, 12314, 119, 29957, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "62", "67", ".", "481", "12" ], "ids": [ 152, 10738, 11733, 44376, 58521, 12066, 12316, 119, 47657, 10186 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "58", "68", ".", "460", "14", "1", "/", "2" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 11824, 12370, 119, 27296, 10247, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##H", "##UR", "##SD", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "22", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 157, 12396, 98348, 83452, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10306, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "AT", "B", "##OS", "##TO", "##N" ], "ids": [ 152, 10738, 11733, 44376, 58521, 30554, 139, 21793, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "AT", "BA", "##L", "##TI", "##M", "##OR", "##E" ], "ids": [ 23056, 32071, 11090, 51036, 30554, 39999, 11369, 72286, 11517, 42622, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "AT", "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 30554, 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "AT", "CH", "##IC", "##AG", "##O" ], "ids": [ 58573, 35066, 77261, 11403, 30554, 39774, 30889, 109865, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "AT", "KA", "##NS", "##AS", "C", "##IT", "##Y" ], "ids": [ 25067, 11090, 35066, 37611, 30554, 85314, 69196, 38025, 140, 37611, 14703 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "AT", "MI", "##N", "##NE", "##S", "##OT", "##A" ], "ids": [ 157, 11259, 12674, 38025, 30554, 75416, 11537, 93280, 10731, 62146, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "NA", "##TION", "##AL", "LE", "##AG", "##UE" ], "ids": [ 56586, 98207, 32002, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "79", "46", ".", "632", "-" ], "ids": [ 30554, 44376, 77261, 10738, 12791, 11528, 119, 47946, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "67", "58", ".", "536", "12" ], "ids": [ 102059, 77261, 66014, 32002, 12316, 11824, 119, 45913, 10186 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "59", "69", ".", "461", "21", "1", "/", "2" ], "ids": [ 86607, 13034, 162, 42622, 11733, 11867, 12573, 119, 45705, 10296, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "58", "69", ".", "457", "22" ], "ids": [ 83243, 42622, 28895, 10738, 11824, 12573, 119, 42950, 10306 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "52", "75", ".", "409", "28" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 11525, 11417, 119, 37659, 10348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "68", "59", ".", "535", "-" ], "ids": [ 145, 11403, 32612, 60493, 11537, 12370, 11867, 119, 45269, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "67", "59", ".", "532", "1", "/", "2" ], "ids": [ 53317, 149, 11403, 83259, 10731, 12316, 11867, 119, 50446, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "63", "62", ".", "504", "4" ], "ids": [ 39774, 30889, 109865, 11403, 12256, 12066, 119, 43098, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "62", "62", ".", "500", "4", "1", "/", "2" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 12066, 12066, 119, 10757, 125, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "53", "73", ".", "421", "14", "1", "/", "2" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 11756, 12545, 119, 38648, 10247, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "70", "59", ".", "543", "-" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 10923, 11867, 119, 50268, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "66", "60", ".", "524", "2", "1", "/", "2" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 12215, 10709, 119, 47189, 123, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "65", "62", ".", "512", "4" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 10843, 12066, 119, 29957, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "54", "70", ".", "435", "13", "1", "/", "2" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 11653, 10923, 119, 36898, 10249, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##H", "##UR", "##SD", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "22", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 157, 12396, 98348, 83452, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10306, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "AT", "CO", "##L", "##OR", "##AD", "##O" ], "ids": [ 53317, 149, 11403, 83259, 10731, 30554, 32992, 11369, 42622, 55538, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "AT", "AT", "##LA", "##NT", "##A" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 30554, 30554, 44376, 77261, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "AT", "H", "##O", "##US", "##TO", "##N" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 30554, 145, 11403, 32612, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "AT", "L", "##OS", "AN", "##GE", "##LE", "##S" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 30554, 149, 21793, 50972, 58719, 51036, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "AT", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O" ], "ids": [ 102059, 77261, 66014, 32002, 30554, 21318, 11537, 64655, 41275, 89955, 36175, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "W", "##ED", "##NE", "##SD", "##A", "##Y", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 160, 33809, 93280, 83452, 10738, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "22" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Major", "League" ], "ids": [ 33036, 10108, 14988, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "Baseball", "games", "played", "on", "Wednesday", "(", "home", "team", "in", "CA", "##PS", ")", ":" ], "ids": [ 27084, 13332, 11553, 10135, 57611, 113, 11816, 11121, 10106, 24707, 46983, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "League" ], "ids": [ 10536, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "California", "7", "NE", "##W", "Y", "##OR", "##K", "1" ], "ids": [ 11621, 128, 86607, 13034, 162, 42622, 11733, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "7", "Chicago", "4" ], "ids": [ 25067, 11090, 35066, 37611, 128, 12317, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Milwaukee", "10", "MI", "##N", "##NE", "##S", "##OT", "##A", "7" ], "ids": [ 36413, 10150, 75416, 11537, 93280, 10731, 62146, 10738, 128 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "6", "Oakland", "4" ], "ids": [ 139, 21793, 60493, 11537, 127, 38340, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "10", "Seattle", "5" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 10150, 20902, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Texas", "10", "CL", "##E", "##VE", "##LA", "##ND", "8", "(", "in", "10", ")" ], "ids": [ 12466, 10150, 75151, 11259, 68560, 44376, 58521, 129, 113, 10106, 10150, 114 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Toronto", "6", "KA", "##NS", "##AS", "C", "##IT", "##Y", "2" ], "ids": [ 15256, 127, 85314, 69196, 38025, 140, 37611, 14703, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "National", "League" ], "ids": [ 10655, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "8", "Florida", "3" ], "ids": [ 39774, 30889, 109865, 11403, 129, 13668, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "12", "New", "York", "11" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 10186, 10287, 10482, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "4", "Cincinnati", "3" ], "ids": [ 30554, 44376, 77261, 10738, 125, 31257, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Pittsburgh", "5", "H", "##O", "##US", "##TO", "##N", "2" ], "ids": [ 23812, 126, 145, 11403, 32612, 60493, 11537, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "10", "St", "Louis", "2" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 10150, 10838, 11334, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Philadelphia", "6", "L", "##OS", "AN", "##GE", "##LE", "##S", "0" ], "ids": [ 15979, 127, 149, 21793, 50972, 58719, 51036, 10731, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "7", "Montreal", "2" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 128, 20990, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "GR", "##EE", "##R", "H", "##OM", "##ER", "IN", "10", "##TH", "L", "##IF", "##TS", "T", "##E", "##X", "##AS", "PA", "##ST", "IN", "##DI", "##AN", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 58787, 95825, 11273, 145, 37079, 24093, 36351, 10150, 109166, 149, 53668, 36545, 157, 11259, 12674, 38025, 32349, 32995, 36351, 58730, 41275, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "1996", "-", "08", "-", "22" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rus", "##ty", "G", "##reer", "'", "s", "two", "-", "run", "home", "##r", "in", "the", "top", "of", "the", "10th", "inning", "ra", "##lli", "##ed", "the", "Texas", "Rangers", "to", "a", "10", "-", "8", "victory", "over", "the", "Cleveland", "Indians", "Wednesday", "in", "the", "rubber", "game", "of", "a", "three", "-", "game", "series", "between", "division", "leaders", "." ], "ids": [ 30796, 11195, 144, 92637, 112, 187, 10551, 118, 14095, 11816, 10129, 10106, 10105, 12364, 10108, 10105, 31004, 110505, 11859, 14088, 10336, 10105, 12466, 23042, 10114, 169, 10150, 118, 129, 19735, 10491, 10105, 21342, 33032, 57611, 10106, 10105, 92724, 11661, 10108, 169, 11003, 118, 11661, 11366, 10948, 13751, 24155, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "one", "out", ",", "G", "##reer", "hit", "a", "1", "-", "1", "pitch", "from", "Julian", "Ta", "##vare", "##z", "(", "4", "-", "7", ")", "over", "the", "right", "-", "field", "fe", "##nce", "for", "his", "15th", "home", "run", "." ], "ids": [ 12613, 10464, 10950, 117, 144, 92637, 14946, 169, 122, 118, 122, 50892, 10188, 23154, 14248, 38971, 10305, 113, 125, 118, 128, 114, 10491, 10105, 13448, 118, 13939, 34778, 12150, 10142, 10226, 36293, 11816, 14095, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "was", "an", "off", "-", "speed", "pitch", "and", "I", "just", "tried", "to", "get", "a", "good", "swing", "on", "it", "and", "put", "it", "in", "play", ",", "\"", "G", "##reer", "said", ".", "\"" ], "ids": [ 107, 10377, 10134, 10151, 11898, 118, 19085, 50892, 10111, 146, 12820, 27156, 10114, 15329, 169, 15198, 74772, 10135, 10271, 10111, 14499, 10271, 10106, 12253, 117, 107, 144, 92637, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "This", "was", "a", "big", "game", "." ], "ids": [ 10747, 10134, 169, 22185, 11661, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "crowd", "was", "behind", "him", "and", "it", "was", "intense", ".", "\"" ], "ids": [ 10117, 50059, 10134, 17155, 10957, 10111, 10271, 10134, 48195, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "shot", "brought", "home", "Ivan", "Rodriguez", ",", "who", "had", "his", "second", "double", "of", "the", "game", ",", "giving", "him", "42", "this", "season", ",", "41", "as", "a", "catch", "##er", "." ], "ids": [ 10117, 19508, 17327, 11816, 15631, 41778, 117, 10479, 10374, 10226, 11132, 15790, 10108, 10105, 11661, 117, 24426, 10957, 11276, 10531, 11226, 117, 11349, 10146, 169, 61093, 10165, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "joined", "Mickey", "Cochrane", ",", "Johnny", "Ben", "##ch", "and", "Terry", "Kennedy", "as", "the", "only", "catch", "##ers", "with", "40", "doubles", "in", "a", "season", "." ], "ids": [ 10357, 13914, 33344, 72744, 117, 15551, 13304, 10269, 10111, 19902, 17817, 10146, 10105, 10893, 61093, 10901, 10169, 10533, 46255, 10106, 169, 11226, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Rangers", "have", "won", "10", "of", "their", "last", "12", "games", "and", "six", "of", "nine", "meetings", "against", "the", "Indians", "this", "season", "." ], "ids": [ 10117, 23042, 10529, 11367, 10150, 10108, 10455, 12469, 10186, 13332, 10111, 12449, 10108, 19964, 47307, 11327, 10105, 33032, 10531, 11226, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "The", "American", "League", "Western", "leaders", "have", "won", "eight", "of", "15", "games", "at", "Jacobs", "Field", ",", "joining", "the", "Yankees", "as", "the", "only", "teams", "with", "a", "winning", "record", "at", "the", "A", ".", "L", ".", "Central", "leaders", "'", "home", "." ], "ids": [ 10117, 10536, 11074, 13163, 24155, 10529, 11367, 16222, 10108, 10208, 13332, 10160, 41981, 16003, 117, 36135, 10105, 60799, 10146, 10105, 10893, 14404, 10169, 169, 16542, 12410, 10160, 10105, 138, 119, 149, 119, 11885, 24155, 112, 11816, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Cleveland", "lost", "for", "just", "the", "second", "time", "in", "six", "games", "." ], "ids": [ 21342, 14172, 10142, 12820, 10105, 11132, 10635, 10106, 12449, 13332, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Indians", "sent", "the", "game", "into", "extra", "innings", "in", "the", "ninth", "on", "Kenny", "Lo", "##ft", "##on", "'", "s", "two", "-", "run", "single", "." ], "ids": [ 10117, 33032, 14541, 10105, 11661, 10708, 19868, 48974, 10106, 10105, 54905, 10135, 30002, 13069, 12961, 10263, 112, 187, 10551, 118, 14095, 11376, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ed", "Vos", "##berg", "(", "1", "-", "0", ")", "ble", "##w", "his", "first", "save", "opportunity", "but", "got", "the", "win", ",", "allowing", "three", "hits", "with", "two", "walks", "and", "three", "strike", "##outs", "in", "1", "2", "/", "3", "score", "##less", "innings", "." ], "ids": [ 13114, 96769, 11348, 113, 122, 118, 121, 114, 10718, 10874, 10226, 10422, 32635, 34468, 10473, 19556, 10105, 14125, 117, 28357, 11003, 27922, 10169, 10551, 106216, 10111, 11003, 37456, 72199, 10106, 122, 123, 120, 124, 17704, 14985, 48974, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dean", "Palmer", "hit", "his", "30th", "home", "##r", "for", "the", "Rangers", "." ], "ids": [ 18657, 26161, 14946, 10226, 95539, 11816, 10129, 10142, 10105, 23042, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "In", "Baltimore", ",", "Cal", "R", "##ip", "##ken", "had", "four", "hits", "and", "sna", "##pped", "a", "fifth", "-", "inning", "tie", "with", "a", "solo", "home", "##r", "and", "Bobby", "Bon", "##illa", "added", "a", "three", "-", "run", "shot", "in", "the", "seventh", "to", "power", "the", "sur", "##ging", "Or", "##iol", "##es", "to", "a", "10", "-", "5", "victory", "over", "the", "Seattle", "Marine", "##rs", "." ], "ids": [ 10167, 21413, 117, 41280, 155, 17437, 11062, 10374, 11598, 27922, 10111, 62541, 44357, 169, 22237, 118, 110505, 27916, 10169, 169, 11395, 11816, 10129, 10111, 19371, 30120, 14250, 16288, 169, 11003, 118, 14095, 19508, 10106, 10105, 37192, 10114, 13183, 10105, 10326, 13808, 19372, 35493, 10171, 10114, 169, 10150, 118, 126, 19735, 10491, 10105, 20902, 12425, 10943, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "Marine", "##rs", "scored", "four", "runs", "in", "the", "top", "of", "the", "fifth", "to", "tie", "the", "game", "5", "-", "5", "but", "R", "##ip", "##ken", "led", "off", "the", "bottom", "of", "the", "inning", "with", "his", "21st", "home", "##r", "off", "starter", "Sterling", "Hitchcock", "(", "12", "-", "6", ")", "." ], "ids": [ 10117, 12425, 10943, 17233, 11598, 17913, 10106, 10105, 12364, 10108, 10105, 22237, 10114, 27916, 10105, 11661, 126, 118, 126, 10473, 155, 17437, 11062, 12857, 11898, 10105, 34787, 10108, 10105, 110505, 10169, 10226, 38408, 11816, 10129, 11898, 59099, 43914, 43427, 113, 10186, 118, 127, 114, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bon", "##illa", "'", "s", "bl", "##ast", "was", "the", "first", "time", "Randy", "Johnson", ",", "last", "season", "'", "s", "C", "##y", "Young", "winner", ",", "allowed", "a", "run", "in", "five", "relief", "appearances", "since", "coming", "off", "the", "disabled", "list", "on", "August", "6", "." ], "ids": [ 30120, 14250, 112, 187, 21484, 15171, 10134, 10105, 10422, 10635, 29769, 13241, 117, 12469, 11226, 112, 187, 140, 10157, 12478, 20826, 117, 18162, 169, 14095, 10106, 12403, 31276, 22905, 11764, 23959, 11898, 10105, 94447, 13416, 10135, 10735, 127, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bon", "##illa", "has", "21", "RB", "##I", "and", "15", "runs", "in", "his", "last", "20", "games", "." ], "ids": [ 30120, 14250, 10393, 10296, 71201, 11281, 10111, 10208, 17913, 10106, 10226, 12469, 10197, 13332, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Baltimore", "has", "won", "seven", "of", "nine", "and", "16", "of", "its", "last", "22", "and", "cut", "the", "Yankees", "'", "lead", "in", "the", "A", ".", "L", ".", "East", "to", "five", "games", "." ], "ids": [ 21413, 10393, 11367, 15767, 10108, 19964, 10111, 10250, 10108, 10474, 12469, 10306, 10111, 21610, 10105, 60799, 112, 14107, 10106, 10105, 138, 119, 149, 119, 11830, 10114, 12403, 13332, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Scott", "Eric", "##kson", "(", "8", "-", "10", ")", "labour", "##ed", "to", "his", "third", "straight", "win", "." ], "ids": [ 12812, 14057, 96688, 113, 129, 118, 10150, 114, 40763, 10336, 10114, 10226, 12628, 31214, 14125, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alex", "Rodriguez", "had", "two", "home", "##rs", "and", "four", "RB", "##I", "for", "the", "Marine", "##rs", ",", "who", "have", "dropped", "three", "in", "a", "row", "and", "11", "of", "15", "." ], "ids": [ 14728, 41778, 10374, 10551, 11816, 10943, 10111, 11598, 71201, 11281, 10142, 10105, 12425, 10943, 117, 10479, 10529, 30241, 11003, 10106, 169, 45006, 10111, 10193, 10108, 10208, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "became", "the", "fifth", "short", "##stop", "in", "major", "-", "league", "history", "to", "hit", "30", "home", "##rs", "in", "a", "season", "and", "the", "first", "since", "R", "##ip", "##ken", "hit", "34", "in", "1991", "." ], "ids": [ 10357, 11179, 10105, 22237, 13716, 78881, 10106, 11922, 118, 15616, 11486, 10114, 14946, 10244, 11816, 10943, 10106, 169, 11226, 10111, 10105, 10422, 11764, 155, 17437, 11062, 14946, 11069, 10106, 10442, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chris", "Ho", "##iles", "hit", "his", "22", "##nd", "home", "##r", "for", "Baltimore", "." ], "ids": [ 13151, 20220, 38278, 14946, 10226, 10306, 11534, 11816, 10129, 10142, 21413, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "In", "New", "York", ",", "Jason", "Dickson", "scattered", "10", "hits", "over", "6", "1", "/", "3", "innings", "in", "his", "major", "-", "league", "debut", "and", "Chili", "Davis", "belt", "##ed", "a", "home", "##r", "from", "each", "side", "of", "the", "plate", "as", "the", "California", "Angels", "defeated", "the", "Yankees", "7", "-", "1", "." ], "ids": [ 10167, 10287, 10482, 117, 16796, 91563, 95335, 10150, 27922, 10491, 127, 122, 120, 124, 48974, 10106, 10226, 11922, 118, 15616, 13424, 10111, 37931, 14281, 62705, 10336, 169, 11816, 10129, 10188, 11948, 12250, 10108, 10105, 35932, 10146, 10105, 11621, 28132, 18058, 10105, 60799, 128, 118, 122, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Dickson", "allowed", "a", "home", "##r", "to", "Derek", "Jet", "##er", "on", "his", "first", "major", "-", "league", "pitch", "but", "settled", "down", "." ], "ids": [ 91563, 18162, 169, 11816, 10129, 10114, 30815, 39933, 10165, 10135, 10226, 10422, 11922, 118, 15616, 50892, 10473, 29014, 12935, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "the", "27", "##th", "pitcher", "used", "by", "the", "Angels", "this", "season", ",", "ty", "##ing", "a", "major", "-", "league", "record", "." ], "ids": [ 10357, 10134, 10105, 10365, 11143, 64603, 11031, 10155, 10105, 28132, 10531, 11226, 117, 26864, 10230, 169, 11922, 118, 15616, 12410, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jimmy", "Key", "(", "9", "-", "10", ")", "took", "the", "loss", "as", "the", "Yankees", "lost", "their", "ninth", "in", "14", "games", "." ], "ids": [ 16226, 21663, 113, 130, 118, 10150, 114, 12149, 10105, 18576, 10146, 10105, 60799, 14172, 10455, 54905, 10106, 10247, 13332, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "strand", "##ed", "11", "base", "##run", "##ners", "." ], "ids": [ 11696, 65803, 10336, 10193, 11404, 35794, 34663, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "California", "played", "without", "interim", "manager", "John", "M", "##c", "##N", "##amar", "##a", ",", "who", "was", "admitted", "to", "a", "New", "York", "hospital", "with", "a", "blood", "c", "##lot", "in", "his", "right", "cal", "##f", "." ], "ids": [ 11621, 11553, 13663, 63313, 16935, 10421, 150, 10350, 11537, 93196, 10113, 117, 10479, 10134, 40345, 10114, 169, 10287, 10482, 18141, 10169, 169, 24911, 171, 20288, 10106, 10226, 13448, 25923, 10575, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Boston", ",", "Mike", "Stanley", "'", "s", "bases", "-", "loaded", "two", "-", "run", "single", "sna", "##pped", "an", "eighth", "-", "inning", "tie", "and", "gave", "the", "Red", "Sox", "their", "third", "straight", "win", ",", "6", "-", "4", "over", "the", "Oakland", "Athletics", "." ], "ids": [ 10167, 13683, 117, 13270, 15400, 112, 187, 23213, 118, 103927, 10551, 118, 14095, 11376, 62541, 44357, 10151, 46758, 118, 110505, 27916, 10111, 15362, 10105, 11641, 55687, 10455, 12628, 31214, 14125, 117, 127, 118, 125, 10491, 10105, 38340, 46800, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Stanley", "owns", "a", ".", "367", "career", "batting", "average", "with", "the", "bases", "loaded", "(", "33", "-", "for", "-", "90", ")", "." ], "ids": [ 15400, 76282, 169, 119, 33317, 13021, 86152, 13551, 10169, 10105, 23213, 103927, 113, 11000, 118, 10142, 118, 10919, 114, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Boston", "'", "s", "Mo", "Vaughn", "went", "3", "-", "for", "-", "3", "with", "a", "walk", ",", "sto", "##le", "home", "for", "one", "of", "his", "three", "runs", "scored", "and", "collected", "his", "116", "##th", "RB", "##I", "." ], "ids": [ 13683, 112, 187, 34987, 102117, 13446, 124, 118, 10142, 118, 124, 10169, 169, 33734, 117, 47264, 10284, 11816, 10142, 10464, 10108, 10226, 11003, 17913, 17233, 10111, 29611, 10226, 17095, 11143, 71201, 11281, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Scott", "Bros", "##ius", "home", "##red", "and", "drove", "in", "two", "runs", "for", "the", "Athletics", ",", "who", "have", "lost", "seven", "of", "their", "last", "nine", "games", "." ], "ids": [ 12812, 23844, 11827, 11816, 15711, 10111, 72256, 10106, 10551, 17913, 10142, 10105, 46800, 117, 10479, 10529, 14172, 15767, 10108, 10455, 12469, 19964, 13332, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Detroit", ",", "Brad", "Aus", "##mus", "'", "s", "three", "-", "run", "home", "##r", "cap", "##ped", "a", "four", "-", "run", "eighth", "and", "lift", "##ed", "the", "Tigers", "to", "a", "7", "-", "4", "victory", "over", "the", "re", "##eling", "Chicago", "White", "Sox", "." ], "ids": [ 10167, 19727, 117, 29382, 18290, 13527, 112, 187, 11003, 118, 14095, 11816, 10129, 13337, 16898, 169, 11598, 118, 14095, 46758, 10111, 63376, 10336, 10105, 38640, 10114, 169, 128, 118, 125, 19735, 10491, 10105, 11639, 55174, 12317, 12136, 55687, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "Tigers", "have", "won", "consecutive", "games", "after", "drop", "##ping", "eight", "in", "a", "row", ",", "but", "have", "won", "nine", "of", "their", "last", "12", "at", "home", "." ], "ids": [ 10117, 38640, 10529, 11367, 29864, 13332, 10662, 36365, 15398, 16222, 10106, 169, 45006, 117, 10473, 10529, 11367, 19964, 10108, 10455, 12469, 10186, 10160, 11816, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "White", "Sox", "have", "lost", "six", "of", "their", "last", "eight", "games", "." ], "ids": [ 10117, 12136, 55687, 10529, 14172, 12449, 10108, 10455, 12469, 16222, 13332, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Kansas", "City", ",", "Juan", "G", "##uz", "##man", "tos", "##sed", "a", "complete", "-", "game", "six", "-", "hit", "##ter", "to", "win", "for", "the", "first", "time", "in", "over", "a", "month", "and", "lower", "his", "league", "-", "best", "ERA", "as", "the", "Toronto", "Blue", "Jay", "##s", "won", "their", "fourth", "straight", ",", "6", "-", "2", "over", "the", "Royals", "." ], "ids": [ 10167, 16735, 10773, 117, 11686, 144, 20498, 10589, 84686, 16219, 169, 17876, 118, 11661, 12449, 118, 14946, 10877, 10114, 14125, 10142, 10105, 10422, 10635, 10106, 10491, 169, 14064, 10111, 18165, 10226, 15616, 118, 12504, 68881, 10146, 10105, 15256, 12972, 18559, 10107, 11367, 10455, 16918, 31214, 117, 127, 118, 123, 10491, 10105, 97906, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "G", "##uz", "##man", "(", "10", "-", "8", ")", "won", "for", "the", "first", "time", "since", "July", "16", ",", "a", "span", "of", "six", "starts", "." ], "ids": [ 144, 20498, 10589, 113, 10150, 118, 129, 114, 11367, 10142, 10105, 10422, 10635, 11764, 11112, 10250, 117, 169, 51551, 10108, 12449, 33039, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "allowed", "two", "runs", "-", "-", "one", "earned", "-", "-", "and", "lower", "##ed", "his", "ERA", "to", "2", ".", "99", "." ], "ids": [ 10357, 18162, 10551, 17913, 118, 118, 10464, 21293, 118, 118, 10111, 18165, 10336, 10226, 68881, 10114, 123, 119, 12187, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Minnesota", ",", "John", "Ja", "##ha", "'", "s", "three", "-", "run", "home", "##r", ",", "his", "26", "##th", ",", "cap", "##ped", "a", "five", "-", "run", "eighth", "inning", "that", "ra", "##lli", "##ed", "the", "Milwaukee", "Brewer", "##s", "to", "a", "10", "-", "7", "victory", "over", "the", "Twins", "." ], "ids": [ 11699, 16306, 117, 10421, 28248, 10921, 112, 187, 11003, 118, 14095, 11816, 10129, 117, 10226, 10314, 11143, 117, 13337, 16898, 169, 12403, 118, 14095, 46758, 110505, 10189, 11859, 14088, 10336, 10105, 36413, 109040, 10107, 10114, 169, 10150, 118, 128, 19735, 10491, 10105, 68084, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Ja", "##ha", "added", "an", "RB", "##I", "single", "in", "the", "ninth", "and", "had", "four", "RB", "##I", "." ], "ids": [ 28248, 10921, 16288, 10151, 71201, 11281, 11376, 10106, 10105, 54905, 10111, 10374, 11598, 71201, 11281, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Jose", "Valentin", "hit", "his", "21st", "home", "##r", "for", "Milwaukee", "." ], "ids": [ 23029, 44460, 14946, 10226, 38408, 11816, 10129, 10142, 36413, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "CO", "##C", "##U", "DO", "##UB", "##LE", "EA", "##RN", "##S", "PSV", "4", "-", "1", "W", "##IN", "." ], "ids": [ 71020, 65622, 24093, 118, 32992, 10858, 12022, 99843, 82439, 51036, 38478, 90412, 10731, 66922, 125, 118, 122, 160, 27128, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "22" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Philip", "Co", "##cu", "scored", "twice", "in", "the", "second", "half", "to", "sp", "##ur", "PSV", "Eindhoven", "to", "a", "4", "-", "1", "away", "win", "over", "NEC", "Nijmegen", "in", "the", "Dutch", "first", "division", "on", "Thursday", "." ], "ids": [ 13324, 13098, 12352, 17233, 26261, 10106, 10105, 11132, 13877, 10114, 32650, 10546, 66922, 55552, 10114, 169, 125, 118, 122, 14942, 14125, 10491, 97104, 81444, 10106, 10105, 17693, 10422, 13751, 10135, 67067, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "scored", "from", "close", "range", "in", "the", "54", "##th", "minute", "and", "from", "a", "bi", "##cycle", "kick", "13", "minutes", "later", "." ], "ids": [ 10357, 17233, 10188, 16065, 15601, 10106, 10105, 11653, 11143, 21760, 10111, 10188, 169, 11342, 49274, 55321, 10249, 15304, 10873, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arthur", "Nu", "##man", "and", "Luc", "Nil", "##is", ",", "Dutch", "top", "scorer", "last", "season", ",", "were", "PSV", "'", "s", "other", "marks", "##men", "." ], "ids": [ 13134, 28336, 10589, 10111, 26589, 66163, 10291, 117, 17693, 12364, 99782, 12469, 11226, 117, 10309, 66922, 112, 187, 10684, 55112, 11418, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 2, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ajax", "Amsterdam", "opened", "their", "title", "defence", "with", "a", "1", "-", "0", "win", "over", "NA", "##C", "Breda", "on", "Wednesday", "." ], "ids": [ 37057, 14017, 14377, 10455, 12887, 47245, 10169, 169, 122, 118, 121, 14125, 10491, 56586, 10858, 57883, 10135, 57611, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "22" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "Thursday", "'", "s", "only" ], "ids": [ 42027, 10108, 67067, 112, 187, 10893 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "first", "division", "match", ":" ], "ids": [ 17693, 10422, 13751, 12356, 131 ], "entity": [ "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9 ] }, { "tokens": [ "NEC", "Nijmegen", "1", "(", "Van", "E", "##yk", "##eren", "15th", ")", "PSV", "Eindhoven", "4", "(", "Nu", "##man", "11th", "," ], "ids": [ 97104, 81444, 122, 113, 11474, 142, 20935, 13653, 36293, 114, 66922, 55552, 125, 113, 28336, 10589, 34062, 117 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nil", "##is", "42", "##nd", ",", "Co", "##cu", "54", "##th", ",", "67", "##th", ")", "." ], "ids": [ 66163, 10291, 11276, 11534, 117, 13098, 12352, 11653, 11143, 117, 12316, 11143, 114, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "1", "-", "2", "." ], "ids": [ 33100, 18086, 122, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "8", ",", "000" ], "ids": [ 46080, 129, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##T", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "22" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "Dutch", "first" ], "ids": [ 32070, 16203, 10108, 169, 17693, 10422 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "match", "on", "Thursday", ":" ], "ids": [ 13751, 12356, 10135, 67067, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NEC", "Nijmegen", "1", "PSV", "Eindhoven", "4" ], "ids": [ 97104, 81444, 122, 66922, 55552, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SH", "##AR", "##PS", "##H", "##O", "##OT", "##ER", "K", "##N", "##UP", "BA", "##C", "##K", "IN", "SW", "##IS", "##S", "S", "##Q", "##U", "##AD", "." ], "ids": [ 71020, 65622, 24093, 118, 38702, 52188, 46983, 12396, 11403, 62146, 24093, 148, 11537, 57487, 39999, 10858, 11733, 36351, 92438, 19088, 10731, 156, 19282, 12022, 55538, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GE", "##NE", "##VA", "1996", "-", "08", "-", "22" ], "ids": [ 62997, 93280, 47172, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Galatasaray", "striker", "Adrian", "K", "##nu", "##p", ",", "scorer", "of", "26", "goals", "in", "45", "international", "##s", ",", "has", "been", "recalled", "by", "Switzerland", "for", "the", "World", "Cup", "qualifier", "against", "Azerbaijan", "in", "Baku", "on", "August", "31", "." ], "ids": [ 51958, 103325, 23928, 148, 11147, 10410, 117, 99782, 10108, 10314, 18173, 10106, 10827, 12533, 10107, 117, 10393, 10590, 68117, 10155, 26002, 10142, 10105, 10315, 11544, 96076, 11327, 28810, 10106, 44005, 10135, 10735, 10413, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 1, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##nu", "##p", "was", "over", "##lo", "##oked", "by", "Artur", "Jorge", "for", "the", "European", "championship", "finals", "earlier", "this", "year", "." ], "ids": [ 148, 11147, 10410, 10134, 10491, 10715, 76792, 10155, 41469, 16172, 10142, 10105, 11914, 20755, 21758, 18905, 10531, 10924, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "new", "coach", "Rolf", "Fr", "##inger", "is", "clearly", "a", "K", "##nu", "##p", "fan", "and", "included", "him", "in", "his", "19", "-", "man", "squad", "on", "Thursday", "." ], "ids": [ 16976, 10751, 15701, 31371, 33884, 18287, 10124, 52340, 169, 148, 11147, 10410, 10862, 10111, 12742, 10957, 10106, 10226, 10270, 118, 10817, 30580, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Switzerland", "failed", "to", "progress", "beyond", "the", "opening", "group", "phase", "in", "Euro", "96", "." ], "ids": [ 26002, 20775, 10114, 40316, 28569, 10105, 17975, 11795, 20394, 10106, 17526, 12308, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Squad", ":" ], "ids": [ 53150, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Goal", "##keeper", "##s", "-", "Marco", "Pas", "##colo", "(", "Cagliari", ")", ",", "Pascal", "Zu", "##ber", "##bue", "##hler", "(", "Grass", "##hop", "##pers", ")", "." ], "ids": [ 72620, 98767, 10107, 118, 14160, 17779, 28266, 113, 58782, 114, 117, 26543, 16229, 12212, 97438, 68972, 113, 68236, 57654, 24193, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Def", "##ender", "##s", "-", "Stephan", "##e", "Hen", "##cho", "##z", "(", "Hamburg", ")", ",", "Marc", "Hot", "##tige", "##r", "(", "Everton", ")", ",", "Y", "##van", "Quentin", "(", "Sion", ")", ",", "Ramon", "Vega", "(", "Cagliari", ")", "Raphael", "Wi", "##cky", "(", "Sion", ")", "." ], "ids": [ 77955, 27323, 10107, 118, 31556, 10112, 86362, 16575, 10305, 113, 15021, 114, 117, 15254, 14091, 32380, 10129, 113, 57936, 114, 117, 162, 12955, 38409, 113, 82683, 114, 117, 33894, 26810, 113, 58782, 114, 58514, 52742, 30742, 113, 82683, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 9, 3, 9, 4, 8, 8, 9, 3, 9, 9 ] }, { "tokens": [ "Mid", "##field", "##ers", "-", "Alexandre", "Com", "##iset", "##ti", "(", "Grass", "##hop", "##pers", ")", ",", "Antonio", "Es", "##posito", "(", "Grass", "##hop", "##pers", ")", ",", "Se", "##bas", "##tien", "Four", "##nier", "(", "Stuttgart", ")", ",", "Christophe", "Oh", "##rel", "(", "Lausanne", ")", ",", "Patrick", "Sy", "##lvestre", "(", "Sion", ")", ",", "David", "Ses", "##a", "(", "Ser", "##vette", ")", ",", "Ci", "##ria", "##co", "Sforza", "(", "Inter", "Milan", ")", "Murat", "Ya", "##kin", "(", "Grass", "##hop", "##pers", ")", "." ], "ids": [ 42234, 13408, 10901, 118, 18009, 16680, 22098, 10325, 113, 68236, 57654, 24193, 114, 117, 11873, 10912, 70097, 113, 68236, 57654, 24193, 114, 117, 11045, 21322, 20322, 16773, 18521, 113, 16048, 114, 117, 31051, 22800, 19362, 113, 37570, 114, 117, 13867, 32879, 88643, 113, 82683, 114, 117, 10804, 23387, 10113, 113, 39759, 34553, 114, 117, 51457, 11021, 10812, 81305, 113, 24362, 15807, 114, 55008, 25148, 12130, 113, 68236, 57654, 24193, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 9, 4, 8, 8, 9, 3, 7, 7, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 7, 9, 9, 4, 8, 8, 8, 9, 3, 7, 9, 4, 8, 8, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Strike", "##rs", "-", "Ku", "##bila", "##y", "Turk", "##yi", "##lma", "##z", "(", "Grass", "##hop", "##pers", ")", ",", "Adrian", "K", "##nu", "##p", "(", "Galatasaray", ")", ",", "Christophe", "Bon", "##vin", "(", "Sion", ")", ",", "Stephan", "##e", "Cha", "##puis", "##at", "(", "Borussia", "Dortmund", ")", "." ], "ids": [ 47256, 10943, 118, 49869, 42595, 10157, 105347, 13641, 23303, 10305, 113, 68236, 57654, 24193, 114, 117, 23928, 148, 11147, 10410, 113, 51958, 114, 117, 31051, 30120, 15478, 113, 82683, 114, 117, 31556, 10112, 53453, 102202, 10526, 113, 48007, 33962, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "IT", "'", "S", "A", "RE", "##CO", "##RD", "-", "40", ",", "000", "BE", "##ER", "##S", "ON", "THE", "H", "##O", "##US", "##E", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 26956, 112, 156, 138, 71033, 82272, 84444, 118, 10533, 117, 10259, 46291, 24093, 10731, 49339, 17443, 145, 11403, 32612, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "22" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sp", "##ecta", "##tors", "at", "Friday", "'", "s", "Brussels", "grand", "prix", "meeting", "have", "an", "extra", "in", "##cent", "##ive", "to", "che", "##er", "on", "the", "athletes", "to", "world", "record", "performances", "-", "-", "a", "free", "glass", "of", "beer", "." ], "ids": [ 46361, 78125, 24324, 10160, 30767, 112, 187, 41239, 13023, 18236, 19822, 10529, 10151, 19868, 10106, 25907, 11942, 10114, 10262, 10165, 10135, 10105, 57700, 10114, 11356, 12410, 22744, 118, 118, 169, 13961, 32362, 10108, 73768, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Belgian", "br", "##ew", "##ery", "has", "offered", "to", "pay", "for", "a", "free", "round", "of", "drink", "##s", "for", "all", "of", "the", "40", ",", "000", "crowd", "if", "a", "world", "record", "goes", "at", "the", "meeting", ",", "organiser", "##s", "said", "on", "Thursday", "." ], "ids": [ 138, 36652, 33989, 26127, 23131, 10393, 20841, 10114, 16868, 10142, 169, 13961, 13569, 10108, 69423, 10107, 10142, 10435, 10108, 10105, 10533, 117, 10259, 50059, 12277, 169, 11356, 12410, 25441, 10160, 10105, 19822, 117, 93446, 10107, 12415, 10135, 67067, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "could", "be", "one", "of", "the", "most", "expensive", "rounds", "of", "drink", "##s", "ever", "." ], "ids": [ 10377, 12174, 10347, 10464, 10108, 10105, 10992, 58069, 44759, 10108, 69423, 10107, 17038, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "meeting", "is", "sold", "out", "already", "." ], "ids": [ 10117, 19822, 10124, 15337, 10950, 19034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "world", "records", "are", "in", "serious", "danger", "of", "being", "broken", "at", "the", "meeting", "-", "-", "the", "women", "'", "s", "1", ",", "000", "metres", "and", "the", "men", "'", "s", "3", ",", "000", "metres", "." ], "ids": [ 13214, 11356, 18791, 10301, 10106, 32342, 45882, 10108, 11223, 36197, 10160, 10105, 19822, 118, 118, 10105, 13190, 112, 187, 122, 117, 10259, 16393, 10111, 10105, 10588, 112, 187, 124, 117, 10259, 16393, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "GE", "##R", "##MA", "##N", "OP", "##EN", "F", "##IR", "##ST", "R", "##O", "##UN", "##D", "SC", "##OR", "##ES", "." ], "ids": [ 41525, 11369, 11565, 118, 62997, 11273, 30696, 11537, 55355, 50655, 143, 73522, 32995, 155, 11403, 69849, 11490, 18137, 42622, 25054, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##UT", "##T", "##GA", "##RT", ",", "Germany", "1996", "-", "08", "-", "22" ], "ids": [ 53317, 65729, 11090, 39061, 46935, 117, 12775, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "first", "round" ], "ids": [ 100085, 10422, 13569 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "scores", "in", "the", "German", "Open", "golf", "championship", "on", "Thursday", "(", "Britain" ], "ids": [ 49931, 10106, 10105, 12026, 11919, 32288, 20755, 10135, 67067, 113, 16032 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1 ] }, { "tokens": [ "unless", "stated", ")", ":" ], "ids": [ 60015, 17067, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "62", "Paul", "Broad", "##hurst" ], "ids": [ 12066, 10772, 86606, 68091 ], "entity": [ "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8 ] }, { "tokens": [ "63", "Raymond", "Russell" ], "ids": [ 12256, 17326, 13481 ], "entity": [ "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 4, 8 ] }, { "tokens": [ "64", "David", "J", ".", "Russell", ",", "Michael", "Campbell", "(", "New", "Zealand", ")", ",", "Ian" ], "ids": [ 11295, 10804, 147, 119, 13481, 117, 10631, 18172, 113, 10287, 14451, 114, 117, 16582 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 4, 8, 9, 1, 5, 9, 9, 4 ] }, { "tokens": [ "Woo", "##sna", "##m", ",", "Bernhard", "Lange", "##r", "(", "Germany", ")", ",", "Ron", "##an", "Ra", "##ffer", "##ty", ",", "Mats" ], "ids": [ 84270, 45981, 10147, 117, 24862, 32384, 10129, 113, 12775, 114, 117, 20368, 10206, 38571, 22888, 11195, 117, 86768 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 4 ] }, { "tokens": [ "Lan", "##ner", "(", "Sweden", ")", ",", "Wayne", "Riley", "(", "Australia", ")" ], "ids": [ 19670, 11129, 113, 20937, 114, 117, 18547, 35643, 113, 11729, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "65", "Ea", "##mon", "##n", "Dar", "##cy", "(", "Ireland", ")", ",", "Per", "Ny", "##man", "(", "Sweden", ")", ",", "Russell", "Clay", "##don", "," ], "ids": [ 10843, 47132, 16278, 10115, 35368, 11710, 113, 14637, 114, 117, 11982, 11459, 10589, 113, 20937, 114, 117, 13481, 36130, 15081, 117 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Mark", "R", "##oe", ",", "Re", "##tief", "Goose", "##n", "(", "South", "Africa", ")", ",", "Carl", "Sun", "##eson" ], "ids": [ 11997, 155, 20085, 117, 20304, 108386, 106354, 10115, 113, 11056, 12880, 114, 117, 12225, 13967, 81420 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8 ] }, { "tokens": [ "66", "Stephen", "Field", ",", "Paul", "Law", "##rie", ",", "Ian", "P", "##yman", ",", "Max", "Angle", "##rt" ], "ids": [ 12215, 13866, 16003, 117, 10772, 13216, 12904, 117, 16582, 153, 66654, 117, 12854, 61265, 10976 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Sweden", ")", ",", "Miles", "Tun", "##nic", "##liff", ",", "Christian", "Ce", "##va", "##er", "(", "France", ")", "," ], "ids": [ 113, 20937, 114, 117, 23603, 77056, 20149, 110320, 117, 11757, 13338, 10362, 10165, 113, 10688, 114, 117 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "Des", "Sm", "##yth", "(", "Ireland", ")", ",", "David", "Carter", ",", "Lee", "Westwood", ",", "Greg" ], "ids": [ 13810, 41922, 96362, 113, 14637, 114, 117, 10804, 18047, 117, 12006, 65507, 117, 22438 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 4, 8, 9, 4 ] }, { "tokens": [ "Cha", "##lmer", "##s", "(", "Australia", ")", ",", "Miguel", "Angel", "Martin", "(", "Spain", ")", "," ], "ids": [ 53453, 78075, 10107, 113, 11729, 114, 117, 13905, 17567, 11235, 113, 16149, 114, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "Thomas", "B", "##jorn", "(", "Denmark", ")", ",", "Fernando", "Roca", "(", "Spain", ")", ",", "Derrick" ], "ids": [ 11096, 139, 72603, 113, 25854, 114, 117, 14022, 58384, 113, 16149, 114, 117, 93527 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 4 ] }, { "tokens": [ "Cooper" ], "ids": [ 18889 ], "entity": [ "B-PER" ], "entity_ids": [ 4 ] }, { "tokens": [ "67", "Jeff", "Hawks", "##worth", ",", "Pa", "##dra", "##ig", "Harrington", "(", "Ireland", ")", ",", "Michael" ], "ids": [ 12316, 17218, 52327, 17929, 117, 26907, 14951, 11142, 93157, 113, 14637, 114, 117, 10631 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4 ] }, { "tokens": [ "Welch", ",", "Thomas", "Go", "##gel", "##e", "(", "Germany", ")", ",", "Paul", "M", "##c", "##G", "##in", "##ley", "(", "Ireland", ")", "," ], "ids": [ 75168, 117, 11096, 14439, 16039, 10112, 113, 12775, 114, 117, 10772, 150, 10350, 11447, 10245, 12105, 113, 14637, 114, 117 ], "entity": [ "B-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "Gary", "Or", "##r", ",", "Jose", "-", "Maria", "Can", "##izar", "##es", "(", "Spain", ")", ",", "Michael", "Jon", "##zon" ], "ids": [ 15516, 19372, 10129, 117, 23029, 118, 11066, 14820, 35752, 10171, 113, 16149, 114, 117, 10631, 17749, 22742 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Sweden", ")", ",", "Paul", "Ea", "##les", ",", "David", "Williams", ",", "Andrew", "Colt", "##art", "," ], "ids": [ 113, 20937, 114, 117, 10772, 47132, 11268, 117, 10804, 12494, 117, 13999, 69952, 15391, 117 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Jonathan", "Loma", "##s", ",", "Jose", "River", "##o", "(", "Spain", ")", ",", "Robert", "Karlsson" ], "ids": [ 16395, 26110, 10107, 117, 23029, 11575, 10133, 113, 16149, 114, 117, 10820, 85716 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8 ] }, { "tokens": [ "(", "Sweden", ")", ",", "Marcus", "Will", "##s", ",", "Pedro", "Linha", "##rt", "(", "Spain", ")", ",", "Jamie" ], "ids": [ 113, 20937, 114, 117, 15818, 15380, 10107, 117, 12849, 85861, 10976, 113, 16149, 114, 117, 27504 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 1, 9, 9, 4 ] }, { "tokens": [ "Sp", "##ence", ",", "Terry", "Price", "(", "Australia", ")", ",", "Juan", "Carlos", "Pine", "##ro", "(", "Spain", ")", "," ], "ids": [ 46361, 18492, 117, 19902, 23002, 113, 11729, 114, 117, 11686, 12050, 45427, 10567, 113, 16149, 114, 117 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 9, 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "Mark", "Mo", "##ulan", "##d" ], "ids": [ 11997, 34987, 43531, 10162 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "UEFA", "RE", "##WA", "##RD", "##S", "T", "##H", "##RE", "##E", "CO", "##UN", "##T", "##RI", "##ES", "FOR", "FA", "##IR", "PL", "##A", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 13528, 71033, 42196, 84444, 10731, 157, 12396, 66014, 11259, 32992, 69849, 11090, 46876, 25054, 109544, 20794, 73522, 71341, 10738, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GE", "##NE", "##VA", "1996", "-", "08", "-", "22" ], "ids": [ 62997, 93280, 47172, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Norway", ",", "England", "and", "Sweden", "were", "re", "##ward", "##ed", "for", "their", "fair", "play", "on", "Thursday", "with", "an", "additional", "place", "in", "the", "1997", "-", "98", "UEFA", "Cup", "competition", "." ], "ids": [ 22582, 117, 11701, 10111, 20937, 10309, 11639, 16988, 10336, 10142, 10455, 45122, 12253, 10135, 67067, 10169, 10151, 18568, 11192, 10106, 10105, 10391, 118, 12327, 13528, 11544, 16622, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Norway", "headed", "the", "UEFA", "Fair", "Play", "rankings", "for", "1995", "-", "96", "with", "8", ".", "62", "points", ",", "ahead", "of", "England", "with", "8", ".", "61", "and", "Sweden", "8", ".", "57", "." ], "ids": [ 22582, 33336, 10105, 13528, 25697, 17712, 97410, 10142, 10436, 118, 12308, 10169, 129, 119, 12066, 12789, 117, 35629, 10108, 11701, 10169, 129, 119, 12314, 10111, 20937, 129, 119, 11817, 119 ], "entity": [ "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rankings", "are", "based", "on", "a", "formula", "that", "takes", "into", "account", "many", "factors", "including", "red", "and", "yellow", "cards", ",", "and", "coaching", "and", "sp", "##ecta", "##tors", "'", "behaviour", "at", "matches", "played", "at", "an", "international", "level", "by", "clubs", "and", "national", "teams", "." ], "ids": [ 10117, 97410, 10301, 11610, 10135, 169, 29659, 10189, 19135, 10708, 23200, 11299, 31075, 11198, 10680, 10111, 29815, 40209, 117, 10111, 57714, 10111, 32650, 78125, 24324, 112, 68628, 10160, 18258, 11553, 10160, 10151, 12533, 13277, 10155, 16707, 10111, 11844, 14404, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Only", "the", "top", "three", "countries", "are", "allocated", "additional", "places", "." ], "ids": [ 18740, 10105, 12364, 11003, 15911, 10301, 99109, 18568, 19261, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "UEFA", "Fair", "Play", "rankings", "are", ":", "1", "." ], "ids": [ 10117, 13528, 25697, 17712, 97410, 10301, 131, 122, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Norway", "8", ".", "62", "points" ], "ids": [ 22582, 129, 119, 12066, 12789 ], "entity": [ "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "England", "8", ".", "61" ], "ids": [ 123, 119, 11701, 129, 119, 12314 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Sweden", "8", ".", "57" ], "ids": [ 124, 119, 20937, 129, 119, 11817 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Faro", "##e", "Islands", "8", ".", "56" ], "ids": [ 125, 119, 91182, 10112, 16872, 129, 119, 11628 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Wales", "8", ".", "54" ], "ids": [ 126, 119, 14137, 129, 119, 11653 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Estonia", "8", ".", "52" ], "ids": [ 127, 119, 31475, 129, 119, 11525 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Ireland", "8", ".", "45" ], "ids": [ 128, 119, 14637, 129, 119, 10827 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Belarus", "8", ".", "39" ], "ids": [ 129, 119, 55131, 129, 119, 11303 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Iceland", "8", ".", "35" ], "ids": [ 130, 119, 53588, 129, 119, 10803 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Netherlands", "8", ".", "30" ], "ids": [ 10150, 119, 22043, 129, 119, 10244 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Denmark", "8", ".", "30" ], "ids": [ 10150, 119, 25854, 129, 119, 10244 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Germany", "8", ".", "30" ], "ids": [ 10150, 119, 12775, 129, 119, 10244 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "13", ".", "Scotland", "8", ".", "29" ], "ids": [ 10249, 119, 16901, 129, 119, 10386 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "13", ".", "Latvia", "8", ".", "29" ], "ids": [ 10249, 119, 55926, 129, 119, 10386 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "15", ".", "Moldova", "8", ".", "24" ], "ids": [ 10208, 119, 29733, 129, 119, 10233 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "16", ".", "Yugoslavia", "8", ".", "22" ], "ids": [ 10250, 119, 38168, 129, 119, 10306 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "16", ".", "Belgium", "8", ".", "22" ], "ids": [ 10250, 119, 26519, 129, 119, 10306 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "18", ".", "Luxembourg", "8", ".", "20" ], "ids": [ 10218, 119, 23903, 129, 119, 10197 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "19", ".", "France", "8", ".", "18" ], "ids": [ 10270, 119, 10688, 129, 119, 10218 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "20", ".", "Israel", "8", ".", "17" ], "ids": [ 10197, 119, 12991, 129, 119, 10273 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "21", ".", "Switzerland", "8", ".", "15" ], "ids": [ 10296, 119, 26002, 129, 119, 10208 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "21", ".", "Slovakia", "8", ".", "15" ], "ids": [ 10296, 119, 43031, 129, 119, 10208 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "23", ".", "Poland", "8", ".", "12" ], "ids": [ 10328, 119, 17879, 129, 119, 10186 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "23", ".", "Portugal", "8", ".", "12" ], "ids": [ 10328, 119, 12939, 129, 119, 10186 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "25", ".", "Georgia", "8", ".", "10" ], "ids": [ 10258, 119, 15234, 129, 119, 10150 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "26", ".", "Ukraine", "8", ".", "09" ], "ids": [ 10314, 119, 19883, 129, 119, 11035 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "26", ".", "Spain", "8", ".", "09" ], "ids": [ 10314, 119, 16149, 129, 119, 11035 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "26", ".", "Finland", "8", ".", "09" ], "ids": [ 10314, 119, 15497, 129, 119, 11035 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "29", ".", "Macedonia", "8", ".", "07" ], "ids": [ 10386, 119, 34840, 129, 119, 10878 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "30", ".", "Lithuania", "8", ".", "06" ], "ids": [ 10244, 119, 57377, 129, 119, 10719 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "31", ".", "Austria", "8", ".", "05" ], "ids": [ 10413, 119, 14479, 129, 119, 10831 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "32", ".", "Russia", "8", ".", "03" ], "ids": [ 10842, 119, 14664, 129, 119, 10907 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "33", ".", "Romania", "8", ".", "02" ], "ids": [ 11000, 119, 13927, 129, 119, 10983 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "33", ".", "Turkey", "8", ".", "02" ], "ids": [ 11000, 119, 22519, 129, 119, 10983 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "35", ".", "Hungary", "7", ".", "98" ], "ids": [ 10803, 119, 24601, 128, 119, 12327 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "36", ".", "Czech", "Republic", "7", ".", "95" ], "ids": [ 11055, 119, 22148, 13681, 128, 119, 11978 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "37", ".", "Greece", "7", ".", "89" ], "ids": [ 11204, 119, 25154, 128, 119, 12642 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "37", ".", "Northern", "Ireland", "7", ".", "89" ], "ids": [ 11204, 119, 15352, 14637, 128, 119, 12642 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "39", ".", "Italy", "7", ".", "85" ], "ids": [ 11303, 119, 11619, 128, 119, 12017 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "40", ".", "Cyprus", "7", ".", "83" ], "ids": [ 10533, 119, 45639, 128, 119, 12408 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "41", ".", "Armenia", "7", ".", "80" ], "ids": [ 11349, 119, 24719, 128, 119, 10832 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "42", ".", "Slovenia", "7", ".", "77" ], "ids": [ 11276, 119, 34583, 128, 119, 12527 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "43", ".", "Croatia", "7", ".", "75" ], "ids": [ 11370, 119, 34993, 128, 119, 11417 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "44", ".", "Bulgaria", "7", ".", "73" ], "ids": [ 11126, 119, 21935, 128, 119, 12545 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "45", ".", "Malta", "7", ".", "40" ], "ids": [ 10827, 119, 23259, 128, 119, 10533 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "P", "##OL", "##IC", "##E", "COM", "##MA", "##ND", "##OS", "ON", "H", "##AN", "##D", "FOR", "AU", "##ST", "##RA", "##L", "##IA", "##NS", "'", "F", "##IR", "##ST", "MA", "##TC", "##H", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 153, 39272, 30889, 11259, 80645, 30696, 58521, 21793, 49339, 145, 41275, 11490, 109544, 29088, 32995, 29990, 11369, 35976, 69196, 112, 143, 73522, 32995, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Armed", "police", "command", "##os", "patrol", "##led", "the", "ground", "when", "Australia", "opened", "their", "short", "tour", "of", "Sri", "Lanka", "with", "a", "five", "-", "run", "win", "over", "the", "country", "'", "s", "youth", "team", "on", "Thursday", "." ], "ids": [ 51383, 15034, 20818, 10310, 62976, 16376, 10105, 16912, 10841, 11729, 14377, 10455, 13716, 12842, 10108, 16098, 20828, 10169, 169, 12403, 118, 14095, 14125, 10491, 10105, 12723, 112, 187, 24215, 11121, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", ",", "in", "Sri", "Lanka", "for", "a", "limited", "over", "##s", "tournament", "which", "also", "includes", "India", "and", "Zimbabwe", ",", "have", "been", "promised", "the", "presence", "of", "command", "##os", ",", "s", "##ni", "##ffer", "dogs", "and", "plain", "##clo", "##thes", "police", "##men", "to", "ensure", "the", "tournament", "is", "trouble", "-", "free", "." ], "ids": [ 11729, 117, 10106, 16098, 20828, 10142, 169, 19264, 10491, 10107, 17390, 10319, 10379, 15433, 11098, 10111, 34577, 117, 10529, 10590, 77137, 10105, 25599, 10108, 20818, 10310, 117, 187, 10342, 22888, 67968, 10111, 62020, 63143, 50167, 15034, 11418, 10114, 40781, 10105, 17390, 10124, 58285, 118, 13961, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "are", "making", "their", "first", "visit", "to", "the", "island", "since", "boy", "##cott", "##ing", "a", "World", "Cup", "fi", "##xt", "##ure", "in", "February", "because", "of", "fear", "##s", "over", "ethnic", "violence", "." ], "ids": [ 11696, 10301, 14293, 10455, 10422, 27541, 10114, 10105, 17354, 11764, 26905, 48426, 10230, 169, 10315, 11544, 14045, 28883, 12101, 10106, 11508, 12373, 10108, 44929, 10107, 10491, 34216, 26342, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", ",", "batting", "first", "in", "Thursday", "'", "s", "the", "warm", "-", "up", "match", ",", "scored", "251", "for", "seven", "from", "their", "50", "over", "##s", "." ], "ids": [ 11729, 117, 86152, 10422, 10106, 67067, 112, 187, 10105, 50089, 118, 10741, 12356, 117, 17233, 26123, 10142, 15767, 10188, 10455, 10462, 10491, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ricky", "Pont", "##ing", "led", "the", "way", "with", "100", "off", "119", "balls", "with", "two", "six", "##es", "and", "nine", "four", "##s", "before", "retiring", "." ], "ids": [ 40486, 23986, 10230, 12857, 10105, 13170, 10169, 10407, 11898, 17963, 88301, 10169, 10551, 12449, 10171, 10111, 19964, 11598, 10107, 11360, 75933, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "youth", "side", "rep", "##lied", "with", "246", "for", "seven", "." ], "ids": [ 10117, 24215, 12250, 76456, 65254, 10169, 26439, 10142, 15767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australian", "coach", "Geoff", "Marsh", "said", "he", "was", "impressed", "with", "the", "competitive", "##ness", "of", "the", "opposition", "." ], "ids": [ 12829, 15701, 59948, 41324, 12415, 10261, 10134, 88363, 10169, 10105, 49836, 14010, 10108, 10105, 21227, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "were", "made", "to", "s", "##we", "##at", "to", "win", ",", "\"", "he", "said", "." ], "ids": [ 107, 12865, 10309, 11019, 10114, 187, 12577, 10526, 10114, 14125, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ONE", "ROM", "##AN", "##IA", "##N", "DI", "##ES", "IN", "B", "##US", "CR", "##AS", "##H", "IN", "B", "##UL", "##GA", "##RI", "##A", "." ], "ids": [ 57929, 41068, 41275, 35976, 11537, 110014, 25054, 36351, 139, 32612, 44912, 38025, 12396, 36351, 139, 100673, 39061, 46876, 10738, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9 ] }, { "tokens": [ "SO", "##F", "##IA", "1996", "-", "08", "-", "22" ], "ids": [ 71020, 11565, 35976, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "Romanian", "passenger", "was", "killed", ",", "and", "14", "others", "were", "injured", "on", "Thursday", "when", "a", "Romanian", "-", "registered", "bus", "coll", "##ide", "##d", "with", "a", "Bulgarian", "one", "in", "northern", "Bulgaria", ",", "police", "said", "." ], "ids": [ 11340, 29543, 33155, 10134, 15875, 117, 10111, 10247, 14633, 10309, 36081, 10135, 67067, 10841, 169, 29543, 118, 33712, 19369, 28552, 13315, 10162, 10169, 169, 43680, 10464, 10106, 17335, 21935, 117, 15034, 12415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "two", "buses", "coll", "##ide", "##d", "head", "on", "at", "5", "o", "'", "clock", "this", "morning", "on", "the", "road", "between", "the", "towns", "of", "R", "##ousse", "and", "Veliko", "Tarn", "##ovo", ",", "police", "said", "." ], "ids": [ 10117, 10551, 59401, 28552, 13315, 10162, 13578, 10135, 10160, 126, 183, 112, 52843, 10531, 28757, 10135, 10105, 15485, 10948, 10105, 26656, 10108, 155, 102467, 10111, 76067, 50463, 28194, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Romanian", "woman", "Maria", "Marco", ",", "35", ",", "was", "killed", "." ], "ids": [ 138, 29543, 18299, 11066, 14160, 117, 10803, 117, 10134, 15875, 119 ], "entity": [ "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "accident", "was", "being", "investigated", ",", "police", "added", "." ], "ids": [ 10117, 25037, 10134, 11223, 100767, 117, 15034, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sofia", "News", "##room", ",", "359", "-", "2", "-", "845", "##6", "##1" ], "ids": [ 118, 118, 21416, 12219, 25525, 117, 35403, 118, 123, 118, 60558, 11211, 10759 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OF", "##F", "##IC", "##IA", "##L", "J", "##O", "##UR", "##NA", "##L", "CO", "##NT", "##EN", "##TS", "-", "O", "##J", "L", "211", "OF", "AU", "##G", "##US", "##T", "21", ",", "1996", "." ], "ids": [ 23240, 11565, 30889, 35976, 11369, 147, 11403, 98348, 36742, 11369, 32992, 77261, 50655, 36545, 118, 152, 15417, 149, 22448, 23240, 29088, 11447, 32612, 11090, 10296, 117, 10389, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*" ], "ids": [ 115 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "(", "Note", "-", "contents", "are", "displayed", "in", "reverse", "order", "to", "that", "in", "the", "printed", "Journal", ")" ], "ids": [ 113, 20231, 118, 97831, 10301, 52991, 10106, 60971, 12990, 10114, 10189, 10106, 10105, 44632, 11929, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "*" ], "ids": [ 115 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Cor", "##rigen", "##dum", "to", "Commission", "Reg", "##ulation", "(", "EC", ")", "No", "1464", "/", "96", "of", "25", "July", "1996", "relating", "to", "a", "standing", "invitation", "to", "tender", "to", "determine", "le", "##vies", "and", "/", "or", "ref", "##unds", "on", "export", "##s", "of", "white", "sugar", "(", "O", "##J", "No", "L", "187", "of", "26", ".", "7", ".", "1996", ")" ], "ids": [ 93495, 64075, 27983, 10114, 14941, 107990, 27894, 113, 27364, 114, 10657, 77035, 120, 12308, 10108, 10258, 11112, 10389, 66842, 10114, 169, 32173, 77674, 10114, 96486, 10114, 37284, 10141, 100335, 10111, 120, 10345, 48056, 105361, 10135, 59220, 10107, 10108, 15263, 60390, 113, 152, 15417, 10657, 149, 23228, 10108, 10314, 119, 128, 119, 10389, 114 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cor", "##rigen", "##dum", "to", "Commission", "Reg", "##ulation", "(", "EC", ")", "No", "658", "/", "96", "of", "9", "April", "1996", "on", "certain", "conditions", "for", "grant", "##ing", "com", "##pensa", "##tory", "payments", "under", "the", "support", "system", "for", "producers", "of", "certain", "arab", "##le", "crops", "(", "O", "##J", "No", "L", "91", "of", "12", ".", "4", ".", "1996", ")" ], "ids": [ 93495, 64075, 27983, 10114, 14941, 107990, 27894, 113, 27364, 114, 10657, 66841, 120, 12308, 10108, 130, 10780, 10389, 10135, 16620, 17315, 10142, 41100, 10230, 10212, 74599, 27197, 99417, 10571, 10105, 13145, 11787, 10142, 46511, 10108, 16620, 45131, 10284, 69422, 113, 152, 15417, 10657, 149, 12519, 10108, 10186, 119, 125, 119, 10389, 114 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Commission", "Reg", "##ulation", "(", "EC", ")", "No", "1663", "/", "96", "of", "20", "August", "1996", "establishing", "the", "standard", "import", "values", "for", "det", "##erm", "##ining", "the", "entry", "price", "of", "certain", "fruit", "and", "veg", "##eta", "##bles", "EN", "##D", "OF", "DO", "##C", "##UM", "##EN", "##T", "." ], "ids": [ 14941, 107990, 27894, 113, 27364, 114, 10657, 45049, 120, 12308, 10108, 10197, 10735, 10389, 55258, 10105, 14979, 67622, 31313, 10142, 10349, 91724, 23025, 10105, 14722, 30839, 10108, 16620, 31595, 10111, 108193, 14724, 14273, 31278, 11490, 23240, 99843, 10858, 72679, 50655, 11090, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Home", "Health", "to", "appeal", "payment", "den", "##ial", "." ], "ids": [ 10167, 13898, 15931, 10114, 44861, 67701, 10140, 15619, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##TO", "##NK", "##A", ",", "Min", "##n", "." ], "ids": [ 75416, 11537, 93280, 60493, 78043, 10738, 117, 28291, 10115, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "22" ], "ids": [ 10389, 118, 11052, 118, 10306 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Home", "Health", "Inc", "said", "on", "Thursday", "it", "will", "appeal", "to", "the", "U", ".", "S", ".", "Federal", "District", "Court", "in", "Minneapolis", "a", "decision", "by", "the", "Health", "Care", "Fin", "##anc", "##ing", "Administration", "(", "HC", "##FA", ")", "that", "denied", "rei", "##mbu", "##rse", "##ment", "of", "certain", "costs", "under", "Medi", "##ca", "##id", "." ], "ids": [ 10167, 13898, 15931, 13604, 12415, 10135, 67067, 10271, 11337, 44861, 10114, 10105, 158, 119, 156, 119, 14492, 11958, 14100, 10106, 43614, 169, 19231, 10155, 10105, 15931, 34731, 39982, 82531, 10230, 22002, 113, 23745, 38351, 114, 10189, 47467, 14243, 61109, 16239, 10426, 10108, 16620, 34495, 10571, 41512, 10425, 11249, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 1, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "The", "HC", "##FA", "Ad", "##mini", "##strat", "##or", "reverse", "##d", "a", "previously", "favorable", "decision", "regarding", "the", "rei", "##mbu", "##rse", "##ment", "of", "costs", "related", "to", "the", "company", "'", "s", "community", "liaison", "personnel", ",", "it", "added", "." ], "ids": [ 10117, 23745, 38351, 25474, 37249, 51351, 10667, 60971, 10162, 169, 17477, 40612, 19231, 33295, 10105, 14243, 61109, 16239, 10426, 10108, 34495, 16382, 10114, 10105, 12100, 112, 187, 13354, 56148, 23889, 117, 10271, 16288, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "said", "it", "continues", "to", "believe", "the", "majority", "of", "the", "community", "liaison", "costs", "are", "cover", "##able", "under", "the", "terms", "of", "the", "Medi", "##care", "program", "." ], "ids": [ 10117, 12100, 12415, 10271, 25266, 10114, 30587, 10105, 19471, 10108, 10105, 13354, 56148, 34495, 10301, 16068, 13096, 10571, 10105, 18873, 10108, 10105, 41512, 22277, 12483, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "\"", "We", "are", "disa", "##ppo", "##inted", "with", "the", "administrator", "'", "s", "decision", "but", "we", "continue", "to", "be", "op", "##timi", "##stic", "regarding", "an", "ultimate", "favorable", "resolution", ",", "\"", "Mark", "Gil", "##dea", ",", "chief", "executive", "officer", ",", "said", "in", "a", "statement", "." ], "ids": [ 107, 12865, 10301, 36474, 45565, 107583, 10169, 10105, 67190, 112, 187, 19231, 10473, 11951, 17734, 10114, 10347, 10303, 82064, 26666, 33295, 10151, 95499, 40612, 40017, 117, 107, 11997, 26463, 20042, 117, 19421, 22676, 19288, 117, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Home", "Health", "said", "it", "previously", "recorded", "a", "reserve", "equal", "to", "16", "percent", "of", "all", "revenue", "related", "to", "the", "community", "liaison", "costs", "." ], "ids": [ 10167, 13898, 15931, 12415, 10271, 17477, 14227, 169, 32608, 32943, 10114, 10250, 22362, 10108, 10435, 51557, 16382, 10114, 10105, 13354, 56148, 34495, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sep", "##arat", "##ely", ",", "In", "Home", "Health", "said", "the", "U", ".", "S", ".", "District", "Court", "in", "Minneapolis", "ruled", "in", "its", "favor", "regarding", "the", "rei", "##mbu", "##rse", "##ment", "of", "certain", "interest", "ex", "##penses", "." ], "ids": [ 67281, 49651, 44096, 117, 10167, 13898, 15931, 12415, 10105, 158, 119, 156, 119, 11958, 14100, 10106, 43614, 34920, 10106, 10474, 19122, 33295, 10105, 14243, 61109, 16239, 10426, 10108, 16620, 17644, 11419, 57025, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "decision", "will", "result", "in", "the", "rei", "##mbu", "##rse", "##ment", "by", "Medi", "##care", "of", "$", "81", ",", "000", "in", "disputed", "costs", "." ], "ids": [ 10747, 19231, 11337, 14493, 10106, 10105, 14243, 61109, 16239, 10426, 10155, 41512, 22277, 10108, 109, 12324, 117, 10259, 10106, 106989, 34495, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "is", "our", "first", "decision", "in", "federal", "dis", "##tr", "##ct", "court", "regarding", "a", "dispute", "with", "Medi", "##care", ",", "\"", "Gil", "##dea", "said", ".", "\"" ], "ids": [ 107, 10747, 10124, 17446, 10422, 19231, 10106, 16293, 27920, 26382, 14526, 14866, 33295, 169, 31310, 10169, 41512, 22277, 117, 107, 26463, 20042, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "We", "are", "extremely", "pl", "##eas", "##ed", "with", "this", "decision", "and", "we", "recognize", "it", "as", "a", "significant", "step", "toward", "resolution", "of", "our", "outstanding", "Medi", "##care", "disputes", ".", "\"" ], "ids": [ 12865, 10301, 38136, 20648, 42658, 10336, 10169, 10531, 19231, 10111, 11951, 80673, 10271, 10146, 169, 17912, 31877, 32216, 40017, 10108, 17446, 53933, 41512, 22277, 89357, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Chicago", "News", "##des", "##k", "312", "-", "408", "-", "878", "##7" ], "ids": [ 118, 118, 12317, 12219, 10920, 10174, 25104, 118, 36899, 118, 74002, 11305 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Op", "##pen", "##heimer", "Capital", "to", "review", "Oct", ".", "div", "." ], "ids": [ 12160, 12708, 43112, 21433, 10114, 17030, 45442, 119, 76486, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "22" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Op", "##pen", "##heimer", "Capital", "LP", "said", "on", "Thursday", "it", "will", "review", "its", "cash", "distribution", "rate", "for", "the", "October", "quarter", "##ly", "distribution", ",", "ass", "##umi", "##ng", "continued", "favorable", "results", "." ], "ids": [ 12160, 12708, 43112, 21433, 17521, 12415, 10135, 67067, 10271, 11337, 17030, 10474, 52828, 18477, 18344, 10142, 10105, 11212, 28330, 10454, 18477, 117, 13935, 17019, 10376, 14278, 40612, 17466, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", ",", "which", "reported", "improved", "first", "quarter", "earning", "##s", "for", "the", "period", "ended", "July", "31", ",", "1996", ",", "declared", "a", "quarter", "##ly", "distribution", "of", "$", "0", ".", "65", "per", "partnership", "unit", "for", "the", "quarter", "ended", "July", "." ], "ids": [ 10117, 12100, 117, 10319, 15943, 34605, 10422, 28330, 56981, 10107, 10142, 10105, 13127, 18428, 11112, 10413, 117, 10389, 117, 25019, 169, 28330, 10454, 18477, 10108, 109, 121, 119, 10843, 10178, 36944, 16511, 10142, 10105, 28330, 18428, 11112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Best", "sees", "Q", "##2", "loss", "similar", "to", "Q", "##1", "loss", "." ], "ids": [ 11730, 41369, 154, 10729, 18576, 13213, 10114, 154, 10759, 18576, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RI", "##CH", "##M", "##ON", "##D", ",", "Va", "." ], "ids": [ 56658, 86448, 11517, 30118, 11490, 117, 14723, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "22" ], "ids": [ 10389, 118, 11052, 118, 10306 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Best", "Products", "Co", "Chairman", "and", "Chief", "Executive", "Daniel", "Levy", "said", "Thursday", "he", "expected", "the", "company", "'", "s", "second", "-", "quarter", "results", "to", "be", "similar", "to", "the", "$", "34", ".", "6", "million", "loss", "posted", "in", "the", "first", "quarter", "." ], "ids": [ 11730, 73903, 13098, 28635, 10111, 16730, 23612, 11792, 16608, 12415, 67067, 10261, 25973, 10105, 12100, 112, 187, 11132, 118, 28330, 17466, 10114, 10347, 13213, 10114, 10105, 109, 11069, 119, 127, 12473, 18576, 51232, 10106, 10105, 10422, 28330, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "also", "told", "Reuters", "before", "the", "retail", "##er", "'", "s", "annual", "meeting", "that", "the", "second", "quarter", "could", "be", "better", "than", "the", "first", "quarter", "ended", "May", "4", ".", "\"" ], "ids": [ 10357, 10379, 21937, 46617, 11360, 10105, 52232, 10165, 112, 187, 19246, 19822, 10189, 10105, 11132, 28330, 12174, 10347, 18322, 11084, 10105, 10422, 28330, 18428, 10725, 125, 119, 107 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "could", "do", "even", "better", ",", "\"", "he", "said", "." ], "ids": [ 12865, 12174, 10149, 13246, 18322, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "second", "-", "quarter", "results", "are", "expected", "to", "be", "released", "in", "September", "." ], "ids": [ 10117, 11132, 118, 28330, 17466, 10301, 25973, 10114, 10347, 11539, 10106, 10596, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Levy", "said", "seeking", "bankruptcy", "protection", "was", "not", "under", "consideration", "." ], "ids": [ 16608, 12415, 51285, 100019, 20344, 10134, 10472, 10571, 90837, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Best", "emerged", "from", "Chapter", "11", "bankruptcy", "protection", "in", "June", "1994", "after", "3", "-", "1", "/", "2", "years", "." ], "ids": [ 11730, 50658, 10188, 23355, 10193, 100019, 20344, 10106, 11120, 10444, 10662, 124, 118, 122, 120, 123, 10855, 119 ], "entity": [ "B-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Bank", "##rupt", "##cy", "is", "always", "possible", ",", "particularly", "when", "you", "lose", "what", "we", "are", "going", "to", "lose", "in", "the", "first", "half", "of", "this", "year", ",", "\"", "Levy", "said", ".", "\"" ], "ids": [ 107, 13533, 46791, 11710, 10124, 19540, 14128, 117, 19658, 10841, 13028, 48742, 12976, 11951, 10301, 19090, 10114, 48742, 10106, 10105, 10422, 13877, 10108, 10531, 10924, 117, 107, 16608, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "But", "this", "is", "not", "something", "we", "are", "str", "##iving", "to", "do", ".", "\"" ], "ids": [ 16976, 10531, 10124, 10472, 26133, 11951, 10301, 17791, 51846, 10114, 10149, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Richmond", "-", "based", "retail", "##er", "lost", "$", "95", ".", "7", "million", "in", "the", "fiscal", "year", "ended", "February", "3", "." ], "ids": [ 10117, 25451, 118, 11610, 52232, 10165, 14172, 109, 11978, 119, 128, 12473, 10106, 10105, 43645, 10924, 18428, 11508, 124, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "was", "the", "second", "-", "largest", "loss", "in", "the", "company", "'", "s", "history", "." ], "ids": [ 13646, 10134, 10105, 11132, 118, 15363, 18576, 10106, 10105, 12100, 112, 187, 11486, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Levy", "said", "that", "Best", "planned", "to", "open", "two", "new", "stores", "this", "fall", "." ], "ids": [ 16608, 12415, 10189, 11730, 24292, 10114, 14087, 10551, 10751, 36006, 10531, 18042, 119 ], "entity": [ "B-PER", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "announced", "in", "March", "that", "it", "was", "closing", "seven", "stores", "and", "backing", "out", "of", "nine", "new", "lease", "agreements", "." ], "ids": [ 10117, 12100, 13854, 10106, 11144, 10189, 10271, 10134, 57409, 15767, 36006, 10111, 31962, 10950, 10108, 19964, 10751, 93261, 98986, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "the", "time", ",", "Best", "said", "it", "did", "not", "plan", "to", "open", "any", "new", "stores", "this", "fall", "." ], "ids": [ 11699, 10105, 10635, 117, 11730, 12415, 10271, 12172, 10472, 13065, 10114, 14087, 11178, 10751, 36006, 10531, 18042, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "currently", "operates", "169", "stores", "in", "23", "states", "." ], "ids": [ 10377, 15313, 36737, 22083, 36006, 10106, 10328, 16316, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "last", "year", "'", "s", "second", "quarter", ",", "which", "ended", "July", "29", ",", "1995", ",", "Best", "posted", "a", "loss", "of", "$", "7", ".", "1", "million", ",", "or", "$", "0", ".", "23", "per", "share", ",", "on", "sales", "of", "$", "311", ".", "9", "million", "." ], "ids": [ 11399, 12469, 10924, 112, 187, 11132, 28330, 117, 10319, 18428, 11112, 10386, 117, 10436, 117, 11730, 51232, 169, 18576, 10108, 109, 128, 119, 122, 12473, 117, 10345, 109, 121, 119, 10328, 10178, 23867, 117, 10135, 23857, 10108, 109, 29780, 119, 130, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Me", "##as", "##les", "exposure", "can", "lead", "to", "bow", "##el", "disease", "-", "study", "." ], "ids": [ 11589, 10403, 11268, 56771, 10944, 14107, 10114, 98073, 10570, 21911, 118, 14687, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "who", "get", "me", "##as", "##les", "while", "pregnant", "may", "have", "ba", "##bies", "at", "higher", "risk", "of", "C", "##ro", "##hn", "'", "s", "disease", ",", "a", "deb", "##ilitat", "##ing", "bow", "##el", "disorder", ",", "researchers", "said", "on", "Friday", "." ], "ids": [ 13536, 10479, 15329, 10911, 10403, 11268, 11371, 82495, 11387, 10529, 15688, 68275, 10160, 17981, 24179, 10108, 140, 10567, 15797, 112, 187, 21911, 117, 169, 55493, 85655, 10230, 98073, 10570, 55405, 117, 53719, 12415, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Three", "out", "of", "four", "Swedish", "ba", "##bies", "born", "to", "mother", "##s", "who", "caught", "me", "##as", "##les", "developed", "serious", "cases", "of", "C", "##ro", "##hn", "'", "s", "disease", ",", "the", "researchers", "said", "." ], "ids": [ 15139, 10950, 10108, 11598, 21381, 15688, 68275, 11175, 10114, 15293, 10107, 10479, 39797, 10911, 10403, 11268, 14628, 32342, 16480, 10108, 140, 10567, 15797, 112, 187, 21911, 117, 10105, 53719, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dr", "Andrew", "Wakefield", "of", "the", "Royal", "Free", "Hospital", "School", "of", "Medicine", "and", "colleagues", "screen", "##ed", "25", ",", "000", "ba", "##bies", "delivered", "at", "University", "Hospital", ",", "Uppsala", ",", "between", "1940", "and", "1949", "." ], "ids": [ 11612, 13999, 88155, 10108, 10105, 11596, 16122, 16025, 10984, 10108, 20670, 10111, 75312, 29963, 10336, 10258, 117, 10259, 15688, 68275, 37577, 10160, 10404, 16025, 117, 29912, 117, 10948, 10888, 10111, 11095, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Four", "of", "the", "mother", "##s", "had", "me", "##as", "##les", "while", "pregnant", "." ], "ids": [ 16773, 10108, 10105, 15293, 10107, 10374, 10911, 10403, 11268, 11371, 82495, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Three", "of", "the", "four", "children", "had", "C", "##ro", "##hn", "'", "s", "disease", ",", "\"", "Wakefield", "'", "s", "group", "wrote", "in", "the", "Lance", "##t", "medical", "journal", "." ], "ids": [ 107, 15139, 10108, 10105, 11598, 12694, 10374, 140, 10567, 15797, 112, 187, 21911, 117, 107, 88155, 112, 187, 11795, 13954, 10106, 10105, 45013, 10123, 19436, 19061, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "C", "##ro", "##hn", "'", "s", "is", "an", "in", "##f", "##lam", "##mation", "of", "the", "bow", "##el", "that", "can", "sometimes", "require", "surgery", "." ], "ids": [ 140, 10567, 15797, 112, 187, 10124, 10151, 10106, 10575, 21114, 41856, 10108, 10105, 98073, 10570, 10189, 10944, 17611, 35742, 44811, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "causes", "dia", "##rr", "##hoe", "##a", ",", "ab", "##dom", "##inal", "pain", "and", "weight", "loss", "." ], "ids": [ 10377, 25781, 10671, 47707, 41948, 10113, 117, 11357, 15561, 37476, 38576, 10111, 25512, 18576, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "researchers", "said", "the", "three", "children", "involved", "had", "especially", "severe", "cases", "." ], "ids": [ 10117, 53719, 12415, 10105, 11003, 12694, 16247, 10374, 17491, 34844, 16480, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Expo", "##sure", "to", "virus", "##es", "can", "often", "cause", "birth", "def", "##ect", "##s", "." ], "ids": [ 52947, 47394, 10114, 20399, 10171, 10944, 12899, 15311, 24711, 100745, 56906, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Most", "notably", ",", "women", "who", "get", "ru", "##bella", "(", "German", "me", "##as", "##les", ")", "have", "a", "high", "risk", "of", "a", "still", "##born", "baby", "." ], "ids": [ 14361, 36900, 117, 13190, 10479, 15329, 13483, 63615, 113, 12026, 10911, 10403, 11268, 114, 10529, 169, 11846, 24179, 10108, 169, 12647, 32315, 40138, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "the", "key", "numbers", "-", "CB", "##I", "August", "industrial", "trends", "." ], "ids": [ 11101, 10105, 18444, 20953, 118, 59791, 11281, 10735, 18138, 109086, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "are", "key", "data", "from", "the", "August", "monthly", "survey", "of", "trends", "in", "UK", "manufacturing", "by", "the", "Confederation", "of", "British", "Industry", "(", "CB", "##I", ")", "." ], "ids": [ 18317, 10301, 18444, 11165, 10188, 10105, 10735, 61673, 35035, 10108, 109086, 10106, 10523, 43615, 10155, 10105, 85398, 10108, 11160, 25539, 113, 59791, 11281, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "CB", "##I", "MO", "##NT", "##HL", "##Y", "TR", "##EN", "##DS", "EN", "##Q", "##UI", "##R", "##Y", "(", "a", ")", "AU", "##G", "J", "##UL", "##Y", "J", "##UN", "##E", "MA", "##Y" ], "ids": [ 59791, 11281, 102059, 77261, 39810, 14703, 80047, 50655, 33953, 31278, 19282, 83259, 11273, 14703, 113, 169, 114, 29088, 11447, 147, 100673, 14703, 147, 69849, 11259, 27277, 14703 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "total", "order", "book", "-", "10", "-", "22", "-", "13", "-", "17" ], "ids": [ 118, 11339, 12990, 12748, 118, 10150, 118, 10306, 118, 10249, 118, 10273 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "export", "order", "book", "-", "14", "-", "13", "-", "11", "-", "7" ], "ids": [ 118, 59220, 12990, 12748, 118, 10247, 118, 10249, 118, 10193, 118, 128 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "stock", "##s", "of", "finished", "goods", "+", "17", "+", "19", "+", "17", "+", "25" ], "ids": [ 118, 20511, 10107, 10108, 15972, 36931, 116, 10273, 116, 10270, 116, 10273, 116, 10258 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "output", "ex", "##pectations", "*", "+", "22", "+", "22", "+", "12", "+", "16" ], "ids": [ 118, 37131, 11419, 96815, 115, 116, 10306, 116, 10306, 116, 10186, 116, 10250 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "domestic", "price", "ex", "##pectations", "*", "0", "-", "1", "+", "6", "+", "4" ], "ids": [ 118, 31084, 30839, 11419, 96815, 115, 121, 118, 122, 116, 127, 116, 125 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "##S", "-", "*", "over", "the", "coming", "four", "months", ";" ], "ids": [ 49307, 29833, 10731, 118, 115, 10491, 10105, 23959, 11598, 15555, 132 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "(", "a", ")", "in", "percent", ",", "giving", "balance", "between", "those" ], "ids": [ 118, 113, 169, 114, 10106, 22362, 117, 24426, 40162, 10948, 12676 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "rep", "##lyi", "##ng", "\"", "above", "normal", "\"", "and", "those", "rep", "##lyi", "##ng", "\"", "below", "normal", ".", "\"" ], "ids": [ 76456, 76611, 10376, 107, 16038, 16626, 107, 10111, 12676, 76456, 76611, 10376, 107, 17544, 16626, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "survey", "was", "conducted", "between", "July", "23", "and", "August", "14", "and", "involved", "1", ",", "305", "companies", ",", "representing", "50", "industries", ",", "accounting", "for", "around", "half", "of", "the", "UK", "'", "s", "manufactured", "export", "##s", "and", "some", "two", "million", "employees", "." ], "ids": [ 10117, 35035, 10134, 23736, 10948, 11112, 10328, 10111, 10735, 10247, 10111, 16247, 122, 117, 25112, 18866, 117, 31221, 10462, 43605, 117, 106010, 10142, 12166, 13877, 10108, 10105, 10523, 112, 187, 56648, 59220, 10107, 10111, 11152, 10551, 12473, 35056, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Rosemary", "Bennett", ",", "London", "News", "##room", "+", "44", "171", "542", "771", "##5" ], "ids": [ 118, 118, 84448, 26075, 117, 10829, 12219, 25525, 116, 11126, 22478, 51620, 65580, 11166 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "ships", "##ales", "." ], "ids": [ 10829, 22513, 18174, 119 ], "entity": [ "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Second", "##hand", "ton", "##nage", "broke", "##rs", "reported", "the", "sale", "of", "the", "following", "vessels", "." ], "ids": [ 118, 14181, 41137, 22464, 45211, 30500, 10943, 15943, 10105, 15488, 10108, 10105, 11901, 45805, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iron", "G", "##ip", "##ps", "##land", "-", "(", "built", "1989", ")", "87", ",", "241", "d", "##w", "##t", "sold", "to", "Greek", "buy", "##ers", "for", "$", "30", "million", "." ], "ids": [ 19247, 144, 17437, 13221, 11080, 118, 113, 12183, 10524, 114, 12581, 117, 23536, 172, 10874, 10123, 15337, 10114, 15286, 47715, 10901, 10142, 109, 10244, 12473, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sai", "##ry", "##u", "Mar", "##u", "No", ":", "2", "-", "(", "built", "1982", ")", "60", ",", "960", "d", "##w", "##t", "sold", "to", "Greek", "buy", "##ers", "for", "$", "15", ".", "5", "million", "." ], "ids": [ 77710, 10908, 10138, 15734, 10138, 10657, 131, 123, 118, 113, 12183, 10642, 114, 10709, 117, 36832, 172, 10874, 10123, 15337, 10114, 15286, 47715, 10901, 10142, 109, 10208, 119, 126, 12473, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "##ain", "##less", "Fighter", "-", "(", "built", "1970", ")", "21", ",", "718", "d", "##w", "##t", "sold", "at", "auction", "for", "$", "6", "million", "." ], "ids": [ 10838, 18073, 14985, 29342, 118, 113, 12183, 10607, 114, 10296, 117, 61768, 172, 10874, 10123, 15337, 10160, 106733, 10142, 109, 127, 12473, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "of", "these", "sales", "may", "not", "be", "final", "as", "they", "may", "be", "subject", "to", "inspection", ",", "survey", "or", "other", "conditions", "." ], "ids": [ 13885, 10108, 11762, 23857, 11387, 10472, 10347, 11070, 10146, 10689, 11387, 10347, 20036, 10114, 99455, 117, 35035, 10345, 10684, 17315, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ga", "##rli", "##c", "pi", "##lls", "do", "n", "'", "t", "lower", "cho", "##les", "##tero", "##l", ",", "study", "finds", "." ], "ids": [ 69699, 47234, 10350, 24109, 22881, 10149, 182, 112, 188, 18165, 11257, 11268, 36751, 10161, 117, 14687, 31478, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ga", "##rli", "##c", "pi", "##lls", "may", "not", "lower", "blood", "cho", "##les", "##tero", "##l", "and", "studies", "that", "show", "they", "do", "may", "be", "fl", "##aw", "##ed", ",", "British", "researchers", "have", "reported", "." ], "ids": [ 69699, 47234, 10350, 24109, 22881, 11387, 10472, 18165, 24911, 11257, 11268, 36751, 10161, 10111, 16668, 10189, 11897, 10689, 10149, 11387, 10347, 58768, 26426, 10336, 117, 11160, 53719, 10529, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "A", "study", "by", "a", "team", "of", "doctors", "at", "Oxford", "University", "has", "found", "people", "with", "high", "blood", "cho", "##les", "##tero", "##l", "do", "not", "benefit", "significantly", "from", "taking", "gar", "##lic", "table", "##ts", "." ], "ids": [ 138, 14687, 10155, 169, 11121, 10108, 82782, 10160, 11109, 10404, 10393, 11823, 11426, 10169, 11846, 24911, 11257, 11268, 36751, 10161, 10149, 10472, 43074, 40394, 10188, 18084, 47243, 25303, 21783, 10806, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "study", "involved", "115", "people", "with", "high", "blood", "cho", "##les", "##tero", "##l", "levels", "." ], "ids": [ 10117, 14687, 16247, 15680, 11426, 10169, 11846, 24911, 11257, 11268, 36751, 10161, 21559, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "were", "given", "900", "milli", "##gram", "##s", "a", "day", "of", "drie", "##d", "gar", "##lic", "po", "##wder", "or", "place", "##bo", "table", "##ts", ".", "\"" ], "ids": [ 11696, 10309, 13507, 13545, 34795, 31253, 10107, 169, 11940, 10108, 16171, 10162, 47243, 25303, 10514, 62228, 10345, 11192, 11790, 21783, 10806, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "were", "no", "significant", "differences", "between", "the", "groups", "receiving", "gar", "##lic", "and", "place", "##bo", ",", "\"", "they", "wrote", "in", "the", "Journal", "of", "the", "Royal", "College", "of", "Phys", "##icia", "##ns", "." ], "ids": [ 11723, 10309, 10192, 17912, 39336, 10948, 10105, 15647, 31391, 47243, 25303, 10111, 11192, 11790, 117, 107, 10689, 13954, 10106, 10105, 11929, 10108, 10105, 11596, 11454, 10108, 53658, 38016, 10891, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Those", "taking", "part", "were", "told", "to", "eat", "a", "low", "-", "fat", "diet", "for", "six", "weeks", "before", "they", "started", "taking", "the", "pi", "##lls", ",", "and", "their", "blood", "cho", "##les", "##tero", "##l", "measured", "before", "and", "after", "the", "six", "-", "week", "period", "." ], "ids": [ 43027, 18084, 10668, 10309, 21937, 10114, 69110, 169, 15626, 118, 67952, 76714, 10142, 12449, 20750, 11360, 10689, 13457, 18084, 10105, 24109, 22881, 117, 10111, 10455, 24911, 11257, 11268, 36751, 10161, 60279, 11360, 10111, 10662, 10105, 12449, 118, 16118, 13127, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "researchers", "said", "this", "would", "make", "their", "findings", "more", "accurate", "." ], "ids": [ 10117, 53719, 12415, 10531, 10894, 13086, 10455, 79441, 10798, 54616, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Several", "studies", "have", "found", "gar", "##lic", "pi", "##lls", "can", "lower", "blood", "pressure", "and", "blood", "cho", "##les", "##tero", "##l", "." ], "ids": [ 28604, 16668, 10529, 11823, 47243, 25303, 24109, 22881, 10944, 18165, 24911, 23460, 10111, 24911, 11257, 11268, 36751, 10161, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "Oxford", "team", "disputed", "these", "findings", "and", "said", "either", "previous", "trials", "may", "have", "been", "interpreted", "in", "##corre", "##ct", "##ly", ",", "those", "taking", "part", "were", "not", "given", "special", "diet", "##s", "before", "##hand", "or", "the", "duration", "of", "the", "studies", "may", "have", "been", "too", "short", "." ], "ids": [ 16976, 10105, 11109, 11121, 106989, 11762, 79441, 10111, 12415, 16106, 16741, 54076, 11387, 10529, 10590, 87134, 10106, 46968, 14526, 10454, 117, 12676, 18084, 10668, 10309, 10472, 13507, 14478, 76714, 10107, 11360, 41137, 10345, 10105, 78547, 10108, 10105, 16668, 11387, 10529, 10590, 16683, 13716, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "six", "-", "month", "trial", "was", "funded", "by", "the", "British", "Heart", "Foundation", "and", "Licht", "##wer", "Ph", "##arma", "GmbH", ",", "which", "makes", "Kwa", "##i", "brand", "gar", "##lic", "table", "##ts", "." ], "ids": [ 10117, 12449, 118, 14064, 23626, 10134, 47845, 10155, 10105, 11160, 15095, 14560, 10111, 48682, 17048, 29343, 81008, 19596, 117, 10319, 20562, 48511, 10116, 23467, 47243, 25303, 21783, 10806, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "study", "did", "not", "address", "whether", "whole", "gar", "##lic", "could", "affect", "cho", "##les", "##tero", "##l", "." ], "ids": [ 10117, 14687, 12172, 10472, 32198, 21883, 21047, 47243, 25303, 12174, 60600, 11257, 11268, 36751, 10161, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "London", "News", "##room", "+", "44", "171", "542", "795", "##0" ], "ids": [ 118, 118, 10829, 12219, 25525, 116, 11126, 22478, 51620, 71882, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "gives", "aid", "to", "vol", "##cano", "-", "hit", "Caribbean", "island", "." ], "ids": [ 16032, 24952, 19778, 10114, 12714, 25498, 118, 14946, 31778, 17354, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "said", "on", "Thursday", "it", "would", "give", "25", "million", "pounds", "(", "$", "39", "million", ")", "of", "development", "aid", "to", "the", "Caribbean", "island", "of", "Montserrat", ",", "where", "much", "of", "the", "population", "living", "in", "the", "south", "has", "fled", "to", "avoid", "a", "vol", "##cano", "." ], "ids": [ 16032, 12415, 10135, 67067, 10271, 10894, 18090, 10258, 12473, 61982, 113, 109, 11303, 12473, 114, 10108, 13405, 19778, 10114, 10105, 31778, 17354, 10108, 58008, 117, 10940, 13172, 10108, 10105, 11077, 14625, 10106, 10105, 13144, 10393, 56598, 10114, 33253, 169, 12714, 25498, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "vol", "##cano", "in", "the", "So", "##uf", "##riere", "hills", "has", "eru", "##pted", "three", "times", "in", "the", "past", "13", "months", "and", "last", "April", "some", "4", ",", "500", "people", "living", "in", "the", "capital", ",", "Plymouth", ",", "and", "southern", "areas", "were", "eva", "##cua", "##ted", "to", "the", "north", ",", "where", "many", "are", "living", "in", "public", "shelter", "##s", "and", "schools", "." ], "ids": [ 10117, 12714, 25498, 10106, 10105, 12882, 21598, 80604, 46484, 10393, 18098, 64471, 11003, 13465, 10106, 10105, 17781, 10249, 15555, 10111, 12469, 10780, 11152, 125, 117, 10757, 11426, 14625, 10106, 10105, 12185, 117, 40814, 117, 10111, 17156, 14544, 10309, 103730, 75545, 11912, 10114, 10105, 12756, 117, 10940, 11299, 10301, 14625, 10106, 11683, 85947, 10107, 10111, 16009, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "assistance", "will", "provide", "a", "fast", "track", "development", "programme", "for", "the", "designated", "(", "northern", ")", "safe", "area", ",", "\"", "Britain", "'", "s", "Overseas", "Development", "Administration", "said", "in", "a", "statement", "." ], "ids": [ 107, 10747, 33514, 11337, 16871, 169, 15040, 14310, 13405, 19611, 10142, 10105, 23386, 113, 17335, 114, 43966, 11168, 117, 107, 16032, 112, 187, 106192, 14502, 22002, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "gave", "8", ".", "5", "million", "pounds", "(", "$", "13", "million", ")", "to", "Montserrat", ",", "which", "is", "one", "of", "its", "dependent", "territories", ",", "when", "the", "vol", "##cano", "first", "became", "active", "." ], "ids": [ 16032, 15362, 129, 119, 126, 12473, 61982, 113, 109, 10249, 12473, 114, 10114, 58008, 117, 10319, 10124, 10464, 10108, 10474, 45034, 46593, 117, 10841, 10105, 12714, 25498, 10422, 11179, 14459, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Overseas", "Development", "Minister", "Lyn", "##da", "Cha", "##lke", "##r", "said", "a", "recent", "census", "had", "shown", "most", "Montserrat", "##ians", "wanted", "to", "remain", "on", "the", "island", ".", "\"" ], "ids": [ 106192, 14502, 14355, 102603, 10229, 53453, 56400, 10129, 12415, 169, 19037, 14670, 10374, 19989, 10992, 58008, 34615, 22591, 10114, 25430, 10135, 10105, 17354, 119, 107 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "development", "of", "the", "north", "will", "help", "them", "to", "do", "just", "that", ",", "\"", "she", "said", "." ], "ids": [ 10117, 13405, 10108, 10105, 12756, 11337, 15217, 11345, 10114, 10149, 12820, 10189, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tennis", "-", "Philipp", "##ous", "##sis", "lo", "##oms", "for", "Sam", "##pra", "##s", "in", "U", ".", "S", ".", "Open", "." ], "ids": [ 27380, 118, 23293, 13499, 13109, 10406, 50995, 10142, 14268, 30631, 10107, 10106, 158, 119, 156, 119, 11919, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "Bill", "Be", "##rk", "##rot" ], "ids": [ 13160, 14321, 16299, 28636 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "22" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "World", "number", "one", "Pete", "Sam", "##pra", "##s", ",", "seeking", "his", "first", "Grand", "Slam", "title", "of", "the", "year", ",", "and", "women", "'", "s", "top", "seed", "St", "##ef", "##fi", "Graf", ",", "aim", "##ing", "for", "her", "third", ",", "should", "be", "able", "to", "ea", "##se", "into", "the", "year", "'", "s", "final", "major", ",", "which", "begins", "on", "Monday", "." ], "ids": [ 10315, 11487, 10464, 23107, 14268, 30631, 10107, 117, 51285, 10226, 10422, 11319, 33445, 12887, 10108, 10105, 10924, 117, 10111, 13190, 112, 187, 12364, 49282, 10838, 16822, 14403, 20617, 117, 56048, 10230, 10142, 10485, 12628, 117, 14819, 10347, 16197, 10114, 22257, 10341, 10708, 10105, 10924, 112, 187, 11070, 11922, 117, 10319, 26462, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sam", "##pra", "##s", "opens", "the", "defence", "of", "his", "U", ".", "S", ".", "Open", "crown", "against", "David", "R", "##ik", "##l", "of", "the", "Czech", "Republic", ",", "while", "top", "-", "ranked", "Graf", "begins", "her", "title", "defence", "against", "Ya", "##yu", "##k", "Bas", "##uki", "of", "Indonesia", "." ], "ids": [ 14268, 30631, 10107, 70702, 10105, 47245, 10108, 10226, 158, 119, 156, 119, 11919, 52990, 11327, 10804, 155, 10896, 10161, 10108, 10105, 22148, 13681, 117, 11371, 12364, 118, 25250, 20617, 26462, 10485, 12887, 47245, 11327, 25148, 25285, 10174, 21237, 39821, 10108, 11658, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 4, 8, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Wednesday", "'", "s", "U", ".", "S", ".", "Open", "draw", "ceremony", "revealed", "that", "both", "title", "holder", "##s", "should", "run", "into", "their", "first", "serious", "opposition", "in", "the", "third", "round", "." ], "ids": [ 57611, 112, 187, 158, 119, 156, 119, 11919, 25974, 34713, 23127, 10189, 11408, 12887, 48938, 10107, 14819, 14095, 10708, 10455, 10422, 32342, 21227, 10106, 10105, 12628, 13569, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lo", "##omi", "##ng", "in", "Sam", "##pra", "##s", "'", "s", "future", "is", "a", "likely", "third", "-", "round", "date", "with", "recent", "nem", "##esis", "Mark", "Philipp", "##ous", "##sis", ",", "the", "rising", "Australian", "who", "took", "out", "Sam", "##pra", "##s", "in", "the", "third", "round", "of", "the", "Australian", "Open", "in", "January", "." ], "ids": [ 13069, 32013, 10376, 10106, 14268, 30631, 10107, 112, 187, 16711, 10124, 169, 22497, 12628, 118, 13569, 13664, 10169, 19037, 11558, 31912, 11997, 23293, 13499, 13109, 117, 10105, 53816, 12829, 10479, 12149, 10950, 14268, 30631, 10107, 10106, 10105, 12628, 13569, 10108, 10105, 12829, 11919, 10106, 11238, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Sam", "##pra", "##s", "ave", "##nge", "##d", "that", "defeat", "with", "a", "straight", "sets", "win", "over", "the", "19", "-", "year", "-", "old", "power", "hit", "##ter", "in", "the", "second", "round", "at", "Wimbledon", "and", "their", "rubber", "match", "in", "New", "York", "could", "provide", "some", "first", "-", "week", "fire", "##works", "." ], "ids": [ 14268, 30631, 10107, 47145, 18180, 10162, 10189, 24800, 10169, 169, 31214, 23597, 14125, 10491, 10105, 10270, 118, 10924, 118, 12898, 13183, 14946, 10877, 10106, 10105, 11132, 13569, 10160, 37932, 10111, 10455, 92724, 12356, 10106, 10287, 10482, 12174, 16871, 11152, 10422, 118, 16118, 13559, 51778, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "only", "a", "st", "##unn", "##ing", "upset", "will", "keep", "Graf", "from", "sailing", "through", "to", "a", "pred", "##ict", "##able", "semifinal", "show", "##down", "with", "third", "seed", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", ",", "the", "German", "star", "could", "also", "be", "tested", "in", "the", "third", "round", "where", "she", "will", "probably", "face", "28", "##th", "-", "ranked", "veteran", "Natasha", "Z", "##vere", "##va", "of", "Belarus", "." ], "ids": [ 14600, 10893, 169, 28780, 104939, 10230, 96213, 11337, 23819, 20617, 10188, 86952, 11222, 10114, 169, 18283, 106788, 13096, 65085, 11897, 27160, 10169, 12628, 49282, 54789, 10368, 14220, 66007, 39574, 16780, 117, 10105, 12026, 16624, 12174, 10379, 10347, 65984, 10106, 10105, 12628, 13569, 10940, 10833, 11337, 23282, 13295, 10348, 11143, 118, 25250, 55669, 79827, 163, 29282, 10362, 10108, 55131, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "There", "will", "be", "no", "repeat", "of", "last", "year", "'", "s", "men", "'", "s", "final", "with", "eighth", "-", "ranked", "Andre", "Aga", "##ssi", "landing", "in", "Sam", "##pra", "##s", "'", "s", "half", "of", "the", "draw", "." ], "ids": [ 11723, 11337, 10347, 10192, 107832, 10108, 12469, 10924, 112, 187, 10588, 112, 187, 11070, 10169, 46758, 118, 25250, 25188, 103721, 28377, 37798, 10106, 14268, 30631, 10107, 112, 187, 13877, 10108, 10105, 25974, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bu", "##mpi", "##ng", "Aga", "##ssi", "up", "to", "the", "sixth", "seed", "##ing", "avoid", "##ed", "the", "possibility", "that", "he", "would", "run", "into", "Sam", "##pra", "##s", "as", "early", "as", "the", "quarter", "-", "finals", ",", "but", "they", "could", "lock", "horn", "##s", "in", "the", "semi", "##s", "." ], "ids": [ 11916, 35407, 10376, 103721, 28377, 10741, 10114, 10105, 28913, 49282, 10230, 33253, 10336, 10105, 53510, 10189, 10261, 10894, 14095, 10708, 14268, 30631, 10107, 10146, 11732, 10146, 10105, 28330, 118, 21758, 117, 10473, 10689, 12174, 79601, 64016, 10107, 10106, 10105, 15900, 10107, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Olympic", "champion", "Aga", "##ssi", "meets", "Karim", "Alam", "##i", "of", "Morocco", "in", "the", "first", "round", "." ], "ids": [ 17952, 17689, 103721, 28377, 40427, 71139, 51255, 10116, 10108, 57295, 10106, 10105, 10422, 13569, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sur", "##prise", "second", "seed", "Michael", "Chang", ",", "ranked", "third", "in", "the", "world", ",", "opens", "against", "Czech", "Daniel", "Va", "##cek", ",", "while", "women", "'", "s", "second", "seed", "Monica", "Se", "##les", "drew", "American", "Anne", "Miller", "as", "her", "first", "victim", "." ], "ids": [ 14453, 72435, 11132, 49282, 10631, 28545, 117, 25250, 12628, 10106, 10105, 11356, 117, 70702, 11327, 22148, 11792, 14723, 37239, 117, 11371, 13190, 112, 187, 11132, 49282, 29242, 11045, 11268, 49098, 10536, 13490, 14615, 10146, 10485, 10422, 62585, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 2, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "-", "ranked", "Austrian", "Thomas", "Must", "##er", ",", "who", "was", "seed", "##ed", "third", ",", "did", "not", "have", "the", "lu", "##ck", "of", "the", "draw", "with", "him", "." ], "ids": [ 14181, 118, 25250, 32201, 11096, 54690, 10165, 117, 10479, 10134, 49282, 10336, 12628, 117, 12172, 10472, 10529, 10105, 14657, 11263, 10108, 10105, 25974, 10169, 10957, 119 ], "entity": [ "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "first", "round", "Must", "##er", "faces", "American", "Rich", "##ey", "Rene", "##berg", ",", "who", "has", "been", "playing", "some", "of", "the", "best", "tennis", "of", "his", "career", "of", "late", "." ], "ids": [ 10167, 10105, 10422, 13569, 54690, 10165, 48343, 10536, 27948, 13005, 91790, 11348, 117, 10479, 10393, 10590, 14879, 11152, 10108, 10105, 12504, 20944, 10108, 10226, 13021, 10108, 13002, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "he", "survive", "##s", ",", "Must", "##er", "is", "seed", "##ed", "to", "run", "into", "either", "fifth", "-", "seed", "##ed", "Wimbledon", "champion", "Richard", "Kraj", "##ice", "##k", "of", "the", "Netherlands", "or", "12th", "-", "seed", "##ed", "American", "Todd", "Martin", "in", "the", "quarter", "-", "finals", "in", "Chang", "'", "s", "half", "of", "the", "draw", "." ], "ids": [ 14535, 10261, 55681, 10107, 117, 54690, 10165, 10124, 49282, 10336, 10114, 14095, 10708, 16106, 22237, 118, 49282, 10336, 37932, 17689, 11118, 98619, 11918, 10174, 10108, 10105, 22043, 10345, 34505, 118, 49282, 10336, 10536, 24708, 11235, 10106, 10105, 28330, 118, 21758, 10106, 28545, 112, 187, 13877, 10108, 10105, 25974, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 2, 4, 8, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Per", "##ha", "##ps", "the", "best", ",", "yet", "most", "un", "##fort", "##una", "##te", ",", "first", "-", "round", "match", "##up", "of", "the", "men", "'", "s", "competition", "pit", "##s", "eighth", "seed", "Jim", "Cour", "##ier", "against", "retiring", "star", "Stefan", "Ed", "##berg", "." ], "ids": [ 11982, 10921, 13221, 10105, 12504, 117, 21833, 10992, 10119, 23044, 14212, 10216, 117, 10422, 118, 13569, 12356, 14590, 10108, 10105, 10588, 112, 187, 16622, 55277, 10107, 46758, 49282, 14178, 44347, 11709, 11327, 75933, 16624, 17399, 13114, 11348, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "The", "popular", "S", "##wed", "##e", "is", "playing", "his", "final", "major", "tournament", "next", "week", "and", "the", "two", "-", "time", "champion", "'", "s", "Grand", "Slam", "fare", "##well", "could", "well", "be", "a", "one", "-", "match", "affair", "." ], "ids": [ 10117, 12600, 156, 48854, 10112, 10124, 14879, 10226, 11070, 11922, 17390, 13451, 16118, 10111, 10105, 10551, 118, 10635, 17689, 112, 187, 11319, 33445, 23252, 15862, 12174, 11206, 10347, 169, 10464, 118, 12356, 63879, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "the", "exception", "of", "a", "Philipp", "##ous", "##sis", "show", "##down", ",", "Sam", "##pra", "##s", "looks", "to", "have", "landed", "in", "a", "com", "##fortable", "quarter", "of", "the", "draw", "with", "the", "like", "##s", "of", "French", "##man", "Cedric", "Pio", "##line", "and", "ail", "##ing", "French", "Open", "champion", "Ye", "##v", "##gen", "##y", "Ka", "##feln", "##iko", "##v", ",", "who", "is", "nur", "##sing", "a", "ri", "##b", "injury", ",", "in", "his", "path", "." ], "ids": [ 12613, 10105, 30646, 10108, 169, 23293, 13499, 13109, 11897, 27160, 117, 14268, 30631, 10107, 59148, 10114, 10529, 58961, 10106, 169, 10212, 81587, 28330, 10108, 10105, 25974, 10169, 10105, 11850, 10107, 10108, 11894, 10589, 107799, 42712, 12953, 10111, 91230, 10230, 11894, 11919, 17689, 20567, 10477, 11280, 10157, 25444, 79650, 18924, 10477, 117, 10479, 10124, 11354, 16357, 169, 29956, 10457, 27443, 117, 10106, 10226, 37013, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 9, 9, 9, 2, 6, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Se", "##les", ",", "runner", "-", "up", "to", "Graf", "last", "year", ",", "is", "seed", "##ed", "to", "run", "into", "fifth", "-", "ranked", "German", "An", "##ke", "Huber", "in", "the", "quarter", "-", "finals", "with", "fourth", "seed", "Con", "##chi", "##ta", "Martinez", "or", "eighth", "-", "seed", "##ed", "Olympic", "champion", "Lindsay", "Davenport", "looking", "like", "her", "most", "likely", "semifinal", "opponents", "." ], "ids": [ 11045, 11268, 117, 43037, 118, 10741, 10114, 20617, 12469, 10924, 117, 10124, 49282, 10336, 10114, 14095, 10708, 22237, 118, 25250, 12026, 10313, 10550, 46398, 10106, 10105, 28330, 118, 21758, 10169, 16918, 49282, 12845, 12806, 10213, 50203, 10345, 46758, 118, 49282, 10336, 17952, 17689, 42228, 74533, 34279, 11850, 10485, 10992, 22497, 65085, 63568, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 2, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Huber", "will", "be", "tested", "immediately", "with", "a", "first", "-", "round", "encounter", "against", "dangerous", "18th", "-", "ranked", "South", "African", "Amanda", "Co", "##etz", "##er", "." ], "ids": [ 16976, 46398, 11337, 10347, 65984, 24029, 10169, 169, 10422, 118, 13569, 84538, 11327, 57195, 27669, 118, 25250, 11056, 13839, 30380, 13098, 75065, 10165, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Sanchez", "Vic", "##ario", ",", "runner", "-", "up", "to", "Graf", "at", "the", "French", "Open", "and", "Wimbledon", ",", "begins", "play", "against", "a", "qualifier", "in", "a", "quarter", "of", "the", "draw", "that", "includes", "young", "talent", "Martina", "Hi", "##ngi", "##s", ",", "the", "16th", "seed", ",", "before", "a", "probable", "quarter", "-", "final", "c", "##lash", "with", "seventh", "-", "seed", "##ed", "veteran", "Jana", "Novo", "##tna", "." ], "ids": [ 66007, 39574, 16780, 117, 43037, 118, 10741, 10114, 20617, 10160, 10105, 11894, 11919, 10111, 37932, 117, 26462, 12253, 11327, 169, 96076, 10106, 169, 28330, 10108, 10105, 25974, 10189, 15433, 14739, 27411, 35012, 20065, 31681, 10107, 117, 10105, 33581, 49282, 117, 11360, 169, 38400, 28330, 118, 11070, 171, 25297, 10169, 37192, 118, 49282, 10336, 55669, 18909, 28649, 34247, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "B-MISC", "I-MISC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 4, 9, 9, 2, 6, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Martinez", "begins", "play", "against", "R", "##ux", "##andra", "Drago", "##mir", "of", "Romania", "." ], "ids": [ 50203, 26462, 12253, 11327, 155, 11855, 90332, 98650, 20825, 10108, 13927, 119 ], "entity": [ "B-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Tennis", "-", "Must", "##er", "upset", ",", "Philipp", "##ous", "##sis", "wins", ",", "St", "##olt", "##enberg", "lose", "##s", "." ], "ids": [ 56898, 39469, 118, 27380, 118, 54690, 10165, 96213, 117, 23293, 13499, 13109, 27279, 117, 10838, 27667, 24304, 48742, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 4, 8, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "21" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10296 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Top", "-", "seed", "##ed", "Thomas", "Must", "##er", "of", "Austria", "was", "beaten", "6", "-", "3", "7", "-", "5", "by", "123", "##rd", "-", "ranked", "Daniel", "Nestor", "of", "Canada", "on", "Wednesday", "in", "his", "first", "match", "of", "the", "$", "2", "million", "Canadian", "Open", "." ], "ids": [ 12685, 118, 49282, 10336, 11096, 54690, 10165, 10108, 14479, 10134, 74075, 127, 118, 124, 128, 118, 126, 10155, 16968, 12023, 118, 25250, 11792, 78424, 10108, 11635, 10135, 57611, 10106, 10226, 10422, 12356, 10108, 10105, 109, 123, 12473, 14023, 11919, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "A", "left", "##hand", "##er", "with", "a", "strong", "serve", ",", "Nestor", "kept", "the", "ra", "##lli", "##es", "short", "by", "constantly", "attacking", "the", "net", "and", "the", "ta", "##ctic", "worked", "in", "the", "second", "-", "round", "match", "against", "Must", "##er", ",", "playing", "his", "first", "match", "after", "receiving", "a", "first", "-", "round", "by", "##e", "along", "with", "the", "other", "top", "eight", "seeds", "." ], "ids": [ 138, 12153, 41137, 10165, 10169, 169, 18093, 19430, 117, 78424, 26546, 10105, 11859, 14088, 10171, 13716, 10155, 85047, 69030, 10105, 11988, 10111, 10105, 11057, 35672, 13858, 10106, 10105, 11132, 118, 13569, 12356, 11327, 54690, 10165, 117, 14879, 10226, 10422, 12356, 10662, 31391, 169, 10422, 118, 13569, 10155, 10112, 12400, 10169, 10105, 10684, 12364, 16222, 68488, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tournament", "also", "lost", "its", "second", "seed", "on", "the", "third", "day", "of", "play", "when", "second", "-", "seed", "##ed", "Goran", "Ivan", "##ise", "##vic", "of", "Croatia", "was", "beaten", "6", "-", "7", "(", "3", "-", "7", ")", "6", "-", "4", "6", "-", "4", "by", "uns", "##eed", "##ed", "Mikael", "Till", "##strom", "of", "Sweden", "." ], "ids": [ 10117, 17390, 10379, 14172, 10474, 11132, 49282, 10135, 10105, 12628, 11940, 10108, 12253, 10841, 11132, 118, 49282, 10336, 84658, 15631, 13041, 48175, 10108, 34993, 10134, 74075, 127, 118, 128, 113, 124, 118, 128, 114, 127, 118, 125, 127, 118, 125, 10155, 15826, 40154, 10336, 54671, 32259, 83474, 10108, 20937, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Other", "seed", "##ed", "players", "ad", "##vancing", "were", "number", "three", "Wayne", "Ferreira", "of", "South", "Africa", ",", "number", "four", "Marcelo", "Rio", "##s", "of", "Chile", ",", "number", "six", "Mali", "##V", "##ai", "Washington", "of", "the", "United", "States", "and", "American", "Todd", "Martin", ",", "the", "seventh", "see", "##ed", "." ], "ids": [ 14490, 49282, 10336, 16021, 10840, 104122, 10309, 11487, 11003, 18547, 39227, 10108, 11056, 12880, 117, 11487, 11598, 38165, 12109, 10107, 10108, 13218, 117, 11487, 12449, 24427, 11779, 11542, 11586, 10108, 10105, 10609, 10859, 10111, 10536, 24708, 11235, 117, 10105, 37192, 12888, 10336, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "B-MISC", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 9, 1, 5, 9, 2, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eight", "##h", "seed", "Marc", "Ross", "##et", "of", "Switzerland", "was", "eliminated", "in", "a", "one", "hour", ",", "55", "minute", "battle", "by", "uns", "##eed", "##ed", "Mark", "Philipp", "##ous", "##sis", "of", "Australia", "." ], "ids": [ 43788, 10237, 49282, 15254, 16690, 10308, 10108, 26002, 10134, 44407, 10106, 169, 10464, 24730, 117, 11358, 21760, 18758, 10155, 15826, 40154, 10336, 11997, 23293, 13499, 13109, 10108, 11729, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Philipp", "##ous", "##sis", "saved", "a", "match", "point", "at", "5", "-", "6", "in", "the", "third", "-", "set", "tie", "break", "before", "winning", "6", "-", "3", "3", "-", "6", "7", "-", "6", "(", "8", "-", "6", ")", "." ], "ids": [ 23293, 13499, 13109, 59185, 169, 12356, 12331, 10160, 126, 118, 127, 10106, 10105, 12628, 118, 11847, 27916, 24194, 11360, 16542, 127, 118, 124, 124, 118, 127, 128, 118, 127, 113, 129, 118, 127, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Philipp", "##ous", "##sis", "'", "s", "com", "##pat", "##riot", ",", "13th", "seed", "Jason", "St", "##olt", "##enberg", ",", "was", "not", "as", "fortuna", "##te", "." ], "ids": [ 23293, 13499, 13109, 112, 187, 10212, 18115, 92113, 117, 33937, 49282, 16796, 10838, 27667, 24304, 117, 10134, 10472, 10146, 50516, 10216, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "held", "one", "match", "point", "at", "9", "-", "8", "in", "a", "marathon", "third", "-", "set", "tie", "break", "but", "was", "beaten", "5", "-", "7", "7", "-", "6", "(", "7", "-", "1", ")", "7", "-", "6", "(", "13", "-", "11", ")", "by", "uns", "##eed", "##ed", "Daniel", "Va", "##cek", "of", "the", "Czech", "Republic", "." ], "ids": [ 10357, 11991, 10464, 12356, 12331, 10160, 130, 118, 129, 10106, 169, 45068, 12628, 118, 11847, 27916, 24194, 10473, 10134, 74075, 126, 118, 128, 128, 118, 127, 113, 128, 118, 122, 114, 128, 118, 127, 113, 10249, 118, 10193, 114, 10155, 15826, 40154, 10336, 11792, 14723, 37239, 10108, 10105, 22148, 13681, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "I", "knew", "I", "had", "to", "serve", "well", "and", "keep", "the", "points", "short", "and", "that", "'", "s", "what", "I", "was", "able", "to", "do", ",", "\"", "said", "Nestor", ",", "who", "ranks", "10th", "in", "doubles", "." ], "ids": [ 107, 146, 46000, 146, 10374, 10114, 19430, 11206, 10111, 23819, 10105, 12789, 13716, 10111, 10189, 112, 187, 12976, 146, 10134, 16197, 10114, 10149, 117, 107, 12415, 78424, 117, 10479, 52593, 31004, 10106, 46255, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "were", "only", "two", "service", "breaks", "in", "the", "match", "." ], "ids": [ 11723, 10309, 10893, 10551, 11989, 68307, 10106, 10105, 12356, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "lank", "##y", "Canadian", "broke", "Must", "##er", "at", "4", "-", "3", "in", "the", "first", "set", "and", "5", "-", "5", "in", "the", "second", "before", "ending", "the", "match", "on", "his", "third", "match", "point", "when", "the", "Austrian", "hit", "a", "service", "return", "long", "." ], "ids": [ 10117, 79240, 10157, 14023, 30500, 54690, 10165, 10160, 125, 118, 124, 10106, 10105, 10422, 11847, 10111, 126, 118, 126, 10106, 10105, 11132, 11360, 29077, 10105, 12356, 10135, 10226, 12628, 12356, 12331, 10841, 10105, 32201, 14946, 169, 11989, 15079, 11695, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "probably", "did", "n", "'", "t", "hit", "five", "ground", "stroke", "##s", "in", "the", "whole", "match", ",", "\"", "said", "Must", "##er", ",", "only", "partly", "jo", "##king", ".", "\"" ], "ids": [ 107, 146, 23282, 12172, 182, 112, 188, 14946, 12403, 16912, 57071, 10107, 10106, 10105, 21047, 12356, 117, 107, 12415, 54690, 10165, 117, 10893, 50686, 12541, 15629, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "way", "he", "was", "chip", "##ping", "and", "char", "##ging", "and", "serving", "and", "volley", "##ing", "I", "did", "n", "'", "t", "really", "get", "my", "tim", "##ing", "playing", "from", "the", "base", "##line", ".", "\"" ], "ids": [ 10117, 13170, 10261, 10134, 64008, 15398, 10111, 101328, 13808, 10111, 20252, 10111, 104717, 10230, 146, 12172, 182, 112, 188, 30181, 15329, 15127, 19604, 10230, 14879, 10188, 10105, 11404, 12953, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "played", "a", "good", "match", ",", "took", "a", "few", "chances", ",", "and", "every", "time", "he", "was", "down", "he", "was", "able", "to", "come", "up", "with", "a", "big", "first", "serve", ".", "\"" ], "ids": [ 107, 10357, 11553, 169, 15198, 12356, 117, 12149, 169, 13824, 84632, 117, 10111, 14234, 10635, 10261, 10134, 12935, 10261, 10134, 16197, 10114, 10678, 10741, 10169, 169, 22185, 10422, 19430, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Playing", "at", "night", "was", "not", "Must", "##er", "'", "s", "pre", "##ference", ".", "\"" ], "ids": [ 75726, 10160, 16903, 10134, 10472, 54690, 10165, 112, 187, 12229, 52790, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "asked", "for", "a", "day", "match", "and", "they", "gave", "me", "a", "night", "match", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 146, 22151, 10142, 169, 11940, 12356, 10111, 10689, 15362, 10911, 169, 16903, 12356, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "do", "n", "'", "t", "like", "playing", "under", "the", "lights", "but", "may", "##be", "it", "would", "not", "have", "made", "any", "difference", ".", "\"" ], "ids": [ 146, 10149, 182, 112, 188, 11850, 14879, 10571, 10105, 71123, 10473, 11387, 11044, 10271, 10894, 10472, 10529, 11019, 11178, 30856, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ivan", "##ise", "##vic", "ra", "##lli", "##ed", "from", "a", "2", "-", "5", "deficit", "in", "the", "first", "set", "but", "then", "played", "er", "##rati", "##cally", "against", "the", "44", "##th", "-", "ranked", "Till", "##strom", ",", "who", "was", "a", "surprise", "winner", "over", "his", "famous", "com", "##pat", "##riot", "Stefan", "Ed", "##berg", "in", "the", "second", "round", "at", "Wimbledon", "." ], "ids": [ 15631, 13041, 48175, 11859, 14088, 10336, 10188, 169, 123, 118, 126, 107383, 10106, 10105, 10422, 11847, 10473, 11059, 11553, 10163, 22425, 72762, 11327, 10105, 11126, 11143, 118, 25250, 32259, 83474, 117, 10479, 10134, 169, 48886, 20826, 10491, 10226, 18689, 10212, 18115, 92113, 17399, 13114, 11348, 10106, 10105, 11132, 13569, 10160, 37932, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Ivan", "##ise", "##vic", "hit", "32", "ac", "##es", "but", "was", "out", "##play", "##ed", "from", "the", "back", "court", "by", "the", "24", "-", "year", "-", "old", "Till", "##strom", "." ], "ids": [ 15631, 13041, 48175, 14946, 10842, 13621, 10171, 10473, 10134, 10950, 31081, 10336, 10188, 10105, 12014, 14866, 10155, 10105, 10233, 118, 10924, 118, 12898, 32259, 83474, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "The", "sixth", "-", "ranked", "Ivan", "##ise", "##vic", ",", "who", "lost", "in", "the", "final", "at", "Indianapolis", "to", "world", "number", "one", "Pete", "Sam", "##pra", "##s", "of", "the", "U", ".", "S", ".", "last", "Sunday", ",", "made", "a", "quick", "get", "##away", "after", "his", "loss", "but", "did", "say", ":", "\"", "Something", "was", "not", "there", "when", "I", "arrived", "(", "in", "Toronto", ")", "." ], "ids": [ 10117, 28913, 118, 25250, 15631, 13041, 48175, 117, 10479, 14172, 10106, 10105, 11070, 10160, 35142, 10114, 11356, 11487, 10464, 23107, 14268, 30631, 10107, 10108, 10105, 158, 119, 156, 119, 12469, 19731, 117, 11019, 169, 69609, 15329, 38249, 10662, 10226, 18576, 10473, 12172, 23763, 131, 107, 36106, 10134, 10472, 11155, 10841, 146, 22584, 113, 10106, 15256, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "I", "did", "n", "'", "t", "feel", "good", "." ], "ids": [ 146, 12172, 182, 112, 188, 38008, 15198, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "I", "did", "n", "'", "t", "have", "a", "good", "feeling", "as", "soon", "as", "I", "lost", "in", "my", "doubles", "(", "on", "Tuesday", ")", ".", "\"" ], "ids": [ 12689, 146, 12172, 182, 112, 188, 10529, 169, 15198, 61362, 10146, 17864, 10146, 146, 14172, 10106, 15127, 46255, 113, 10135, 70245, 114, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "thought", "he", "looked", "a", "little", "un", "##fo", "##cus", "##ed", "at", "certain", "times", "on", "his", "ground", "stroke", "##s", ",", "\"", "said", "Till", "##strom", "." ], "ids": [ 107, 146, 18957, 10261, 59822, 169, 16745, 10119, 21330, 14319, 10336, 10160, 16620, 13465, 10135, 10226, 16912, 57071, 10107, 117, 107, 12415, 32259, 83474, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "The", "19", "-", "year", "-", "old", "Philipp", "##ous", "##sis", ",", "who", "beat", "Sam", "##pra", "##s", "in", "the", "third", "round", "of", "this", "year", "'", "s", "Australian", "Open", ",", "stayed", "cal", "##m", "in", "a", "ner", "##vy", "third", "-", "set", "tie", "break", "against", "Ross", "##et", "." ], "ids": [ 10117, 10270, 118, 10924, 118, 12898, 23293, 13499, 13109, 117, 10479, 27868, 14268, 30631, 10107, 10106, 10105, 12628, 13569, 10108, 10531, 10924, 112, 187, 12829, 11919, 117, 42296, 25923, 10147, 10106, 169, 59097, 15343, 12628, 118, 11847, 27916, 24194, 11327, 16690, 10308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "\"", "I", "'", "m", "pl", "##eas", "##ed", "because", "I", "did", "n", "'", "t", "play", "that", "great", "today", ",", "but", "I", "fought", "really", "well", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 146, 112, 181, 20648, 42658, 10336, 12373, 146, 12172, 182, 112, 188, 12253, 10189, 14772, 18745, 117, 10473, 146, 29766, 30181, 11206, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "I", "was", "down", "2", "-", "5", "in", "the", "tie", "##break", "(", "in", "the", "third", "set", ")", ",", "I", "just", "thought", "about", "winning", "my", "two", "serves", "and", "hoped", "that", "he", "might", "get", "tight", "." ], "ids": [ 12242, 146, 10134, 12935, 123, 118, 126, 10106, 10105, 27916, 83065, 113, 10106, 10105, 12628, 11847, 114, 117, 146, 12820, 18957, 10978, 16542, 15127, 10551, 24474, 10111, 84245, 10189, 10261, 20970, 15329, 85202, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Then", "he", "sh", "##anke", "##d", "a", "for", "##ehan", "##d", "at", "to", "make", "it", "5", "-", "all", "and", "that", "helped", "me", "back", ".", "\"" ], "ids": [ 26467, 10261, 48201, 62428, 10162, 169, 10142, 79788, 10162, 10160, 10114, 13086, 10271, 126, 118, 10435, 10111, 10189, 20890, 10911, 12014, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Soccer", "-", "Results", "of", "South", "Korean", "pro", "-", "soccer", "games", "." ], "ids": [ 25914, 118, 33036, 10108, 11056, 20501, 11284, 118, 41356, 13332, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "22" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "South", "Korean", "pro", "-", "soccer", "games", "played", "on", "Wednesday", "." ], "ids": [ 33036, 10108, 11056, 20501, 11284, 118, 41356, 13332, 11553, 10135, 57611, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Any", "##ang", "3", "Cho", "##nna", "##m", "3", "(", "half", "##time", "2", "-", "0", ")" ], "ids": [ 47336, 11889, 124, 50690, 16441, 10147, 124, 113, 13877, 18086, 123, 118, 121, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##uch", "##on", "0", "Su", "##won", "0", "(", "half", "##time", "0", "-", "0", ")" ], "ids": [ 153, 20591, 10263, 121, 12271, 36816, 121, 113, 13877, 18086, 121, 118, 121, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "after", "games", "played", "on", "Wednesday", "(", "tab", "##ulate", "under", "-", "won", ",", "drawn", ",", "lost", ",", "goals", "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 58592, 10107, 10662, 13332, 11553, 10135, 57611, 113, 100781, 70863, 10571, 118, 11367, 117, 34788, 117, 14172, 117, 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "D", "L", "G", "/", "F", "G", "/", "A", "P" ], "ids": [ 160, 141, 149, 144, 120, 143, 144, 120, 138, 153 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##uch", "##on", "1", "1", "0", "1", "0", "4" ], "ids": [ 153, 20591, 10263, 122, 122, 121, 122, 121, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##nan", "1", "0", "0", "5", "4", "3" ], "ids": [ 50690, 13470, 122, 121, 121, 126, 125, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Any", "##ang", "0", "2", "0", "5", "5", "2" ], "ids": [ 47336, 11889, 121, 123, 121, 126, 126, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##won", "0", "2", "0", "3", "3", "2" ], "ids": [ 12271, 36816, 121, 123, 121, 124, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Po", "##hang", "0", "1", "0", "3", "3", "1" ], "ids": [ 11255, 30222, 121, 122, 121, 124, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##usan", "0", "1", "0", "0", "2", "1" ], "ids": [ 153, 29885, 121, 122, 121, 121, 123, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##nna", "##m", "0", "1", "1", "5", "6", "1" ], "ids": [ 50690, 16441, 10147, 121, 122, 122, 126, 127, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", "##ls", "##an", "0", "0", "1", "4", "5", "0" ], "ids": [ 158, 11747, 10206, 121, 121, 122, 125, 126, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##n", "##buk", "0", "0", "0", "0", "0", "0" ], "ids": [ 50690, 10115, 58074, 121, 121, 121, 121, 121, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Senegal", "cho", "##lera", "outbreak", "kills", "five", "." ], "ids": [ 38052, 11257, 37684, 63831, 69179, 12403, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DA", "##KA", "##R", "1996", "-", "08", "-", "22" ], "ids": [ 47855, 67813, 11273, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "outbreak", "of", "cho", "##lera", "has", "killed", "five", "people", "in", "the", "central", "Senegal", "town", "of", "Kao", "##lac", "##k", ",", "where", "health", "authorities", "have", "recorded", "291", "cases", "since", "August", "11", ",", "a", "medical", "official", "said", "on", "Thursday", "." ], "ids": [ 10313, 63831, 10108, 11257, 37684, 10393, 15875, 12403, 11426, 10106, 10105, 12397, 38052, 12221, 10108, 32411, 63279, 10174, 117, 10940, 17004, 28308, 10529, 14227, 31240, 16480, 11764, 10735, 10193, 117, 169, 19436, 14731, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Doctor", "Masse", "##rig", "##ne", "N", "##dia", "##ye", "said", "medical", "staff", "were", "over", "##w", "##hel", "##med", "with", "work", ".", "\"" ], "ids": [ 17376, 81775, 34294, 10238, 151, 13852, 12871, 12415, 19436, 18927, 10309, 10491, 10874, 31572, 21986, 10169, 11424, 119, 107 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "People", "are", "rus", "##hing", "to", "the", "hospital", "as", "soon", "as", "the", "first", "symptoms", "appear", ",", "that", "'", "s", "why", "we", "have", "fewer", "deaths", ",", "\"", "he", "told", "Reuters", "by", "telephone", "from", "the", "town", ",", "160", "km", "(", "100", "miles", ")", "southeast", "of", "the", "Senegal", "##ese", "capital", "Dakar", "." ], "ids": [ 14235, 10301, 19867, 30809, 10114, 10105, 18141, 10146, 17864, 10146, 10105, 10422, 62319, 22641, 117, 10189, 112, 187, 31237, 11951, 10529, 74139, 50438, 117, 107, 10261, 21937, 46617, 10155, 69009, 10188, 10105, 12221, 117, 13849, 10204, 113, 10407, 14148, 114, 36798, 10108, 10105, 38052, 13565, 12185, 58846, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 9 ] }, { "tokens": [ "Nigerian", "general", "takes", "over", "Liberia", "EC", "##OM", "##O", "##G", "force", "." ], "ids": [ 85012, 11389, 19135, 10491, 59169, 27364, 37079, 11403, 11447, 15031, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-LOC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 1, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "MO", "##NR", "##O", "##VI", "##A", "1996", "-", "08", "-", "22" ], "ids": [ 102059, 93776, 11403, 90939, 10738, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nigerian", "Major", "General", "Sam", "Victor", "Mal", "##u", "took", "over", "on", "Thursday", "as", "commander", "of", "the", "EC", "##OM", "##O", "##G", "peace", "##kee", "##ping", "force", "in", "Liberia", ",", "two", "days", "after", "the", "start", "of", "the", "latest", "cea", "##sef", "##ire", "in", "the", "six", "-", "year", "civil", "war", "." ], "ids": [ 85012, 14988, 11220, 14268, 14173, 18076, 10138, 12149, 10491, 10135, 67067, 10146, 27703, 10108, 10105, 27364, 37079, 11403, 11447, 28101, 49721, 15398, 15031, 10106, 59169, 117, 10551, 13990, 10662, 10105, 15148, 10108, 10105, 50908, 25578, 107749, 11627, 10106, 10105, 12449, 118, 10924, 14161, 10338, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mal", "##u", "replaced", "another", "Nigerian", "major", "general", ",", "John", "Ini", "##enger", ",", "who", "told", "officers", "at", "the", "hand", "##over", "ceremony", "that", "peace", "was", "now", "at", "hand", "for", "Liberia", "after", "six", "years", "of", "fighting", "and", "more", "than", "a", "dozen", "failed", "accord", "##s", "." ], "ids": [ 18076, 10138, 16478, 12864, 85012, 11922, 11389, 117, 10421, 25336, 102591, 117, 10479, 21937, 23579, 10160, 10105, 15230, 16666, 34713, 10189, 28101, 10134, 11858, 10160, 15230, 10142, 59169, 10662, 12449, 10855, 10108, 27535, 10111, 10798, 11084, 169, 84956, 20775, 35233, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "search", "for", "peace", "in", "Liberia", "has", "been", "difficult", ",", "challenging", "and", "sometimes", "pain", "##ful", "." ], "ids": [ 107, 10117, 22419, 10142, 28101, 10106, 59169, 10393, 10590, 25232, 117, 109024, 10111, 17611, 38576, 14446, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peace", "##keeper", "##s", "were", "har", "##asse", "##d", ",", "killed", "and", "taken", "host", "##age", ",", "\"", "he", "said", "." ], "ids": [ 20705, 98767, 10107, 10309, 10453, 77923, 10162, 117, 15875, 10111, 15109, 19317, 12276, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "difficult", "but", "I", "want", "to", "assure", "you", "that", "peace", "is", "in", "sight", ".", "\"" ], "ids": [ 107, 10377, 10124, 25232, 10473, 146, 21528, 10114, 62316, 13028, 10189, 28101, 10124, 10106, 78327, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "United", "Nations", "military", "observer", "##s", "travelling", "to", "the", "western", "town", "of", "Tu", "##b", "##man", "##burg", "on", "Wednesday", "to", "monitor", "the", "cea", "##sef", "##ire", "were", "delayed", "by", "shooting", "along", "the", "highway", ",", "U", ".", "N", ".", "special", "representative", "Anthony", "Nya", "##ky", "##i", "said", "." ], "ids": [ 10609, 15145, 14041, 79368, 10107, 81353, 10114, 10105, 16672, 12221, 10108, 20108, 10457, 10589, 12248, 10135, 57611, 10114, 60774, 10105, 25578, 107749, 11627, 10309, 67058, 10155, 38969, 12400, 10105, 31729, 117, 158, 119, 151, 119, 14478, 33786, 14751, 42541, 11445, 10116, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "They", "finally", "went", "ahead", "with", "an", "escort", "from", "the", "U", "##L", "##IM", "##O", "-", "J", "faction", "." ], "ids": [ 11696, 21256, 13446, 35629, 10169, 10151, 100883, 10188, 10105, 158, 11369, 42031, 11403, 118, 147, 84395, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Fact", "##ion", "leaders", "who", "agreed", "a", "new", "peace", "deal", "in", "the", "Nigerian", "capital", "Abu", "##ja", "on", "Saturday", "have", "accused", "each", "other", "of", "breaking", "the", "cea", "##sef", "##ire", "." ], "ids": [ 85245, 11046, 24155, 10479, 25577, 169, 10751, 28101, 19918, 10106, 10105, 85012, 12185, 18332, 10320, 10135, 24848, 10529, 37303, 11948, 10684, 10108, 47105, 10105, 25578, 107749, 11627, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "latest", "peace", "deal", "for", "##ese", "##es", "the", "disa", "##rma", "##ment", "of", "an", "estimated", "60", ",", "000", "combat", "##ants", "and", "sets", "a", "target", "date", "of", "May", "30", "next", "year", "for", "elections", "." ], "ids": [ 10117, 50908, 28101, 19918, 10142, 13565, 10171, 10105, 36474, 25248, 10426, 10108, 10151, 25267, 10709, 117, 10259, 18159, 22595, 10111, 23597, 169, 28564, 13664, 10108, 10725, 10244, 13451, 10924, 10142, 22054, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "EC", "##OM", "##O", "##G", "force", ",", "currently", "10", ",", "000", "strong", ",", "was", "sent", "to", "Liberia", "by", "the", "Economic", "Community", "of", "West", "African", "States", "in", "1990", "at", "the", "height", "of", "the", "fighting", "." ], "ids": [ 10117, 27364, 37079, 11403, 11447, 15031, 117, 15313, 10150, 117, 10259, 18093, 117, 10134, 14541, 10114, 59169, 10155, 10105, 19080, 18553, 10108, 11164, 13839, 10859, 10106, 10420, 10160, 10105, 30778, 10108, 10105, 27535, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Guinea", "calls", "two", "days", "of", "prayer", "." ], "ids": [ 17209, 31886, 10551, 13990, 10108, 82012, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##NA", "##K", "##R", "##Y", "1996", "-", "08", "-", "22" ], "ids": [ 32992, 36742, 11733, 11273, 14703, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "West", "African", "state", "of", "Guinea", "declared", "Thursday", "and", "Friday", "days", "of", "national", "prayer", "." ], "ids": [ 10117, 11164, 13839, 11388, 10108, 17209, 25019, 67067, 10111, 30767, 13990, 10108, 11844, 82012, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "government", "statement", ",", "broadcast", "repeatedly", "by", "state", "radio", ",", "said", "the", "two", "days", "of", "prayer", "were", "\"", "for", "the", "dead", ",", "for", "peace", "and", "pro", "##sper", "##ity", "in", "Guinea", ",", "the", "victory", "of", "the", "new", "government", "and", "the", "health", "of", "the", "head", "of", "state", "\"", "." ], "ids": [ 138, 12047, 33311, 117, 21391, 77998, 10155, 11388, 12429, 117, 12415, 10105, 10551, 13990, 10108, 82012, 10309, 107, 10142, 10105, 23457, 117, 10142, 28101, 10111, 11284, 34185, 11949, 10106, 17209, 117, 10105, 19735, 10108, 10105, 10751, 12047, 10111, 10105, 17004, 10108, 10105, 13578, 10108, 11388, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "precise", "reason", "for", "the", "call", "was", "not", "immediately", "clear", "." ], "ids": [ 10117, 89165, 27949, 10142, 10105, 20575, 10134, 10472, 24029, 24866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Guinea", "'", "s", "president", ",", "Lan", "##sana", "Conte", ",", "vice", "-", "president", "of", "the", "Organisation", "of", "the", "Islamic", "Conference", ",", "left", "for", "Kuwait", "on", "August", "16", "to", "prepare", "the", "next", "O", "##IC", "summit", "in", "Pakistan", "in", "1997", "." ], "ids": [ 17209, 112, 187, 12931, 117, 19670, 51308, 49082, 117, 16543, 118, 12931, 10108, 10105, 22223, 10108, 10105, 22150, 16424, 117, 12153, 10142, 44892, 10135, 10735, 10250, 10114, 69977, 10105, 13451, 152, 30889, 60531, 10106, 15437, 10106, 10391, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Ko", "##rani", "##c", "reading", "sessions", "and", "prayer", "##s", "were", "to", "be", "held", "in", "the", "farming", "town", "of", "Bad", "##i", "-", "Ton", "##don", ",", "near", "his", "home", "about", "60", "km", "(", "40", "miles", ")", "from", "the", "capital", "Con", "##ak", "##ry", "." ], "ids": [ 30186, 31110, 10350, 32432, 45320, 10111, 82012, 10107, 10309, 10114, 10347, 11991, 10106, 10105, 61295, 12221, 10108, 14027, 10116, 118, 48899, 15081, 117, 12883, 10226, 11816, 10978, 10709, 10204, 113, 10533, 14148, 114, 10188, 10105, 12185, 12845, 10710, 10908, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Conte", ",", "an", "army", "general", ",", "survived", "a", "February", "army", "pay", "revolt", "which", "at", "the", "time", "he", "described", "as", "a", "vei", "##led", "attempt", "to", "top", "##ple", "him", "." ], "ids": [ 49082, 117, 10151, 17977, 11389, 117, 37035, 169, 11508, 17977, 16868, 99737, 10319, 10160, 10105, 10635, 10261, 13010, 10146, 169, 50766, 16376, 21395, 10114, 12364, 22238, 10957, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "has", "since", "named", "a", "prime", "minister", "for", "the", "first", "time", "since", "early", "in", "his", "rule", "and", "ordered", "a", "c", "##rack", "##down", "on", "corruption", "." ], "ids": [ 10357, 10393, 11764, 12038, 169, 19287, 16930, 10142, 10105, 10422, 10635, 11764, 11732, 10106, 10226, 21983, 10111, 23782, 169, 171, 71189, 27160, 10135, 50410, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Conte", "seized", "power", "in", "1984", "after", "the", "death", "of", "veteran", "Marx", "##ist", "leader", "Ahmed", "Se", "##kou", "Tour", "##e", "." ], "ids": [ 49082, 80176, 13183, 10106, 10597, 10662, 10105, 12557, 10108, 55669, 22919, 11293, 15014, 25530, 11045, 14530, 11595, 10112, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "He", "won", "elections", "in", "1993", "." ], "ids": [ 10357, 11367, 22054, 10106, 10463, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "African", "answer", "##s", "U", ".", "S", ".", "message", "in", "a", "bot", "##tle", "." ], "ids": [ 11056, 13839, 57085, 10107, 158, 119, 156, 119, 30514, 10106, 169, 41960, 16406, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "22" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "South", "African", "boy", "is", "writing", "back", "to", "an", "American", "girl", "whose", "message", "in", "a", "bot", "##tle", "he", "found", "was", "##hed", "up", "on", "President", "Nelson", "Mandela", "'", "s", "old", "prison", "island", "." ], "ids": [ 138, 11056, 13839, 26905, 10124, 17637, 12014, 10114, 10151, 10536, 24699, 16879, 30514, 10106, 169, 41960, 16406, 10261, 11823, 10134, 16081, 10741, 10135, 12811, 15962, 63881, 112, 187, 12898, 20538, 17354, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Carlo", "Hoffmann", ",", "an", "11", "-", "year", "-", "old", "jail", "##er", "'", "s", "son", "who", "found", "the", "bot", "##tle", "on", "the", "beach", "at", "Robb", "##en", "Island", "off", "Cape", "Town", "after", "winter", "storm", "##s", ",", "will", "send", "his", "letter", "back", "by", "ordinary", "mail", "on", "Thursday", ",", "the", "post", "office", "said", "." ], "ids": [ 16976, 14437, 35016, 117, 10151, 10193, 118, 10924, 118, 12898, 75934, 10165, 112, 187, 10312, 10479, 11823, 10105, 41960, 16406, 10135, 10105, 45405, 10160, 67250, 10136, 11848, 11898, 18642, 14380, 10662, 25977, 31642, 10107, 117, 11337, 45567, 10226, 19310, 12014, 10155, 64481, 30049, 10135, 67067, 117, 10105, 11841, 14301, 12415, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "will", "be", "sent", "for", "free", "." ], "ids": [ 10377, 11337, 10347, 14541, 10142, 13961, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Danielle", "Murray", "from", "Sand", "##usk", "##y", ",", "Ohio", ",", "the", "same", "age", "as", "her", "new", "pen", "##friend", ",", "asked", "for", "a", "rep", "##ly", "from", "who", "##ever", "received", "the", "message", "she", "fl", "##ung", "on", "its", "journey", "months", "ago", "on", "the", "other", "side", "of", "the", "Atlantic", "Ocean", "." ], "ids": [ 65004, 17917, 10188, 35071, 107320, 10157, 117, 13608, 117, 10105, 11561, 12089, 10146, 10485, 10751, 66558, 97856, 117, 22151, 10142, 169, 76456, 10454, 10188, 10479, 23433, 12296, 10105, 30514, 10833, 58768, 10716, 10135, 10474, 43610, 15555, 36390, 10135, 10105, 10684, 12250, 10108, 10105, 16739, 20500, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Rot", "##tw", "##eile", "##r", "kills", "South", "African", "to", "##ddle", "##r", "." ], "ids": [ 56115, 76797, 97852, 10129, 69179, 11056, 13839, 10114, 73182, 10129, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "22" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "rot", "##tw", "##eile", "##r", "dog", "belonging", "to", "an", "elderly", "South", "African", "couple", "sa", "##vage", "##d", "to", "death", "their", "two", "-", "year", "-", "old", "grandson", "who", "was", "visiting", ",", "police", "said", "on", "Thursday", "." ], "ids": [ 138, 64354, 76797, 97852, 10129, 17835, 54188, 10114, 10151, 106226, 11056, 13839, 20969, 10148, 39005, 10162, 10114, 12557, 10455, 10551, 118, 10924, 118, 12898, 60111, 10479, 10134, 48780, 117, 15034, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "dog", "attacked", "Louis", "Boo", "##y", "in", "the", "front", "garden", "of", "his", "grand", "##pare", "##nts", "'", "house", "in", "Van", "##der", "##bij", "##lpa", "##rk", "near", "Johannesburg", "on", "Tuesday", "." ], "ids": [ 10117, 17835, 30272, 11334, 102498, 10157, 10106, 10105, 14589, 35651, 10108, 10226, 13023, 28927, 14073, 112, 13215, 10106, 11474, 11304, 57670, 70285, 16299, 12883, 42392, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 1, 9, 9, 9 ] }, { "tokens": [ "His", "blood", "##y", "body", "was", "lying", "in", "the", "garden", "when", "his", "parents", "arrived", "in", "the", "afternoon", "to", "pick", "him", "up", "." ], "ids": [ 11597, 24911, 10157, 14333, 10134, 74730, 10106, 10105, 35651, 10841, 10226, 17293, 22584, 10106, 10105, 73213, 10114, 36833, 10957, 10741, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "unclear", "where", "the", "grand", "##pare", "##nts", "were", "at", "the", "time", "." ], "ids": [ 10377, 10134, 94475, 10940, 10105, 13023, 28927, 14073, 10309, 10160, 10105, 10635, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dogs", "fie", "##rce", "enough", "to", "s", "##care", "off", "bu", "##rg", "##lars", "are", "becoming", "increasingly", "popular", "in", "the", "crime", "-", "in", "##feste", "##d", "Johannesburg", "area", "." ], "ids": [ 54059, 29959, 31526, 21408, 10114, 187, 22277, 11898, 11499, 20251, 100792, 10301, 19881, 45015, 12600, 10106, 10105, 22564, 118, 10106, 84639, 10162, 42392, 11168, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "IN", "##DI", "##CA", "##TO", "##RS", "-", "Hungary", "-", "updated", "Aug", "22", "." ], "ids": [ 36351, 58730, 46900, 60493, 39469, 118, 24601, 118, 13973, 53012, 10306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UD", "##AP", "##ES", "##T", "1996", "-", "08", "-", "22" ], "ids": [ 139, 86888, 38423, 25054, 11090, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "latest", "indicato", "##rs", ":" ], "ids": [ 10117, 50908, 89392, 10943, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "CP", "##I", "(", "p", "##ct", ")", "July", "+", "0", ".", "4", "##m", "/", "m", ";", "23", ".", "0", "##yr", "/", "yr", "(", "June", "+", "0", ".", "9", ";", "+", "23", ".", "6", ")" ], "ids": [ 40070, 11281, 113, 184, 14526, 114, 11112, 116, 121, 119, 125, 10147, 120, 181, 132, 10328, 119, 121, 20728, 120, 12590, 113, 11120, 116, 121, 119, 130, 132, 116, 10328, 119, 127, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PP", "##I", "(", "p", "##ct", ")", "June", "+", "0", ".", "7", "m", "/", "m", ";", "+", "21", ".", "5", "##yr", "/", "yr", "(", "May", "+", "1", ".", "7", ";", "+", "22", ".", "0", ")" ], "ids": [ 33428, 11281, 113, 184, 14526, 114, 11120, 116, 121, 119, 128, 181, 120, 181, 132, 116, 10296, 119, 126, 20728, 120, 12590, 113, 10725, 116, 122, 119, 128, 132, 116, 10306, 119, 121, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Industry", "output", "(", "p", "##ct", ")", "June", "-", "7", ".", "8", "m", "/", "m", ";", "-", "0", ".", "2", "##yr", "/", "yr", "(", "May", "+", "7", ".", "3", ";", "-", "3", ".", "6", ")" ], "ids": [ 25539, 37131, 113, 184, 14526, 114, 11120, 118, 128, 119, 129, 181, 120, 181, 132, 118, 121, 119, 123, 20728, 120, 12590, 113, 10725, 116, 128, 119, 124, 132, 118, 124, 119, 127, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Current", "account", "Jan", "-", "May", "-", "$", "738", "million", "(", "Jan", "-", "April", "-", "$", "748", "million", ")" ], "ids": [ 37293, 23200, 11806, 118, 10725, 118, 109, 75664, 12473, 113, 11806, 118, 10780, 118, 109, 67528, 12473, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NB", "##H", "trade", "balance", "Jan", "-", "May", "-", "$", "934", "million", "(", "Jan", "-", "April", "-", "$", "774", "million", ")" ], "ids": [ 89980, 12396, 18908, 40162, 11806, 118, 10725, 118, 109, 81765, 12473, 113, 11806, 118, 10780, 118, 109, 67668, 12473, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MIT", "trade", "balance", "Jan", "-", "June", "-", "$", "1", ".", "45", "bl", "##n", "(", "Jan", "-", "May", "-", "$", "1", ".", "24", "bl", "##n", ")" ], "ids": [ 31472, 18908, 40162, 11806, 118, 11120, 118, 109, 122, 119, 10827, 21484, 10115, 113, 11806, 118, 10725, 118, 109, 122, 119, 10233, 21484, 10115, 114 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gross", "foreign", "debt", "May", "$", "27", ",", "246", ".", "5", "million", "(", "April", "$", "28", ",", "716", ".", "8", "million", ")" ], "ids": [ 50557, 20796, 55869, 10725, 109, 10365, 117, 26439, 119, 126, 12473, 113, 10780, 109, 10348, 117, 67406, 119, 129, 12473, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "foreign", "debt", "May", "$", "14", ",", "390", ".", "7", "million", "(", "April", "$", "15", ",", "704", ".", "3", "million", ")" ], "ids": [ 32577, 20796, 55869, 10725, 109, 10247, 117, 28323, 119, 128, 12473, 113, 10780, 109, 10208, 117, 58083, 119, 124, 12473, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Une", "##mployment", "(", "p", "##ct", ")", "July", "10", ".", "8", "p", "##ct", "(", "June", "10", ".", "6", "p", "##ct", ")" ], "ids": [ 13509, 108472, 113, 184, 14526, 114, 11112, 10150, 119, 129, 184, 14526, 113, 11120, 10150, 119, 127, 184, 14526, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Budget", "deficit", "(", "H", "##UF", ")", "Jan", "-", "July", "102", "bl", "##n", "(", "Jan", "-", "June", "122", "bl", "##n", ")" ], "ids": [ 62967, 107383, 113, 145, 103104, 114, 11806, 118, 11112, 14818, 21484, 10115, 113, 11806, 118, 11120, 17484, 21484, 10115, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "-", "bill", "yield", "##s", "%", "(", "1", "##mo", ")", "22", ".", "95", "(", "3", "##mo", ")", "23", ".", "02", "(", "6", "##mo", ")", "23", ".", "53", "(", "1", "##yr", ")", "24", ".", "40" ], "ids": [ 157, 118, 34497, 95757, 10107, 110, 113, 122, 11033, 114, 10306, 119, 11978, 113, 124, 11033, 114, 10328, 119, 10983, 113, 127, 11033, 114, 10328, 119, 11756, 113, 122, 20728, 114, 10233, 119, 10533 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Government", "bond", "yield", "##s", ":", "(", "2", "-", "yr", "1998", "/", "J", ")", "25", ".", "49", ",", "(", "3", "-", "yr", "1999", "/", "c", ")", "24", ".", "44" ], "ids": [ 14581, 55185, 95757, 10107, 131, 113, 123, 118, 12590, 10363, 120, 147, 114, 10258, 119, 11580, 117, 113, 124, 118, 12590, 10324, 120, 171, 114, 10233, 119, 11126 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "NB", "##H", "is", "BB", "##B", "-", "minus", "by", "Duff", "&", "Phelps", ",", "IB", "##CA", "and", "Thomson", "Bank", "##W", "##at", "##ch", ",", "BB", "-", "plus", "by", "S", "&", "P", ",", "BA", "##1", "by", "Moody", "'", "s", "In", "##vestor", "##s", "Service", ",", "BB", "##B", "+", "by", "the", "Japan", "Credit", "Rat", "##ing", "Agency", "." ], "ids": [ 10117, 89980, 12396, 10124, 49622, 11274, 118, 84437, 10155, 75278, 111, 97041, 117, 110503, 46900, 10111, 25045, 13533, 13034, 10526, 10269, 117, 49622, 118, 10563, 10155, 156, 111, 153, 117, 39999, 10759, 10155, 64663, 112, 187, 10167, 83436, 10107, 13489, 117, 49622, 11274, 116, 10155, 10105, 11891, 75181, 29839, 10230, 21887, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "The", "NB", "##H", "trade", "data", "is", "based", "on", "cash", "flow", ",", "MIT", "data", "on", "customs", "statistics", "." ], "ids": [ 10117, 89980, 12396, 18908, 11165, 10124, 11610, 10135, 52828, 30676, 117, 31472, 11165, 10135, 89907, 36730, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Budapest", "news", "##room", "(", "36", "1", ")", "266", "241", "##0" ], "ids": [ 118, 118, 14745, 14424, 25525, 113, 11055, 122, 114, 28477, 23536, 10929 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fifty", "Russian", "##s", "die", "in", "c", "##lash", "with", "rebels", "-", "Inter", "##fa", "##x", "." ], "ids": [ 101757, 13463, 10107, 10128, 10106, 171, 25297, 10169, 57545, 118, 24362, 13369, 10686, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "22" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "50", "Russian", "service", "##men", "have", "been", "killed", "in", "a", "battle", "with", "separat", "##ist", "rebels", "which", "eru", "##pted", "in", "the", "Che", "##chen", "capital", "G", "##ro", "##zny", "on", "Thursday", "and", "continued", "after", "Russia", "and", "the", "rebels", "agreed", "a", "tr", "##uce", ",", "Inter", "##fa", "##x", "news", "agency", "said", "." ], "ids": [ 11699, 16298, 10462, 13463, 11989, 11418, 10529, 10590, 15875, 10106, 169, 18758, 10169, 81806, 11293, 57545, 10319, 18098, 64471, 10106, 10105, 44131, 11909, 12185, 144, 10567, 25424, 10135, 67067, 10111, 14278, 10662, 14664, 10111, 10105, 57545, 25577, 169, 32221, 24075, 117, 24362, 13369, 10686, 14424, 34649, 12415, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "##fa", "##x", "quoted", "Russian", "military", "command", "in", "Che", "##chny", "##a", "as", "saying", "that", "about", "200", "interior", "ministry", "forces", ",", "sent", "on", "re", "##cona", "##isance", "mission", ",", "c", "##lash", "##ed", "with", "rebels", "at", "Min", "##ut", "##ka", "Square", "." ], "ids": [ 24362, 13369, 10686, 70676, 13463, 14041, 20818, 10106, 44131, 95063, 10113, 10146, 22807, 10189, 10978, 10777, 14806, 65338, 13729, 117, 14541, 10135, 11639, 60017, 93498, 17032, 117, 171, 25297, 10336, 10169, 57545, 10160, 28291, 11159, 10371, 19465, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 7, 7, 9, 2, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "The", "Inter", "##fa", "##x", "report", "could", "not", "be", "independently", "confirmed", "." ], "ids": [ 10117, 24362, 13369, 10686, 17553, 12174, 10472, 10347, 74480, 27347, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Moscow", "peace", "##maker", "Alexander", "Le", "##bed", "and", "rebel", "chief", "-", "of", "-", "staff", "As", "##lan", "Mask", "##hado", "##v", "signed", "an", "agreement", "earlier", "on", "Thursday", "under", "which", "the", "two", "sides", "would", "cea", "##se", "all", "host", "##ilities", "at", "no", "##on", "(", "080", "##0", "GMT", ")", "on", "Friday", "." ], "ids": [ 18744, 28101, 32295, 12063, 10281, 33627, 10111, 56696, 19421, 118, 10108, 118, 18927, 10882, 12055, 69189, 54719, 10477, 14775, 10151, 25432, 18905, 10135, 67067, 10571, 10319, 10105, 10551, 27263, 10894, 25578, 10341, 10435, 19317, 83133, 10160, 10192, 10263, 113, 81051, 10929, 20362, 114, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "##fa", "##x", "made", "clear", "that", "the", "interior", "ministry", "det", "##achment", "had", "been", "sent", "on", "the", "mission", "before", "the", "tr", "##uce", "deal", "had", "been", "signed", "at", "the", "local", "equivalent", "of", "1500", "GMT", "." ], "ids": [ 24362, 13369, 10686, 11019, 24866, 10189, 10105, 14806, 65338, 10349, 58031, 10374, 10590, 14541, 10135, 10105, 17032, 11360, 10105, 32221, 24075, 19918, 10374, 10590, 14775, 10160, 10105, 11436, 30647, 10108, 13922, 20362, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "But", "fie", "##rce", "fighting", "still", "ra", "##ged", "at", "1600", "GMT", ",", "Inter", "##fa", "##x", "said", "." ], "ids": [ 16976, 29959, 31526, 27535, 12647, 11859, 18832, 10160, 16709, 20362, 117, 24362, 13369, 10686, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "It", "quoted", "a", "source", "in", "the", "Russian", "command", "in", "Che", "##chny", "##a", "as", "saying", "that", "the", "service", "##men", "were", "out", "##num", "##bere", "##d", "by", "the", "rebels", "." ], "ids": [ 10377, 70676, 169, 15247, 10106, 10105, 13463, 20818, 10106, 44131, 95063, 10113, 10146, 22807, 10189, 10105, 11989, 11418, 10309, 10950, 18991, 102410, 10162, 10155, 10105, 57545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Polish", "school", "##girl", "black", "##mail", "##er", "wanted", "text", "##books", "." ], "ids": [ 19870, 11393, 92507, 15045, 85505, 10165, 22591, 15541, 82108, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##DA", "##NS", "##K", ",", "Poland", "1996", "-", "08", "-", "22" ], "ids": [ 144, 36382, 69196, 11733, 117, 17879, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Polish", "school", "##girl", "black", "##mail", "##ed", "two", "women", "with", "ano", "##nymous", "letters", "threat", "##ening", "death", "and", "later", "explained", "that", "she", "needed", "money", "for", "text", "##books", ",", "police", "said", "on", "Thursday", "." ], "ids": [ 138, 19870, 11393, 92507, 15045, 85505, 10336, 10551, 13190, 10169, 12797, 66615, 26005, 41256, 24428, 12557, 10111, 10873, 44191, 10189, 10833, 23794, 17920, 10142, 15541, 82108, 117, 15034, 12415, 10135, 67067, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "13", "-", "year", "-", "old", "girl", "tried", "to", "extra", "##ct", "60", "and", "70", "z", "##loty", "##s", "(", "$", "22", "and", "$", "26", ")", "from", "two", "residents", "of", "Sie", "##rako", "##wice", "by", "threat", "##ening", "to", "take", "their", "lives", ",", "\"", "a", "police", "spoke", "##sman", "said", "in", "the", "nearby", "northern", "city", "of", "G", "##dans", "##k", "on", "Thursday", "." ], "ids": [ 107, 10117, 10249, 118, 10924, 118, 12898, 24699, 27156, 10114, 19868, 14526, 10709, 10111, 10923, 194, 103931, 10107, 113, 109, 10306, 10111, 109, 10314, 114, 10188, 10551, 22058, 10108, 11583, 63418, 46199, 10155, 41256, 24428, 10114, 13574, 10455, 21418, 117, 107, 169, 15034, 50005, 24305, 12415, 10106, 10105, 22301, 17335, 11584, 10108, 144, 86511, 10174, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "women", "reported", "the", "black", "##mail", "letters", "and", "police", "caught", "the", "girl", "on", "Wednesday", "as", "she", "tried", "to", "pick", "up", "the", "cash", "at", "the", "Sie", "##rako", "##wice", "railway", "station", "." ], "ids": [ 10357, 12415, 10105, 13190, 15943, 10105, 15045, 85505, 26005, 10111, 15034, 39797, 10105, 24699, 10135, 57611, 10146, 10833, 27156, 10114, 36833, 10741, 10105, 52828, 10160, 10105, 11583, 63418, 46199, 18271, 11825, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "\"", "Interview", "##ed", "in", "the", "presence", "of", "a", "ps", "##ych", "##ologist", ",", "she", "said", "she", "wanted", "to", "use", "the", "money", "for", "school", "books", "and", "clothes", ",", "\"", "spoke", "##sman", "Kazimierz", "Soc", "##ha", "told", "Reuters", "." ], "ids": [ 107, 27781, 10336, 10106, 10105, 25599, 10108, 169, 97764, 14950, 51940, 117, 10833, 12415, 10833, 22591, 10114, 11760, 10105, 17920, 10142, 11393, 15174, 10111, 89543, 117, 107, 50005, 24305, 44167, 23104, 10921, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 9 ] }, { "tokens": [ "He", "said", "the", "case", "of", "the", "girl", ",", "from", "a", "poor", "family", "that", "had", "never", "been", "in", "trouble", "with", "the", "law", ",", "would", "go", "before", "a", "special", "court", "dealing", "with", "under", "##age", "offen", "##ders", "." ], "ids": [ 10357, 12415, 10105, 13474, 10108, 10105, 24699, 117, 10188, 169, 23247, 11365, 10189, 10374, 14794, 10590, 10106, 58285, 10169, 10105, 13255, 117, 10894, 11783, 11360, 169, 14478, 14866, 73082, 10169, 10571, 12276, 84646, 25779, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Czech", "CN", "##B", "-", "120", "index", "rises", "1", ".", "2", "pt", "##s", "to", "869", ".", "3", "." ], "ids": [ 22148, 73067, 11274, 118, 12048, 19776, 91144, 122, 119, 123, 28756, 10107, 10114, 71612, 119, 124, 119 ], "entity": [ "B-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##AG", "##UE", "1996", "-", "08", "-", "22" ], "ids": [ 23837, 109865, 62674, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "CN", "##B", "-", "120", "index", ",", "a", "broad", "daily", "measure", "of", "Czech", "e", "##qui", "##ties", ",", "rose", "1", ".", "2", "points", "on", "Thursday", "to", "869", ".", "3", ",", "the", "Czech", "National", "Bank", "(", "CN", "##B", ")", "said", "." ], "ids": [ 10117, 73067, 11274, 118, 12048, 19776, 117, 169, 41848, 27636, 38713, 10108, 22148, 173, 39639, 14197, 117, 29467, 122, 119, 123, 12789, 10135, 67067, 10114, 71612, 119, 124, 117, 10105, 22148, 10655, 13533, 113, 73067, 11274, 114, 12415, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Eight", "of", "the", "ten", "sector", "##al", "indice", "##s", "rose", ",", "with", "the", "banking", "index", "rising", "the", "most", ",", "up", "14", ".", "4", "points", "to", "1", ",", "294", ".", "5", "." ], "ids": [ 43788, 10108, 10105, 11769, 17417, 10415, 75878, 10107, 29467, 117, 10169, 10105, 75703, 19776, 53816, 10105, 10992, 117, 10741, 10247, 119, 125, 12789, 10114, 122, 117, 33041, 119, 126, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Prague", "News", "##room", ",", "42", "-", "2", "-", "242", "##3", "-", "000", "##3" ], "ids": [ 118, 118, 33745, 12219, 25525, 117, 11276, 118, 123, 118, 27297, 10884, 118, 10259, 10884 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "##s", ",", "rebels", "sign", "deal", "in", "Che", "##chny", "##a", "." ], "ids": [ 13463, 10107, 117, 57545, 26794, 19918, 10106, 44131, 95063, 10113, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "NO", "##V", "##Y", "##E", "AT", "##AG", "##I", ",", "Russia", "1996", "-", "08", "-", "22" ], "ids": [ 49307, 11779, 14703, 11259, 30554, 109865, 11281, 117, 14664, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "President", "Boris", "Ye", "##lts", "##in", "'", "s", "security", "su", "##prem", "##o", "Alexander", "Le", "##bed", "and", "Che", "##chen", "rebel", "chief", "-", "of", "-", "staff", "As", "##lan", "Mask", "##hado", "##v", "signed", "a", "deal", "on", "Thursday", "aimed", "at", "ending", "three", "weeks", "of", "renewed", "fighting", "in", "the", "region", "." ], "ids": [ 13463, 12811, 21463, 20567, 72847, 10245, 112, 187, 21849, 10198, 110327, 10133, 12063, 10281, 33627, 10111, 44131, 11909, 56696, 19421, 118, 10108, 118, 18927, 10882, 12055, 69189, 54719, 10477, 14775, 169, 19918, 10135, 67067, 53004, 10160, 29077, 11003, 20750, 10108, 81783, 27535, 10106, 10105, 12220, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 2, 6, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "final", "contents", "of", "the", "document", "nego", "##tia", "##ted", "in", "this", "village", "south", "of", "the", "Che", "##chen", "capital", "G", "##ro", "##zny", "have", "not", "been", "officially", "disc", "##lose", "##d", "." ], "ids": [ 10117, 11070, 97831, 10108, 10105, 25166, 21134, 16180, 11912, 10106, 10531, 11607, 13144, 10108, 10105, 44131, 11909, 12185, 144, 10567, 25424, 10529, 10472, 10590, 23296, 27224, 46614, 10162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "##ar", "-", "Tas", "##s", "news", "agency", "said", "it", "provided", "for", "the", "dis", "##enga", "##gement", "of", "Russian", "and", "rebel", "forces", "in", "Che", "##chny", "##a", "." ], "ids": [ 10377, 10354, 118, 57387, 10107, 14424, 34649, 12415, 10271, 16491, 10142, 10105, 27920, 97817, 54050, 10108, 13463, 10111, 56696, 13729, 10106, 44131, 95063, 10113, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Le", "##bed", "aide", "says", "Russian", "-", "Che", "##chen", "talks", "going", "well", "." ], "ids": [ 10281, 33627, 23135, 22153, 13463, 118, 44131, 11909, 56672, 19090, 11206, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##V", "##Y", "##E", "AT", "##AG", "##I", ",", "Russia", "1996", "-", "08", "-", "22" ], "ids": [ 49307, 11779, 14703, 11259, 30554, 109865, 11281, 117, 14664, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Talk", "##s", "between", "Russia", "'", "s", "Alexander", "Le", "##bed", "and", "Che", "##chen", "separat", "##ist", "leaders", "were", "going", "well", "on", "Thursday", "and", "the", "two", "sides", "were", "working", "out", "a", "detailed", "schedule", "on", "how", "to", "stop", "the", "war", ",", "a", "Le", "##bed", "aide", "said", "." ], "ids": [ 32003, 10107, 10948, 14664, 112, 187, 12063, 10281, 33627, 10111, 44131, 11909, 81806, 11293, 24155, 10309, 19090, 11206, 10135, 67067, 10111, 10105, 10551, 27263, 10309, 14616, 10950, 169, 47368, 52561, 10135, 14796, 10114, 20517, 10105, 10338, 117, 169, 10281, 33627, 23135, 12415, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Press", "spoke", "##sman", "Alexander", "Bar", "##kha", "##tov", "told", "reporter", "##s", "the", "negotiations", ",", "being", "held", "at", "this", "rebel", "-", "held", "village", "some", "20", "km", "(", "12", "miles", ")", "south", "of", "the", "Che", "##chen", "capital", "G", "##ro", "##zny", ",", "were", "progress", "##ing", "br", "##isk", "##ly", "and", "being", "conducted", "in", "a", "good", "mo", "##od", "." ], "ids": [ 10568, 50005, 24305, 12063, 20698, 77639, 50996, 21937, 41408, 10107, 10105, 61946, 117, 11223, 11991, 10160, 10531, 56696, 118, 11991, 11607, 11152, 10197, 10204, 113, 10186, 14148, 114, 13144, 10108, 10105, 44131, 11909, 12185, 144, 10567, 25424, 117, 10309, 40316, 10230, 33989, 14362, 10454, 10111, 11223, 23736, 10106, 169, 15198, 46912, 12680, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "a", "document", "would", "be", "completed", "in", "an", "hour", "'", "s", "time", "for", "signature", "by", "the", "two", "sides", ",", "who", "were", "working", "on", "a", "\"", "day", "-", "by", "-", "day", "schedule", "to", "stop", "the", "war", "in", "Che", "##chny", "##a", ".", "\"" ], "ids": [ 10357, 12415, 169, 25166, 10894, 10347, 15782, 10106, 10151, 24730, 112, 187, 10635, 10142, 44852, 10155, 10105, 10551, 27263, 117, 10479, 10309, 14616, 10135, 169, 107, 11940, 118, 10155, 118, 11940, 52561, 10114, 20517, 10105, 10338, 10106, 44131, 95063, 10113, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", "shown", "on", "Russian", "television", "." ], "ids": [ 20567, 72847, 10245, 19989, 10135, 13463, 14162, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 2, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "22" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "television", "showed", "a", "brief", "clip", "of", "Boris", "Ye", "##lts", "##in", "on", "Thursday", ",", "with", "the", "president", "lau", "##ghing", "and", "sm", "##iling", "as", "he", "spoke", "to", "nominee", "health", "minister", "Tat", "##yana", "Dmitri", "##eva", "." ], "ids": [ 13463, 14162, 27463, 169, 29040, 48545, 10108, 21463, 20567, 72847, 10245, 10135, 67067, 117, 10169, 10105, 12931, 27207, 90427, 10111, 39709, 64118, 10146, 10261, 50005, 10114, 81878, 17004, 16930, 86561, 31523, 59429, 18085, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "It", "was", "the", "first", "time", "the", "president", "had", "been", "shown", "on", "television", "since", "he", "was", "inaugurated", "for", "a", "second", "term", "in", "office", "on", "August", "9", "." ], "ids": [ 10377, 10134, 10105, 10422, 10635, 10105, 12931, 10374, 10590, 19989, 10135, 14162, 11764, 10261, 10134, 99911, 10142, 169, 11132, 13719, 10106, 14301, 10135, 10735, 130, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "returned", "to", "the", "Kr", "##emlin", "on", "Thursday", "after", "a", "two", "-", "day", "break", "in", "the", "lake", "##lands", "of", "northwestern", "Russia", "." ], "ids": [ 10357, 14030, 10114, 10105, 17640, 110169, 10135, 67067, 10662, 169, 10551, 118, 11940, 24194, 10106, 10105, 24923, 18425, 10108, 89929, 14664, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Bosnia", "-", "Aug", "22", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 29634, 118, 53012, 10306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "SAR", "##A", "##J", "##E", "##VO", "1996", "-", "08", "-", "22" ], "ids": [ 97404, 10738, 15417, 11259, 70325, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "the", "leading", "stories", "in", "the", "Sarajevo", "press", "on", "Thursday", "." ], "ids": [ 13252, 10301, 10105, 16018, 21158, 10106, 10105, 21402, 21040, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OS", "##L", "##O", "##B", "##OD", "##J", "##EN", "##J", "##E" ], "ids": [ 18398, 11369, 11403, 11274, 77836, 15417, 50655, 15417, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "The", "Bosnia", "##n", "fede", "##ration", "launch", "##es", "a", "common", "payment", "system", "on", "Friday", "." ], "ids": [ 118, 10117, 29634, 10115, 83482, 19466, 29227, 10171, 169, 14624, 67701, 11787, 10135, 30767, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Under", "the", "new", "system", "taxes", "and", "customs", "may", "be", "paid", "in", "the", "Bosnia", "##n", "dina", "##r", ",", "the", "Croatian", "kuna", "or", "the", "Deutsche", "mark", "until", "a", "new", "Bosnia", "##n", "currency", "is", "introduced", "." ], "ids": [ 12594, 10105, 10751, 11787, 49870, 10111, 89907, 11387, 10347, 25938, 10106, 10105, 29634, 10115, 21641, 10129, 117, 10105, 48963, 39301, 10345, 10105, 15389, 29221, 11444, 169, 10751, 29634, 10115, 83759, 10124, 17037, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "-", "The", "president", "of", "the", "Bosnia", "##n", "Association", "for", "Re", "##fuge", "##es", "and", "Dis", "##placed", "Person", "##s", ",", "Mir", "##hun", "##isa", "Kom", "##ari", "##ca", "says", "many", "survivors", "of", "the", "1995", "massacre", "in", "the", "Bosnia", "##n", "town", "of", "Sr", "##ebre", "##nica", "are", "lang", "##uis", "##hing", "as", "forced", "labor", "##ers", "in", "Serbian", "mines", "." ], "ids": [ 118, 10117, 12931, 10108, 10105, 29634, 10115, 11751, 10142, 20304, 101935, 10171, 10111, 101270, 93570, 30325, 10107, 117, 43209, 35931, 19403, 106306, 12476, 10425, 22153, 11299, 81690, 10108, 10105, 10436, 53810, 10106, 10105, 29634, 10115, 12221, 10108, 26064, 100657, 14134, 10301, 12603, 31466, 30809, 10146, 20054, 27605, 10901, 10106, 37952, 33601, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "According", "to", "Kom", "##ari", "##ca", ",", "2", ",", "400", "male", "residents", "of", "Sr", "##ebre", "##nica", "work", "in", "the", "Tre", "##p", "##ca", "mine", "and", "1", ",", "900", "work", "in", "a", "mine", "in", "Aleksandr", "##ovac", "." ], "ids": [ 14156, 10114, 106306, 12476, 10425, 117, 123, 117, 11176, 17416, 22058, 10108, 26064, 100657, 14134, 11424, 10106, 10105, 30932, 10410, 10425, 27546, 10111, 122, 117, 13545, 11424, 10106, 169, 27546, 10106, 29027, 84627, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "D", "##NE", "##V", "##NI", "AV", "##A", "##Z" ], "ids": [ 141, 93280, 11779, 52898, 49932, 10738, 13966 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Slovenia", "##n", "police", "briefly", "det", "##ain", "two", "Bosnia", "##n", "opposition", "leaders", "in", "Ljubljana", "and", "can", "##cel", "opposition", "political", "ra", "##lli", "##es", "in", "Ljubljana", "and", "Maribor", "." ], "ids": [ 118, 34583, 10115, 15034, 36327, 10349, 18073, 10551, 29634, 10115, 21227, 24155, 10106, 30768, 10111, 10944, 32942, 21227, 13736, 11859, 14088, 10171, 10106, 30768, 10111, 74077, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "-", "-", "Sarajevo", "news", "##room", ",", "+", "387", "-", "71", "-", "663", "-", "864", "." ], "ids": [ 118, 118, 21402, 14424, 25525, 117, 116, 32697, 118, 12513, 118, 66760, 118, 70118, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##ro", "##zny", "quiet", "over", "##night", "after", "raids", "." ], "ids": [ 144, 10567, 25424, 104951, 10491, 45217, 10662, 77939, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AL", "##K", "##HA", "##N", "-", "Y", "##UR", "##T", ",", "Russia", "1996", "-", "08", "-", "22" ], "ids": [ 47271, 11733, 58132, 11537, 118, 162, 98348, 11090, 117, 14664, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "city", "of", "G", "##ro", "##zny", ",", "pound", "##ed", "by", "Russian", "planes", "and", "artillery", "for", "hours", "on", "Wednesday", ",", "cal", "##med", "down", "over", "##night", ",", "although", "spor", "##adi", "##c", "explosion", "##s", "and", "shooting", "could", "still", "be", "heard", "." ], "ids": [ 10117, 11584, 10108, 144, 10567, 25424, 117, 99233, 10336, 10155, 13463, 39972, 10111, 46524, 10142, 19573, 10135, 57611, 117, 25923, 21986, 12935, 10491, 45217, 117, 14779, 40458, 18974, 10350, 53021, 10107, 10111, 38969, 12174, 12647, 10347, 32240, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "correspondent", "Lawrence", "She", "##ets", ",", "speaking", "from", "the", "nearby", "village", "of", "Al", "##kha", "##n", "-", "Yu", "##rt", ",", "said", "he", "had", "heard", "little", "from", "G", "##ro", "##zny", "since", "Wednesday", "evening", "'", "s", "arrival", "of", "Russian", "security", "chief", "Alexander", "Le", "##bed", ",", "who", "said", "he", "\"", "came", "with", "peace", "\"", "." ], "ids": [ 46617, 70503, 16198, 11149, 17137, 117, 33740, 10188, 10105, 22301, 11607, 10108, 10883, 77639, 10115, 118, 19387, 10976, 117, 12415, 10261, 10374, 32240, 16745, 10188, 144, 10567, 25424, 11764, 57611, 42135, 112, 187, 40285, 10108, 13463, 21849, 19421, 12063, 10281, 33627, 117, 10479, 12415, 10261, 107, 13383, 10169, 28101, 107, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "couple", "of", "helicopter", "##s", "flew", "over", "the", "city", "early", "on", "Thursday", "morning", ",", "but", "did", "not", "appear", "to", "be", "firing", "at", "anything", "." ], "ids": [ 138, 20969, 10108, 80634, 10107, 64284, 10491, 10105, 11584, 11732, 10135, 67067, 28757, 117, 10473, 12172, 10472, 22641, 10114, 10347, 68573, 10160, 42819, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Le", "##bed", "said", "on", "Wednesday", "he", "had", "c", "##lin", "##ched", "a", "tr", "##uce", "with", "Che", "##chen", "separat", "##ists", "and", "he", "promised", "to", "halt", "a", "threatened", "bombing", "assault", "on", "G", "##ro", "##zny", ",", "which", "the", "rebels", "have", "held", "since", "August", "6", "." ], "ids": [ 10281, 33627, 12415, 10135, 57611, 10261, 10374, 171, 13020, 35456, 169, 32221, 24075, 10169, 44131, 11909, 81806, 18206, 10111, 10261, 77137, 10114, 59334, 169, 44593, 67011, 50150, 10135, 144, 10567, 25424, 117, 10319, 10105, 57545, 10529, 11991, 11764, 10735, 127, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Boat", "passengers", "rescued", "off", "Colombia", "##n", "coast", "." ], "ids": [ 53627, 37008, 106435, 11898, 15223, 10115, 22216, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "B", "##O", "##GO", "##TA", ",", "Colombia", "1996", "-", "08", "-", "22" ], "ids": [ 139, 11403, 83821, 24951, 117, 15223, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colombia", "'", "s", "Coast", "Guard", "on", "Thursday", "rescued", "12", "people", "lost", "for", "three", "days", "in", "an", "open", "boat", "off", "the", "Pacific", "coast", ",", "officials", "said", "." ], "ids": [ 15223, 112, 187, 17498, 28739, 10135, 67067, 106435, 10186, 11426, 14172, 10142, 11003, 13990, 10106, 10151, 14087, 30418, 11898, 10105, 14597, 22216, 117, 27730, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "boat", "had", "been", "missing", "since", "Monday", "afternoon", "when", "it", "left", "the", "tin", "##y", "island", "of", "Go", "##rgo", "##na", "off", "Colombia", "'", "s", "southwest", "coast", "with", "sight", "##see", "##rs", "for", "a", "return", "trip", "to", "Na", "##rino", "province", ",", "near", "the", "border", "with", "Ecuador", "." ], "ids": [ 10117, 30418, 10374, 10590, 39542, 11764, 40714, 73213, 10841, 10271, 12153, 10105, 21629, 10157, 17354, 10108, 14439, 69518, 10219, 11898, 15223, 112, 187, 37297, 22216, 10169, 78327, 20262, 10943, 10142, 169, 15079, 37307, 10114, 10685, 28540, 14342, 117, 12883, 10105, 20949, 10169, 20475, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "boat", "ran", "out", "of", "fuel", "and", "did", "not", "have", "a", "radio", "to", "call", "for", "help", ",", "Navy", "spoke", "##sman", "Lt", ".", "Italo", "Pine", "##da", "said", "." ], "ids": [ 10117, 30418, 17044, 10950, 10108, 30550, 10111, 12172, 10472, 10529, 169, 12429, 10114, 20575, 10142, 15217, 117, 14780, 50005, 24305, 45684, 119, 102171, 45427, 10229, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "He", "said", "11", "passengers", "and", "one", "boat", "##man", "survived", "on", "co", "##con", "##uts", "and", "rain", "##water", "during", "65", "hours", "lost", "at", "sea", "." ], "ids": [ 10357, 12415, 10193, 37008, 10111, 10464, 30418, 10589, 37035, 10135, 11170, 23486, 33876, 10111, 50939, 21099, 10939, 10843, 19573, 14172, 10160, 14931, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "boat", "was", "to", "##wed", "to", "the", "port", "city", "of", "Buena", "##ventura", "." ], "ids": [ 10117, 30418, 10134, 10114, 48854, 10114, 10105, 16874, 11584, 10108, 71436, 100817, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Argentine", "July", "raw", "steel", "output", "up", "14", ".", "8", "p", "##ct", "vs", "'", "95", "." ], "ids": [ 31469, 11112, 78444, 28605, 37131, 10741, 10247, 119, 129, 184, 14526, 14987, 112, 11978, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UE", "##NO", "##S", "AI", "##RE", "##S", "1996", "-", "08", "-", "22" ], "ids": [ 139, 62674, 67292, 10731, 62405, 66014, 10731, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Argentine", "raw", "steel", "output", "was", "355", ",", "900", "tonnes", "in", "July", ",", "14", ".", "8", "percent", "higher", "than", "in", "July", "1995", "and", "up", "1", ".", "9", "percent", "from", "June", ",", "Steel", "Industry", "Center", "said", "Thursday", "." ], "ids": [ 31469, 78444, 28605, 37131, 10134, 33195, 117, 13545, 39435, 10106, 11112, 117, 10247, 119, 129, 22362, 17981, 11084, 10106, 11112, 10436, 10111, 10741, 122, 119, 130, 22362, 10188, 11120, 117, 27450, 25539, 11719, 12415, 67067, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Primary", "iron", "output", "was", "297", ",", "700", "tonnes", ",", "14", ".", "5", "percent", "more", "than", "last", "July", "and", "0", ".", "1", "percent", "more", "than", "in", "June", "." ], "ids": [ 20863, 32374, 37131, 10134, 29469, 117, 12367, 39435, 117, 10247, 119, 126, 22362, 10798, 11084, 12469, 11112, 10111, 121, 119, 122, 22362, 10798, 11084, 10106, 11120, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hot", "la", "##minat", "##e", "production", "was", "349", ",", "000", "tonnes", ",", "3", ".", "2", "percent", "up", "from", "July", "1995", "and", "0", ".", "8", "percent", "up", "from", "June", "." ], "ids": [ 14091, 10109, 104130, 10112, 12116, 10134, 37633, 117, 10259, 39435, 117, 124, 119, 123, 22362, 10741, 10188, 11112, 10436, 10111, 121, 119, 129, 22362, 10741, 10188, 11120, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Production", "of", "cold", "la", "##minat", "##es", "was", "120", ",", "500", "tonnes", ",", "4", ".", "2", "percent", "higher", "than", "the", "same", "month", "last", "year", "and", "11", "percent", "higher", "than", "in", "June", "." ], "ids": [ 20769, 10108, 41626, 10109, 104130, 10171, 10134, 12048, 117, 10757, 39435, 117, 125, 119, 123, 22362, 17981, 11084, 10105, 11561, 14064, 12469, 10924, 10111, 10193, 22362, 17981, 11084, 10106, 11120, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Jason", "Webb", ",", "Buenos", "Aires", "News", "##room", "+", "541", "318", "-", "06", "##55" ], "ids": [ 118, 118, 16796, 34923, 117, 13929, 13960, 12219, 25525, 116, 49172, 30670, 118, 10719, 99555 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peru", "'", "s", "guerrilla", "##s", "kill", "one", ",", "take", "8", "host", "##age", "in", "jungle", "." ], "ids": [ 18158, 112, 187, 106552, 10107, 32099, 10464, 117, 13574, 129, 19317, 12276, 10106, 104783, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IM", "##A", ",", "Peru", "1996", "-", "08", "-", "21" ], "ids": [ 149, 42031, 10738, 117, 18158, 10389, 118, 11052, 118, 10296 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peru", "##vian", "guerrilla", "##s", "killed", "one", "man", "and", "took", "eight", "people", "host", "##age", "after", "taking", "over", "a", "village", "in", "the", "country", "'", "s", "northeastern", "jungle", "region", ",", "anti", "-", "terrorist", "police", "sources", "said", "on", "Wednesday", "." ], "ids": [ 18158, 66868, 106552, 10107, 15875, 10464, 10817, 10111, 12149, 16222, 11426, 19317, 12276, 10662, 18084, 10491, 169, 11607, 10106, 10105, 12723, 112, 187, 81029, 104783, 12220, 117, 14249, 118, 76482, 15034, 19023, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "three", "hours", "on", "Tuesday", ",", "around", "100", "members", "of", "the", "Mao", "##ist", "rebel", "group", "Shining", "Path", "took", "control", "of", "Al", "##ome", "##lla", "Rob", "##les", ",", "a", "small", "village", "about", "345", "miles", "(", "550", "km", ")", "northeast", "of", "Lima", ",", "the", "sources", "said", "." ], "ids": [ 11399, 11003, 19573, 10135, 70245, 117, 12166, 10407, 12464, 10108, 10105, 32339, 11293, 56696, 11795, 107099, 66339, 12149, 12608, 10108, 10883, 22451, 11083, 20386, 11268, 117, 169, 12474, 11607, 10978, 30287, 14148, 113, 20676, 10204, 114, 33002, 10108, 18671, 117, 10105, 19023, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 3, 7, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "guerrilla", "##s", "made", "village", "##rs", "listen", "to", "propaganda", "speech", "##es", "in", "the", "village", "centre", ",", "others", "forced", "passing", "motori", "##sts", "out", "of", "their", "cars", "and", "dau", "##bed", "their", "vehicles", "with", "slogan", "##s", "." ], "ids": [ 13885, 106552, 10107, 11019, 11607, 10943, 55129, 10114, 34510, 29811, 10171, 10106, 10105, 11607, 12672, 117, 14633, 20054, 33389, 62424, 28036, 10950, 10108, 10455, 24602, 10111, 24902, 33627, 10455, 27237, 10169, 68732, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "By", "Wednesday", ",", "the", "where", "##abo", "##uts", "of", "the", "eight", "host", "##ages", "was", "still", "not", "known", ",", "the", "sources", "said", "." ], "ids": [ 12716, 57611, 117, 10105, 10940, 90276, 33876, 10108, 10105, 16222, 19317, 24115, 10134, 12647, 10472, 11053, 117, 10105, 19023, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "recent", "months", "the", "Shining", "Path", ",", "severely", "weak", "##ened", "since", "the", "1992", "capture", "of", "its", "leader", "Abi", "##mael", "G", "##uz", "##man", ",", "has", "been", "step", "##ping", "up", "both", "its", "military", "and", "propaganda", "activities", "." ], "ids": [ 10167, 19037, 15555, 10105, 107099, 66339, 117, 77464, 61285, 27867, 11764, 10105, 10450, 32083, 10108, 10474, 15014, 101604, 92212, 144, 20498, 10589, 117, 10393, 10590, 31877, 15398, 10741, 11408, 10474, 14041, 10111, 34510, 19286, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peru", "'", "s", "guerrilla", "conflicts", "have", "cost", "at", "least", "30", ",", "000", "lives", "and", "$", "25", "billion", "in", "damage", "to", "infrastructure", "since", "1980", "." ], "ids": [ 18158, 112, 187, 106552, 83594, 10529, 18849, 10160, 16298, 10244, 117, 10259, 21418, 10111, 109, 10258, 25848, 10106, 26115, 10114, 44284, 11764, 10538, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "Sur", "##inam", "rebel", "leader", "held", "after", "shooting", "." ], "ids": [ 42355, 14453, 98988, 56696, 15014, 11991, 10662, 38969, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RA", "##MA", "##RI", "##B", "##O", ",", "Sur", "##inam", "1996", "-", "08", "-", "21" ], "ids": [ 32349, 29990, 30696, 46876, 11274, 11403, 117, 14453, 98988, 10389, 118, 11052, 118, 10296 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fl", "##am", "##boy", "##ant", "former", "Suriname", "##se", "rebel", "leader", "Ron", "##ny", "Brun", "##s", "##wijk", "was", "in", "custody", "on", "Wednesday", "charged", "with", "attempted", "murder", ",", "police", "said", "." ], "ids": [ 29981, 11008, 40825, 11236, 11775, 60671, 10341, 56696, 15014, 20368, 10756, 102877, 10107, 42727, 10134, 10106, 103772, 10135, 57611, 38253, 10169, 30881, 29448, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brun", "##s", "##wijk", "turned", "himself", "into", "police", "after", "Freddy", "Pin", "##as", ",", "a", "Suriname", "##se", "-", "born", "visit", "##or", "from", "the", "Netherlands", ",", "accused", "Brun", "##s", "##wijk", "of", "trying", "to", "kill", "him", "on", "Sunday", "after", "a", "bar", "-", "room", "bra", "##wl", "in", "the", "small", "mining", "town", "of", "Moe", "##ngo", ",", "about", "56", "miles", "(", "90", "km", ")", "east", "of", "Para", "##mari", "##bo", ",", "said", "police", "spoke", "##sman", "R", "##o", "Ga", "##jad", "##har", "." ], "ids": [ 102877, 10107, 42727, 21031, 14764, 10708, 15034, 10662, 52358, 74325, 10403, 117, 169, 60671, 10341, 118, 11175, 27541, 10667, 10188, 10105, 22043, 117, 37303, 102877, 10107, 42727, 10108, 32862, 10114, 32099, 10957, 10135, 19731, 10662, 169, 18121, 118, 19555, 67603, 37676, 10106, 10105, 12474, 32802, 12221, 10108, 80790, 32448, 117, 10978, 11628, 14148, 113, 10919, 10204, 114, 13827, 10108, 13497, 65899, 11790, 117, 12415, 15034, 50005, 24305, 155, 10133, 69699, 55415, 18387, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Pin", "##as", ",", "showing", "cuts", "and", "br", "##uise", "##s", "on", "his", "face", ",", "told", "reporter", "##s", "the", "former", "head", "of", "the", "fear", "##ed", "Jungle", "Command", "had", "tried", "and", "failed", "to", "shoot", "him", "after", "Pin", "##as", "objecte", "##d", "to", "Brun", "##s", "##wijk", "'", "s", "advances", "toward", "his", "wife", "." ], "ids": [ 74325, 10403, 117, 37501, 73311, 10111, 33989, 100976, 10107, 10135, 10226, 13295, 117, 21937, 41408, 10107, 10105, 11775, 13578, 10108, 10105, 44929, 10336, 46927, 23945, 10374, 27156, 10111, 20775, 10114, 53839, 10957, 10662, 74325, 10403, 94853, 10162, 10114, 102877, 10107, 42727, 112, 187, 105689, 32216, 10226, 14384, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pin", "##as", "said", "Brun", "##s", "##wijk", "then", "ordered", "his", "body", "##guard", "##s", "to", "beat", "him", "up", "." ], "ids": [ 74325, 10403, 12415, 102877, 10107, 42727, 11059, 23782, 10226, 14333, 80928, 10107, 10114, 27868, 10957, 10741, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brun", "##s", "##wijk", ",", "35", ",", "denied", "the", "charges", "and", "said", "he", "had", "merely", "defended", "himself", "when", "Pin", "##as", "attacked", "him", "with", "a", "bot", "##tle", "." ], "ids": [ 102877, 10107, 42727, 117, 10803, 117, 47467, 10105, 31128, 10111, 12415, 10261, 10374, 70807, 63798, 14764, 10841, 74325, 10403, 30272, 10957, 10169, 169, 41960, 16406, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "the", "second", "time", "Brun", "##s", "##wijk", "had", "been", "charged", "with", "attempted", "murder", "in", "less", "than", "two", "years", "." ], "ids": [ 10377, 10134, 10105, 11132, 10635, 102877, 10107, 42727, 10374, 10590, 38253, 10169, 30881, 29448, 10106, 15306, 11084, 10551, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "1994", "he", "served", "two", "months", "in", "prison", "for", "shooting", "a", "thi", "##ef", "in", "the", "but", "##tock", "##s", "." ], "ids": [ 10167, 10444, 10261, 12325, 10551, 15555, 10106, 20538, 10142, 38969, 169, 24106, 16822, 10106, 10105, 10473, 60458, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brun", "##s", "##wijk", "led", "a", "rebel", "group", "of", "about", "1", ",", "000", "in", "a", "1986", "up", "##rising", "against", "the", "regime", "of", "military", "strong", "##man", "Des", "##i", "Bou", "##ters", "##e", "." ], "ids": [ 102877, 10107, 42727, 12857, 169, 56696, 11795, 10108, 10978, 122, 117, 10259, 10106, 169, 10578, 10741, 70904, 11327, 10105, 24807, 10108, 14041, 18093, 10589, 13810, 10116, 62583, 21891, 10112, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "The", "conflict", ",", "which", "killed", "more", "than", "500", "and", "caused", "thousands", "to", "fl", "##ee", "to", "neighbouring", "French", "Guiana", "in", "the", "late", "1980s", ",", "eventually", "pave", "##d", "the", "way", "to", "democratic", "elections", "in", "1991", "." ], "ids": [ 10117, 24620, 117, 10319, 15875, 10798, 11084, 10757, 10111, 19513, 39966, 10114, 58768, 13321, 10114, 79475, 11894, 94882, 10106, 10105, 13002, 21215, 117, 16328, 102731, 10162, 10105, 13170, 10114, 72209, 22054, 10106, 10442, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Despite", "numerous", "problems", "with", "authorities", ",", "Brun", "##s", "##wijk", "went", "on", "to", "become", "a", "successful", "businessman", "with", "mining", "and", "log", "##ging", "interests", "." ], "ids": [ 21230, 19083, 20390, 10169, 28308, 117, 102877, 10107, 42727, 13446, 10135, 10114, 13461, 169, 17330, 49910, 10169, 32802, 10111, 49316, 13808, 36026, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "also", "manages", "and", "occasionally", "plays", "for", "one", "of", "the", "leading", "local", "soccer", "teams", "." ], "ids": [ 10357, 10379, 75923, 10111, 45905, 17724, 10142, 10464, 10108, 10105, 16018, 11436, 41356, 14404, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Noi", "##sy", "saw", "leads", "Thai", "police", "to", "hero", "##in", "hide", "##away", "." ], "ids": [ 105412, 16105, 17112, 34868, 26207, 15034, 10114, 51670, 10245, 96935, 38249, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##NG", "##KO", "##K", "1996", "-", "08", "-", "22" ], "ids": [ 39999, 34065, 57277, 11733, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Hong", "Kong", "car", "##pente", "##r", "was", "arrested", "in", "the", "Thai", "seas", "##ide", "town", "of", "Pat", "##tay", "##a", "after", "police", "seized", "18", "kg", "(", "39", ".", "7", "pounds", ")", "of", "hero", "##in", "following", "com", "##plaints", "by", "residents", "of", "a", "noi", "##sy", "saw", ",", "police", "said", "on", "Thursday", "." ], "ids": [ 138, 15078, 14577, 13000, 103115, 10129, 10134, 29479, 10106, 10105, 26207, 63856, 13315, 12221, 10108, 24714, 47134, 10113, 10662, 15034, 80176, 10218, 11895, 113, 11303, 119, 128, 61982, 114, 10108, 51670, 10245, 11901, 10212, 104221, 10155, 22058, 10108, 169, 37390, 16105, 17112, 117, 15034, 12415, 10135, 67067, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Che", "##ung", "Si", "##u", "Man", ",", "40", ",", "was", "arrested", "late", "on", "Wednesday", "after", "police", "search", "##ed", "a", "house", "and", "found", "hero", "##in", "in", "bag", "##s", "and", "hidden", "in", "holl", "##ow", "spaces", "in", "wooden", "plan", "##ks", ",", "police", "said", "." ], "ids": [ 44131, 10716, 11741, 10138, 11343, 117, 10533, 117, 10134, 29479, 13002, 10135, 57611, 10662, 15034, 22419, 10336, 169, 13215, 10111, 11823, 51670, 10245, 10106, 56332, 10107, 10111, 57786, 10106, 46232, 16602, 54450, 10106, 43678, 13065, 11676, 117, 15034, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "suspect", "said", "he", "was", "hired", "to", "make", "a", "wooden", "box", "from", "the", "plan", "##ks", "in", "order", "to", "hide", "the", "hero", "##in", "." ], "ids": [ 10117, 97881, 12415, 10261, 10134, 35444, 10114, 13086, 169, 43678, 21509, 10188, 10105, 13065, 11676, 10106, 12990, 10114, 96935, 10105, 51670, 10245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "went", "to", "the", "house", "after", "receiving", "com", "##plaints", "of", "saw", "##ing", "during", "the", "night", "over", "the", "course", "of", "several", "days", "." ], "ids": [ 18051, 13446, 10114, 10105, 13215, 10662, 31391, 10212, 104221, 10108, 17112, 10230, 10939, 10105, 16903, 10491, 10105, 15348, 10108, 11736, 13990, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "they", "arrived", "to", "investigate", ",", "police", "saw", "people", "es", "##cap", "##ing", "from", "the", "back", "door", "so", "they", "decided", "to", "search", "the", "house", "." ], "ids": [ 12242, 10689, 22584, 10114, 78189, 117, 15034, 17112, 11426, 10196, 93103, 10230, 10188, 10105, 12014, 10522, 10380, 10689, 17270, 10114, 22419, 10105, 13215, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "seized", "hero", "##in", "has", "an", "estimated", "street", "value", "of", "about", "300", "million", "ba", "##ht", "(", "$", "12", "million", ")", ",", "police", "said", "." ], "ids": [ 10117, 80176, 51670, 10245, 10393, 10151, 25267, 23840, 19211, 10108, 10978, 11093, 12473, 15688, 13599, 113, 109, 10186, 12473, 114, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Official", "##s", "are", "now", "hunting", "for", "the", "suspect", "'", "s", "coll", "##abo", "##rators", ",", "police", "said", "." ], "ids": [ 17678, 10107, 10301, 11858, 57232, 10142, 10105, 97881, 112, 187, 28552, 90276, 94721, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Che", "##ung", "was", "being", "det", "##ained", "pen", "##ding", "formal", "charges", ",", "police", "said", "." ], "ids": [ 44131, 10716, 10134, 11223, 10349, 65804, 66558, 13971, 23129, 31128, 117, 15034, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", "foreign", "minister", "arrives", "in", "China", "." ], "ids": [ 11729, 20796, 16930, 69631, 10106, 11593, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "22" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australian", "Foreign", "Minister", "Alexander", "Down", "##er", "arrived", "in", "Beijing", "on", "Thursday", "for", "a", "four", "-", "day", "visit", "that", "follows", "rising", "fri", "##ction", "between", "the", "two", "nations", "in", "recent", "weeks", "." ], "ids": [ 12829, 20277, 14355, 12063, 16005, 10165, 22584, 10106, 23824, 10135, 67067, 10142, 169, 11598, 118, 11940, 27541, 10189, 23698, 53816, 35350, 17530, 10948, 10105, 10551, 30683, 10106, 19037, 20750, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Down", "##er", "was", "to", "meet", "Chinese", "Foreign", "Minister", "Qi", "##an", "Qi", "##chen", "and", "sign", "an", "agreement", "on", "an", "Australian", "consul", "##ate", "in", "Hong", "Kong", ",", "an", "official", "of", "the", "Australian", "em", "##bas", "##sy", "in", "Beijing", "said", "." ], "ids": [ 16005, 10165, 10134, 10114, 23267, 13299, 20277, 14355, 88454, 10206, 88454, 11909, 10111, 26794, 10151, 25432, 10135, 10151, 12829, 53704, 12436, 10106, 15078, 14577, 117, 10151, 14731, 10108, 10105, 12829, 10266, 21322, 16105, 10106, 23824, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "China", "will", "res", "##ume", "so", "##vereignty", "over", "Hong", "Kong", ",", "a", "British", "colony", ",", "in", "mid", "-", "1997", "." ], "ids": [ 11593, 11337, 39429, 20467, 10380, 104831, 10491, 15078, 14577, 117, 169, 11160, 48968, 117, 10106, 15607, 118, 10391, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Relations", "between", "China", "and", "Australia", "have", "been", "strain", "##ed", "in", "recent", "weeks", "because", "of", "Australia", "'", "s", "plan", "to", "sell", "uranium", "to", "China", "'", "s", "rival", "Taiwan", "." ], "ids": [ 36503, 10948, 11593, 10111, 11729, 10529, 10590, 110158, 10336, 10106, 19037, 20750, 12373, 10108, 11729, 112, 187, 13065, 10114, 36300, 87937, 10114, 11593, 112, 187, 24792, 19449, 119 ], "entity": [ "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Other", "issues", "affect", "##ing", "ties", "include", "plans", "by", "an", "Australian", "cabinet", "minister", "to", "visit", "Taiwan", ",", "a", "security", "pa", "##ct", "between", "Canberra", "and", "Washington", "and", "a", "possible", "visit", "to", "Australia", "next", "month", "by", "Tibet", "'", "s", "exile", "##d", "spiritual", "leader", "the", "Dalai", "Lama", "." ], "ids": [ 14490, 17850, 60600, 10230, 45169, 12363, 18195, 10155, 10151, 12829, 33801, 16930, 10114, 27541, 19449, 117, 169, 21849, 10931, 14526, 10948, 46452, 10111, 11586, 10111, 169, 14128, 27541, 10114, 11729, 13451, 14064, 10155, 26392, 112, 187, 67696, 10162, 42422, 15014, 10105, 104419, 39453, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Down", "##er", "is", "the", "first", "Australian", "minister", "to", "visit", "China", "since", "the", "new", "conservative", "government", "took", "office", "in", "Canberra", "in", "March", "." ], "ids": [ 16005, 10165, 10124, 10105, 10422, 12829, 16930, 10114, 27541, 11593, 11764, 10105, 10751, 50202, 12047, 12149, 14301, 10106, 46452, 10106, 11144, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "##s", "accuse", "PA", "of", "ban", "##ning", "books", "." ], "ids": [ 56119, 10107, 93413, 32349, 10108, 11915, 11269, 15174, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##BL", "##US", ",", "West", "Bank", "1996", "-", "08", "-", "22" ], "ids": [ 56586, 94701, 32612, 117, 11164, 13533, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "West", "Bank", "books", "##eller", "charged", "on", "Thursday", "that", "the", "Palestinian", "Information", "Ministry", "has", "forced", "him", "to", "sign", "an", "under", "##tak", "##ing", "not", "to", "dis", "##tri", "##but", "##e", "books", "written", "by", "critics", "of", "Israeli", "-", "PL", "##O", "self", "-", "rule", "deals", "." ], "ids": [ 138, 11164, 13533, 15174, 35303, 38253, 10135, 67067, 10189, 10105, 56119, 12145, 19170, 10393, 20054, 10957, 10114, 26794, 10151, 10571, 19049, 10230, 10472, 10114, 27920, 21570, 23170, 10112, 15174, 13398, 10155, 29832, 10108, 28446, 118, 71341, 11403, 16567, 118, 21983, 78037, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "made", "me", "sign", "an", "under", "##tak", "##ing", "not", "to", "sell", "the", "books", "to", "anyone", "at", "the", "risk", "of", "legal", "action", "." ], "ids": [ 107, 11696, 11019, 10911, 26794, 10151, 10571, 19049, 10230, 10472, 10114, 36300, 10105, 15174, 10114, 51747, 10160, 10105, 24179, 10108, 17139, 14204, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "official", "told", "me", "'", "you", "have", "to", "either", "destroy", "the", "books", "or", "return", "them", "to", "Amman", "'", ",", "\"", "Da", "##oud", "Ma", "##kka", "##wi", ",", "owner", "of", "the", "Na", "##blu", "##s", "-", "based", "al", "-", "R", "##isal", "##a", "books", "##hop", ",", "told", "Reuters", "." ], "ids": [ 11340, 14731, 21937, 10911, 112, 13028, 10529, 10114, 16106, 59792, 10105, 15174, 10345, 15079, 11345, 10114, 107098, 112, 117, 107, 11818, 50555, 13744, 20878, 15926, 117, 24414, 10108, 10105, 10685, 88506, 10107, 118, 11610, 10164, 118, 155, 67740, 10113, 15174, 57654, 117, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 2, 6, 6, 6, 6, 1, 5, 5, 5, 5, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "He", "said", "ministry", "officials", "made", "him", "sign", "this", "a", "few", "weeks", "ago", "after", "he", "brought", "about", "a", "dozen", "copies", "from", "Jordan", "of", "a", "book", "by", "Edward", "Said", ",", "a", "prominent", "scholar", "at", "New", "York", "City", "'", "s", "Columbia", "University", "." ], "ids": [ 10357, 12415, 65338, 27730, 11019, 10957, 26794, 10531, 169, 13824, 20750, 36390, 10662, 10261, 17327, 10978, 169, 84956, 26102, 10188, 16366, 10108, 169, 12748, 10155, 11984, 36393, 117, 169, 22861, 49658, 10160, 10287, 10482, 10773, 112, 187, 13469, 10404, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Said", ",", "a", "U", ".", "S", ".", "citizen", "of", "Palestinian", "origin", ",", "has", "been", "an", "out", "##sp", "##oken", "critic", "of", "the", "1993", "Israeli", "-", "PL", "##O", "self", "-", "rule", "deal", "and", "has", "written", "at", "least", "two", "books", "on", "the", "accord", "." ], "ids": [ 36393, 117, 169, 158, 119, 156, 119, 64735, 10108, 56119, 22608, 117, 10393, 10590, 10151, 10950, 54609, 91556, 39727, 10108, 10105, 10463, 28446, 118, 71341, 11403, 16567, 118, 21983, 19918, 10111, 10393, 13398, 10160, 16298, 10551, 15174, 10135, 10105, 35233, 119 ], "entity": [ "B-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 1, 5, 5, 5, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Wednesday", "a", "books", "##eller", "in", "the", "West", "Bank", "town", "of", "Rama", "##llah", "said", "police", "about", "a", "month", "ago", "con", "##fis", "##cated", "several", "copies", "of", "two", "of", "Said", "'", "s", "books", "on", "the", "Israel", "-", "PL", "##O", "self", "-", "rule", "deals", "." ], "ids": [ 10576, 57611, 169, 15174, 35303, 10106, 10105, 11164, 13533, 12221, 10108, 42746, 98134, 12415, 15034, 10978, 169, 14064, 36390, 10173, 65702, 57736, 11736, 26102, 10108, 10551, 10108, 36393, 112, 187, 15174, 10135, 10105, 12991, 118, 71341, 11403, 16567, 118, 21983, 78037, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "Information", "Ministry", "Director", "-", "General", "Mu", "##taw", "##ake", "##l", "Ta", "##ha", "denied", "that", "ministry", "officials", "forced", "anyone", "to", "sign", "any", "under", "##tak", "##ing", "and", "insisted", "that", "the", "Palestinian", "Authority", "has", "no", "plans", "to", "censo", "##r", "books", "." ], "ids": [ 56119, 12145, 19170, 15480, 118, 11220, 49056, 108659, 26389, 10161, 14248, 10921, 47467, 10189, 65338, 27730, 20054, 51747, 10114, 26794, 11178, 10571, 19049, 10230, 10111, 110660, 10189, 10105, 56119, 26553, 10393, 10192, 18195, 10114, 19326, 10129, 15174, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "is", "no", "strategy", "to", "ban", "books", "or", "to", "su", "##pp", "##ress", "freedom", "of", "expression", "in", "any", "form", "what", "##so", "##ever", ",", "\"", "Ta", "##ha", "told", "Reuters", "." ], "ids": [ 107, 11723, 10124, 10192, 40919, 10114, 11915, 15174, 10345, 10114, 10198, 16587, 30743, 33700, 10108, 23515, 10106, 11178, 12188, 12976, 11669, 23433, 117, 107, 14248, 10921, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 3, 9 ] }, { "tokens": [ "But", "Ta", "##ha", "said", "that", "the", "absence", "of", "rele", "##vent", "legislation", "##s", "may", "have", "resulted", "in", "some", "mis", "##take", "##s", "by", "some", "security", "officials", "." ], "ids": [ 16976, 14248, 10921, 12415, 10189, 10105, 28589, 10108, 43373, 22657, 40807, 10107, 11387, 10529, 26633, 10106, 11152, 12606, 47529, 10107, 10155, 11152, 21849, 27730, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "may", "explain", "some", "mis", "##take", "##s", "against", "some", "journalists", "and", "writers", ",", "\"", "he", "said", "." ], "ids": [ 107, 10747, 11387, 67004, 11152, 12606, 47529, 10107, 11327, 11152, 85851, 10111, 35729, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Da", "##oud", "said", "books", "by", "other", "authors", ",", "including", "British", "Journalist", "Patrick", "Seal", "##e", ",", "were", "also", "banned", "." ], "ids": [ 11818, 50555, 12415, 15174, 10155, 10684, 39476, 117, 11198, 11160, 52033, 13867, 63323, 10112, 117, 10309, 10379, 58587, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "that", "security", "officials", "often", "visit", "his", "shop", "to", "make", "sure", "he", "was", "not", "selling", "the", "books", "." ], "ids": [ 10357, 12415, 10189, 21849, 27730, 12899, 27541, 10226, 39090, 10114, 13086, 62452, 10261, 10134, 10472, 30870, 10105, 15174, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "think", "this", "is", "a", "bad", "beginning", "." ], "ids": [ 107, 146, 27874, 10531, 10124, 169, 15838, 17967, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "we", "have", "confidence", ",", "why", "should", "we", "be", "af", "##raid", "of", "the", "other", "opinion", "?", "\"" ], "ids": [ 14535, 11951, 10529, 74187, 117, 31237, 14819, 11951, 10347, 10452, 89025, 10108, 10105, 10684, 32282, 136, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Da", "##oud", "said", "." ], "ids": [ 11818, 50555, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 8, 9, 9 ] }, { "tokens": [ "Thousand", "##s", "of", "books", "were", "banned", "from", "sale", "in", "the", "West", "Bank", "and", "Gaza", "Strip", "by", "the", "Israeli", "military", "authorities", "before", "the", "Jewish", "state", "handed", "over", "parts", "of", "the", "two", "areas", "to", "the", "PL", "##O", "under", "a", "self", "-", "rule", "deal", "in", "1994", "." ], "ids": [ 61795, 10107, 10108, 15174, 10309, 58587, 10188, 15488, 10106, 10105, 11164, 13533, 10111, 42434, 79527, 10155, 10105, 28446, 14041, 28308, 11360, 10105, 17119, 11388, 44040, 10491, 15569, 10108, 10105, 10551, 14544, 10114, 10105, 71341, 11403, 10571, 169, 16567, 118, 21983, 19918, 10106, 10444, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egypt", "bl", "##ames", "Istanbul", "control", "tower", "for", "accident", "." ], "ids": [ 20440, 21484, 55497, 25218, 12608, 27795, 10142, 25037, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##IR", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 24707, 73522, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "chairman", "of", "national", "carrier", "Egypt", "##A", "##ir", "on", "Thursday", "bl", "##amed", "the", "control", "tower", "at", "Istanbul", "airport", "for", "the", "Egypt", "##A", "##ir", "plane", "accident", "." ], "ids": [ 10117, 27627, 10108, 11844, 53402, 20440, 10738, 10835, 10135, 67067, 21484, 83865, 10105, 12608, 27795, 10160, 25218, 28460, 10142, 10105, 20440, 10738, 10835, 35007, 25037, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Twenty", "people", "were", "injured", "on", "Wednesday", "when", "the", "Egypt", "##A", "##ir", "Boeing", "707", "over", "##sh", "##ot", "the", "runway", ",", "caught", "fire", ",", "hit", "a", "taxi", "and", "skip", "##ped", "across", "a", "road", "onto", "a", "railway", "line", "." ], "ids": [ 51521, 11426, 10309, 36081, 10135, 57611, 10841, 10105, 20440, 10738, 10835, 20172, 49880, 10491, 13264, 11290, 10105, 88789, 117, 39797, 13559, 117, 14946, 169, 72231, 10111, 52124, 16898, 15130, 169, 15485, 31095, 169, 18271, 12117, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chairman", "Mohamed", "Fa", "##him", "Ray", "##yan", "told", "a", "news", "conference", "at", "Cairo", "airport", ":", "\"", "The", "control", "tower", "should", "have", "allocated", "the", "plane", "another", "runway", ",", "instead", "of", "the", "one", "the", "plane", "landed", "on", ".", "\"" ], "ids": [ 28635, 31790, 44271, 31362, 13871, 15976, 21937, 169, 14424, 25029, 10160, 37580, 28460, 131, 107, 10117, 12608, 27795, 14819, 10529, 99109, 10105, 35007, 12864, 88789, 117, 17427, 10108, 10105, 10464, 10105, 35007, 58961, 10135, 119, 107 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "one", "it", "landed", "on", "is", "2", ",", "250", "metres", "(", "2", ",", "460", "yards", ")", "long", "while", "the", "other", "one", "if", "more", "than", "3", ",", "000", "metres", "(", "3", ",", "300", "yards", ")", "long", "and", "is", "less", "steep", ",", "\"", "he", "added", "." ], "ids": [ 107, 10117, 10464, 10271, 58961, 10135, 10124, 123, 117, 12214, 16393, 113, 123, 117, 27296, 25537, 114, 11695, 11371, 10105, 10684, 10464, 12277, 10798, 11084, 124, 117, 10259, 16393, 113, 124, 117, 11093, 25537, 114, 11695, 10111, 10124, 15306, 102718, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "a", "Turkish", "civil", "aviation", "authority", "official", "had", "made", "the", "same", "point", "and", "he", "noted", "that", "a", "Turkish", "plane", "had", "a", "similar", "accident", "there", "in", "1994", "." ], "ids": [ 10357, 12415, 169, 22814, 14161, 45559, 26772, 14731, 10374, 11019, 10105, 11561, 12331, 10111, 10261, 18575, 10189, 169, 22814, 35007, 10374, 169, 13213, 25037, 11155, 10106, 10444, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Egypt", "##A", "##ir", "pilot", "bl", "##amed", "Turkish", "airport", "staff", "for", "mis", "##lea", "##ding", "him", "." ], "ids": [ 10117, 20440, 10738, 10835, 20618, 21484, 83865, 22814, 28460, 18927, 10142, 12606, 25277, 13971, 10957, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "landing", "took", "place", "after", "a", "rain", "##stor", "##m", "." ], "ids": [ 10117, 37798, 12149, 11192, 10662, 169, 50939, 42396, 10147, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Its", "not", "an", "accident", "." ], "ids": [ 107, 14864, 10472, 10151, 25037, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "very", "wet", "." ], "ids": [ 10377, 112, 187, 12558, 41115, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "brak", "##e", "action", "is", "very", "poor", "and", "the", "tower", "said", "it", "'", "s", "medium", "." ], "ids": [ 10117, 40225, 10112, 14204, 10124, 12558, 23247, 10111, 10105, 27795, 12415, 10271, 112, 187, 29843, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "'", "s", "wrong", ",", "\"", "the", "pilot", "told", "private", "I", "##hla", "##s", "news", "agency", "in", "English", "." ], "ids": [ 13646, 112, 187, 56126, 117, 107, 10105, 20618, 21937, 14591, 146, 74935, 10107, 14424, 34649, 10106, 11616, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 2, 9 ] }, { "tokens": [ "Egypt", "wants", "nothing", "to", "do", "with", "Sudan", "##ese", "rulers", "." ], "ids": [ 20440, 45769, 33338, 10114, 10149, 10169, 28407, 13565, 99456, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "CA", "##IR", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 24707, 73522, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Egyptian", "government", "will", "have", "nothing", "more", "to", "do", "with", "the", "Sudan", "##ese", "government", "because", "it", "continues", "to", "shelter", "and", "support", "Egyptian", "militants", ",", "President", "Ho", "##sni", "Mu", "##bara", "##k", "said", "in", "a", "speech", "on", "Thursday", "." ], "ids": [ 10117, 34624, 12047, 11337, 10529, 33338, 10798, 10114, 10149, 10169, 10105, 28407, 13565, 12047, 12373, 10271, 25266, 10114, 85947, 10111, 13145, 34624, 73829, 117, 12811, 20220, 67826, 49056, 43221, 10174, 12415, 10106, 169, 29811, 10135, 67067, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egypt", "says", "the", "Sudan", "##ese", "government", "helped", "the", "Mo", "##sle", "##m", "militants", "who", "tried", "to", "kill", "Mu", "##bara", "##k", "in", "Addis", "Ab", "##aba", "last", "year", "." ], "ids": [ 20440, 22153, 10105, 28407, 13565, 12047, 20890, 10105, 34987, 42176, 10147, 73829, 10479, 27156, 10114, 32099, 49056, 43221, 10174, 10106, 83077, 15595, 18696, 12469, 10924, 119 ], "entity": [ "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 2, 6, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "It", "sponsored", "last", "week", "'", "s", "U", ".", "N", ".", "Security", "Council", "resolution", "threat", "##ening", "a", "ban", "on", "Sudan", "##ese", "flights", "abroad", "if", "K", "##hart", "##oum", "does", "not", "hand", "over", "three", "men", "accused", "in", "the", "Addis", "Ab", "##aba", "incident", "." ], "ids": [ 10377, 44747, 12469, 16118, 112, 187, 158, 119, 151, 119, 20924, 12821, 40017, 41256, 24428, 169, 11915, 10135, 28407, 13565, 55650, 50901, 12277, 148, 34567, 88314, 15107, 10472, 15230, 10491, 11003, 10588, 37303, 10106, 10105, 83077, 15595, 18696, 28005, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "The", "san", "##ctions", "will", "come", "into", "effect", "in", "November", "if", "Sudan", "fail", "##s", "to", "extra", "##dite", "the", "men", ",", "but", "Sudan", "says", "it", "cannot", "hand", "them", "over", "to", "Ethiopia", "for", "trial", "because", "they", "are", "not", "in", "Sudan", "." ], "ids": [ 10117, 14608, 42068, 11337, 10678, 10708, 18514, 10106, 10819, 12277, 28407, 84891, 10107, 10114, 19868, 59627, 10105, 10588, 117, 10473, 28407, 22153, 10271, 25259, 15230, 11345, 10491, 10114, 49281, 10142, 23626, 12373, 10689, 10301, 10472, 10106, 28407, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "We", "are", "still", "ea", "##ger", "that", "nothing", "should", "affect", "the", "Sudan", "##ese", "people", "but", "we", "will", "not", "deal", "with", "the", "current", "regime", "or", "the", "Tur", "##abi", "front", "or", "whatever", ",", "\"", "Mu", "##bara", "##k", "told", "a", "group", "of", "academic", "##s", "." ], "ids": [ 107, 12865, 10301, 12647, 22257, 11446, 10189, 33338, 14819, 60600, 10105, 28407, 13565, 11426, 10473, 11951, 11337, 10472, 19918, 10169, 10105, 14978, 24807, 10345, 10105, 105549, 62229, 14589, 10345, 104429, 117, 107, 49056, 43221, 10174, 21937, 169, 11795, 10108, 23765, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hassan", "al", "-", "Tur", "##abi", "is", "the", "leader", "of", "the", "National", "Islamic", "Front", ",", "the", "political", "force", "behind", "the", "Sudan", "##ese", "government", "." ], "ids": [ 35004, 10164, 118, 105549, 62229, 10124, 10105, 15014, 10108, 10105, 10655, 22150, 19241, 117, 10105, 13736, 15031, 17155, 10105, 28407, 13565, 12047, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "n", "'", "t", "want", "to", "go", "into", "more", "details", "than", "that", "but", "there", "are", "more", "details", "and", "they", "are", "bitter", "." ], "ids": [ 107, 146, 10149, 182, 112, 188, 21528, 10114, 11783, 10708, 10798, 29500, 11084, 10189, 10473, 11155, 10301, 10798, 29500, 10111, 10689, 10301, 97737, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "are", "terrorist", "##s", "they", "are", "shelter", "##ing", "and", "they", "make", "Sudan", "##ese", "passo", "##rts", "for", "them", "and", "they", "get", "paid", "by", "them", ",", "\"", "Mu", "##bara", "##k", "said", "." ], "ids": [ 11723, 10301, 76482, 10107, 10689, 10301, 85947, 10230, 10111, 10689, 13086, 28407, 13565, 50339, 26215, 10142, 11345, 10111, 10689, 15329, 25938, 10155, 11345, 117, 107, 49056, 43221, 10174, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "He", "did", "not", "say", "if", "Egypt", "would", "go", "so", "far", "as", "to", "break", "relations", ",", "a", "step", "it", "has", "been", "re", "##lu", "##cta", "##nt", "to", "take", ",", "os", "##tens", "##ib", "##ly", "because", "it", "would", "affect", "ordinary", "Sudan", "##ese", "." ], "ids": [ 10357, 12172, 10472, 23763, 12277, 20440, 10894, 11783, 10380, 13301, 10146, 10114, 24194, 19824, 117, 169, 31877, 10271, 10393, 10590, 11639, 11435, 24290, 10368, 10114, 13574, 117, 10427, 58513, 17609, 10454, 12373, 10271, 10894, 60600, 64481, 28407, 13565, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Turkish", "shares", "shed", "gains", "in", "profit", "-", "taking", "." ], "ids": [ 22814, 45751, 106942, 92193, 10106, 25081, 118, 18084, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IS", "##TA", "##NB", "##UL", "1996", "-", "08", "-", "22" ], "ids": [ 40214, 24951, 53244, 100673, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turkish", "shares", "ended", "lower", "on", "Thursday", ",", "shed", "##ding", "gains", "of", "earlier", "in", "the", "week", "ami", "##d", "profit", "-", "taking", "sales", ",", "broke", "##rs", "said", "." ], "ids": [ 22814, 45751, 18428, 18165, 10135, 67067, 117, 106942, 13971, 92193, 10108, 18905, 10106, 10105, 16118, 16992, 10162, 25081, 118, 18084, 23857, 117, 30500, 10943, 12415, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "IM", "##K", "##B", "-", "100", "lost", "0", ".", "19", "percent", "or", "123", ".", "89", "points", "to", "end", "at", "64", ",", "178", ".", "78", "." ], "ids": [ 10117, 97126, 11733, 11274, 118, 10407, 14172, 121, 119, 10270, 22362, 10345, 16968, 119, 12642, 12789, 10114, 11572, 10160, 11295, 117, 22475, 119, 12492, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ga", "##ins", "so", "far", "this", "week", "have", "total", "##led", "2", ".", "92", "percent", "." ], "ids": [ 69699, 14411, 10380, 13301, 10531, 16118, 10529, 11339, 16376, 123, 119, 12458, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Daily", "volume", "dropped", "to", "7", ".", "2", "tri", "##llion", "li", "##ra", "from", "Wednesday", "'", "s", "7", ".", "8", "tri", "##llion", "li", "##ra", "." ], "ids": [ 17252, 15901, 30241, 10114, 128, 119, 123, 15633, 67102, 11614, 10288, 10188, 57611, 112, 187, 128, 119, 129, 15633, 67102, 11614, 10288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Prof", "##it", "-", "taking", "sales", "in", "the", "afternoon", "showed", "the", "latest", "gains", "of", "the", "index", "were", "actually", "a", "reaction", "rise", "." ], "ids": [ 107, 24864, 10486, 118, 18084, 23857, 10106, 10105, 73213, 27463, 10105, 50908, 92193, 10108, 10105, 19776, 10309, 24376, 169, 35723, 28710, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "ex", "##pect", "the", "market", "to", "go", "as", "far", "down", "as", "63", ",", "000", "tom", "##or", "##row", "if", "sales", "continue", ",", "\"", "said", "Bu", "##rci", "##n", "Ma", "##vit", "##una", "from", "Inter", "##bank", "." ], "ids": [ 146, 11419, 51511, 10105, 17313, 10114, 11783, 10146, 13301, 12935, 10146, 12256, 117, 10259, 19132, 10667, 21454, 12277, 23857, 17734, 117, 107, 12415, 11916, 43774, 10115, 13744, 18522, 14212, 10188, 24362, 20583, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 9 ] }, { "tokens": [ "Bro", "##kers", "said", "profit", "taking", "sales", "had", "come", "especially", "as", "the", "index", "approached", "the", "65", ",", "000", "resistance", "level", "." ], "ids": [ 32470, 25739, 12415, 25081, 18084, 23857, 10374, 10678, 17491, 10146, 10105, 19776, 63548, 10105, 10843, 117, 10259, 33823, 13277, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "the", "index", "could", "also", "rise", "towards", "65", ",", "000", "if", "the", "che", "##ap", "share", "prices", "attracted", "buy", "##ers", "." ], "ids": [ 11696, 12415, 10105, 19776, 12174, 10379, 28710, 18095, 10843, 117, 10259, 12277, 10105, 10262, 16070, 23867, 57476, 48906, 47715, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "market", "had", "its", "first", "resistance", "at", "67", ",", "000", "if", "it", "pie", "##rce", "##d", "65", ",", "000", ",", "they", "added", "." ], "ids": [ 10117, 17313, 10374, 10474, 10422, 33823, 10160, 12316, 117, 10259, 12277, 10271, 19642, 31526, 10162, 10843, 117, 10259, 117, 10689, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "session", "'", "s", "most", "active", "shares", "were", "those", "of", "Is", "##bank", "gained", "300", "li", "##ra", "to", "8", ",", "600", "." ], "ids": [ 10117, 30066, 112, 187, 10992, 14459, 45751, 10309, 12676, 10108, 12034, 20583, 25222, 11093, 11614, 10288, 10114, 129, 117, 11796, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "of", "utility", "Cu", "##kur", "##ova", "lost", "3", ",", "000", "li", "##ra", "to", "67", ",", "000", "." ], "ids": [ 106583, 11234, 10108, 85410, 34387, 24260, 12804, 14172, 124, 117, 10259, 11614, 10288, 10114, 12316, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "85", "-", "share", "industrial", "index", "lost", "0", ".", "47", "percent", "to", "70", ",", "848", ".", "86", "and", "the", "15", "-", "share", "financial", "index", "rose", "by", "0", ".", "55", "percent", "to", "55", ",", "929", ".", "89", "." ], "ids": [ 10117, 12017, 118, 23867, 18138, 19776, 14172, 121, 119, 11413, 22362, 10114, 10923, 117, 75153, 119, 12224, 10111, 10105, 10208, 118, 23867, 20570, 19776, 29467, 10155, 121, 119, 11358, 22362, 10114, 11358, 117, 69073, 119, 12642, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Of", "the", "218", "shares", "traded", ",", "gain", "##ers", "out", "##did", "loser", "##s", "by", "100", "to", "64", "and", "54", "shares", "were", "stable", "." ], "ids": [ 12610, 10105, 24599, 45751, 52696, 117, 25881, 10901, 10950, 63252, 55526, 10107, 10155, 10407, 10114, 11295, 10111, 11653, 45751, 10309, 38430, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Istanbul", "News", "##room", ",", "+", "90", "-", "212", "-", "275", "08", "##7", "##5", "SA" ], "ids": [ 118, 118, 25218, 12219, 25525, 117, 116, 10919, 118, 22023, 118, 23896, 11052, 11305, 11166, 21318 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Miss", "Universe", "hide", "##s", "behind", "vei", "##l", "of", "silence", "." ], "ids": [ 14247, 27558, 96935, 10107, 17155, 50766, 10161, 10108, 72445, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ki", "##eran", "Murray" ], "ids": [ 28941, 28415, 17917 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "LA", "##S", "CR", "##UC", "##ES", ",", "N", ".", "M", ".", "1996", "-", "08", "-", "22" ], "ids": [ 29079, 10731, 44912, 93089, 25054, 117, 151, 119, 150, 119, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Miss", "Universe", ",", "Venezuela", "'", "s", "Alicia", "Machado", ",", "left", "New", "Mexico", "on", "Thursday", ",", "ref", "##using", "to", "answer", "questions", "about", "her", "weight", "or", "claims", "she", "was", "told", "to", "either", "go", "on", "a", "crash", "diet", "or", "give", "up", "her", "title", "." ], "ids": [ 14247, 27558, 117, 15693, 112, 187, 39375, 54653, 117, 12153, 10287, 10490, 10135, 67067, 117, 48056, 95179, 10114, 57085, 26686, 10978, 10485, 25512, 10345, 25880, 10833, 10134, 21937, 10114, 16106, 11783, 10135, 169, 42774, 76714, 10345, 18090, 10741, 10485, 12887, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 1, 9, 9, 4, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Machado", ",", "19", ",", "flew", "to", "Los", "Angeles", "after", "sl", "##ip", "##ping", "away", "from", "the", "New", "Mexico", "desert", "town", "of", "Las", "C", "##ruces", ",", "where", "she", "attended", "the", "1996", "Miss", "Teen", "USA", "page", "##ant", "on", "Wednesday", "." ], "ids": [ 54653, 117, 10270, 117, 64284, 10114, 10630, 12233, 10662, 38523, 17437, 15398, 14942, 10188, 10105, 10287, 10490, 56538, 12221, 10108, 11518, 140, 107294, 117, 10940, 10833, 17696, 10105, 10389, 14247, 35072, 11061, 15975, 11236, 10135, 57611, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "Machado", "was", "not", "a", "contestant", "here", ",", "she", "came", "under", "intense", "scrutin", "##y", "following", "reports", "she", "was", "given", "an", "ultima", "##tum", "by", "Los", "Angeles", "-", "based", "Miss", "Universe", "Inc", ".", "to", "drop", "27", "pounds", "(", "12", "kg", ")", "in", "two", "weeks", "or", "risk", "losing", "her", "crown", "." ], "ids": [ 14600, 54653, 10134, 10472, 169, 96509, 19353, 117, 10833, 13383, 10571, 48195, 88579, 10157, 11901, 26610, 10833, 10134, 13507, 10151, 20371, 15673, 10155, 10630, 12233, 118, 11610, 14247, 27558, 13604, 119, 10114, 36365, 10365, 61982, 113, 10186, 11895, 114, 10106, 10551, 20750, 10345, 24179, 27817, 10485, 52990, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Venezuela", ",", "her", "mother", "told", "Reuters", "that", "Machado", "had", "a", "s", "##wo", "##llen", "face", "when", "she", "left", "home", "two", "weeks", "ago", "because", "she", "had", "her", "wis", "##dom", "teeth", "extra", "##cted", "." ], "ids": [ 10167, 15693, 117, 10485, 15293, 21937, 46617, 10189, 54653, 10374, 169, 187, 16828, 16815, 13295, 10841, 10833, 12153, 11816, 10551, 20750, 36390, 12373, 10833, 10374, 10485, 16512, 15561, 75839, 19868, 27756, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 3, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Marta", "Fa", "##jar", "##do", "insisted", "her", "daughter", ",", "who", "wei", "##ghed", "112", "pounds", "(", "51", "kg", ")", "when", "she", "won", "the", "Miss", "Universe", "title", "in", "Las", "Vegas", "in", "May", ",", "had", "perfect", "##ly", "normal", "eating", "hab", "##its", "." ], "ids": [ 32088, 44271, 17502, 10317, 110660, 10485, 15243, 117, 10479, 86981, 75395, 16129, 61982, 113, 11524, 11895, 114, 10841, 10833, 11367, 10105, 14247, 27558, 12887, 10106, 11518, 21589, 10106, 10725, 117, 10374, 43477, 10454, 16626, 77596, 16266, 15508, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Everybody", "has", "their", "own", "add", "##ict", "##ion", "to", "something", "or", "other", "but", "it", "'", "s", "not", "as", "if", "she", "eat", "##s", "ca", "##kes", "like", "c", "##raz", "##y", ",", "\"", "she", "said", "." ], "ids": [ 107, 56965, 10393, 10455, 12542, 42852, 106788, 11046, 10114, 26133, 10345, 10684, 10473, 10271, 112, 187, 10472, 10146, 12277, 10833, 69110, 10107, 11135, 21885, 11850, 171, 29948, 10157, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Organ", "##iser", "##s", "flat", "##ly", "denied", "ever", "threat", "##ening", "Machado", "but", "immediately", "put", "her", "under", "w", "##rap", "##s", "and", "blocked", "access", "to", "her", "." ], "ids": [ 72154, 25004, 10107, 31307, 10454, 47467, 17038, 41256, 24428, 54653, 10473, 24029, 14499, 10485, 10571, 191, 53750, 10107, 10111, 98935, 18314, 10114, 10485, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dre", "##ssed", "in", "a", "black", "str", "##ap", "##less", "evening", "go", "##wn", "at", "Wednesday", "'", "s", "page", "##ant", ",", "Machado", "was", "clearly", "he", "##avier", "than", "the", "contestants", "but", "still", "won", "ra", "##ve", "reviews", "after", "her", "brief", "appearance", "on", "stage", "." ], "ids": [ 72531, 50987, 10106, 169, 15045, 17791, 16070, 14985, 42135, 11783, 20395, 10160, 57611, 112, 187, 15975, 11236, 117, 54653, 10134, 52340, 10261, 97767, 11084, 10105, 99885, 10473, 12647, 11367, 11859, 10612, 24860, 10662, 10485, 29040, 19099, 10135, 15365, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Are", "you", "ki", "##ddin", "##g", "?" ], "ids": [ 107, 13491, 13028, 10879, 51256, 10240, 136 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "'", "s", "fant", "##astic", ",", "\"", "said", "Nikki", "Campbell", ",", "28", ",", "who", "went", "to", "the", "page", "##ant", ".", "\"" ], "ids": [ 11149, 112, 187, 69262, 97656, 117, 107, 12415, 65311, 18172, 117, 10348, 117, 10479, 13446, 10114, 10105, 15975, 11236, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "looked", "great", "." ], "ids": [ 11149, 59822, 14772, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Very", "sex", "##y", ".", "\"" ], "ids": [ 37282, 18549, 10157, 119, 107 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Machado", "'", "s", "public", "##ists", "said", "on", "Thursday", "she", "was", "scheduled", "to", "stay", "in", "Los", "Angeles", "for", "promotional", "work", "with", "sponsor", "##s", "before", "returning", "to", "Venezuela", "on", "Sept", "." ], "ids": [ 54653, 112, 187, 11683, 18206, 12415, 10135, 67067, 10833, 10134, 34081, 10114, 29597, 10106, 10630, 12233, 10142, 92199, 11424, 10169, 50306, 10107, 11360, 30052, 10114, 15693, 10135, 51768, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "5", "." ], "ids": [ 126, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Beauty", "queen", "##s", "are", "high", "-", "profile", "personal", "##ities", "in", "Venezuela", "and", "Machado", "'", "s", "alleged", "weight", "problem", "made", "front", "page", "news", "this", "week", "." ], "ids": [ 35340, 62343, 10107, 10301, 11846, 118, 29549, 14927, 17285, 10106, 15693, 10111, 54653, 112, 187, 48164, 25512, 18077, 11019, 14589, 15975, 14424, 10531, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "an", "official", "of", "the", "Miss", "Venezuela", "Organisation", "who", "first", "said", "Machado", "had", "been", "told", "to", "lose", "weight", "fast", "." ], "ids": [ 10377, 10134, 10151, 14731, 10108, 10105, 14247, 15693, 22223, 10479, 10422, 12415, 54653, 10374, 10590, 21937, 10114, 48742, 25512, 15040, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "People", "close", "to", "her", "said", "she", "then", "ea", "##sed", "up", "on", "her", "diet", "and", "ind", "##ul", "##ged", "her", "passion", "for", "pasta", "and", "ca", "##ke", ",", "but", "it", "was", "not", "clear", "how", "many", "pounds", "she", "gained", "and", "most", "people", "who", "saw", "her", "said", "she", "was", "still", "a", "long", "way", "from", "being", "fat", "." ], "ids": [ 14235, 16065, 10114, 10485, 12415, 10833, 11059, 22257, 16219, 10741, 10135, 10485, 76714, 10111, 30386, 10604, 18832, 10485, 53946, 10142, 63941, 10111, 11135, 10550, 117, 10473, 10271, 10134, 10472, 24866, 14796, 11299, 61982, 10833, 25222, 10111, 10992, 11426, 10479, 17112, 10485, 12415, 10833, 10134, 12647, 169, 11695, 13170, 10188, 11223, 67952, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "Brooks", ",", "president", "of", "Miss", "Universe", "Inc", ",", "said", "he", "spoke", "with", "Machado", "to", "assure", "her", "that", "organiser", "##s", "were", "not", "putting", "pressure", "on", "her", "." ], "ids": [ 11235, 27625, 117, 12931, 10108, 14247, 27558, 13604, 117, 12415, 10261, 50005, 10169, 54653, 10114, 62316, 10485, 10189, 93446, 10107, 10309, 10472, 71028, 23460, 10135, 10485, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "She", "'", "s", "fine", "with", "it", "." ], "ids": [ 107, 11149, 112, 187, 13435, 10169, 10271, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "wish", "##ed", ",", "as", "we", "all", "did", ",", "that", "it", "had", "n", "'", "t", "happened", "but", "she", "'", "s", "spiritual", "##ly", "and", "mental", "##ly", "ter", "##rif", "##ic", "." ], "ids": [ 11149, 66069, 10336, 117, 10146, 11951, 10435, 12172, 117, 10189, 10271, 10374, 182, 112, 188, 44936, 10473, 10833, 112, 187, 42422, 10454, 10111, 27993, 10454, 12718, 52070, 11130, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "'", "s", "no", "problem", "what", "##so", "##ever", ",", "\"", "he", "told", "Reuters", "." ], "ids": [ 11723, 112, 187, 10192, 18077, 12976, 11669, 23433, 117, 107, 10261, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "He", "said", "the", "lifestyle", "associated", "with", "being", "Miss", "Universe", "could", "make", "routine", "exercise", "difficult", "." ], "ids": [ 10357, 12415, 10105, 87089, 18107, 10169, 11223, 14247, 27558, 12174, 13086, 94650, 56120, 25232, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "problem", "is", "they", "travel", "so", "much", "and", "are", "so", "bus", "##y", "that", "the", "ability", "to", "have", "any", "type", "of", "regiment", "##ed", "routine", "work", "##out", "does", "n", "'", "t", "exist", "." ], "ids": [ 107, 10117, 18077, 10124, 10689, 23595, 10380, 13172, 10111, 10301, 10380, 19369, 10157, 10189, 10105, 23599, 10114, 10529, 11178, 12807, 10108, 33818, 10336, 94650, 11424, 17514, 15107, 182, 112, 188, 32120, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "dont", "know", "if", "Alicia", "is", "working", "out", "." ], "ids": [ 146, 11758, 21852, 12277, 39375, 10124, 14616, 10950, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "We", "have", "n", "'", "t", "talk", "##ed", "about", "it", "because", "it", "has", "n", "'", "t", "been", "an", "issue", ",", "\"", "he", "said", "." ], "ids": [ 12865, 10529, 182, 112, 188, 31311, 10336, 10978, 10271, 12373, 10271, 10393, 182, 112, 188, 10590, 10151, 15557, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ke", "##vor", "##kian", "attend", "##s", "third", "suicide", "in", "week", "." ], "ids": [ 47124, 19360, 79189, 34465, 10107, 12628, 35656, 10106, 16118, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##ON", "##TI", "##AC", ",", "Mi", "##ch", "." ], "ids": [ 153, 30118, 72286, 30340, 117, 19803, 10269, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "22" ], "ids": [ 10389, 118, 11052, 118, 10306 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dr", ".", "Jack", "Ke", "##vor", "##kian", "attended", "his", "third", "suicide", "in", "less", "than", "a", "week", "on", "Thursday", ",", "bringing", "the", "body", "of", "a", "40", "-", "year", "-", "old", "Missouri", "woman", "suffering", "from", "multiple", "s", "##cle", "##ros", "##is", "to", "a", "hospital", "emergency", "room", ",", "doctors", "said", "." ], "ids": [ 11612, 119, 12342, 47124, 19360, 79189, 17696, 10226, 12628, 35656, 10106, 15306, 11084, 169, 16118, 10135, 67067, 117, 45749, 10105, 14333, 10108, 169, 10533, 118, 10924, 118, 12898, 16279, 18299, 49552, 10188, 19865, 187, 19478, 12333, 10291, 10114, 169, 18141, 44461, 19555, 117, 82782, 12415, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dr", "Robert", "Ara", "##nosi", "##an", ",", "emergency", "room", "director", "at", "Pont", "##iac", "Ost", "##eo", "##pat", "##hic", "Hospital", ",", "said", "Ke", "##vor", "##kian", "brought", "in", "the", "body", "of", "Patricia", "Smith", ",", "of", "Lee", "##s", "Summit", ",", "Mo", "." ], "ids": [ 11612, 10820, 54789, 74955, 10206, 117, 44461, 19555, 12461, 10160, 23986, 46917, 32352, 15998, 18115, 39187, 16025, 117, 12415, 47124, 19360, 79189, 17327, 10106, 10105, 14333, 10108, 26751, 11673, 117, 10108, 12006, 10107, 50954, 117, 34987, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 5, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 1, 5, 5, 9, 1, 9 ] }, { "tokens": [ ",", "at", "mid", "##day", "and", "told", "doctors", "that", "she", "had", "been", "paral", "##yse", "##d", "by", "the", "disease", "." ], "ids": [ 117, 10160, 15607, 24558, 10111, 21937, 82782, 10189, 10833, 10374, 10590, 102568, 45158, 10162, 10155, 10105, 21911, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "his", "second", "assisted", "-", "suicide", "in", "36", "hours", "and", "the", "37", "##th", "that", "he", "has", "acknowledged", "attending", "since", "starting", "his", "c", "##rusade", "for", "doctor", "assisted", "suicide", "in", "1990", "." ], "ids": [ 10377, 10134, 10226, 11132, 53253, 118, 35656, 10106, 11055, 19573, 10111, 10105, 11204, 11143, 10189, 10261, 10393, 87215, 54234, 11764, 21868, 10226, 171, 94117, 10142, 26937, 53253, 35656, 10106, 10420, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ke", "##vor", "##kian", "'", "s", "lawyer", ",", "Geoffrey", "Fi", "##eger", ",", "said", "those", "attending", "Smith", "'", "s", "death", "included", "her", "husband", ",", "David", ",", "a", "police", "officer", ",", "her", "father", ",", "James", "Poland", ",", "and", "Ke", "##vor", "##kian", "." ], "ids": [ 47124, 19360, 79189, 112, 187, 38055, 117, 32540, 36448, 95609, 117, 12415, 12676, 54234, 11673, 112, 187, 12557, 12742, 10485, 19634, 117, 10804, 117, 169, 15034, 19288, 117, 10485, 13194, 117, 10900, 17879, 117, 10111, 47124, 19360, 79189, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "It", "was", "the", "first", "known", "time", "that", "a", "police", "officer", "has", "been", "president", "at", "the", "suicide", "of", "one", "of", "Ke", "##vor", "##kian", "'", "s", "patients", "." ], "ids": [ 10377, 10134, 10105, 10422, 11053, 10635, 10189, 169, 15034, 19288, 10393, 10590, 12931, 10160, 10105, 35656, 10108, 10464, 10108, 47124, 19360, 79189, 112, 187, 25965, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "He", "offered", "no", "details", "about", "the", "cause", "of", "Smith", "'", "s", "death", "or", "the", "location", "." ], "ids": [ 10357, 20841, 10192, 29500, 10978, 10105, 15311, 10108, 11673, 112, 187, 12557, 10345, 10105, 18214, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "was", "a", "nurse", "who", "had", "\"", "rapidly", "progress", "##ing", "mult", "##ple", "s", "##cle", "##ros", "##is", ".", "\"" ], "ids": [ 11149, 10134, 169, 108470, 10479, 10374, 107, 47489, 40316, 10230, 32766, 22238, 187, 19478, 12333, 10291, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Tuesday", "night", ",", "Ke", "##vor", "##kian", "attended", "the", "death", "of", "Louise", "Sie", "##bens", ",", "a", "76", "-", "year", "-", "old", "Texas", "woman", "with", "am", "##yot", "##rop", "##hic", "lateral", "s", "##cle", "##ros", "##is", ",", "or", "Lou", "G", "##ehr", "##ig", "'", "s", "disease", "." ], "ids": [ 10576, 70245, 16903, 117, 47124, 19360, 79189, 17696, 10105, 12557, 10108, 18605, 11583, 102553, 117, 169, 12428, 118, 10924, 118, 12898, 12466, 18299, 10169, 10392, 103036, 30698, 39187, 35080, 187, 19478, 12333, 10291, 117, 10345, 30056, 144, 89707, 11142, 112, 187, 21911, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "On", "August", "15", ",", "Ke", "##vor", "##kian", "helped", "Judith", "Cu", "##rren", ",", "a", "42", "-", "year", "-", "old", "Massachusetts", "nurse", ",", "who", "suffered", "from", "chronic", "fat", "##igue", "syndrome", ",", "a", "non", "-", "terminal", "illness", ",", "to", "end", "her", "life", "." ], "ids": [ 10576, 10735, 10208, 117, 47124, 19360, 79189, 20890, 35043, 34387, 46111, 117, 169, 11276, 118, 10924, 118, 12898, 15123, 108470, 117, 10479, 26090, 10188, 91347, 67952, 96021, 38117, 117, 169, 10446, 118, 23552, 56507, 117, 10114, 11572, 10485, 12103, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fair", "##view", ",", "Texas", ",", "$", "1", ".", "82", "million", "deal", "Ba", "##a", "##1", "-", "Moody", "'", "s", "." ], "ids": [ 25697, 30512, 117, 12466, 117, 109, 122, 119, 12180, 12473, 19918, 21333, 10113, 10759, 118, 64663, 112, 187, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "22" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Moody", "'", "s", "In", "##vestor", "##s", "Service", "-" ], "ids": [ 64663, 112, 187, 10167, 83436, 10107, 13489, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Rat", "##ing", "Anno", "##unce", "##ment", "As", "of", "08", "/", "21", "/", "96", "." ], "ids": [ 29839, 10230, 26473, 93050, 10426, 10882, 10108, 11052, 120, 10296, 120, 12308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Issue", "##r", ":", "Fair", "##view", "Town" ], "ids": [ 39115, 10129, 131, 25697, 30512, 14380 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 9, 9, 1, 5, 5 ] }, { "tokens": [ "State", ":", "TX" ], "ids": [ 11104, 131, 86545 ], "entity": [ "O", "O", "B-LOC" ], "entity_ids": [ 9, 9, 1 ] }, { "tokens": [ "Rat", "##ing", ":", "Ba", "##a", "##1" ], "ids": [ 29839, 10230, 131, 21333, 10113, 10759 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sale", "Am", "##oun", "##t", ":", "1", ",", "820", ",", "000" ], "ids": [ 66272, 11500, 43971, 10123, 131, 122, 117, 45443, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##pect", "##ed", "Sale", "Date", ":", "08", "/", "27", "/", "96" ], "ids": [ 27746, 51511, 10336, 66272, 29897, 131, 11052, 120, 10365, 120, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "U", ".", "S", ".", "Municipal", "Des", "##k", ",", "212", "-", "859", "-", "1650" ], "ids": [ 118, 118, 158, 119, 156, 119, 18069, 13810, 10174, 117, 22023, 118, 80786, 118, 29117 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Def", "##iant", "U", ".", "S", ".", "neo", "-", "Nazi", "jail", "##ed", "by", "German", "court", "." ], "ids": [ 77955, 24096, 158, 119, 156, 119, 50071, 118, 25831, 75934, 10336, 10155, 12026, 14866, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 2, 6, 6, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Andrew", "Gray" ], "ids": [ 13999, 17533 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "H", "##AM", "##BU", "##R", "##G", ",", "Germany", "1996", "-", "08", "-", "22" ], "ids": [ 145, 36535, 108865, 11273, 11447, 117, 12775, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Hamburg", "court", "sentenced", "U", ".", "S", ".", "neo", "-", "Nazi", "leader", "Gary", "Lau", "##ck", "on", "Thursday", "to", "four", "years", "in", "prison", "for", "pump", "##ing", "banned", "extrem", "##ist", "propaganda", "into", "Germany", "from", "his", "base", "in", "the", "United", "States", "." ], "ids": [ 138, 15021, 14866, 53365, 158, 119, 156, 119, 50071, 118, 25831, 15014, 15516, 73185, 11263, 10135, 67067, 10114, 11598, 10855, 10106, 20538, 10142, 106392, 10230, 58587, 44112, 11293, 34510, 10708, 12775, 10188, 10226, 11404, 10106, 10105, 10609, 10859, 119 ], "entity": [ "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "I-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 1, 5, 5, 5, 2, 6, 6, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Lau", "##ck", ",", "from", "Lincoln", ",", "Nebraska", ",", "ye", "##lle", "##d", "a", "tira", "##de", "of", "abuse", "at", "the", "court", "after", "his", "conviction", "for", "in", "##citing", "racial", "hat", "##red", "." ], "ids": [ 73185, 11263, 117, 10188, 16944, 117, 25562, 117, 11023, 11270, 10162, 169, 102770, 10253, 10108, 51401, 10160, 10105, 14866, 10662, 10226, 94259, 10142, 10106, 104360, 33377, 11250, 15711, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "struggle", "will", "go", "on", ",", "\"", "the", "43", "-", "year", "-", "old", "sh", "##out", "##ed", "in", "German", "before", "being", "escort", "##ed", "out", "by", "security", "guards", "." ], "ids": [ 107, 10117, 48919, 11337, 11783, 10135, 117, 107, 10105, 11370, 118, 10924, 118, 12898, 48201, 17514, 10336, 10106, 12026, 11360, 11223, 100883, 10336, 10950, 10155, 21849, 99024, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lau", "##ck", "'", "s", "lawyer", "vo", "##wed", "he", "would", "appeal", "against", "the", "court", "'", "s", "decision", ",", "arguing", "that", "his", "client", "should", "have", "been", "set", "free", "because", "he", "had", "not", "committed", "any", "offen", "##ce", "under", "German", "law", "." ], "ids": [ 73185, 11263, 112, 187, 38055, 12556, 48854, 10261, 10894, 44861, 11327, 10105, 14866, 112, 187, 19231, 117, 108297, 10189, 10226, 37748, 14819, 10529, 10590, 11847, 13961, 12373, 10261, 10374, 10472, 38184, 11178, 84646, 10419, 10571, 12026, 13255, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "German", "government", "hai", "##led", "the", "conviction", "as", "a", "major", "victory", "in", "the", "fight", "against", "neo", "-", "Nazis", "##m", "." ], "ids": [ 10117, 12026, 12047, 13080, 16376, 10105, 94259, 10146, 169, 11922, 19735, 10106, 10105, 20780, 11327, 50071, 118, 81351, 10147, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "Lau", "##ck", "'", "s", "worldwide", "network", "has", "been", "the", "main", "source", "of", "anti", "-", "Semi", "##tic", "propaganda", "material", "flowing", "into", "Germany", "since", "the", "1970s", "." ], "ids": [ 73185, 11263, 112, 187, 31197, 17175, 10393, 10590, 10105, 12126, 15247, 10108, 14249, 118, 71467, 13275, 34510, 13540, 109769, 10708, 12775, 11764, 10105, 21844, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Lau", "##ck", "posse", "##ssed", "a", "well", "-", "oil", "##ed", "propaganda", "machine", ",", "hon", "##ed", "during", "more", "than", "20", "years", ",", "\"", "pre", "##sid", "##ing", "judge", "G", "##uent", "##er", "Bertram", "told", "the", "court", "." ], "ids": [ 107, 73185, 11263, 83509, 50987, 169, 11206, 118, 21073, 10336, 34510, 21432, 117, 14923, 10336, 10939, 10798, 11084, 10197, 10855, 117, 107, 12229, 34396, 10230, 31624, 144, 85110, 10165, 105372, 21937, 10105, 14866, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "set", "up", "a", "propaganda", "can", "##non", "and", "fired", "it", "at", "Germany", ".", "\"" ], "ids": [ 107, 10357, 11847, 10741, 169, 34510, 10944, 17518, 10111, 38903, 10271, 10160, 12775, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "said", "Bertram", ",", "who", "also", "read", "out", "extra", "##cts", "from", "Lau", "##ck", "'", "s", "material", "pra", "##ising", "Hitler", "as", "\"", "the", "greatest", "of", "all", "leaders", "\"", "and", "describing", "the", "Nazi", "sl", "##au", "##ghter", "of", "millions", "of", "Jews", "as", "a", "my", "##th", "." ], "ids": [ 12415, 105372, 117, 10479, 10379, 24944, 10950, 19868, 39159, 10188, 73185, 11263, 112, 187, 13540, 69857, 53624, 15637, 10146, 107, 10105, 31434, 10108, 10435, 24155, 107, 10111, 62278, 10105, 25831, 38523, 11705, 45953, 10108, 18123, 10108, 26490, 10146, 169, 15127, 11143, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ea", "##ger", "to", "put", "Lau", "##ck", "behind", "bars", "quickly", "and", "avoid", "a", "long", "and", "complex", "trial", ",", "prose", "##cutor", "Bernd", "Mau", "##rus", "##chat", "limited", "his", "charges", "to", "offen", "##ces", "since", "1994", "." ], "ids": [ 47132, 11446, 10114, 14499, 73185, 11263, 17155, 56829, 23590, 10111, 33253, 169, 11695, 10111, 17217, 23626, 117, 84145, 98957, 49554, 103722, 13923, 73267, 19264, 10226, 31128, 10114, 84646, 14585, 11764, 10444, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "had", "demanded", "a", "five", "-", "year", "jail", "term", "but", "said", "he", "was", "sat", "##isfied", "with", "the", "court", "'", "s", "sentence", "." ], "ids": [ 10357, 10374, 78164, 169, 12403, 118, 10924, 75934, 13719, 10473, 12415, 10261, 10134, 20694, 108813, 10169, 10105, 14866, 112, 187, 49219, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Publishing", "and", "dis", "##tri", "##but", "##ing", "neo", "-", "Nazi", "material", "is", "illegal", "in", "Germany", "but", "Lau", "##ck", "'", "s", "defence", "team", "had", "argued", "that", "U", ".", "S", "freedom", "of", "speech", "laws", "meant", "he", "was", "free", "to", "produce", "his", "s", "##was", "##tika", "-", "covered", "books", ",", "magazines", ",", "videos", "and", "flag", "##s", "in", "his", "home", "##land", "." ], "ids": [ 14092, 10111, 27920, 21570, 23170, 10230, 50071, 118, 25831, 13540, 10124, 39806, 10106, 12775, 10473, 73185, 11263, 112, 187, 47245, 11121, 10374, 35525, 10189, 158, 119, 156, 33700, 10108, 29811, 28160, 31580, 10261, 10134, 13961, 10114, 17368, 10226, 187, 64785, 24511, 118, 21543, 15174, 117, 48320, 117, 37655, 10111, 31773, 10107, 10106, 10226, 11816, 11080, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Interior", "Minister", "Manfred", "Kant", "##her", "said", "in", "a", "statement", "he", "\"", "wel", "##come", "##d", "the", "prose", "##cution", "and", "conviction", "of", "one", "of", "the", "ring", "##lea", "##ders", "of", "international", "neo", "-", "Nazis", "##m", "and", "biggest", "dis", "##tri", "##but", "##ers", "of", "vi", "##cious", "ra", "##cist", "publications", "\"", "." ], "ids": [ 33667, 14355, 34544, 45879, 14206, 12415, 10106, 169, 33311, 10261, 107, 16829, 61643, 10162, 10105, 84145, 64195, 10111, 94259, 10108, 10464, 10108, 10105, 21550, 25277, 25779, 10108, 12533, 50071, 118, 81351, 10147, 10111, 36304, 27920, 21570, 23170, 10901, 10108, 13956, 45376, 11859, 80092, 29834, 107, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "high", "time", "he", "was", "behind", "bars", ",", "\"", "the", "opposition", "Social", "Democrats", "said", "in", "a", "statement", "." ], "ids": [ 107, 10377, 10124, 11846, 10635, 10261, 10134, 17155, 56829, 117, 107, 10105, 21227, 12824, 56282, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lau", "##ck", ",", "dressed", "in", "a", "sob", "##er", "blue", "suit", "and", "sporting", "his", "trade", "##mark", "Hitler", "##es", "##que", "black", "mo", "##usta", "##che", ",", "showed", "no", "sign", "of", "em", "##otion", "as", "Bertram", "spent", "more", "than", "an", "hour", "reading", "out", "the", "verdi", "##ct", "and", "explain", "##ing", "the", "court", "'", "s", "decision", "." ], "ids": [ 73185, 11263, 117, 94092, 10106, 169, 22755, 10165, 23254, 26315, 10111, 89476, 10226, 18908, 22719, 15637, 10171, 11189, 15045, 46912, 25134, 11119, 117, 27463, 10192, 26794, 10108, 10266, 70984, 10146, 105372, 18571, 10798, 11084, 10151, 24730, 32432, 10950, 10105, 37922, 14526, 10111, 67004, 10230, 10105, 14866, 112, 187, 19231, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "as", "Lau", "##ck", "was", "about", "to", "be", "led", "away", ",", "he", "turned", "to", "reporter", "##s", "and", "blu", "##rte", "##d", "out", "a", "virtually", "in", "##com", "##pre", "##hen", "##sible", "quick", "-", "fire", "dia", "##tri", "##be", "against", "the", "court", "." ], "ids": [ 16976, 10146, 73185, 11263, 10134, 10978, 10114, 10347, 12857, 14942, 117, 10261, 21031, 10114, 41408, 10107, 10111, 57965, 13733, 10162, 10950, 169, 83659, 10106, 22530, 30619, 14786, 55864, 69609, 118, 13559, 10671, 21570, 11044, 11327, 10105, 14866, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Nei", "##ther", "the", "National", "Socialist", "##s", "(", "Nazis", ")", "nor", "the", "communist", "##s", "dare", "##d", "to", "ki", "##dna", "##p", "an", "American", "citizen", ",", "\"", "he", "sh", "##out", "##ed", ",", "in", "an", "ob", "##lique", "reference", "to", "his", "extra", "##dition", "to", "Germany", "from", "Denmark", ".", "\"" ], "ids": [ 107, 25822, 22623, 10105, 10655, 42637, 10107, 113, 81351, 114, 31515, 10105, 64574, 10107, 45476, 10162, 10114, 10879, 35630, 10410, 10151, 10536, 64735, 117, 107, 10261, 48201, 17514, 10336, 117, 10106, 10151, 17339, 34508, 21457, 10114, 10226, 19868, 34540, 10114, 12775, 10188, 25854, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9 ] }, { "tokens": [ "That", "'", "s", "the", "truth", ".", "\"" ], "ids": [ 13646, 112, 187, 10105, 47226, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "attorney", ",", "Hans", "-", "Otto", "Sieg", ",", "told", "reporter", "##s", "outside", "the", "court", "##room", "that", "the", "judges", "had", "not", "explained", "how", "a", "German", "court", "could", "judge", "someone", "for", "actions", "carried", "out", "in", "the", "United", "States", "." ], "ids": [ 11597, 54131, 117, 11768, 118, 13573, 27581, 117, 21937, 41408, 10107, 17555, 10105, 14866, 25525, 10189, 10105, 56181, 10374, 10472, 44191, 14796, 169, 12026, 14866, 12174, 31624, 30455, 10142, 22115, 21086, 10950, 10106, 10105, 10609, 10859, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Bertram", "said", "Lau", "##ck", "was", "ob", "##ses", "##sed", "by", "Nazis", "##m", "and", "devoted", "his", "life", "to", "leading", "his", "National", "Socialist", "German", "Workers", "'", "Party", "Foreign", "Organisation", "(", "NSDAP", "-", "A", "##O", ")", ",", "which", "derives", "its", "name", "from", "the", "full", "German", "title", "of", "Hitler", "'", "s", "Nazi", "party", "." ], "ids": [ 105372, 12415, 73185, 11263, 10134, 17339, 13149, 16219, 10155, 81351, 10147, 10111, 57910, 10226, 12103, 10114, 16018, 10226, 10655, 42637, 12026, 52896, 112, 12529, 20277, 22223, 113, 38895, 118, 138, 11403, 114, 117, 10319, 109129, 10474, 11324, 10188, 10105, 13375, 12026, 12887, 10108, 15637, 112, 187, 25831, 14039, 119 ], "entity": [ "B-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 9, 4, 8, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 9, 9, 2, 9, 9 ] }, { "tokens": [ "During", "the", "three", "-", "month", "trial", ",", "the", "court", "dealt", "mainly", "with", "issues", "of", "the", "NSDAP", "-", "A", "##O", "'", "s", "\"", "NS", "Kampf", "##ruf", "\"", "(", "\"", "National", "Socialist", "Battle", "Cry", "\"", ")", "magazine", ",", "filled", "with", "references", "to", "Ar", "##yan", "su", "##prem", "##acy", "and", "defa", "##mat", "##ory", "statements", "about", "Jews", "." ], "ids": [ 12550, 10105, 11003, 118, 14064, 23626, 117, 10105, 14866, 102810, 20827, 10169, 17850, 10108, 10105, 38895, 118, 138, 11403, 112, 187, 107, 37314, 33762, 59459, 107, 113, 107, 10655, 42637, 14810, 33909, 107, 114, 15438, 117, 39287, 10169, 50171, 10114, 18484, 15976, 10198, 110327, 94077, 10111, 93279, 17480, 21493, 70808, 10978, 26490, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "The", "court", "rejected", "Sieg", "'", "s", "argument", "that", "Lau", "##ck", "'", "s", "extra", "##dition", "from", "Denmark", ",", "where", "he", "was", "arrested", "in", "March", "last", "year", "at", "the", "request", "of", "German", "authorities", ",", "was", "illegal", "." ], "ids": [ 10117, 14866, 39541, 27581, 112, 187, 36847, 10189, 73185, 11263, 112, 187, 19868, 34540, 10188, 25854, 117, 10940, 10261, 10134, 29479, 10106, 11144, 12469, 10924, 10160, 10105, 37449, 10108, 12026, 28308, 117, 10134, 39806, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lau", "##ck", "was", "also", "convicted", "of", "disse", "##minat", "##ing", "the", "symbols", "of", "anti", "-", "constitutional", "organisations", "." ], "ids": [ 73185, 11263, 10134, 10379, 61487, 10108, 15718, 104130, 10230, 10105, 81467, 10108, 14249, 118, 61537, 41536, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "will", "probably", "be", "free", "in", "around", "two", "and", "a", "half", "years", "." ], "ids": [ 10357, 11337, 23282, 10347, 13961, 10106, 12166, 10551, 10111, 169, 13877, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "court", "ruled", "that", "the", "15", "months", "he", "has", "spent", "in", "custody", "since", "his", "arrest", "should", "be", "sub", "##tract", "##ed", "from", "his", "prison", "term", "." ], "ids": [ 10117, 14866, 34920, 10189, 10105, 10208, 15555, 10261, 10393, 18571, 10106, 103772, 11764, 10226, 45165, 14819, 10347, 13987, 94666, 10336, 10188, 10226, 20538, 13719, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "UN", "official", "says", "Iraqi", "deal", "will", "occur", "\"", "soon", "\"", "." ], "ids": [ 26578, 14731, 22153, 57806, 19918, 11337, 32728, 107, 17864, 107, 119 ], "entity": [ "B-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "UN", "##IT", "##ED", "NA", "##TION", "##S", "1996", "-", "08", "-", "22" ], "ids": [ 26578, 37611, 33809, 56586, 98207, 10731, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "senior", "U", ".", "N", ".", "official", "said", "on", "Thursday", "he", "expected", "arrangements", "to", "implement", "the", "Iraqi", "oil", "-", "for", "-", "food", "deal", "could", "be", "completed", "\"", "quite", "soon", ".", "\"" ], "ids": [ 138, 17843, 158, 119, 151, 119, 14731, 12415, 10135, 67067, 10261, 25973, 56449, 10114, 92292, 10105, 57806, 21073, 118, 10142, 118, 18301, 19918, 12174, 10347, 15782, 107, 31324, 17864, 119, 107 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "am", "re", "##lu", "##cta", "##nt", "to", "sp", "##ecu", "##late", "but", "we", "are", "doing", "the", "preparation", "##s", "and", "the", "secretary", "-", "general", "is", "an", "##xi", "##ous", "to", "start", "the", "program", ",", "\"", "said", "Under", "##se", "##creta", "##ry", "-", "General", "Ya", "##sus", "##hi", "Ak", "##ashi", "." ], "ids": [ 107, 146, 10392, 11639, 11435, 24290, 10368, 10114, 32650, 97038, 23953, 10473, 11951, 10301, 30918, 10105, 59386, 10107, 10111, 10105, 37664, 118, 11389, 10124, 10151, 20572, 13499, 10114, 15148, 10105, 12483, 117, 107, 12415, 12594, 10341, 104988, 10908, 118, 11220, 25148, 16824, 11924, 71275, 51151, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "\"", "It", "might", "be", "soon", "##er", "than", "you", "think", ",", "\"", "he", "told", "reporter", "##s", "after", "brief", "##ing", "the", "Security", "Council", "on", "arrangements", "for", "monitor", "##s", "needed", "to", "carry", "out", "the", "agreement", "." ], "ids": [ 107, 10377, 20970, 10347, 17864, 10165, 11084, 13028, 27874, 117, 107, 10261, 21937, 41408, 10107, 10662, 29040, 10230, 10105, 20924, 12821, 10135, 56449, 10142, 60774, 10107, 23794, 10114, 31626, 10950, 10105, 25432, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ak", "##ashi", "is", "head", "of", "the", "Department", "of", "Human", "##itarian", "affairs", "." ], "ids": [ 71275, 51151, 10124, 13578, 10108, 10105, 12933, 10108, 15426, 63378, 43417, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "His", "deputy", "earlier", "sp", "##ecu", "##lated", "at", "least", "10", "days", "." ], "ids": [ 11597, 45404, 18905, 32650, 97038, 50476, 10160, 16298, 10150, 13990, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sus", "##pect", "##ed", "killer", "##s", "of", "bishop", "dead", "-", "-", "Algeria", "TV", "." ], "ids": [ 21241, 51511, 10336, 61976, 10107, 10108, 39868, 23457, 118, 118, 43776, 10813, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "22" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Algeria", "##n", "security", "forces", "have", "shot", "dead", "three", "Mo", "##sle", "##m", "guerrilla", "##s", "suspected", "of", "killing", "a", "leading", "French", "bishop", "in", "western", "Algeria", ",", "the", "Algeria", "##n", "state", "-", "run", "television", "said", "on", "Thursday", "." ], "ids": [ 43776, 10115, 21849, 13729, 10529, 19508, 23457, 11003, 34987, 42176, 10147, 106552, 10107, 80337, 10108, 34248, 169, 16018, 11894, 39868, 10106, 16672, 43776, 117, 10105, 43776, 10115, 11388, 118, 14095, 14162, 12415, 10135, 67067, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Security", "forces", "also", "arrested", "four", "other", "men", "sought", "for", "giving", "support", "to", "the", "sl", "##ain", "Mo", "##sle", "##m", "rebels", ",", "the", "television", "said", "." ], "ids": [ 20924, 13729, 10379, 29479, 11598, 10684, 10588, 32570, 10142, 24426, 13145, 10114, 10105, 38523, 18073, 34987, 42176, 10147, 57545, 117, 10105, 14162, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "television", ",", "which", "did", "not", "say", "when", "the", "security", "forces", "killed", "the", "rebels", ",", "said", "the", "four", "arrested", "men", "con", "##fes", "##sed", "details", "of", "the", "assassination", "of", "the", "French", "Roman", "Catholic", "Bishop", "Pierre", "Cl", "##aver", "##ie", "." ], "ids": [ 10117, 14162, 117, 10319, 12172, 10472, 23763, 10841, 10105, 21849, 13729, 15875, 10105, 57545, 117, 12415, 10105, 11598, 29479, 10588, 10173, 58058, 16219, 29500, 10108, 10105, 94509, 10108, 10105, 11894, 12359, 15473, 17576, 11609, 101989, 85427, 10400, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 2, 6, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "The", "58", "-", "year", "-", "old", "Cl", "##aver", "##ie", "was", "killed", "in", "August", "1", "in", "a", "bomb", "bl", "##ast", "at", "his", "residence", "in", "the", "western", "Algeria", "##n", "city", "of", "Ora", "##n", ",", "hours", "after", "he", "met", "visiting", "French", "Foreign", "Minister", "Her", "##ve", "de", "Cha", "##rette", "in", "Al", "##giers", "." ], "ids": [ 10117, 11824, 118, 10924, 118, 12898, 101989, 85427, 10400, 10134, 15875, 10106, 10735, 122, 10106, 169, 41654, 21484, 15171, 10160, 10226, 33879, 10106, 10105, 16672, 43776, 10115, 11584, 10108, 73591, 10115, 117, 19573, 10662, 10261, 10428, 48780, 11894, 20277, 14355, 13229, 10612, 10104, 53453, 73458, 10106, 10883, 92894, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 9 ] }, { "tokens": [ "An", "estimated", "50", ",", "000", "Algeria", "##ns", "and", "more", "than", "110", "foreign", "##ers", "have", "been", "killed", "in", "Algeria", "'", "s", "violence", "pit", "##ting", "Mo", "##sle", "##m", "rebels", "against", "the", "Algeria", "##n", "government", "forces", "since", "early", "1992", ",", "when", "the", "authorities", "cancelled", "a", "general", "election", "in", "which", "radical", "Islam", "##ists", "took", "a", "commanding", "lead", "." ], "ids": [ 10313, 25267, 10462, 117, 10259, 43776, 10891, 10111, 10798, 11084, 13057, 20796, 10901, 10529, 10590, 15875, 10106, 43776, 112, 187, 26342, 55277, 12141, 34987, 42176, 10147, 57545, 11327, 10105, 43776, 10115, 12047, 13729, 11764, 11732, 10450, 117, 10841, 10105, 28308, 60557, 169, 11389, 13685, 10106, 10319, 31991, 14727, 18206, 12149, 169, 93644, 14107, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "flow", "##n", "cargo", "January", "-", "July", "rise", "3", ".", "8", "percent", "." ], "ids": [ 12026, 30676, 10115, 15856, 11238, 118, 11112, 28710, 124, 119, 129, 22362, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##AN", "##K", "##F", "##UR", "##T", "1996", "-", "08", "-", "22" ], "ids": [ 64655, 41275, 11733, 11565, 98348, 11090, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "following", "table", "shows", "total", "flow", "##n", "air", "cargo", "volumes", "in", "tonnes", "handled", "at", "international", "German", "airport", "##s", "January", "-", "July", "1996", "." ], "ids": [ 10117, 11901, 21783, 15573, 11339, 30676, 10115, 12566, 15856, 25079, 10106, 39435, 90170, 10160, 12533, 12026, 28460, 10107, 11238, 118, 11112, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "figures", "ex", "##clu", "##de", "truck", "##ed", "air", "##fre", "##ight", "according", "to", "the", "German", "airport", "##s", "association", "AD", "##V", "." ], "ids": [ 10117, 21068, 11419, 78225, 10253, 58907, 10336, 12566, 37135, 27521, 18071, 10114, 10105, 12026, 28460, 10107, 18061, 22992, 11779, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Berlin", "(", "total", ")", "17", ",", "844", "up", "5", ".", "9", "p", "##ct" ], "ids": [ 11193, 113, 11339, 114, 10273, 117, 74010, 10741, 126, 119, 130, 184, 14526 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Te", "##gel", "10", ",", "896", "up", "3", ".", "1" ], "ids": [ 118, 21452, 16039, 10150, 117, 68802, 10741, 124, 119, 122 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Tempel", "##hof", "202", "down", "60", ".", "0" ], "ids": [ 118, 56206, 20202, 22171, 12935, 10709, 119, 121 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Sc", "##hoe", "##ne", "##feld", "6", ",", "746", "up", "16", ".", "8" ], "ids": [ 118, 55260, 41948, 10238, 14457, 127, 117, 76770, 10741, 10250, 119, 129 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bremen", "1", ",", "453", "up", "13", ".", "1" ], "ids": [ 21360, 122, 117, 38213, 10741, 10249, 119, 122 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dresden", "792", "up", "11", ".", "4" ], "ids": [ 20893, 61874, 10741, 10193, 119, 125 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Due", "##ss", "##sel", "##dorf", "31", ",", "347", "down", "4", ".", "4" ], "ids": [ 20896, 13420, 12912, 16631, 10413, 117, 30844, 12935, 125, 119, 125 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Frankfurt", "768", ",", "269", "up", "1", ".", "5" ], "ids": [ 15226, 57498, 117, 29745, 10741, 122, 119, 126 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hamburg", "21", ",", "240", "down", "3", ".", "5" ], "ids": [ 15021, 10296, 117, 16017, 12935, 124, 119, 126 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hannover", "6", ",", "030", "up", "15", ".", "3" ], "ids": [ 19739, 127, 117, 78336, 10741, 10208, 119, 124 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ko", "##eln", "(", "Cologne", ")", "182", ",", "887", "up", "11", ".", "8" ], "ids": [ 30186, 34138, 113, 52577, 114, 21926, 117, 75774, 10741, 10193, 119, 129 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leipzig", "/", "Halle", "1", ",", "806", "up", "45", ".", "6" ], "ids": [ 15067, 120, 23368, 122, 117, 65736, 10741, 10827, 119, 127 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Munich", "44", ",", "525", "up", "11", ".", "8" ], "ids": [ 27349, 11126, 117, 35316, 10741, 10193, 119, 129 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mu", "##ens", "##ter", "/", "Os", "##na", "##bru", "##eck", "382", "up", "28", ".", "2" ], "ids": [ 49056, 12457, 10877, 120, 12087, 10219, 40309, 26721, 37309, 10741, 10348, 119, 123 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nuremberg", "25", ",", "929", "up", "17", ".", "8" ], "ids": [ 84766, 10258, 117, 69073, 10741, 10273, 119, 129 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Saar", "##bru", "##ecken", "626", "up", "28", ".", "3" ], "ids": [ 100459, 40309, 88132, 55440, 10741, 10348, 119, 124 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stuttgart", "10", ",", "655", "up", "11", ".", "7" ], "ids": [ 16048, 10150, 117, 55639, 10741, 10193, 119, 128 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##TA", "##L", "1", ",", "113", ",", "785", "up", "3", ".", "8" ], "ids": [ 58573, 24951, 11369, 122, 117, 16990, 117, 55281, 10741, 124, 119, 129 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Air", "Cargo", "News", "##room", "Tel", "+", "44", "161", "542", "770", "##6", "Fax", "+", "44", "171", "542", "501", "##7" ], "ids": [ 118, 11704, 70766, 12219, 25525, 25369, 116, 11126, 21163, 51620, 48622, 11211, 64530, 116, 11126, 22478, 51620, 34067, 11305 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Par", "##iba", "##s", "repeat", "##s", "buy", "on", "A", "##ego", "##n", "after", "results", "." ], "ids": [ 17434, 53622, 10107, 107832, 10107, 47715, 10135, 138, 12419, 10115, 10662, 17466, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "22" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "Aug", "22", "research", "." ], "ids": [ 42027, 10108, 53012, 10306, 14108, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Company", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "Price", "-", "-", "-", "Bro", "##ker", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 11739, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 23002, 118, 118, 118, 32470, 11880, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##ego", "##n", "83", ".", "40", "Par", "##iba", "##s" ], "ids": [ 138, 12419, 10115, 12408, 119, 10533, 17434, 53622, 10107 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 3, 7, 7 ] }, { "tokens": [ "COM", "##ME", "##NT", ":", "\"", "Not", "only", "did", "A", "##ego", "##n", "surprise", "with", "earning", "##s", "of", "711", "million", "gu", "##ild", "##ers", ",", "which", "were", "above", "the", "top", "of", "the", "expected", "range", ",", "it", "also", "for", "##eca", "##st", "a", "similar", "performance", "in", "the", "second", "half", ".", "\"" ], "ids": [ 80645, 42424, 77261, 131, 107, 16040, 10893, 12172, 138, 12419, 10115, 48886, 10169, 56981, 10107, 10108, 52089, 12473, 75980, 65820, 10901, 117, 10319, 10309, 16038, 10105, 12364, 10108, 10105, 25973, 15601, 117, 10271, 10379, 10142, 33588, 10562, 169, 13213, 14432, 10106, 10105, 11132, 13877, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reiter", "##ates", "previous", "\"", "buy", "\"", "re", "##com", "##mend", "##ation", "after", "results", "." ], "ids": [ 95994, 26171, 16741, 107, 47715, 107, 11639, 22530, 101480, 11809, 10662, 17466, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Esti", "##mates", "(", "D", "##f", "##l", ")", ":", "EP", "##S", "P", "/", "E", "Di", "##vide", "##nd" ], "ids": [ 42272, 36778, 113, 141, 10575, 10161, 114, 131, 14111, 10731, 153, 120, 142, 12944, 41638, 11534 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1996", "5", ".", "83", "13", ".", "8", "2", ".", "75" ], "ids": [ 10389, 126, 119, 12408, 10249, 119, 129, 123, 119, 11417 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1997", "6", ".", "59", "12", ".", "2", "3", ".", "10" ], "ids": [ 10391, 127, 119, 11867, 10186, 119, 123, 124, 119, 10150 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Amsterdam", "news", "##room", ",", "+", "31", "20", "504", "5000", "(", "Fax", "+", "31", "20", "504", "504", "##0", ")" ], "ids": [ 118, 118, 14017, 14424, 25525, 117, 116, 10413, 10197, 43098, 17436, 113, 64530, 116, 10413, 10197, 43098, 43098, 10929, 114 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "'", "s", "Ball", "##y", "##bun", "##ion", "fans", "invited", "to", "Chicago", "." ], "ids": [ 24139, 112, 187, 19479, 10157, 42880, 11046, 20950, 33392, 10114, 12317, 119 ], "entity": [ "B-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 3, 7, 7, 7, 9, 9, 9, 1, 9 ] }, { "tokens": [ "D", "##UB", "##L", "##IN", "1996", "-", "08", "-", "22" ], "ids": [ 141, 82439, 11369, 27128, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "President", "Bill", "Clinton", "had", "to", "drop", "the", "resort", "of", "Ball", "##y", "##bun", "##ion", "from", "a", "w", "##hir", "##l", "##wind", "Irish", "tour", "last", "year", "." ], "ids": [ 158, 119, 156, 119, 12811, 13160, 24139, 10374, 10114, 36365, 10105, 60637, 10108, 19479, 10157, 42880, 11046, 10188, 169, 191, 21840, 10161, 47673, 15624, 12842, 12469, 10924, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 4, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "So", "Ball", "##y", "##bun", "##ion", "is", "going", "to", "America", "instead", "." ], "ids": [ 12882, 19479, 10157, 42880, 11046, 10124, 19090, 10114, 11440, 17427, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Two", "residents", "of", "the", "Atlantic", "resort", ",", "where", "Clinton", "was", "to", "have", "played", "golf", "with", "the", "Irish", "Foreign", "Minister", "Dick", "Spring", ",", "have", "been", "invited", "to", "the", "Democratic", "party", "convention", "in", "Chicago", "on", "August", "26", "-", "29", "." ], "ids": [ 13214, 22058, 10108, 10105, 16739, 60637, 117, 10940, 24139, 10134, 10114, 10529, 11553, 32288, 10169, 10105, 15624, 20277, 14355, 19988, 18698, 117, 10529, 10590, 33392, 10114, 10105, 19281, 14039, 37812, 10106, 12317, 10135, 10735, 10314, 118, 10386, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "have", "been", "asked", "to", "bring", "with", "them", "the", "placa", "##rds", "they", "wave", "##d", "when", "Clinton", "addressed", "Ireland", "at", "a", "pack", "##ed", "ceremony", "in", "Dublin", "city", "centre", "on", "December", "1", ",", "last", "year", "." ], "ids": [ 11696, 10529, 10590, 22151, 10114, 26092, 10169, 11345, 10105, 57474, 40725, 10689, 32981, 10162, 10841, 24139, 71121, 14637, 10160, 169, 78978, 10336, 34713, 10106, 20495, 11584, 12672, 10135, 11288, 122, 117, 12469, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "read", ":", "\"", "Ball", "##y", "##bun", "##ion", "back", "##s", "Clinton", ".", "\"" ], "ids": [ 11696, 24944, 131, 107, 19479, 10157, 42880, 11046, 12014, 10107, 24139, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 4, 9, 9 ] }, { "tokens": [ "\"", "The", "Democratic", "party", "have", "requested", "we", "bring", "our", "placa", "##rds", "with", "us", "." ], "ids": [ 107, 10117, 19281, 14039, 10529, 59728, 11951, 26092, 17446, 57474, 40725, 10169, 19626, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "will", "be", "guests", "of", "the", "Kennedy", "##s", ",", "\"", "said", "Frank", "Qui", "##lter", ",", "one", "of", "the", "two", "who", "have", "been", "invited", "to", "Chicago", "." ], "ids": [ 12865, 11337, 10347, 62375, 10108, 10105, 17817, 10107, 117, 107, 12415, 11872, 35921, 31897, 117, 10464, 10108, 10105, 10551, 10479, 10529, 10590, 33392, 10114, 12317, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Clinton", "made", "a", "tri", "##ump", "##hant", "Irish", "tour", "to", "back", "a", "Northern", "Ireland", "peace", "process", "but", "was", "forced", "to", "drop", "Ball", "##y", "##bun", "##ion", "from", "a", "pack", "##ed", "schedule", "at", "the", "last", "minute", "." ], "ids": [ 24139, 11019, 169, 15633, 67299, 65325, 15624, 12842, 10114, 12014, 169, 15352, 14637, 28101, 15138, 10473, 10134, 20054, 10114, 36365, 19479, 10157, 42880, 11046, 10188, 169, 78978, 10336, 52561, 10160, 10105, 12469, 21760, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bonn", "says", "Moscow", "has", "promised", "to", "observe", "cea", "##sef", "##ire", "." ], "ids": [ 21982, 22153, 18744, 10393, 77137, 10114, 78275, 25578, 107749, 11627, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Germany", "said", "on", "Thursday", "it", "had", "received", "ass", "##urance", "##s", "from", "the", "Russian", "government", "that", "its", "forces", "would", "observe", "the", "latest", "cea", "##sef", "##ire", "in", "Che", "##chny", "##a", "." ], "ids": [ 12775, 12415, 10135, 67067, 10271, 10374, 12296, 13935, 41078, 10107, 10188, 10105, 13463, 12047, 10189, 10474, 13729, 10894, 78275, 10105, 50908, 25578, 107749, 11627, 10106, 44131, 95063, 10113, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Foreign", "Ministry", "spoke", "##sman", "Martin", "Er", "##dman", "##n", "said", "top", "Bonn", "diplomat", "Wolfgang", "Is", "##ching", "##er", "had", "been", "assure", "##d", "by", "senior", "Russian", "officials", "that", "the", "ultima", "##tum", "to", "storm", "and", "take", "the", "Che", "##chen", "capital", "of", "G", "##ro", "##zny", "was", "not", "valid", "." ], "ids": [ 20277, 19170, 50005, 24305, 11235, 10915, 59609, 10115, 12415, 12364, 21982, 45652, 14290, 12034, 41247, 10165, 10374, 10590, 62316, 10162, 10155, 17843, 13463, 27730, 10189, 10105, 20371, 15673, 10114, 31642, 10111, 13574, 10105, 44131, 11909, 12185, 10108, 144, 10567, 25424, 10134, 10472, 64999, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 8, 9, 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Russian", "side", "confirmed", "that", "the", "cea", "##sef", "##ire", "is", "in", "place", "and", "they", "will", "keep", "to", "it", ",", "\"", "Er", "##dman", "##n", "told", "Reuters", "after", "speaking", "by", "telephone", "to", "Is", "##ching", "##er", ",", "who", "had", "met", "the", "officials", "on", "a", "two", "-", "day", "visit", "to", "Moscow", "." ], "ids": [ 107, 10117, 13463, 12250, 27347, 10189, 10105, 25578, 107749, 11627, 10124, 10106, 11192, 10111, 10689, 11337, 23819, 10114, 10271, 117, 107, 10915, 59609, 10115, 21937, 46617, 10662, 33740, 10155, 69009, 10114, 12034, 41247, 10165, 117, 10479, 10374, 10428, 10105, 27730, 10135, 169, 10551, 118, 11940, 27541, 10114, 18744, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "He", "returned", "to", "Bonn", "on", "Thursday", "." ], "ids": [ 10357, 14030, 10114, 21982, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Is", "##ching", "##er", "is", "the", "political", "director", "of", "Bonn", "'", "s", "foreign", "ministry", "." ], "ids": [ 12034, 41247, 10165, 10124, 10105, 13736, 12461, 10108, 21982, 112, 187, 20796, 65338, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Is", "##ching", "##er", "said", "he", "met", "three", "Russian", "deputy", "foreign", "ministers", "and", "a", "vice", "defence", "minister", ",", "who", "confirmed", "Russian", "Foreign", "Minister", "Ye", "##v", "##gen", "##y", "Prima", "##kov", "'", "s", "pl", "##ed", "##ge", "that", "Moscow", "would", "seek", "a", "political", "solution", "under", "the", "ae", "##gis", "of", "the", "Organisation", "for", "Security", "and", "Cooperation", "in", "Europe", "(", "OS", "##CE", ")", "." ], "ids": [ 12034, 41247, 10165, 12415, 10261, 10428, 11003, 13463, 45404, 20796, 66281, 10111, 169, 16543, 47245, 16930, 117, 10479, 27347, 13463, 20277, 14355, 20567, 10477, 11280, 10157, 20328, 16433, 112, 187, 20648, 10336, 10525, 10189, 18744, 10894, 48394, 169, 13736, 28502, 10571, 10105, 81506, 22725, 10108, 10105, 22223, 10142, 20924, 10111, 97225, 10106, 11767, 113, 18398, 43161, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "\"", "The", "ultima", "##tum", "(", "to", "storm", "G", "##ro", "##zny", ")", "is", "no", "longer", "an", "issue", ",", "\"", "he", "said", "quo", "##ting", "Is", "##ching", "##er", ",", "who", "had", "been", "sent", "to", "Moscow", "by", "German", "Foreign", "Minister", "Klaus", "Ki", "##nke", "##l", "as", "his", "personal", "en", "##voy", "to", "ur", "##ge", "an", "end", "to", "Moscow", "'", "s", "military", "campaign", "in", "the", "break", "##away", "region", "." ], "ids": [ 107, 10117, 20371, 15673, 113, 10114, 31642, 144, 10567, 25424, 114, 10124, 10192, 20165, 10151, 15557, 117, 107, 10261, 12415, 48718, 12141, 12034, 41247, 10165, 117, 10479, 10374, 10590, 14541, 10114, 18744, 10155, 12026, 20277, 14355, 21350, 28941, 53770, 10161, 10146, 10226, 14927, 10110, 81843, 10114, 10399, 10525, 10151, 11572, 10114, 18744, 112, 187, 14041, 17323, 10106, 10105, 24194, 38249, 12220, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Is", "##ching", "##er", "said", "the", "threat", "of", "a", "major", "assault", "to", "take", "G", "##ro", "##zny", "had", "been", "the", "una", "##uth", "##oris", "##ed", "initiative", "of", "the", "commanding", "general", "and", "not", "Moscow", "'", "s", "intention", "." ], "ids": [ 12034, 41247, 10165, 12415, 10105, 41256, 10108, 169, 11922, 50150, 10114, 13574, 144, 10567, 25424, 10374, 10590, 10105, 10153, 66365, 81597, 10336, 34960, 10108, 10105, 93644, 11389, 10111, 10472, 18744, 112, 187, 41241, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "officials", "had", "been", "positive", "about", "Ki", "##nke", "##l", "'", "s", "request", "on", "Wednesday", "that", "President", "Boris", "Ye", "##lts", "##in", "'", "s", "security", "chief", "Alexander", "Le", "##bed", "should", ",", "on", "his", "return", "to", "Moscow", ",", "meet", "Tim", "Gold", "##iman", ",", "the", "OS", "##CE", "representative", "responsible", "for", "Che", "##chny", "##a", ",", "he", "said", "." ], "ids": [ 10117, 27730, 10374, 10590, 19737, 10978, 28941, 53770, 10161, 112, 187, 37449, 10135, 57611, 10189, 12811, 21463, 20567, 72847, 10245, 112, 187, 21849, 19421, 12063, 10281, 33627, 14819, 117, 10135, 10226, 15079, 10114, 18744, 117, 23267, 15318, 14363, 45357, 117, 10105, 18398, 43161, 33786, 21586, 10142, 44131, 95063, 10113, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 3, 7, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "India", "says", "sees", "no", "arms", "race", "with", "China", ",", "Pakistan", "." ], "ids": [ 11098, 22153, 41369, 10192, 28150, 14025, 10169, 11593, 117, 15437, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "NE", "##W", "DE", "##L", "##HI", "1996", "-", "08", "-", "22" ], "ids": [ 86607, 13034, 25067, 11369, 108880, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "said", "on", "Thursday", "that", "its", "opposition", "to", "a", "global", "nuclear", "test", "ban", "treaty", "did", "not", "mean", "New", "Delhi", "intended", "to", "enter", "into", "an", "arms", "race", "with", "neighbouring", "Pakistan", "and", "China", "." ], "ids": [ 11098, 12415, 10135, 67067, 10189, 10474, 21227, 10114, 169, 18331, 20761, 15839, 11915, 56353, 12172, 10472, 36110, 10287, 18720, 24071, 10114, 31006, 10708, 10151, 28150, 14025, 10169, 79475, 15437, 10111, 11593, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Foreign", "Minister", "I", ".", "K", ".", "G", "##uj", "##ral", "was", "asked", "at", "a", "news", "conference", "if", "India", "'", "s", "decision", "to", "block", "adoption", "of", "the", "accord", "in", "Geneva", "would", "lead", "to", "an", "arms", "race", "with", "Pakistan", "and", "China", "." ], "ids": [ 20277, 14355, 146, 119, 148, 119, 144, 83260, 13600, 10134, 22151, 10160, 169, 14424, 25029, 12277, 11098, 112, 187, 19231, 10114, 27242, 58630, 10108, 10105, 35233, 10106, 47244, 10894, 14107, 10114, 10151, 28150, 14025, 10169, 15437, 10111, 11593, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "\"", "I", "do", "n", "'", "t", "see", "that", "possibility", "because", "India", "is", "not", "entering", "into", "any", "arms", "race", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 146, 10149, 182, 112, 188, 12888, 10189, 53510, 12373, 11098, 10124, 10472, 44824, 10708, 11178, 28150, 14025, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Our", "not", "signing", "a", "new", "treaty", "does", "not", "mean", "we", "are", "going", "in", "for", "any", "new", "kind", "of", "weapons", ",", "particularly", "nuclear", ".", "\"" ], "ids": [ 18465, 10472, 46529, 169, 10751, 56353, 15107, 10472, 36110, 11951, 10301, 19090, 10106, 10142, 11178, 10751, 22282, 10108, 31881, 117, 19658, 20761, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", ",", "along", "with", "Britain", ",", "France", ",", "Russia", "and", "the", "United", "States", ",", "is", "a", "declared", "nuclear", "power", "." ], "ids": [ 11593, 117, 12400, 10169, 16032, 117, 10688, 117, 14664, 10111, 10105, 10609, 10859, 117, 10124, 169, 25019, 20761, 13183, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 1, 9, 1, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "carried", "out", "a", "nuclear", "test", "in", "1974", "but", "says", "it", "has", "not", "built", "the", "bomb", "." ], "ids": [ 11098, 21086, 10950, 169, 20761, 15839, 10106, 10723, 10473, 22153, 10271, 10393, 10472, 12183, 10105, 41654, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##pert", "##s", "believe", "both", "India", "and", "Pakistan", "could", "quickly", "ass", "##emble", "nuclear", "weapons", "." ], "ids": [ 27746, 52368, 10107, 30587, 11408, 11098, 10111, 15437, 12174, 23590, 13935, 91259, 20761, 31881, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##uj", "##ral", "said", "he", "did", "not", "ex", "##pect", "India", "'", "s", "veto", "of", "the", "Comprehensive", "Test", "Ban", "Treaty", "(", "CT", "##B", "##T", ")", "to", "damage", "bila", "##teral", "ties", "with", "other", "nations", "." ], "ids": [ 144, 83260, 13600, 12415, 10261, 12172, 10472, 11419, 51511, 11098, 112, 187, 104017, 10108, 10105, 102301, 22495, 21631, 38031, 113, 45513, 11274, 11090, 114, 10114, 26115, 12517, 98161, 45169, 10169, 10684, 30683, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "not", "visual", "##ise", "its", "strain", "##ing", "our", "bila", "##teral", "relations", "with", "any", "country", "." ], "ids": [ 107, 146, 10149, 10472, 24559, 13041, 10474, 110158, 10230, 17446, 12517, 98161, 19824, 10169, 11178, 12723, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "text", "has", "already", "been", "blocked", ",", "\"", "he", "said", "." ], "ids": [ 10117, 15541, 10393, 19034, 10590, 98935, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##uj", "##ral", "said", "India", "would", "re", "-", "ex", "##amine", "its", "position", "if", "the", "treaty", ",", "particularly", "a", "clause", "providing", "for", "its", "entry", "into", "force", ",", "was", "modified", "." ], "ids": [ 144, 83260, 13600, 12415, 11098, 10894, 11639, 118, 11419, 45980, 10474, 12956, 12277, 10105, 56353, 117, 19658, 169, 104911, 26099, 10142, 10474, 14722, 10708, 15031, 117, 10134, 40957, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ask", "##ed", "what", "India", "would", "do", "if", "the", "pa", "##ct", "were", "forward", "##ed", "to", "the", "United", "Nations", "General", "Assembly", ",", "G", "##uj", "##ral", "said", ":", "\"", "That", "bridge", "I", "will", "cross", "when", "I", "come", "to", "it", ".", "\"" ], "ids": [ 93919, 10336, 12976, 11098, 10894, 10149, 12277, 10105, 10931, 14526, 10309, 23307, 10336, 10114, 10105, 10609, 15145, 11220, 17918, 117, 144, 83260, 13600, 12415, 131, 107, 13646, 21126, 146, 11337, 19630, 10841, 146, 10678, 10114, 10271, 119, 107 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "written", "statement", "released", "at", "the", "news", "conference", ",", "G", "##uj", "##ral", "rei", "##tera", "##ted", "India", "'", "s", "object", "##ions", "to", "the", "treaty", ",", "under", "nego", "##tia", "##tion", "at", "the", "Conference", "on", "Dis", "##arma", "##ment", "in", "Geneva", "." ], "ids": [ 10167, 169, 13398, 33311, 11539, 10160, 10105, 14424, 25029, 117, 144, 83260, 13600, 14243, 22833, 11912, 11098, 112, 187, 29331, 15880, 10114, 10105, 56353, 117, 10571, 21134, 16180, 10822, 10160, 10105, 16424, 10135, 101270, 81008, 10426, 10106, 47244, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 1, 9 ] }, { "tokens": [ "\"", "It", "is", "a", "sad", "fact", "that", "the", "nuclear", "weapon", "states", "show", "no", "interest", "in", "giving", "up", "their", "nuclear", "he", "##gem", "##ony", ",", "\"", "the", "statement", "said", "." ], "ids": [ 107, 10377, 10124, 169, 81708, 18638, 10189, 10105, 20761, 54157, 16316, 11897, 10192, 17644, 10106, 24426, 10741, 10455, 20761, 10261, 20531, 16131, 117, 107, 10105, 33311, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##uj", "##ral", "said", "India", "had", "national", "security", "concerns", "that", "made", "it", "impossible", "for", "New", "Delhi", "to", "sign", "the", "CT", "##B", "##T", "." ], "ids": [ 144, 83260, 13600, 12415, 11098, 10374, 11844, 21849, 42663, 10189, 11019, 10271, 38199, 10142, 10287, 18720, 10114, 26794, 10105, 45513, 11274, 11090, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "\"", "Our", "security", "concerns", "ob", "##lige", "us", "to", "maintain", "our", "nuclear", "option", ",", "\"", "he", "said", ",", "adding", "that", "India", "had", "exercise", "##d", "rest", "##rain", "##t", "in", "not", "carrying", "out", "any", "nuclear", "tests", "since", "the", "country", "'", "s", "lo", "##ne", "test", "bl", "##ast", "in", "1974", "." ], "ids": [ 107, 18465, 21849, 42663, 17339, 14425, 19626, 10114, 37215, 17446, 20761, 32562, 117, 107, 10261, 12415, 117, 44841, 10189, 11098, 10374, 56120, 10162, 17333, 32782, 10123, 10106, 10472, 39157, 10950, 11178, 20761, 34926, 11764, 10105, 12723, 112, 187, 10406, 10238, 15839, 21484, 15171, 10106, 10723, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", ":", "\"", "We", "cannot", "accept", "con", "##stra", "##ints", "on", "our", "option", "as", "long", "as", "nuclear", "weapon", "states", "continue", "to", "re", "##ly", "on", "their", "nuclear", "ar", "##sena", "##ls", "for", "their", "security", "\"", "." ], "ids": [ 10357, 12415, 131, 107, 12865, 25259, 45218, 10173, 19975, 71772, 10135, 17446, 32562, 10146, 11695, 10146, 20761, 54157, 16316, 17734, 10114, 11639, 10454, 10135, 10455, 20761, 10456, 62191, 11747, 10142, 10455, 21849, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "says", "death", "of", "its", "citizen", "will", "sou", "##r", "ties", "." ], "ids": [ 16032, 22153, 12557, 10108, 10474, 64735, 11337, 20514, 10129, 45169, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DH", "##A", "##KA", "1996", "-", "08", "-", "22" ], "ids": [ 83164, 10738, 67813, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "British", "minister", "expressed", "his", "government", "'", "s", "official", "dis", "##qui", "##et", "on", "Thursday", "at", "the", "recent", "death", "of", "a", "British", "citizen", "of", "Bangladesh", "##i", "origin", "at", "Dhaka", "airport", "." ], "ids": [ 138, 11160, 16930, 31685, 10226, 12047, 112, 187, 14731, 27920, 39639, 10308, 10135, 67067, 10160, 10105, 19037, 12557, 10108, 169, 11160, 64735, 10108, 24080, 10116, 22608, 10160, 75710, 28460, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 6, 9, 9, 1, 9, 9 ] }, { "tokens": [ "\"", "I", "have", "told", "Bangladesh", "leaders", "that", "British", "gov", "##erm", "##ent", "has", "attached", "serious", "importance", "to", "the", "resolution", "of", "the", "tra", "##gic", "death", "of", "Sir", "##aj", "Mia", ",", "\"", "Under", "-", "Secretary", "of", "State", "for", "Foreign", "and", "Commonwealth", "Affairs", "Liam", "Fox", "Fox", ",", "told", "reporter", "##s", "." ], "ids": [ 107, 146, 10529, 21937, 24080, 24155, 10189, 11160, 13585, 91724, 11405, 10393, 36957, 32342, 21912, 10114, 10105, 40017, 10108, 10105, 11264, 42153, 12557, 10108, 12852, 21171, 41367, 117, 107, 12594, 118, 19382, 10108, 11104, 10142, 20277, 10111, 22603, 20891, 48437, 14880, 14880, 117, 21937, 41408, 10107, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sir", "##aj", "Mia", "died", "at", "Dhaka", "airport", "on", "May", "9", "during", "intero", "##gation", "by", "customs", "officials", "after", "arriving", "from", "London", "." ], "ids": [ 12852, 21171, 41367, 12482, 10160, 75710, 28460, 10135, 10725, 130, 10939, 53034, 61005, 10155, 89907, 27730, 10662, 65200, 10188, 10829, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "His", "body", "bore", "multiple", "injuries", ",", "and", "his", "relatives", "com", "##plained", "that", "he", "was", "murdered", "." ], "ids": [ 11597, 14333, 73823, 19865, 49718, 117, 10111, 10226, 51893, 10212, 103154, 10189, 10261, 10134, 65861, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "post", "-", "morte", "##m", "report", "suggested", "he", "might", "have", "been", "torture", "##d", "." ], "ids": [ 138, 11841, 118, 13590, 10147, 17553, 27675, 10261, 20970, 10529, 10590, 81954, 10162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "customs", "authorities", "said", "the", "passenger", "was", "dr", "##unk", "and", "died", "of", "loss", "of", "blood", "from", "a", "deep", "cut", "in", "his", "w", "##rist", "after", "he", "hit", "a", "glass", "sheet", "." ], "ids": [ 16976, 89907, 28308, 12415, 10105, 33155, 10134, 17094, 33551, 10111, 12482, 10108, 18576, 10108, 24911, 10188, 169, 26591, 21610, 10106, 10226, 191, 24953, 10662, 10261, 14946, 169, 32362, 55030, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fox", ",", "who", "arrived", "in", "Bangladesh", "on", "Tuesday", "on", "four", "-", "day", "visit", ",", "said", "Britain", "wanted", "Dhaka", "to", "act", "seriously", "on", "the", "case", "." ], "ids": [ 14880, 117, 10479, 22584, 10106, 24080, 10135, 70245, 10135, 11598, 118, 11940, 27541, 117, 12415, 16032, 22591, 75710, 10114, 19833, 75543, 10135, 10105, 13474, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "is", "one", "of", "the", "reasons", "of", "my", "visit", "here", ".", ".", "." ], "ids": [ 107, 10747, 10124, 10464, 10108, 10105, 31725, 10108, 15127, 27541, 19353, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "this", "is", "an", "important", "issue", "in", "our", "relationship", "\"", ",", "said", "Fox", ",", "who", "is", "due", "to", "leave", "for", "Nepal", "on", "Friday", "." ], "ids": [ 10531, 10124, 10151, 12452, 15557, 10106, 17446, 19808, 107, 117, 12415, 14880, 117, 10479, 10124, 10850, 10114, 21964, 10142, 22276, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Fox", "said", "the", "incident", "had", "strain", "##ed", "relations", "between", "the", "two", "governments", "." ], "ids": [ 14880, 12415, 10105, 28005, 10374, 110158, 10336, 19824, 10948, 10105, 10551, 52052, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "Mia", "'", "s", "issue", "had", "been", "raised", "in", "the", "House", "of", "Commons", "." ], "ids": [ 10357, 12415, 10105, 41367, 112, 187, 15557, 10374, 10590, 20526, 10106, 10105, 11545, 10108, 13812, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Fox", "said", "he", "had", "brought", "up", "the", "issue", "at", "every", "meeting", "he", "had", "had", "with", "government", "leaders", "in", "Dhaka", "." ], "ids": [ 14880, 12415, 10261, 10374, 17327, 10741, 10105, 15557, 10160, 14234, 19822, 10261, 10374, 10374, 10169, 12047, 24155, 10106, 75710, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "He", "said", "the", "Bangladesh", "government", "had", "assure", "##d", "him", "it", "was", "taking", "the", "matter", "seriously", "." ], "ids": [ 10357, 12415, 10105, 24080, 12047, 10374, 62316, 10162, 10957, 10271, 10134, 18084, 10105, 27904, 75543, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "British", "government", "wants", "a", "th", "##oro", "##ugh", "investigation", "and", "a", "just", "outcome", ",", "\"", "he", "said", "." ], "ids": [ 107, 10117, 11160, 12047, 45769, 169, 77586, 30700, 25905, 32719, 10111, 169, 12820, 89097, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fox", "said", "the", "British", "government", "wanted", "an", "end", "to", "the", "alleged", "har", "##ass", "##ment", "of", "its", "national", "##s", "at", "Dhaka", "airport", "by", "customs", "officials", "." ], "ids": [ 14880, 12415, 10105, 11160, 12047, 22591, 10151, 11572, 10114, 10105, 48164, 10453, 98800, 10426, 10108, 10474, 11844, 10107, 10160, 75710, 28460, 10155, 89907, 27730, 119 ], "entity": [ "B-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bangladesh", "'", "s", "Criminal", "Investigation", "Department", "has", "charged", "two", "immigration", "officials", "in", "connection", "with", "Mia", "'", "s", "killing", "." ], "ids": [ 24080, 112, 187, 42198, 61421, 12933, 10393, 38253, 10551, 55031, 27730, 10106, 31671, 10169, 41367, 112, 187, 34248, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "Mia", ",", "a", "father", "of", "five", "children", ",", "had", "a", "restaurant", "business", "in", "a", "London", "suburb", "." ], "ids": [ 41367, 117, 169, 13194, 10108, 12403, 12694, 117, 10374, 169, 26234, 14155, 10106, 169, 10829, 54824, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "India", "fear", "##s", "attempts", "to", "dis", "##rupt", "Kashmir", "poll", "##s", "." ], "ids": [ 11098, 44929, 10107, 30406, 10114, 27920, 46791, 56335, 70156, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "SR", "##IN", "##AG", "##AR", ",", "India", "1996", "-", "08", "-", "22" ], "ids": [ 23032, 27128, 109865, 52188, 117, 11098, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "'", "s", "Home", "(", "interior", ")", "Minister", "accused", "Pakistan", "on", "on", "Thursday", "of", "planning", "to", "dis", "##rupt", "state", "elections", "in", "trouble", "##d", "Jammu", "and", "Kashmir", "state", "." ], "ids": [ 11098, 112, 187, 13898, 113, 14806, 114, 14355, 37303, 15437, 10135, 10135, 67067, 10108, 30240, 10114, 27920, 46791, 11388, 22054, 10106, 58285, 10162, 103818, 10111, 56335, 11388, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9 ] }, { "tokens": [ "\"", "It", "seems", "that", "from", "across", "the", "border", "there", "is", "going", "to", "be", "a", "planned", "attempt", "to", "dis", "##rupt", "the", "elections", ",", "\"", "Inde", "##rj", "##it", "Gupta", "told", "reporter", "##s", "in", "the", "state", "capital", "Sri", "##na", "##gar", "." ], "ids": [ 107, 10377, 34208, 10189, 10188, 15130, 10105, 20949, 11155, 10124, 19090, 10114, 10347, 169, 24292, 21395, 10114, 27920, 46791, 10105, 22054, 117, 107, 43376, 106186, 10486, 60940, 21937, 41408, 10107, 10106, 10105, 11388, 12185, 16098, 10219, 14415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "local", "poll", "##s", "next", "month", "will", "be", "the", "first", "since", "1987", "in", "the", "state", ",", "c", "##lam", "##ped", "under", "direct", "rule", "from", "New", "Delhi", "since", "1990", "." ], "ids": [ 10117, 11436, 70156, 10107, 13451, 14064, 11337, 10347, 10105, 10422, 11764, 10581, 10106, 10105, 11388, 117, 171, 21114, 16898, 10571, 16934, 21983, 10188, 10287, 18720, 11764, 10420, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "India", "has", "often", "accused", "Pakistan", "of", "ab", "##etting", "milita", "##ncy", "in", "the", "valley", ",", "a", "charge", "Islam", "##abad", "has", "always", "denied", "." ], "ids": [ 11098, 10393, 12899, 37303, 15437, 10108, 11357, 105242, 92924, 24166, 10106, 10105, 34852, 117, 169, 18163, 14727, 45407, 10393, 19540, 47467, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Gupta", "said", "there", "might", "be", "an", "increase", "in", "the", "number", "of", "people", "in", "##fil", "##trat", "##ing", "the", "Kashmir", "valley", "to", "create", "dis", "##tur", "##ban", "##ce", "in", "the", "region", "." ], "ids": [ 60940, 12415, 11155, 20970, 10347, 10151, 20299, 10106, 10105, 11487, 10108, 11426, 10106, 41784, 61908, 10230, 10105, 56335, 34852, 10114, 18842, 27920, 15698, 10927, 10419, 10106, 10105, 12220, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "notice", "##d", "among", "the", "people", "who", "come", "from", "across", "the", "border", ",", "there", "is", "a", "growing", "number", "of", "foreign", "mer", "##cena", "##ries", ",", "\"", "Gupta", "said", "." ], "ids": [ 107, 12865, 48323, 10162, 13328, 10105, 11426, 10479, 10678, 10188, 15130, 10105, 20949, 117, 11155, 10124, 169, 25566, 11487, 10108, 20796, 13697, 49369, 15388, 117, 107, 60940, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "India", "and", "Pakistan", "have", "fought", "two", "of", "their", "three", "wars", "over", "the", "trouble", "##d", "region", "of", "Kashmir", "since", "independence", "from", "Britain", "in", "1947", "." ], "ids": [ 11098, 10111, 15437, 10529, 29766, 10551, 10108, 10455, 11003, 68756, 10491, 10105, 58285, 10162, 12220, 10108, 56335, 11764, 31412, 10188, 16032, 10106, 11113, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Prime", "Minister", "H", ".", "D", ".", "Dev", "##e", "Go", "##wd", "##a", "'", "s", "centre", "-", "left", "government", "hopes", "the", "elections", "will", "help", "restore", "normal", "##ity", "and", "democratic", "rule", "in", "Jammu", "and", "Kashmir", ",", "where", "more", "than", "20", ",", "000", "people", "have", "died", "in", "ins", "##urg", "##ency", "-", "related", "violence", "since", "1990", "." ], "ids": [ 19924, 14355, 145, 119, 141, 119, 89586, 10112, 14439, 44466, 10113, 112, 187, 12672, 118, 12153, 12047, 82467, 10105, 22054, 11337, 15217, 76873, 16626, 11949, 10111, 72209, 21983, 10106, 103818, 10111, 56335, 117, 10940, 10798, 11084, 10197, 117, 10259, 11426, 10529, 12482, 10106, 15498, 51932, 87415, 118, 16382, 26342, 11764, 10420, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "a", "dozen", "militant", "groups", "are", "fighting", "New", "Delhi", "'", "s", "rule", "in", "the", "state", "." ], "ids": [ 15704, 169, 84956, 79006, 15647, 10301, 27535, 10287, 18720, 112, 187, 21983, 10106, 10105, 11388, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dhaka", "stock", "##s", "end", "up", "on", "gains", "by", "engineering", ",", "banks", "." ], "ids": [ 75710, 20511, 10107, 11572, 10741, 10135, 92193, 10155, 25008, 117, 41375, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DH", "##A", "##KA", "1996", "-", "08", "-", "22" ], "ids": [ 83164, 10738, 67813, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dhaka", "stock", "##s", "edge", "##d", "up", "on", "sharp", "##ly", "higher", "volume", "as", "engineering", "and", "cash", "shares", "gained", "ami", "##d", "buy", "##ing", "by", "both", "small", "and", "institution", "##al", "investors", ",", "broke", "##rs", "said", "." ], "ids": [ 75710, 20511, 10107, 30599, 10162, 10741, 10135, 77348, 10454, 17981, 15901, 10146, 25008, 10111, 52828, 45751, 25222, 16992, 10162, 47715, 10230, 10155, 11408, 12474, 10111, 30481, 10415, 83795, 117, 30500, 10943, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Dhaka", "Stock", "Exchange", "(", "DS", "##E", ")", "all", "-", "share", "price", "index", "rose", "8", ".", "05", "points", "or", "0", ".", "7", "percent", "to", "1", ",", "156", ".", "79", "on", "a", "turno", "##ver", "of", "146", ".", "2", "million", "taka", "." ], "ids": [ 10117, 75710, 31916, 32424, 113, 28102, 11259, 114, 10435, 118, 23867, 30839, 19776, 29467, 129, 119, 10831, 12789, 10345, 121, 119, 128, 22362, 10114, 122, 117, 20410, 119, 12791, 10135, 169, 17440, 12563, 10108, 19680, 119, 123, 12473, 81739, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Of", "the", "total", "119", "issues", "traded", "71", "closed", "higher", ",", "44", "ended", "lower", "and", "four", "remained", "un", "##chang", "##ed", "." ], "ids": [ 12610, 10105, 11339, 17963, 17850, 52696, 12513, 18440, 17981, 117, 11126, 18428, 18165, 10111, 11598, 15980, 10119, 64208, 10336, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "." ], "ids": [ 119 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "National", "Bank", "rose", "12", ".", "71", "taka", "to", "228", ".", "7", ",", "Eastern", "Cable", "##s", "gained", "20", ".", "37", "to", "677", ".", "98", "and", "A", "##pe", "##x", "Tanner", "##y", "lost", "22", ".", "72", "to", "597", "." ], "ids": [ 10655, 13533, 29467, 10186, 119, 12513, 81739, 10114, 25646, 119, 128, 117, 16311, 55536, 10107, 25222, 10197, 119, 11204, 10114, 74531, 119, 12327, 10111, 138, 11355, 10686, 83830, 10157, 14172, 10306, 119, 12120, 10114, 58779, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bro", "##kers", "said", "the", "stock", "##s", "recovered", "early", "losses", "to", "edge", "up", "at", "close", "because", "of", "institution", "##al", "support", "and", "short", "-", "covering", "ahead", "of", "Friday", "weekend", "." ], "ids": [ 32470, 25739, 12415, 10105, 20511, 10107, 55051, 11732, 45353, 10114, 30599, 10741, 10160, 16065, 12373, 10108, 30481, 10415, 13145, 10111, 13716, 118, 41810, 35629, 10108, 30767, 43440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "RB", "##I", "chief", "sees", "cut", "in", "cash", "reserve", "ratio", "." ], "ids": [ 11098, 71201, 11281, 19421, 41369, 21610, 10106, 52828, 32608, 26755, 119 ], "entity": [ "B-LOC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "DE", "##L", "##HI", "1996", "-", "08", "-", "22" ], "ids": [ 86607, 13034, 25067, 11369, 108880, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Reserve", "bank", "of", "India", "governor", "C", ".", "Rang", "##ara", "##jan", "said", "on", "Thursday", "that", "he", "expected", "the", "cash", "reserve", "ratio", "(", "CR", "##R", ")", "maintained", "by", "banks", "to", "be", "reduced", "over", "the", "medium", "term", "." ], "ids": [ 10117, 23120, 19423, 10108, 11098, 28795, 140, 119, 28221, 12677, 14376, 12415, 10135, 67067, 10189, 10261, 25973, 10105, 52828, 32608, 26755, 113, 44912, 11273, 114, 32974, 10155, 41375, 10114, 10347, 25724, 10491, 10105, 29843, 13719, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Over", "the", "medium", "term", ",", "ye", "##s", ",", "\"", "he", "told", "Reuters", "after", "address", "##ing", "industrial", "##ists", "in", "the", "capital", "." ], "ids": [ 107, 15704, 10105, 29843, 13719, 117, 11023, 10107, 117, 107, 10261, 21937, 46617, 10662, 32198, 10230, 18138, 18206, 10106, 10105, 12185, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "denied", "having", "said", "in", "a", "recent", "newspaper", "interview", "that", "the", "CR", "##R", "could", "be", "raised", "if", "necessary", "." ], "ids": [ 10357, 47467, 13677, 12415, 10106, 169, 19037, 22047, 21213, 10189, 10105, 44912, 11273, 12174, 10347, 20526, 12277, 27039, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "he", "was", "only", "trying", "(", "in", "that", "newspaper", "report", ")", "to", "explain", "the", "theoretical", "position", "on", "the", "use", "of", "the", "CR", "##R", "by", "central", "banks", "to", "manage", "money", "supply", "." ], "ids": [ 10357, 12415, 10261, 10134, 10893, 32862, 113, 10106, 10189, 22047, 17553, 114, 10114, 67004, 10105, 81436, 12956, 10135, 10105, 11760, 10108, 10105, 44912, 11273, 10155, 12397, 41375, 10114, 59251, 17920, 28914, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rang", "##ara", "##jan", "explained", "that", "the", "cash", "reserve", "ratio", "was", "an", "instrument", "that", "central", "banks", "could", "use", "to", "re", "##gula", "##te", "money", "supply", "by", "reducing", "or", "increasing", "the", "ratio", "." ], "ids": [ 28221, 12677, 14376, 44191, 10189, 10105, 52828, 32608, 26755, 10134, 10151, 24346, 10189, 12397, 41375, 12174, 11760, 10114, 11639, 56901, 10216, 17920, 28914, 10155, 62915, 10345, 30816, 10105, 26755, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "in", "the", "current", "context", ",", "the", "government", "stood", "by", "an", "earlier", "commitment", "to", "reduce", "it", "over", "a", "period", "of", "time", ",", "he", "said", "in", "response", "to", "a", "question", "." ], "ids": [ 16976, 10106, 10105, 14978, 30798, 117, 10105, 12047, 39320, 10155, 10151, 18905, 75010, 10114, 29888, 10271, 10491, 169, 13127, 10108, 10635, 117, 10261, 12415, 10106, 21001, 10114, 169, 20210, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "New", "Delhi", "news", "##room", ",", "+", "91", "-", "11", "-", "301", "##20", "##24" ], "ids": [ 118, 118, 10287, 18720, 14424, 25525, 117, 116, 12519, 118, 10193, 118, 26224, 22650, 53398 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "p", "##ct", "India", "current", "account", "deficit", "via", "##ble", "-", "RB", "##I", "." ], "ids": [ 13214, 184, 14526, 11098, 14978, 23200, 107383, 11406, 11203, 118, 71201, 11281, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "B", "##OM", "##BA", "##Y", "1996", "-", "08", "-", "22" ], "ids": [ 139, 37079, 35999, 14703, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Reserve", "Bank", "of", "India", "Governor", "Cha", "##kra", "##vart", "##y", "Rang", "##ara", "##jan", "said", "on", "Thursday", "that", "a", "current", "account", "deficit", "of", "two", "percent", "of", "gross", "domestic", "product", "(", "GDP", ")", "was", "sustainable", "given", "the", "cu", "##rr", "##rent", "rate", "of", "growth", "." ], "ids": [ 10117, 23120, 13533, 10108, 11098, 20462, 53453, 31707, 73492, 10157, 28221, 12677, 14376, 12415, 10135, 67067, 10189, 169, 14978, 23200, 107383, 10108, 10551, 22362, 10108, 92746, 31084, 21535, 113, 47832, 114, 10134, 92241, 13507, 10105, 10854, 47707, 28208, 18344, 10108, 14609, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "current", "account", "deficit", "of", "around", "two", "percent", "of", "GDP", "is", "a", "sustainable", "level", "of", "deficit", "given", "the", "expected", "real", "growth", "rate", "and", "the", "trends", "in", "import", "##s", "and", "export", "##s", ",", "\"", "Rang", "##ara", "##jan", "said", "in", "an", "address", "to", "business", "leaders", "in", "New", "Delhi", "." ], "ids": [ 107, 10117, 14978, 23200, 107383, 10108, 12166, 10551, 22362, 10108, 47832, 10124, 169, 92241, 13277, 10108, 107383, 13507, 10105, 25973, 13486, 14609, 18344, 10111, 10105, 109086, 10106, 67622, 10107, 10111, 59220, 10107, 117, 107, 28221, 12677, 14376, 12415, 10106, 10151, 32198, 10114, 14155, 24155, 10106, 10287, 18720, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Rang", "##ara", "##jan", "said", "a", "current", "account", "deficit", "of", "two", "percent", "brought", "about", "by", "a", "16", "-", "17", "percent", "annual", "growth", "in", "export", "##s", "and", "a", "14", "-", "15", "percent", "rise", "in", "import", "##s", "along", "with", "an", "increase", "in", "non", "-", "debt", "flows", "could", "lead", "to", "a", "reduction", "in", "the", "debt", "-", "service", "ratio", "to", "below", "20", "percent", "over", "the", "next", "five", "years", "." ], "ids": [ 28221, 12677, 14376, 12415, 169, 14978, 23200, 107383, 10108, 10551, 22362, 17327, 10978, 10155, 169, 10250, 118, 10273, 22362, 19246, 14609, 10106, 59220, 10107, 10111, 169, 10247, 118, 10208, 22362, 28710, 10106, 67622, 10107, 12400, 10169, 10151, 20299, 10106, 10446, 118, 55869, 41271, 12174, 14107, 10114, 169, 51608, 10106, 10105, 55869, 118, 11989, 26755, 10114, 17544, 10197, 22362, 10491, 10105, 13451, 12403, 10855, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Bombay", "news", "##room", "+", "91", "-", "22", "-", "265", "9000" ], "ids": [ 118, 118, 39961, 14424, 25525, 116, 12519, 118, 10306, 118, 25521, 56911 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mother", "Teresa", "devoted", "to", "world", "'", "s", "poor", "." ], "ids": [ 23625, 21218, 57910, 10114, 11356, 112, 187, 23247, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##LC", "##UT", "##TA", "1996", "-", "08", "-", "22" ], "ids": [ 24707, 84906, 65729, 24951, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mother", "Teresa", ",", "known", "as", "the", "Saint", "of", "the", "Gut", "##ters", ",", "won", "the", "Nobel", "Peace", "Prize", "in", "1979", "for", "bringing", "hope", "and", "dig", "##nity", "to", "millions", "of", "poor", ",", "un", "##want", "##ed", "people", "with", "her", "simple", "message", ":", "\"", "The", "poor", "must", "know", "that", "we", "love", "them", ".", "\"" ], "ids": [ 23625, 21218, 117, 11053, 10146, 10105, 10602, 10108, 10105, 41377, 21891, 117, 11367, 10105, 16280, 20705, 17017, 10106, 10675, 10142, 45749, 50725, 10111, 80592, 96585, 10114, 18123, 10108, 23247, 117, 10119, 104216, 10336, 11426, 10169, 10485, 16205, 30514, 131, 107, 10117, 23247, 14982, 21852, 10189, 11951, 16138, 11345, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "the", "world", "he", "##aps", "honours", "on", "her", "and", "even", "regard", "##s", "her", "as", "a", "living", "saint", ",", "the", "nun", "of", "Albanian", "descent", "maintains", "she", "is", "merely", "doing", "God", "'", "s", "work", "." ], "ids": [ 14600, 10105, 11356, 10261, 76591, 106111, 10135, 10485, 10111, 13246, 42047, 10107, 10485, 10146, 169, 14625, 24353, 117, 10105, 11715, 10108, 54257, 52709, 74905, 10833, 10124, 70807, 30918, 14015, 112, 187, 11424, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "gives", "me", "great", "jo", "##y", "and", "fu", "##lf", "##ilm", "##ent", "to", "love", "and", "care", "for", "the", "poor", "and", "ne", "##gle", "##cted", ",", "\"", "she", "said", ".", "\"" ], "ids": [ 107, 10377, 24952, 10911, 14772, 12541, 10157, 10111, 11005, 35173, 51782, 11405, 10114, 16138, 10111, 11131, 10142, 10105, 23247, 10111, 10554, 23239, 27756, 117, 107, 10833, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "poor", "do", "not", "need", "our", "sy", "##mpa", "##thy", "and", "pit", "##y", "." ], "ids": [ 10117, 23247, 10149, 10472, 17367, 17446, 12261, 31285, 54047, 10111, 55277, 10157, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "need", "our", "love", "and", "com", "##pass", "##ion", ".", "\"" ], "ids": [ 11696, 17367, 17446, 16138, 10111, 10212, 36388, 11046, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "di", "##min", "##uti", "##ve", "Roman", "Catholic", "missionary", "was", "on", "resp", "##irat", "##ory", "support", "in", "intensive", "care", "in", "an", "Indian", "nur", "##sing", "home", "on", "Thursday", "after", "suffering", "heart", "failure", "." ], "ids": [ 10117, 10120, 14956, 19065, 10612, 12359, 15473, 89063, 10134, 10135, 52812, 56610, 21493, 13145, 10106, 73636, 11131, 10106, 10151, 12544, 11354, 16357, 11816, 10135, 67067, 10662, 49552, 21736, 31562, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "an", "attending", "doctor", "said", "Mother", "Teresa", ",", "who", "turns", "86", "next", "Tuesday", ",", "was", "con", "##sci", "##ous", "and", "in", "stable", "condition", "." ], "ids": [ 16976, 10151, 54234, 26937, 12415, 23625, 21218, 117, 10479, 37374, 12224, 13451, 70245, 117, 10134, 10173, 89270, 13499, 10111, 10106, 38430, 24713, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "task", "Mother", "Teresa", "began", "alone", "in", "1949", "in", "the", "sl", "##ums", "of", "dense", "##ly", "-", "populated", "Calcutta", ",", "and", "grew", "to", "touch", "the", "heart", "##s", "of", "people", "around", "the", "world", "." ], "ids": [ 10117, 37758, 23625, 21218, 11941, 24087, 10106, 11095, 10106, 10105, 38523, 24379, 10108, 70020, 10454, 118, 84374, 54383, 117, 10111, 23616, 10114, 54981, 10105, 21736, 10107, 10108, 11426, 12166, 10105, 11356, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "in", "1979", "she", "was", "told", "she", "had", "won", "the", "Nobel", "Peace", "Prize", ",", "she", "said", "characteristic", "##ally", ":", "\"", "I", "am", "un", "##worthy", ".", "\"" ], "ids": [ 12242, 10106, 10675, 10833, 10134, 21937, 10833, 10374, 11367, 10105, 16280, 20705, 17017, 117, 10833, 12415, 62906, 19777, 131, 107, 146, 10392, 10119, 102786, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "world", "disa", "##gree", "##d", ",", "show", "##ering", "more", "than", "80", "national", "and", "international", "honours", "on", "her", "including", "the", "B", "##hara", "##t", "Rat", "##na", ",", "or", "Je", "##wel", "of", "India", ",", "the", "country", "'", "s", "highest", "civilian", "award", "." ], "ids": [ 10117, 11356, 36474, 91479, 10162, 117, 11897, 19232, 10798, 11084, 10832, 11844, 10111, 12533, 106111, 10135, 10485, 11198, 10105, 139, 32169, 10123, 29839, 10219, 117, 10345, 13796, 20706, 10108, 11098, 117, 10105, 12723, 112, 187, 18134, 53653, 17725, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Her", "health", "began", "to", "det", "##eri", "##orat", "##e", "in", "1989", "when", "she", "was", "fitted", "with", "a", "heart", "pace", "##maker", "." ], "ids": [ 13229, 17004, 11941, 10114, 10349, 13227, 99124, 10112, 10106, 10524, 10841, 10833, 10134, 55037, 10169, 169, 21736, 32547, 32295, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "year", "later", ",", "the", "Vatican", "announced", "she", "was", "step", "##ping", "down", "as", "Superior", "of", "her", "Mission", "##aries", "of", "Charity", "order", "." ], "ids": [ 138, 10924, 10873, 117, 10105, 54527, 13854, 10833, 10134, 31877, 15398, 12935, 10146, 25244, 10108, 10485, 14157, 26445, 10108, 71370, 12990, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "More", "than", "100", "dele", "##gates", "flew", "in", "from", "around", "the", "world", "to", "elect", "a", "successor", "." ], "ids": [ 15946, 11084, 10407, 28250, 71675, 64284, 10106, 10188, 12166, 10105, 11356, 10114, 106095, 169, 33095, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "could", "not", "agree", ",", "so", "asked", "her", "to", "stay", "on", "." ], "ids": [ 11696, 12174, 10472, 68312, 117, 10380, 22151, 10485, 10114, 29597, 10135, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "agreed", "." ], "ids": [ 11149, 25577, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "In", "1991", ",", "Mother", "Teresa", "was", "treated", "at", "a", "California", "hospital", "for", "heart", "disease", "and", "bacteria", "##l", "pne", "##umon", "##ia", "." ], "ids": [ 10167, 10442, 117, 23625, 21218, 10134, 45369, 10160, 169, 11621, 18141, 10142, 21736, 21911, 10111, 63318, 10161, 63821, 108689, 10280, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "1993", ",", "she", "fell", "in", "Rome", "and", "broke", "three", "ri", "##bs", "." ], "ids": [ 10167, 10463, 117, 10833, 25194, 10106, 14592, 10111, 30500, 11003, 29956, 19528, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "August", "the", "same", "year", ",", "while", "in", "New", "Delhi", "to", "receive", "yet", "another", "award", ",", "she", "developed", "malaria", ",", "complicated", "by", "her", "heart", "and", "lung", "problems", "." ], "ids": [ 10167, 10735, 10105, 11561, 10924, 117, 11371, 10106, 10287, 18720, 10114, 26286, 21833, 12864, 17725, 117, 10833, 14628, 88086, 117, 104904, 10155, 10485, 21736, 10111, 66041, 20390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "April", "she", "frac", "##ture", "##d", "her", "left", "coll", "##ar", "bone", "." ], "ids": [ 14812, 10780, 10833, 25038, 16023, 10162, 10485, 12153, 28552, 10354, 57254, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "her", "increasing", "fra", "##ilt", "##y", ",", "art", "##hri", "##tis", "and", "failing", "eyes", "##ight", "has", "not", "stopped", "her", "travels", "around", "the", "world", "to", "ming", "##le", "with", "the", "poor", "and", "des", "##perate", "." ], "ids": [ 16976, 10485, 30816, 10628, 51777, 10157, 117, 11938, 53743, 13434, 10111, 72103, 38144, 27521, 10393, 10472, 40949, 10485, 68987, 12166, 10105, 11356, 10114, 58102, 10284, 10169, 10105, 23247, 10111, 10139, 71470, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mother", "Teresa", "was", "born", "Agnes", "Go", "##in", "##x", "##ha", "Be", "##ja", "##x", "##hiu", "to", "Albanian", "parents", "in", "Skopje", ",", "in", "what", "was", "then", "Serbia", ",", "on", "August", "27", ",", "1910", "." ], "ids": [ 23625, 21218, 10134, 11175, 33647, 14439, 10245, 10686, 10921, 14321, 10320, 10686, 93055, 10114, 54257, 17293, 10106, 54454, 117, 10106, 12976, 10134, 11059, 20141, 117, 10135, 10735, 10365, 117, 11585, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 8, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "attended", "a", "government", "school", "and", "was", "already", "deeply", "religious", "by", "the", "time", "she", "was", "12", "." ], "ids": [ 11149, 17696, 169, 12047, 11393, 10111, 10134, 19034, 78846, 19366, 10155, 10105, 10635, 10833, 10134, 10186, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "the", "age", "of", "18", "she", "became", "a", "Lor", "##etto", "nun", ",", "hop", "##ing", "to", "work", "at", "the", "Order", "'", "s", "Calcutta", "mission", "." ], "ids": [ 11699, 10105, 12089, 10108, 10218, 10833, 11179, 169, 91473, 24327, 11715, 117, 26369, 10230, 10114, 11424, 10160, 10105, 14715, 112, 187, 54383, 17032, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "She", "was", "sent", "to", "Lor", "##etto", "Abbey", "in", "Dublin", "and", "from", "there", "to", "India", "to", "begin", "her", "novi", "##tia", "##te", "and", "teach", "ge", "##ography", "at", "a", "convent", "school", "in", "Calcutta", "." ], "ids": [ 11149, 10134, 14541, 10114, 91473, 24327, 30339, 10106, 20495, 10111, 10188, 11155, 10114, 11098, 10114, 16135, 10485, 39122, 16180, 10216, 10111, 59816, 46503, 34850, 10160, 169, 80215, 11393, 10106, 54383, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "She", "said", "her", "divine", "call", "to", "work", "among", "the", "poor", "came", "in", "September", ",", "1946", ".", "\"" ], "ids": [ 11149, 12415, 10485, 70687, 20575, 10114, 11424, 13328, 10105, 23247, 13383, 10106, 10596, 117, 11063, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "message", "was", "quite", "clear", ",", "\"", "she", "told", "one", "interview", "##er", ".", "\"" ], "ids": [ 10117, 30514, 10134, 31324, 24866, 117, 107, 10833, 21937, 10464, 21213, 10165, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "was", "to", "leave", "the", "convent", "and", "help", "the", "poor", "while", "living", "among", "them", "." ], "ids": [ 146, 10134, 10114, 21964, 10105, 80215, 10111, 15217, 10105, 23247, 11371, 14625, 13328, 11345, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "an", "order", "." ], "ids": [ 10377, 10134, 10151, 12990, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "knew", "where", "I", "belonged", ".", "\"" ], "ids": [ 146, 46000, 10940, 146, 55893, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Vatican", "and", "the", "mother", "superior", "in", "Dublin", "approved", "and", "after", "intensive", "training", "as", "a", "nurse", "with", "American", "mission", "##aries", "she", "opened", "her", "first", "Calcutta", "sl", "##um", "school", "in", "December", "1949", "." ], "ids": [ 10117, 54527, 10111, 10105, 15293, 15855, 10106, 20495, 29855, 10111, 10662, 73636, 15722, 10146, 169, 108470, 10169, 10536, 17032, 26445, 10833, 14377, 10485, 10422, 54383, 38523, 10465, 11393, 10106, 11288, 11095, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "took", "the", "name", "of", "Teresa", ",", "after", "France", "'", "s", "Saint", "There", "##se", "of", "the", "Child", "Jesus", "." ], "ids": [ 11149, 12149, 10105, 11324, 10108, 21218, 117, 10662, 10688, 112, 187, 10602, 11723, 10341, 10108, 10105, 21640, 15831, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 9, 9, 1, 9, 9, 9, 4, 8, 9, 9, 9, 4, 9 ] }, { "tokens": [ "In", "India", "she", "was", "simply", "called", "Mother", "." ], "ids": [ 10167, 11098, 10833, 10134, 26097, 11552, 23625, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "Mother", "Teresa", "set", "up", "her", "first", "home", "for", "the", "dying", "in", "a", "Hindu", "rest", "house", "in", "Calcutta", "after", "she", "saw", "a", "penn", "##iles", "##s", "woman", "turned", "away", "by", "a", "city", "hospital", "." ], "ids": [ 23625, 21218, 11847, 10741, 10485, 10422, 11816, 10142, 10105, 84769, 10106, 169, 22090, 17333, 13215, 10106, 54383, 10662, 10833, 17112, 169, 62603, 38278, 10107, 18299, 21031, 14942, 10155, 169, 11584, 18141, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Named", "\"", "Ni", "##rmal", "Hr", "##ida", "##y", "\"", "(", "Ten", "##der", "Heart", ")", ",", "it", "was", "the", "first", "of", "a", "chain", "of", "150", "homes", "for", "dying", ",", "des", "##titut", "##e", "people", ",", "ad", "##mitting", "nearly", "18", ",", "000", "a", "year", "." ], "ids": [ 88747, 107, 30409, 66619, 74968, 11726, 10157, 107, 113, 16411, 11304, 15095, 114, 117, 10271, 10134, 10105, 10422, 10108, 169, 32768, 10108, 11766, 14154, 10142, 84769, 117, 10139, 102083, 10112, 11426, 117, 10840, 86074, 21377, 10218, 117, 10259, 169, 10924, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 5, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Her", "Mission", "##aries", "of", "Charity", ",", "a", "Roman", "Catholic", "religious", "order", "she", "founded", "in", "1949", ",", "now", "runs", "about", "300", "homes", "for", "un", "##want", "##ed", "children", "and", "the", "des", "##titut", "##e", "in", "India", "and", "abroad", "." ], "ids": [ 13229, 14157, 26445, 10108, 71370, 117, 169, 12359, 15473, 19366, 12990, 10833, 14078, 10106, 11095, 117, 11858, 17913, 10978, 11093, 14154, 10142, 10119, 104216, 10336, 12694, 10111, 10105, 10139, 102083, 10112, 10106, 11098, 10111, 50901, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "In", "1994", "a", "British", "television", "documentary", "called", "the", "my", "##th", "around", "Mother", "Teresa", "a", "mixture", "of", "\"", "hy", "##per", "##bol", "##e", "and", "c", "##red", "##uli", "##ty", "\"", "." ], "ids": [ 10167, 10444, 169, 11160, 14162, 27838, 11552, 10105, 15127, 11143, 12166, 23625, 21218, 169, 73745, 10108, 107, 15165, 12713, 22729, 10112, 10111, 171, 15711, 24207, 11195, 107, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Catholics", "around", "the", "world", "rose", "to", "her", "defence", "." ], "ids": [ 89482, 12166, 10105, 11356, 29467, 10114, 10485, 47245, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "F", "##OC", "##US", "-", "News", "for", "##eca", "##sts", "alien", "-", "led", "profit", "bo", "##ost", "." ], "ids": [ 56898, 39469, 118, 143, 49378, 32612, 118, 12219, 10142, 33588, 28036, 81087, 118, 12857, 25081, 20506, 18239, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bernard", "Hi", "##ckey" ], "ids": [ 14450, 20065, 92334 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "22" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Media", "baron", "Rupert", "Murdoch", "'", "s", "News", "Corp", "Ltd", "reported", "lower", "than", "expected", "1995", "/", "96", "profits", "on", "Thursday", ",", "but", "for", "##eca", "##st", "that", "the", "hit", "film", "\"", "Independence", "Day", "\"", "would", "help", "increase", "profits", "by", "at", "least", "20", "percent", "in", "1996", "/", "97", "." ], "ids": [ 13341, 33795, 44706, 98283, 112, 187, 12219, 44687, 15129, 15943, 18165, 11084, 25973, 10436, 120, 12308, 100106, 10135, 67067, 117, 10473, 10142, 33588, 10562, 10189, 10105, 14946, 10458, 107, 36834, 12360, 107, 10894, 15217, 20299, 100106, 10155, 10160, 16298, 10197, 22362, 10106, 10389, 120, 12328, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "From", "an", "earning", "##s", "perspective", ",", "the", "current", "fiscal", "year", "has", "begun", "with", "great", "promise", "due", "to", "the", "hit", "motion", "picture", "'", "Independence", "Day", ",", "'", "\"", "News", "Corp", "said", "in", "a", "statement", "anno", "##un", "##cing", "its", "results", "for", "the", "year", "to", "June", "30", ",", "1996", "." ], "ids": [ 107, 12222, 10151, 56981, 10107, 39836, 117, 10105, 14978, 43645, 10924, 10393, 49510, 10169, 14772, 73871, 10850, 10114, 10105, 14946, 30107, 36761, 112, 36834, 12360, 117, 112, 107, 12219, 44687, 12415, 10106, 169, 33311, 11671, 11107, 19113, 10474, 17466, 10142, 10105, 10924, 10114, 11120, 10244, 117, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "mode", "##rating", "paper", "prices", "and", "solid", "orders", "for", "advertising", "at", "its", "Fox", "Broadcasting", "television", "network", "in", "the", "United", "States", "would", "also", "help", "bo", "##ost", "profits", "in", "the", "1996", "/", "97", "year", ".", "\"" ], "ids": [ 10377, 12415, 18417, 45527, 17895, 57476, 10111, 37751, 31303, 10142, 49828, 10160, 10474, 14880, 28362, 14162, 17175, 10106, 10105, 10609, 10859, 10894, 10379, 15217, 20506, 18239, 100106, 10106, 10105, 10389, 120, 12328, 10924, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "budget", "##ed", "profit", "increase", "of", "at", "least", "20", "percent", "for", "the", "full", "year", "currently", "appears", "very", "att", "##aina", "##ble", ",", "\"", "News", "Corp", "said", "." ], "ids": [ 138, 25293, 10336, 25081, 20299, 10108, 10160, 16298, 10197, 22362, 10142, 10105, 13375, 10924, 15313, 20296, 12558, 10788, 77262, 11203, 117, 107, 12219, 44687, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "The", "bu", "##llis", "##h", "comments", "for", "the", "coming", "year", "sooth", "##ed", "anal", "##yst", "##s", "and", "most", "share", "##holders", ",", "who", "were", "disa", "##ppo", "##inted", "by", "the", "lower", "than", "expected", "profit", "for", "1995", "/", "96", "." ], "ids": [ 10117, 11499, 44417, 10237, 61565, 10142, 10105, 23959, 10924, 108734, 10336, 106615, 62769, 10107, 10111, 10992, 23867, 75111, 117, 10479, 10309, 36474, 45565, 107583, 10155, 10105, 18165, 11084, 25973, 25081, 10142, 10436, 120, 12308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "News", "announced", "pre", "-", "ab", "##normal", "##s", "net", "profit", "for", "the", "year", "fell", "six", "percent", "to", "A", "$", "1", ".", "26", "billion", "(", "US", "$", "995", "million", ")", "and", "earning", "##s", "per", "share", "dropped", "to", "40", "cents", "from", "46", "cents", "." ], "ids": [ 12219, 13854, 12229, 118, 11357, 89304, 10107, 11988, 25081, 10142, 10105, 10924, 25194, 12449, 22362, 10114, 138, 109, 122, 119, 10314, 25848, 113, 10808, 109, 66164, 12473, 114, 10111, 56981, 10107, 10178, 23867, 30241, 10114, 10533, 63487, 10188, 11528, 63487, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ana", "##lys", "##ts", "had", "on", "average", "expected", "a", "pre", "-", "ab", "##normal", "##s", "profit", "of", "A", "$", "1", ".", "343", "billion", "." ], "ids": [ 16377, 52176, 10806, 10374, 10135, 13551, 25973, 169, 12229, 118, 11357, 89304, 10107, 25081, 10108, 138, 109, 122, 119, 32007, 25848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "year", "just", "gone", "was", "disa", "##ppo", "##inti", "##ng", ",", "but", "the", "out", "##lo", "##ok", "for", "the", "current", "year", "looks", "good", ",", "\"", "First", "Pacific", "media", "anal", "##yst", "Lac", "##hla", "##n", "Drummond", "said", "." ], "ids": [ 107, 10117, 10924, 12820, 45041, 10134, 36474, 45565, 49886, 10376, 117, 10473, 10105, 10950, 10715, 11140, 10142, 10105, 14978, 10924, 59148, 15198, 117, 107, 12128, 14597, 12518, 106615, 62769, 12602, 74935, 10115, 90452, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "News", "Corp", "said", "strong", "performances", "in", "U", ".", "S", ".", "television", "and", "British", "newspapers", "were", "offs", "##et", "by", "lower", "profits", "from", "News", "Corp", "'", "s", "magazine", "and", "publishing", "divisions", "and", "further", "he", "##fty", "losses", "from", "its", "Asian", "Star", "TV", "operations", "." ], "ids": [ 12219, 44687, 12415, 18093, 22744, 10106, 158, 119, 156, 119, 14162, 10111, 11160, 48473, 10309, 51851, 10308, 10155, 18165, 100106, 10188, 12219, 44687, 112, 187, 15438, 10111, 38880, 30268, 10111, 14586, 10261, 88180, 45353, 10188, 10474, 16900, 11836, 10813, 18356, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Higher", "news", "##print", "prices", "hit", "profits", "hard", ".", "\"" ], "ids": [ 35471, 14424, 53233, 57476, 14946, 100106, 19118, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Throughout", "the", "group", ",", "higher", "paper", "prices", "increased", "costs", "by", "over", "US", "$", "300", "million", ",", "\"", "it", "said", "." ], "ids": [ 56302, 10105, 11795, 117, 17981, 17895, 57476, 19299, 34495, 10155, 10491, 10808, 109, 11093, 12473, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "News", "Corp", "said", "British", "newspaper", "operating", "profits", "rose", "10", "percent", "for", "the", "year", ",", "as", "higher", "cover", "prices", "at", "The", "Sun", "and", "The", "Times", "and", "higher", "advertising", "volumes", "offs", "##et", "increased", "news", "##print", "costs", "." ], "ids": [ 12219, 44687, 12415, 11160, 22047, 24210, 100106, 29467, 10150, 22362, 10142, 10105, 10924, 117, 10146, 17981, 16068, 57476, 10160, 10117, 13967, 10111, 10117, 12020, 10111, 17981, 49828, 25079, 51851, 10308, 19299, 14424, 53233, 34495, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ad", "##vert", "##ising", "revenue", "##s", "at", "The", "Times", "grew", "20", "percent", "." ], "ids": [ 25474, 30013, 53624, 51557, 10107, 10160, 10117, 12020, 23616, 10197, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Ana", "##lys", "##ts", "said", "sharp", "##ly", "lower", "earning", "##s", "from", "News", "Corp", "'", "s", "book", "publishing", "division", "and", "its", "U", ".", "S", ".", "magazines", "had", "been", "the", "major", "surprise", "##s", "in", "the", "results", "for", "1995", "/", "96", "." ], "ids": [ 16377, 52176, 10806, 12415, 77348, 10454, 18165, 56981, 10107, 10188, 12219, 44687, 112, 187, 12748, 38880, 13751, 10111, 10474, 158, 119, 156, 119, 48320, 10374, 10590, 10105, 11922, 48886, 10107, 10106, 10105, 17466, 10142, 10436, 120, 12308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "News", "Corp", "said", "revenue", "gains", "at", "its", "magazines", "and", "ins", "##erts", "division", "were", "offs", "##et", "by", "higher", "paper", "prices", "and", "lower", "sales", "at", "the", "U", ".", "S", ".", "TV", "Guide", "." ], "ids": [ 12219, 44687, 12415, 51557, 92193, 10160, 10474, 48320, 10111, 15498, 64115, 13751, 10309, 51851, 10308, 10155, 17981, 17895, 57476, 10111, 18165, 23857, 10160, 10105, 158, 119, 156, 119, 10813, 14086, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 3, 7, 9 ] }, { "tokens": [ "News", "said", "dramatic", "##ally", "lower", "earning", "##s", "from", "the", "British", "arm", "of", "its", "Harper", "-", "Collins", "publishing", "division", "more", "than", "offs", "##et", "healthy", "results", "from", "its", "U", ".", "S", ".", "operation", "." ], "ids": [ 12219, 12415, 60156, 19777, 18165, 56981, 10107, 10188, 10105, 11160, 31251, 10108, 10474, 15390, 118, 16949, 38880, 13751, 10798, 11084, 51851, 10308, 89601, 17466, 10188, 10474, 158, 119, 156, 119, 20080, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "It", "said", "the", "demi", "##se", "of", "the", "Net", "Book", "Agreement", "had", "hur", "##t", "the", "British", "operations", ",", "and", "weak", "performances", "from", "the", "San", "Francisco", "unit", "of", "Harper", "-", "Collins", "had", "not", "helped", "." ], "ids": [ 10377, 12415, 10105, 18844, 10341, 10108, 10105, 32577, 13801, 62223, 10374, 52824, 10123, 10105, 11160, 18356, 117, 10111, 61285, 22744, 10188, 10105, 10469, 11798, 16511, 10108, 15390, 118, 16949, 10374, 10472, 20890, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "minimum", "price", "setting", "ex", "##pired", "last", "September", "when", "three", "publisher", "##s", "pulled", "out", "." ], "ids": [ 10117, 26503, 30839, 29421, 11419, 110603, 12469, 10596, 10841, 11003, 45072, 10107, 65884, 10950, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "it", "was", "the", "bu", "##llis", "##h", "profit", "for", "##eca", "##st", "for", "1996", "/", "97", "that", "took", "the", "spot", "##light", "in", "the", "market", ",", "with", "some", "anal", "##yst", "##s", "saying", "20", "percent", "may", "even", "be", "an", "under", "##state", "##ment", "." ], "ids": [ 16976, 10271, 10134, 10105, 11499, 44417, 10237, 25081, 10142, 33588, 10562, 10142, 10389, 120, 12328, 10189, 12149, 10105, 28504, 24310, 10106, 10105, 17313, 117, 10169, 11152, 106615, 62769, 10107, 22807, 10197, 22362, 11387, 13246, 10347, 10151, 10571, 65023, 10426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "they", "'", "re", "saying", "at", "least", "20", "percent", ",", "then", "their", "internal", "for", "##eca", "##sts", "are", "probably", "saying", "25", "or", "30", "percent", ",", "\"", "said", "one", "Sydney", "media", "anal", "##yst", "who", "declined", "to", "be", "named", "." ], "ids": [ 107, 14535, 10689, 112, 11639, 22807, 10160, 16298, 10197, 22362, 117, 11059, 10455, 29868, 10142, 33588, 28036, 10301, 23282, 22807, 10258, 10345, 10244, 22362, 117, 107, 12415, 10464, 14470, 12518, 106615, 62769, 10479, 44948, 10114, 10347, 12038, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "News", "Corp", "'", "s", "shares", "were", "down", "eight", "cents", "at", "A", "$", "6", ".", "39", "at", "2", ".", "00", "p", ".", "m", ".", "(", "040", "##0", "GMT", ")", "in", "a", "soft", "market", "." ], "ids": [ 12219, 44687, 112, 187, 45751, 10309, 12935, 16222, 63487, 10160, 138, 109, 127, 119, 11303, 10160, 123, 119, 11025, 184, 119, 181, 119, 113, 82738, 10929, 20362, 114, 10106, 169, 44898, 17313, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "A", "$", "1", "=", "US", "$", "0", ".", "79", ")" ], "ids": [ 113, 138, 109, 122, 134, 10808, 109, 121, 119, 12791, 114 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "373", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 37358, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Budget", "cuts", "to", "bo", "##ost", "Australia", "saving", "##s", "-", "RB", "##A", "." ], "ids": [ 56898, 39469, 118, 62967, 73311, 10114, 20506, 18239, 11729, 90682, 10107, 118, 71201, 10738, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "CAN", "##B", "##ER", "##RA", "1996", "-", "08", "-", "22" ], "ids": [ 98038, 11274, 24093, 29990, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Australian", "government", "'", "s", "plans", "to", "sl", "##ash", "its", "budget", "deficit", "should", "make", "a", "useful", "contribution", "to", "national", "saving", "##s", ",", "the", "Reserve", "Bank", "of", "Australia", "(", "RB", "##A", ")", "said", "in", "its", "annual", "report", "." ], "ids": [ 10117, 12829, 12047, 112, 187, 18195, 10114, 38523, 73491, 10474, 25293, 107383, 14819, 13086, 169, 48765, 34967, 10114, 11844, 90682, 10107, 117, 10105, 23120, 13533, 10108, 11729, 113, 71201, 10738, 114, 12415, 10106, 10474, 19246, 17553, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "government", "'", "s", "announced", "plans", "to", "balance", "the", "budget", ",", "if", "real", "##ised", ",", "would", "make", "a", "useful", "contribution", "to", "raising", "national", "saving", "##s", ",", "\"", "the", "RB", "##A", "said", "." ], "ids": [ 107, 10117, 12047, 112, 187, 13854, 18195, 10114, 40162, 10105, 25293, 117, 12277, 13486, 20666, 117, 10894, 13086, 169, 48765, 34967, 10114, 59252, 11844, 90682, 10107, 117, 107, 10105, 71201, 10738, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "The", "bank", "said", "there", "were", "concerns", "fiscal", "con", "##sol", "##idat", "##ion", "would", "und", "##ul", "##y", "rest", "##ric", "##t", "growth", ",", "but", "evidence", "was", "amb", "##igu", "##ous", "." ], "ids": [ 10117, 19423, 12415, 11155, 10309, 42663, 43645, 10173, 43115, 90710, 11046, 10894, 10130, 10604, 10157, 17333, 18570, 10123, 14609, 117, 10473, 18713, 10134, 10559, 86552, 13499, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "its", "1996", "/", "97", "budget", "announced", "on", "Tuesday", ",", "the", "Australian", "Coalition", "government", "announced", "an", "underlying", "budget", "deficit", "of", "A", "$", "5", ".", "65", "billion", ",", "and", "pl", "##ed", "##ged", "to", "return", "the", "underlying", "budget", "balance", "to", "sur", "##plus", "by", "1998", "/", "99", "." ], "ids": [ 10167, 10474, 10389, 120, 12328, 25293, 13854, 10135, 70245, 117, 10105, 12829, 65836, 12047, 13854, 10151, 93680, 25293, 107383, 10108, 138, 109, 126, 119, 10843, 25848, 117, 10111, 20648, 10336, 18832, 10114, 15079, 10105, 93680, 25293, 40162, 10114, 10326, 70413, 10155, 10363, 120, 12187, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 3, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "budget", "deficit", "was", "A", "$", "10", ".", "3", "billion", "in", "1995", "/", "96", "." ], "ids": [ 10117, 25293, 107383, 10134, 138, 109, 10150, 119, 124, 25848, 10106, 10436, 120, 12308, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Det", "##erm", "##ined", "and", "c", "##redible", "efforts", "to", "rein", "in", "uns", "##usta", "##ina", "##ble", "fiscal", "positions", "(", "are", ")", "often", "re", "##ward", "##ed", "by", "rising", "confidence", ",", "giving", "favour", "##able", "effects", "on", "economic", "activity", "even", "in", "the", "short", "term", ",", "\"", "it", "said", "." ], "ids": [ 107, 10666, 91724, 28751, 10111, 171, 94530, 22116, 10114, 74720, 10106, 15826, 25134, 11067, 11203, 43645, 23188, 113, 10301, 114, 12899, 11639, 16988, 10336, 10155, 53816, 74187, 117, 24426, 61264, 13096, 21274, 10135, 13925, 22205, 13246, 10106, 10105, 13716, 13719, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "More", "generally", ",", "the", "long", "-", "term", "effects", "of", "fiscal", "con", "##sol", "##idat", "##ion", "are", "clearly", "positive", ",", "with", "higher", "saving", "tend", "##ing", "to", "promote", "economic", "growth", "by", "raising", "investment", "and", "lower", "##ing", "long", "-", "term", "real", "interest", "rates", ",", "\"", "the", "RB", "##A", "said", "." ], "ids": [ 107, 15946, 18081, 117, 10105, 11695, 118, 13719, 21274, 10108, 43645, 10173, 43115, 90710, 11046, 10301, 52340, 19737, 117, 10169, 17981, 90682, 45415, 10230, 10114, 32807, 13925, 14609, 10155, 59252, 37933, 10111, 18165, 10230, 11695, 118, 13719, 13486, 17644, 38200, 117, 107, 10105, 71201, 10738, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "B", "##N", "##Z", "cuts", "NZ", "fixed", "home", "len", "##ding", "rates", "." ], "ids": [ 139, 11537, 13966, 73311, 105920, 37770, 11816, 28859, 13971, 38200, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bank", "of", "New", "Zealand", "said", "on", "Thursday", "it", "was", "cutting", "its", "fixed", "home", "len", "##ding", "rates", "." ], "ids": [ 13533, 10108, 10287, 14451, 12415, 10135, 67067, 10271, 10134, 63039, 10474, 37770, 11816, 28859, 13971, 38200, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rates", "are", ":" ], "ids": [ 10117, 38200, 10301, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "New", "rate", "old", "rate" ], "ids": [ 10287, 18344, 12898, 18344 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Six", "month", "rate", "10", ".", "5", "p", "##ct", "10", ".", "75" ], "ids": [ 20615, 14064, 18344, 10150, 119, 126, 184, 14526, 10150, 119, 11417 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "year", "10", ".", "5", "p", "##ct", "10", ".", "95" ], "ids": [ 11340, 10924, 10150, 119, 126, 184, 14526, 10150, 119, 11978 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "year", "10", ".", "5", "p", "##ct", "11", ".", "25" ], "ids": [ 13214, 10924, 10150, 119, 126, 184, 14526, 10193, 119, 10258 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Three", "year", "10", ".", "5", "p", "##ct", "11", ".", "25" ], "ids": [ 15139, 10924, 10150, 119, 126, 184, 14526, 10193, 119, 10258 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##N", "##Z", "said", "it", "was", "respond", "##ing", "to", "lower", "whole", "##sale", "rates", "." ], "ids": [ 139, 11537, 13966, 12415, 10271, 10134, 100062, 10230, 10114, 18165, 21047, 88258, 38200, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fi", "##xe", "##d", "business", "and", "farm", "len", "##ding", "rates", "rates", "were", "left", "un", "##chang", "##ed", "although", "they", "were", "under", "review", "." ], "ids": [ 36448, 16074, 10162, 14155, 10111, 30568, 28859, 13971, 38200, 38200, 10309, 12153, 10119, 64208, 10336, 14779, 10689, 10309, 10571, 17030, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Wellington", "news", "##room", "64", "4", "473", "##4", "746" ], "ids": [ 118, 118, 28557, 14424, 25525, 11295, 125, 39130, 11011, 76770 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Power", "NZ", "O", "##D", "##V", "up", "8", "p", "##ct", "at", "NZ", "$", "524", "million", "." ], "ids": [ 12952, 105920, 152, 11490, 11779, 10741, 129, 184, 14526, 10160, 105920, 109, 47189, 12473, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Power", "New", "Zealand", "said", "on", "Thursday", "that", "the", "Op", "##timi", "##sed", "De", "##pri", "##val", "Value", "(", "O", "##D", "##V", ")", "of", "its", "network", "at", "March", "31", ",", "1996", "has", "been", "set", "at", "$", "524", ".", "2", "million", ",", "an", "increase", "of", "eight", "percent", "on", "its", "$", "486", ".", "5", "million", "val", "##uation", "a", "year", "earlier", "." ], "ids": [ 12952, 10287, 14451, 12415, 10135, 67067, 10189, 10105, 12160, 82064, 16219, 10190, 101319, 12234, 83513, 113, 152, 11490, 11779, 114, 10108, 10474, 17175, 10160, 11144, 10413, 117, 10389, 10393, 10590, 11847, 10160, 109, 47189, 119, 123, 12473, 117, 10151, 20299, 10108, 16222, 22362, 10135, 10474, 109, 35333, 119, 126, 12473, 25460, 64513, 169, 10924, 18905, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "said", "the", "increase", "reflected", "the", "value", "of", "extensions", "to", "the", "network", "to", "meet", "economic", "growth", "in", "its", "supply", "area", "and", "an", "increase", "in", "the", "estimated", "life", "##sp", "##an", "of", "the", "network", "." ], "ids": [ 10117, 12100, 12415, 10105, 20299, 74152, 10105, 19211, 10108, 105755, 10114, 10105, 17175, 10114, 23267, 13925, 14609, 10106, 10474, 28914, 11168, 10111, 10151, 20299, 10106, 10105, 25267, 12103, 54609, 10206, 10108, 10105, 17175, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "the", "increase", "was", "consistent", "with", "the", "approach", "followed", "by", "other", "power", "companies", "and", "reflected", "the", "company", "'", "s", "new", "levels", "of", "prevent", "##ative", "maintenance", "and", "equipment", "up", "##grad", "##ing", "." ], "ids": [ 10377, 12415, 10105, 20299, 10134, 54787, 10169, 10105, 23068, 15689, 10155, 10684, 13183, 18866, 10111, 74152, 10105, 12100, 112, 187, 10751, 21559, 10108, 29320, 44695, 40347, 10111, 24518, 10741, 34486, 10230, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rev", "##alu", "##ation", "was", "undertaken", "to", "meet", "the", "disc", "##los", "##ure" ], "ids": [ 10117, 86095, 45532, 11809, 10134, 92311, 10114, 23267, 10105, 27224, 13788, 12101 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "requirements", "of", "the", "Ministry", "of", "Commerce", "." ], "ids": [ 39282, 10108, 10105, 19170, 10108, 37613, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "-", "-", "Wellington", "news", "##room", "64", "4", "473", "##4", "746" ], "ids": [ 118, 118, 28557, 14424, 25525, 11295, 125, 39130, 11011, 76770 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thai", "##s", "hun", "##t", "for", "Australian", "jail", "break", "##er", "." ], "ids": [ 26207, 10107, 12041, 10123, 10142, 12829, 75934, 24194, 10165, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##NG", "##KO", "##K" ], "ids": [ 39999, 34065, 57277, 11733 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5 ] }, { "tokens": [ "Thailand", "has", "launched", "a", "man", "##hun", "##t", "for", "an", "Australian", "who", "escaped", "from", "a", "high", "security", "prison", "in", "Bangkok", "while", "aw", "##ait", "##ing", "trial", "on", "drug", "possession", "charges", ",", "officials", "said", "on", "Thursday", "." ], "ids": [ 19621, 10393, 18850, 169, 10817, 35931, 10123, 10142, 10151, 12829, 10479, 65602, 10188, 169, 11846, 21849, 20538, 10106, 34793, 11371, 56237, 14598, 10230, 23626, 10135, 20998, 36294, 31128, 117, 27730, 12415, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Daniel", "West", "##lake", ",", "46", ",", "from", "Victoria", ",", "made", "the", "first", "su", "##ces", "##s", "##ful", "escape", "from", "K", "##long", "##prem", "prison", "in", "the", "northern", "out", "##ski", "##rts", "of", "the", "capital", "on", "Sunday", "night", "." ], "ids": [ 11792, 11164, 103566, 117, 11528, 117, 10188, 13661, 117, 11019, 10105, 10422, 10198, 14585, 10107, 14446, 30220, 10188, 148, 31508, 110327, 20538, 10106, 10105, 17335, 10950, 11401, 26215, 10108, 10105, 12185, 10135, 19731, 16903, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "believed", "by", "prison", "officials", "to", "still", "be", "in", "Thailand", "." ], "ids": [ 10357, 10134, 20718, 10155, 20538, 27730, 10114, 12647, 10347, 10106, 19621, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "We", "have", "ordered", "a", "massive", "hun", "##t", "for", "him", "and", "I", "am", "quite", "con", "##fi", "##dent", "we", "will", "get", "him", "soon", ",", "\"", "Vi", "##vit", "Chat", "##upa", "##ris", "##ut", ",", "deputy", "director", "general", "of", "the", "Cor", "##rec", "##tion", "Department", ",", "told", "Reuters", "." ], "ids": [ 107, 12865, 10529, 23782, 169, 35394, 12041, 10123, 10142, 10957, 10111, 146, 10392, 31324, 10173, 14403, 21029, 11951, 11337, 15329, 10957, 17864, 117, 107, 31826, 18522, 103205, 25009, 12125, 11159, 117, 45404, 12461, 11389, 10108, 10105, 93495, 74755, 10822, 12933, 117, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 9 ] }, { "tokens": [ "West", "##lake", ",", "arrested", "in", "December", "1993", "and", "charged", "with", "hero", "##in", "traffic", "##king", ",", "saw", "##ed", "the", "iron", "gr", "##ill", "off", "his", "cell", "window", "and", "climb", "##ed", "down", "the", "prison", "'", "s", "five", "-", "metre", "(", "15", "-", "foot", ")", "wall", "on", "a", "ro", "##pe", "made", "from", "bed", "sheet", "##s", ",", "Vi", "##vit", "said", "." ], "ids": [ 11164, 103566, 117, 29479, 10106, 11288, 10463, 10111, 38253, 10169, 51670, 10245, 26482, 15629, 117, 17112, 10336, 10105, 32374, 30518, 19503, 11898, 10226, 20748, 39051, 10111, 93274, 10336, 12935, 10105, 20538, 112, 187, 12403, 118, 35843, 113, 10208, 118, 24963, 114, 26699, 10135, 169, 25470, 11355, 11019, 10188, 30113, 55030, 10107, 117, 31826, 18522, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "correct", "##ions", "department", "was", "pro", "##bing", "the", "escape", "and", "had", "ordered", "all", "foreign", "in", "##mates", "chain", "##ed", "to", "prevent", "more", "break", "##outs", "." ], "ids": [ 10117, 49148, 15880, 21079, 10134, 11284, 27300, 10105, 30220, 10111, 10374, 23782, 10435, 20796, 10106, 36778, 32768, 10336, 10114, 29320, 10798, 24194, 72199, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "are", "266", "Western", "##ers", ",", "including", "six", "Australian", "##s", ",", "in", "the", "prison", ",", "most", "aw", "##ait", "##ing", "trial", "on", "drugs", "charges", "." ], "ids": [ 11723, 10301, 28477, 13163, 10901, 117, 11198, 12449, 12829, 10107, 117, 10106, 10105, 20538, 117, 10992, 56237, 14598, 10230, 23626, 10135, 40421, 31128, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "also", "are", "about", "5", ",", "000", "Thai", "in", "##mates", "in", "K", "##long", "##prem", ",", "a", "prison", "official", "said", "." ], "ids": [ 11723, 10379, 10301, 10978, 126, 117, 10259, 26207, 10106, 36778, 10106, 148, 31508, 110327, 117, 169, 20538, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tokyo", "So", "##ir", "-", "1996", "parent", "for", "##eca", "##st", "." ], "ids": [ 15308, 12882, 10835, 118, 10389, 43045, 10142, 33588, 10562, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "22" ], "ids": [ 76531, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "to", "December", "31", ",", "1996" ], "ids": [ 13567, 10114, 11288, 10413, 117, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "billion", "##s", "of", "ye", "##n", "unless", "specified", ")" ], "ids": [ 113, 10106, 25848, 10107, 10108, 11023, 10115, 60015, 64561, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##TE", "##ST", "ACT", "##U", "##AL" ], "ids": [ 29079, 29833, 32995, 90119, 12022, 32002 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Par", "##ent", ")", "FOR", "##EC", "##AS", "##T", "Y", "##EA", "##R", "-", "AG", "##O" ], "ids": [ 113, 17434, 11405, 114, 109544, 35826, 38025, 11090, 162, 36789, 11273, 118, 17935, 11403 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sales", "26", ".", "00", "26", ".", "70" ], "ids": [ 48514, 10314, 119, 11025, 10314, 119, 10923 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Current", "400", "million", "329", "million" ], "ids": [ 37293, 11176, 12473, 33922, 12473 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "250", "million", "84", "million" ], "ids": [ 32577, 12214, 12473, 11761, 12473 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "EP", "##S", "11", ".", "61", "ye", "##n", "3", ".", "92", "ye", "##n" ], "ids": [ 14111, 10731, 10193, 119, 12314, 11023, 10115, 124, 119, 12458, 11023, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Or", "##d", "div", "10", ".", "00", "ye", "##n", "10", ".", "00", "ye", "##n" ], "ids": [ 19372, 10162, 76486, 10150, 119, 11025, 11023, 10115, 10150, 119, 11025, 11023, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Tokyo", "So", "##ir", "Co", "Ltd", "is", "a", "speciali", "##sed", "manufacturer", "of", "women", "\"", "s", "formal", "wear", "." ], "ids": [ 49307, 29833, 118, 15308, 12882, 10835, 13098, 15129, 10124, 169, 73375, 16219, 56961, 10108, 13190, 107, 187, 23129, 49866, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ka", "W", "##ah", "Bank", "sets", "HK", "$", "43", "mln", "FR", "##CD", "." ], "ids": [ 25444, 160, 12257, 13533, 23597, 33150, 109, 11370, 35198, 64655, 40952, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "22" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ka", "W", "##ah", "Bank", "'", "s", "HK", "$", "43", "million", "floating", "rate", "certificate", "of", "de", "##posit", "issue", "has", "been", "privately", "placed", ",", "sole", "arra", "##nger", "HS", "##BC", "Market", "##s", "said", "." ], "ids": [ 25444, 160, 12257, 13533, 112, 187, 33150, 109, 11370, 12473, 106720, 18344, 93552, 10108, 10104, 106185, 15557, 10393, 10590, 81411, 16906, 117, 23140, 38192, 18904, 86393, 38964, 28409, 10107, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "The", "facility", "has", "a", "tenor", "of", "six", "months", "." ], "ids": [ 10117, 27774, 10393, 169, 36187, 10108, 12449, 15555, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "pays", "a", "coup", "##on", "of", "15", "basis", "points", "over", "the", "six", "-", "month", "Hong", "Kong", "Inter", "##bank", "Off", "##ered", "Rate", "." ], "ids": [ 10377, 13850, 169, 26854, 10263, 10108, 10208, 17172, 12789, 10491, 10105, 12449, 118, 14064, 15078, 14577, 24362, 20583, 23490, 45452, 105299, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Other", "details", "are", "not", "available", "." ], "ids": [ 14490, 29500, 10301, 10472, 14579, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "de", "##posit", "date", "is", "September", "5", ",", "1996", "." ], "ids": [ 10117, 10104, 106185, 13664, 10124, 10596, 126, 117, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clear", "##ing", "is", "through", "the", "Hong", "Kong", "Central", "Money", "##market", "##s", "Unit", "." ], "ids": [ 69050, 10230, 10124, 11222, 10105, 15078, 14577, 11885, 24002, 60336, 10107, 19919, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "-", "-", "Hong", "Kong", "News", "##room", "(", "852", ")", "284", "##7", "403", "##9" ], "ids": [ 118, 118, 15078, 14577, 12219, 25525, 113, 70072, 114, 29137, 11305, 36151, 11373 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Malaysia", "ban", "##s", "nit", "##ro", "##fur", "##an", "usage", "in", "chi", "##cken", "feed", "." ], "ids": [ 13625, 11915, 10107, 74203, 10567, 33874, 10206, 26455, 10106, 14325, 21181, 44988, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##U", "##AL", "##A", "L", "##UM", "##P", "##UR", "1996", "-", "08", "-", "22" ], "ids": [ 148, 12022, 32002, 10738, 149, 72679, 11127, 98348, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Malaysia", "has", "banned", "the", "use", "of", "nit", "##ro", "##fur", "##an", ",", "an", "anti", "##bio", "##tic", ",", "in", "chi", "##cken", "feed", "and", "vet", "##erina", "##ry", "applications", "because", "it", "believes", "the", "drug", "could", "cause", "cancer", ",", "the", "health", "ministry", "said", "on", "Thursday", "." ], "ids": [ 13625, 10393, 58587, 10105, 11760, 10108, 74203, 10567, 33874, 10206, 117, 10151, 14249, 16813, 13275, 117, 10106, 14325, 21181, 44988, 10111, 56975, 90643, 10908, 26066, 12373, 10271, 56920, 10105, 20998, 12174, 15311, 22723, 117, 10105, 17004, 65338, 12415, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "hoped", "that", "lives", "##tock", "breed", "##ers", "and", "feed", "##mill", "##ers", "will", "ab", "##ide", "by", "the", "laws", "and", "respect", "the", "cabinet", "decision", "in", "the", "interest", "of", "consumer", "safety", ",", "\"", "Health", "Minister", "Chu", "##a", "Ju", "##i", "Men", "##g", "was", "quoted", "as", "saying", "by", "the", "national", "Berna", "##ma", "news", "agency", "." ], "ids": [ 107, 10377, 10124, 84245, 10189, 21418, 60458, 50246, 10901, 10111, 44988, 100496, 10901, 11337, 11357, 13315, 10155, 10105, 28160, 10111, 28944, 10105, 33801, 19231, 10106, 10105, 17644, 10108, 64580, 27116, 117, 107, 15931, 14355, 31518, 10113, 45031, 10116, 13026, 10240, 10134, 70676, 10146, 22807, 10155, 10105, 11844, 89971, 10369, 14424, 34649, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Chu", "##a", "said", "offen", "##ders", "could", "face", "a", "two", "-", "year", "prison", "sentence", "and", "a", "maximum", "fine", "of", "5", ",", "000", "ring", "##git", "(", "$", "2000", ")", "." ], "ids": [ 31518, 10113, 12415, 84646, 25779, 12174, 13295, 169, 10551, 118, 10924, 20538, 49219, 10111, 169, 22393, 13435, 10108, 126, 117, 10259, 21550, 26264, 113, 109, 10180, 114, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "ban", "takes", "effect", "immediately", ",", "\"", "he", "added", "." ], "ids": [ 107, 10117, 11915, 19135, 18514, 24029, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##DO", "##NE", "##SI", "##AN", "ST", "##OCK", "##S", "-", "factors", "to", "watch", "-", "August", "22", "." ], "ids": [ 36351, 104847, 93280, 44802, 41275, 53317, 96608, 10731, 118, 31075, 10114, 34481, 118, 10735, 10306, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "JA", "##KA", "##RT", "##A", "1996", "-", "08", "-", "22" ], "ids": [ 53399, 67813, 46935, 10738, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "are", "some", "of", "the", "main", "factors", "likely", "to", "affect", "Indonesian", "stock", "##s", "on", "Thursday", ":" ], "ids": [ 18317, 10301, 11152, 10108, 10105, 12126, 31075, 22497, 10114, 60600, 47340, 20511, 10107, 10135, 67067, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "*", "Security", "was", "tight", "in", "Jakarta", "ahead", "of", "a", "trial", "involving", "ou", "##sted", "Indonesian", "Democratic", "Party", "leader", "Mega", "##wati", "Su", "##kar", "##no", "##put", "##ri", "." ], "ids": [ 115, 115, 20924, 10134, 85202, 10106, 14164, 35629, 10108, 169, 23626, 40368, 10431, 36018, 47340, 19281, 12529, 15014, 35693, 66790, 12271, 15190, 10343, 27876, 10401, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 4, 8, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Around", "200", "police", "and", "troops", "were", "stationed", "outside", "the", "court", "in", "central", "Jakarta", "but", "there", "was", "no", "sign", "of", "demo", "##nst", "##rators", "." ], "ids": [ 25801, 10777, 15034, 10111, 20836, 10309, 77675, 17555, 10105, 14866, 10106, 12397, 14164, 10473, 11155, 10134, 10192, 26794, 10108, 30776, 40300, 94721, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "*", "The", "Dow", "Jones", "industrial", "average", "closed", "down", "31", ".", "44", "points", "at", "5", ",", "689", ".", "82", "on", "Wednesday", ",", "ending", "a", "three", "-", "session", "winning", "streak", "as", "investors", "took", "profits", "and", "tobacco", "stock", "##s", "took", "a", "beating", "." ], "ids": [ 115, 115, 10117, 106035, 12298, 18138, 13551, 18440, 12935, 10413, 119, 11126, 12789, 10160, 126, 117, 72583, 119, 12180, 10135, 57611, 117, 29077, 169, 11003, 118, 30066, 16542, 88302, 10146, 83795, 12149, 100106, 10111, 92887, 20511, 10107, 12149, 169, 58081, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MA", "##R", "##K", "##ET", "##S", ":" ], "ids": [ 27277, 11273, 11733, 52338, 10731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "*", "The", "Jakarta", "com", "##posite", "index", "rose", "2", ".", "60", "points", ",", "or", "0", ".", "48", "percent", ",", "to", "542", ".", "20", "points", "on", "Wednesday", "on", "the", "back", "of", "bar", "##gain", "-", "hunting", "in", "selected", "big", "-", "capital", "##ised", "stock", "##s", "and", "second", "##liner", "##s", "." ], "ids": [ 115, 115, 10117, 14164, 10212, 65117, 19776, 29467, 123, 119, 10709, 12789, 117, 10345, 121, 119, 11300, 22362, 117, 10114, 51620, 119, 10197, 12789, 10135, 57611, 10135, 10105, 12014, 10108, 18121, 85473, 118, 57232, 10106, 19546, 22185, 118, 12185, 20666, 20511, 10107, 10111, 11132, 103140, 10107, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "*", "On", "Thursday", ",", "the", "Indonesian", "ru", "##pia", "##h", "was", "at", "2", ",", "343", ".", "00", "/", "43", ".", "50", "in", "early", "trading", "against", "an", "opening", "of", "2", ",", "342", ".", "75", "/", "43", ".", "50", "." ], "ids": [ 115, 115, 10576, 67067, 117, 10105, 47340, 13483, 17837, 10237, 10134, 10160, 123, 117, 32007, 119, 11025, 120, 11370, 119, 10462, 10106, 11732, 46663, 11327, 10151, 17975, 10108, 123, 117, 34430, 119, 11417, 120, 11370, 119, 10462, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##OCK", "##S", "TO", "W", "##AT", "##CH" ], "ids": [ 53317, 96608, 10731, 58573, 160, 32071, 86448 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "*", "Pack", "##aging", "manufacturer", "Super", "In", "##dah", "Ma", "##km", "##ur", "on", "announcement", "of", "a", "tender", "offer", "by", "PT", "V", "##DH", "Te", "##gu", "##h", "Sa", "##kti", ",", "a", "who", "##lly", "-", "owned", "subsidiary", "of", "Singapore", "-", "listed", "Van", "Der", "Horst", "." ], "ids": [ 115, 115, 54223, 43569, 56961, 12786, 10167, 30942, 13744, 23440, 10546, 10135, 76557, 10108, 169, 96486, 24443, 10155, 30350, 159, 58606, 21452, 12589, 10237, 12404, 31915, 117, 169, 10479, 17903, 118, 17012, 53898, 10108, 19437, 118, 17585, 11474, 10445, 36424, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 3, 7, 7, 9 ] }, { "tokens": [ "*", "*", "Private", "##ly", "-", "owned", "Bank", "Du", "##ta", "on", "market", "talk", "that", "it", "is", "obtaining", "fresh", "syn", "##dicated", "loans", ",", "a", "management", "res", "##hu", "##ffle", "and", "fresh", "equity", "injection", "." ], "ids": [ 115, 115, 26867, 10454, 118, 17012, 13533, 14925, 10213, 10135, 17313, 31311, 10189, 10271, 10124, 107536, 54181, 14379, 82187, 106416, 117, 169, 17150, 39429, 13723, 66267, 10111, 54181, 102686, 91879, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "*", "Ci", "##put", "##ra", "Development", "on", "reports", "of", "a", "plan", "to", "build", "property", "projects", "worth", "$", "2", "billion", "in", "Jakarta", "and", "Surabaya", "." ], "ids": [ 115, 115, 51457, 27876, 10288, 14502, 10135, 26610, 10108, 169, 13065, 10114, 23332, 18381, 22846, 43509, 109, 123, 25848, 10106, 14164, 10111, 55805, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Key", "stock", "and", "currency", "market", "movements", "at", "1600", "GMT", "." ], "ids": [ 21663, 20511, 10111, 83759, 17313, 42641, 10160, 16709, 20362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "following", "table", "shows", "the", "latest", "close", "of", "key", "indice", "##s", "*", "on", "major", "world", "stock", "exchange", "##s", ",", "the", "day", "'", "s", "change", "in", "points", "and", "the", "indice", "##s", "'", "1996", "closing", "high", "##s", "and", "low", "##s", "(", "with", "dates", ")", "." ], "ids": [ 10117, 11901, 21783, 15573, 10105, 50908, 16065, 10108, 18444, 75878, 10107, 115, 10135, 11922, 11356, 20511, 27714, 10107, 117, 10105, 11940, 112, 187, 15453, 10106, 12789, 10111, 10105, 75878, 10107, 112, 10389, 57409, 11846, 10107, 10111, 15626, 10107, 113, 10169, 27722, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Also", "shown", "are", "the", "London", "closing", "values", "of", "the", "German", "mark", ",", "the", "Japanese", "ye", "##n", ",", "the", "British", "pound", "and", "gold", "bu", "##llion", "(", "previous", "day", "'", "s", "close", "##s", "in", "bra", "##ckets", ")", ":" ], "ids": [ 20593, 19989, 10301, 10105, 10829, 57409, 31313, 10108, 10105, 12026, 29221, 117, 10105, 13847, 11023, 10115, 117, 10105, 11160, 99233, 10111, 18128, 11499, 67102, 113, 16741, 11940, 112, 187, 16065, 10107, 10106, 67603, 81143, 114, 131 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AU", "##G", "23", "DA", "##Y", "'", "S", "CH", "##AN", "##GE", "1996", "H", "##IG", "##H", "1996", "L", "##OW" ], "ids": [ 29088, 11447, 10328, 47855, 14703, 112, 156, 39774, 41275, 58719, 10389, 145, 89696, 12396, 10389, 149, 33893 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CL", "##OS", "##E", "IN", "P", "##O", "##IN", "##TS" ], "ids": [ 75151, 21793, 11259, 36351, 153, 11403, 27128, 36545 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "5", ",", "710", ".", "53", "-", "22", ".", "94", "5", ",", "778", ".", "00", "5", ",", "032", ".", "94" ], "ids": [ 86607, 13034, 162, 42622, 11733, 126, 117, 46887, 119, 11756, 118, 10306, 119, 12749, 126, 117, 65036, 119, 11025, 126, 117, 104038, 119, 12749 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "mid", "##day", ")", "(", "May", "22", ")", "(", "Jan", "10", ")" ], "ids": [ 113, 15607, 24558, 114, 113, 10725, 10306, 114, 113, 11806, 10150, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "3", ",", "907", ".", "5", "+", "16", ".", "4", "3", ",", "907", ".", "5", "3", ",", "632", ".", "3" ], "ids": [ 149, 30118, 104847, 11537, 124, 117, 59463, 119, 126, 116, 10250, 119, 125, 124, 117, 59463, 119, 126, 124, 117, 47946, 119, 124 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Aug", "23", ")", "(", "Jul", "16", ")" ], "ids": [ 113, 53012, 10328, 114, 113, 65855, 10250, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "21", ",", "228", ".", "80", "-", "134", ".", "44", "22", ",", "666", ".", "80", "19", ",", "734", ".", "70" ], "ids": [ 76531, 10296, 117, 25646, 119, 10832, 118, 18546, 119, 11126, 10306, 117, 38593, 119, 10832, 10270, 117, 76734, 119, 10923 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Jun", "26", ")", "(", "Mar", "13", ")" ], "ids": [ 113, 26187, 10314, 114, 113, 15734, 10249, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##AN", "##K", "##F", "##UR", "##T", "2", ",", "555", ".", "16", "-", "2", ".", "10", "2", ",", "583", ".", "49", ")", "2", ",", "284", ".", "86" ], "ids": [ 64655, 41275, 11733, 11565, 98348, 11090, 123, 117, 44517, 119, 10250, 118, 123, 119, 10150, 123, 117, 49134, 119, 11580, 114, 123, 117, 29137, 119, 12224 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Jul", "5", ")", "(", "Jan", "2", ")" ], "ids": [ 113, 65855, 126, 114, 113, 11806, 123, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "2", ",", "020", ".", "82", "+", "3", ".", "06", "2", ",", "146", ".", "79", "1", ",", "897", ".", "85" ], "ids": [ 32349, 46876, 10731, 123, 117, 71906, 119, 12180, 116, 124, 119, 10719, 123, 117, 19680, 119, 12791, 122, 117, 77353, 119, 12017 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Apr", "30", ")", "(", "Jan", "11", ")" ], "ids": [ 113, 81464, 10244, 114, 113, 11806, 10193, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "2", ",", "292", ".", "9", "+", "18", ".", "3", "2", ",", "326", ".", "00", "2", ",", "096", ".", "10" ], "ids": [ 156, 14703, 11490, 93280, 14703, 123, 117, 29477, 119, 130, 116, 10218, 119, 124, 123, 117, 32558, 119, 11025, 123, 117, 100069, 119, 10150 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Apr", "26", ")", "(", "Jul", "17", ")" ], "ids": [ 113, 81464, 10314, 114, 113, 65855, 10273, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "11", ",", "424", ".", "64", "-", "54", ".", "13", "11", ",", "594", ".", "99", "10", ",", "204", ".", "87" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10193, 117, 40635, 119, 11295, 118, 11653, 119, 10249, 10193, 117, 59962, 119, 12187, 10150, 117, 22253, 119, 12581 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Feb", "16", ")", "(", "Jan", "2", ")" ], "ids": [ 113, 21194, 10250, 114, 113, 11806, 123, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "FOR", "##E", "##IG", "##N", "EX", "##CH", "##AN", "##GE", "/", "GO", "##LD", "B", "##UL", "##L", "##ION", "CL", "##OS", "##E", "IN", "L", "##ON", "##DO", "##N" ], "ids": [ 109544, 11259, 89696, 11537, 80426, 86448, 41275, 58719, 120, 41525, 62943, 139, 100673, 11369, 52980, 75151, 21793, 11259, 36351, 149, 30118, 104847, 11537 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5 ] }, { "tokens": [ "Dollar", "/", "mark", ".", ".", "." ], "ids": [ 24597, 120, 29221, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "487", "##1", "(", "1", ".", "493", "##5", ")" ], "ids": [ 122, 119, 49270, 10759, 113, 122, 119, 44814, 11166, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dollar", "/", "ye", "##n", ".", ".", ".", "." ], "ids": [ 24597, 120, 11023, 10115, 119, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "108", ".", "50", "(", "108", ".", "43", ")" ], "ids": [ 15845, 119, 10462, 113, 15845, 119, 11370, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pound", "/", "dollar", ".", "." ], "ids": [ 100820, 120, 34807, 119, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "$", "1", ".", "552", "##0", "(", "$", "1", ".", "549", "##7", ")" ], "ids": [ 109, 122, 119, 44809, 10929, 113, 109, 122, 119, 53713, 11305, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gold", "(", "ou", "##nce", ")", ".", "." ], "ids": [ 14363, 113, 10431, 12150, 114, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "$", "387", ".", "50", "(", "$", "386", ".", "95", ")" ], "ids": [ 109, 32697, 119, 10462, 113, 109, 37194, 119, 11978, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "*", "IN", "##DI", "##CE", "##S", "US", "##ED", "AND", "THE", "##IR", "AL", "##L", "-", "TIME", "CL", "##OS", "##ING", "H", "##IG", "##HS" ], "ids": [ 115, 36351, 58730, 43161, 10731, 10808, 33809, 52428, 17443, 73522, 47271, 11369, 118, 89275, 75151, 21793, 50183, 145, 89696, 62181 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "York", "Dow", "Jones", "industrial", "average", "-", "-", "5", ",", "778", ".", "00", "(", "May", "22", "/", "96", ")" ], "ids": [ 10287, 10482, 106035, 12298, 18138, 13551, 118, 118, 126, 117, 65036, 119, 11025, 113, 10725, 10306, 120, 12308, 114 ], "entity": [ "B-LOC", "I-LOC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "F", "##TS", "##E", "-", "100", "index", "-", "-", "3", ",", "907", ".", "5", "(", "Aug", "23", "/", "96", ")" ], "ids": [ 10829, 143, 36545, 11259, 118, 10407, 19776, 118, 118, 124, 117, 59463, 119, 126, 113, 53012, 10328, 120, 12308, 114 ], "entity": [ "B-LOC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tokyo", "Ni", "##kke", "##i", "average", "-", "-", "38", ",", "915", ".", "87", "(", "Dec", "29", "/", "89", ")" ], "ids": [ 15308, 30409, 25389, 10116, 13551, 118, 118, 11171, 117, 67576, 119, 12581, 113, 46147, 10386, 120, 12642, 114 ], "entity": [ "B-LOC", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Frankfurt", "DA", "##X", "-", "3", "##O", "index", "-", "-", "2", ",", "583", ".", "49", "(", "Jul", "5", "/", "96", ")" ], "ids": [ 15226, 47855, 12674, 118, 124, 11403, 19776, 118, 118, 123, 117, 49134, 119, 11580, 113, 65855, 126, 120, 12308, 114 ], "entity": [ "B-LOC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "CA", "##C", "-", "40", "General", "index", "-", "-", "2", ",", "355", ".", "93", "(", "Feb", "2", "/", "94", ")" ], "ids": [ 10728, 24707, 10858, 118, 10533, 11220, 19776, 118, 118, 123, 117, 33195, 119, 12479, 113, 21194, 123, 120, 12749, 114 ], "entity": [ "B-LOC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "Australian", "All", "-", "Or", "##dina", "##ries", "index", "-", "-", "2", ",", "340", ".", "6", "(", "Feb", "3", "/", "94", ")" ], "ids": [ 14470, 12829, 11101, 118, 19372, 25755, 15388, 19776, 118, 118, 123, 117, 22405, 119, 127, 113, 21194, 124, 120, 12749, 114 ], "entity": [ "B-LOC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", "Hang", "Sen", "##g", "index", "-", "-", "12", ",", "201", ".", "09", "(", "Jan", "4", "/", "94", ")" ], "ids": [ 15078, 14577, 61163, 18082, 10240, 19776, 118, 118, 10186, 117, 20726, 119, 11035, 113, 11806, 125, 120, 12749, 114 ], "entity": [ "B-LOC", "I-LOC", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ukraine", "hai", "##ls", "peace", "as", "marks", "five", "-", "year", "independence", "." ], "ids": [ 19883, 13080, 11747, 28101, 10146, 55112, 12403, 118, 10924, 31412, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ros", "##tis", "##lav", "K", "##hot", "##in" ], "ids": [ 109292, 13434, 25768, 148, 55788, 10245 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "K", "##IE", "##V", "1996", "-", "08", "-", "23" ], "ids": [ 148, 71655, 11779, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ukraine", "celebrate", "##s", "five", "years", "of", "independence", "from", "Kr", "##emlin", "rule", "on", "Saturday", ",", "hai", "##ling", "civil", "and", "inter", "-", "ethnic", "peace", "as", "its", "main", "post", "-", "Soviet", "achievement", "." ], "ids": [ 19883, 72951, 10107, 12403, 10855, 10108, 31412, 10188, 17640, 110169, 21983, 10135, 24848, 117, 13080, 11945, 14161, 10111, 22021, 118, 34216, 28101, 10146, 10474, 12126, 11841, 118, 15277, 66089, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "Ukraine", "'", "s", "declaration", "of", "independence", "in", "1991", ",", "backed", "nine", "-", "to", "-", "one", "by", "a", "referendum", "in", "December", "of", "that", "year", ",", "effectively", "dealt", "a", "death", "blow", "to", "the", "Soviet", "empire", "and", "ended", "more", "than", "three", "centuries", "of", "rule", "from", "Moscow", "." ], "ids": [ 19883, 112, 187, 105108, 10108, 31412, 10106, 10442, 117, 61010, 19964, 118, 10114, 118, 10464, 10155, 169, 39697, 10106, 11288, 10108, 10189, 10924, 117, 46767, 102810, 169, 12557, 106194, 10114, 10105, 15277, 34873, 10111, 18428, 10798, 11084, 11003, 29994, 10108, 21983, 10188, 18744, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Ukraine", ",", "with", "a", "Russian", "community", "of", "11", "million", "people", "-", "-", "the", "world", "'", "s", "largest", "outside", "Russia", "-", "-", "has", "avoid", "##ed", "conflicts", "like", "those", "in", "Russia", "'", "s", "Che", "##chny", "##a", ",", "neighbouring", "Moldova", ",", "and", "the", "former", "Soviet", "republic", "##s", "of", "Georgia", ",", "Azerbaijan", "and", "Taj", "##iki", "##stan", "." ], "ids": [ 19883, 117, 10169, 169, 13463, 13354, 10108, 10193, 12473, 11426, 118, 118, 10105, 11356, 112, 187, 15363, 17555, 14664, 118, 118, 10393, 33253, 10336, 83594, 11850, 12676, 10106, 14664, 112, 187, 44131, 95063, 10113, 117, 79475, 29733, 117, 10111, 10105, 11775, 15277, 108499, 10107, 10108, 15234, 117, 28810, 10111, 61713, 20897, 17414, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 1, 9, 1, 5, 5, 9 ] }, { "tokens": [ "\"", "Ukraine", "'", "s", "biggest", "achievements", "for", "five", "years", "are", "the", "preservation", "of", "civil", "peace", "and", "inter", "-", "ethnic", "harm", "##ony", ",", "\"", "President", "Leonid", "Ku", "##ch", "##ma", "said", "in", "tele", "##vised", "statement", "this", "week", "." ], "ids": [ 107, 19883, 112, 187, 36304, 86773, 10142, 12403, 10855, 10301, 10105, 90764, 10108, 14161, 28101, 10111, 22021, 118, 34216, 105999, 16131, 117, 107, 12811, 66751, 49869, 10269, 10369, 12415, 10106, 56142, 46836, 33311, 10531, 16118, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Unlike", "many", "other", "post", "-", "Soviet", "countries", "we", "were", "able", "to", "deal", "with", "conflict", "situations", "in", "a", "peace", "##ful", "and", "civili", "##sed", "way", ".", "\"" ], "ids": [ 107, 45227, 11299, 10684, 11841, 118, 15277, 15911, 11951, 10309, 16197, 10114, 19918, 10169, 24620, 52844, 10106, 169, 28101, 14446, 10111, 71458, 16219, 13170, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "independence", "was", "initially", "accompanied", "by", "hy", "##per", "-", "inflation", "and", "economic", "collapse", ",", "although", "there", "are", "signs", "of", "a", "turn", "##aro", "##und", "." ], "ids": [ 16976, 31412, 10134, 20465, 39951, 10155, 15165, 12713, 118, 105888, 10111, 13925, 64306, 117, 14779, 11155, 10301, 45033, 10108, 169, 18923, 24489, 17242, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inf", "##lation", "-", "-", "a", "hy", "##per", "-", "inflation", "##ary", "10", ",", "300", "percent", "a", "year", "in", "1993", "-", "-", "was", "a", "respect", "##able", "0", ".", "1", "percent", "a", "month", "in", "June", "and", "July", "and", "the", "economy", "has", "just", "begun", "to", "grow", "." ], "ids": [ 74479, 19718, 118, 118, 169, 15165, 12713, 118, 105888, 14926, 10150, 117, 11093, 22362, 169, 10924, 10106, 10463, 118, 118, 10134, 169, 28944, 13096, 121, 119, 122, 22362, 169, 14064, 10106, 11120, 10111, 11112, 10111, 10105, 27570, 10393, 12820, 49510, 10114, 42254, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ku", "##ch", "##ma", "told", "a", "solem", "##n", "ceremony", "at", "the", "Ukraina", "Palace", "on", "Friday", "that", "\"", "there", "was", "a", "turning", "point", "\"", "in", "reforms", "and", "that", "he", "expected", "a", "rise", "in", "the", "standard", "of", "living", "in", "the", "near", "future", "." ], "ids": [ 49869, 10269, 10369, 21937, 169, 76671, 10115, 34713, 10160, 10105, 32443, 22015, 10135, 30767, 10189, 107, 11155, 10134, 169, 48448, 12331, 107, 10106, 71856, 10111, 10189, 10261, 25973, 169, 28710, 10106, 10105, 14979, 10108, 14625, 10106, 10105, 12883, 16711, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "is", "no", "doubt", "that", "economic", "growth", "has", "already", "started", ",", "\"", "said", "Adel", "##bert", "K", "##no", "##bl", ",", "head", "of", "the", "International", "Monetary", "Fund", "'", "s", "mission", "in", "Ukraine", ".", "\"" ], "ids": [ 107, 11723, 10124, 10192, 86697, 10189, 13925, 14609, 10393, 19034, 13457, 117, 107, 12415, 80444, 18072, 148, 10343, 31766, 117, 13578, 10108, 10105, 10771, 100549, 26762, 112, 187, 17032, 10106, 19883, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "The", "national", "bank", "and", "the", "government", "have", "every", "reason", "to", "be", "proud", "of", "their", "efforts", ".", "\"" ], "ids": [ 10117, 11844, 19423, 10111, 10105, 12047, 10529, 14234, 27949, 10114, 10347, 97801, 10108, 10455, 22116, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Central", "bank", "officials", "said", "on", "Thursday", "that", "a", "much", "-", "post", "##pone", "##d", "hry", "##vna", "currency", "would", "\"", "def", "##inite", "##ly", "\"", "be", "introduced", "before", "the", "end", "of", "this", "year", "." ], "ids": [ 11885, 19423, 27730, 12415, 10135, 67067, 10189, 169, 13172, 118, 11841, 35741, 10162, 47747, 28492, 83759, 10894, 107, 100745, 100240, 10454, 107, 10347, 17037, 11360, 10105, 11572, 10108, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "will", "replace", "the", "interim", "kar", "##bov", "##ane", "##ts", "currency", ",", "which", "was", "introduced", "at", "par", "to", "the", "Russian", "ro", "##ub", "##le", "in", "1992", "but", "now", "trade", "##s", "at", "almost", "33", "kar", "##bov", "##ane", "##ts", "per", "ro", "##ub", "##le", "." ], "ids": [ 10377, 11337, 37156, 10105, 63313, 25085, 96970, 12822, 10806, 83759, 117, 10319, 10134, 17037, 10160, 10248, 10114, 10105, 13463, 25470, 20664, 10284, 10106, 10450, 10473, 11858, 18908, 10107, 10160, 17122, 11000, 25085, 96970, 12822, 10806, 10178, 25470, 20664, 10284, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ukraine", "has", "repeatedly", "promised", "to", "introduce", "the", "hry", "##vna", "but", "had", "to", "post", "##pone", "the", "plans", "because", "of", "economic", "problems", "." ], "ids": [ 19883, 10393, 77998, 77137, 10114, 55741, 10105, 47747, 28492, 10473, 10374, 10114, 11841, 35741, 10105, 18195, 12373, 10108, 13925, 20390, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "##ud", "of", "its", "record", "in", "pro", "##mpt", "##ly", "joining", "both", "the", "Council", "of", "Europe", "and", "NATO", "'", "s", "Partnership", "for", "Peace", ",", "Ukraine", "caused", "a", "foreign", "policy", "w", "##rang", "##le", "this", "week", ",", "offen", "##ding", "China", "by", "allowing", "a", "Taiwan", "##ese", "minister", "to", "appear", "on", "a", "public", ",", "if", "uno", "##fficial", "visit", "." ], "ids": [ 14021, 11679, 10108, 10474, 12410, 10106, 11284, 109361, 10454, 36135, 11408, 10105, 12821, 10108, 11767, 10111, 21662, 112, 187, 101476, 10142, 20705, 117, 19883, 19513, 169, 20796, 14368, 191, 24141, 10284, 10531, 16118, 117, 84646, 13971, 11593, 10155, 28357, 169, 19449, 13565, 16930, 10114, 22641, 10135, 169, 11683, 117, 12277, 11381, 101272, 27541, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 9, 9, 2, 6, 6, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "cancelled", "a", "visit", "by", "a", "top", "-", "level", "delegation", "in", "protest", "." ], "ids": [ 11593, 60557, 169, 27541, 10155, 169, 12364, 118, 13277, 98689, 10106, 36627, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kiev", "'", "s", "Foreign", "Minister", "Hen", "##nad", "##y", "Udo", "##ven", "##ko", "said", "Beijing", "was", "over", "##rea", "##cting", "." ], "ids": [ 30903, 112, 187, 20277, 14355, 86362, 24773, 10157, 90024, 11975, 10440, 12415, 23824, 10134, 10491, 13236, 64716, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Ukraine", ",", "seeing", "itself", "as", "a", "bridge", "between", "Russia", "and", "the", "rapidly", "Western", "##ising", "countries", "of", "eastern", "Europe", ",", "is", "looking", "West", "as", "well", "as", "East", "." ], "ids": [ 16976, 19883, 117, 57039, 17587, 10146, 169, 21126, 10948, 14664, 10111, 10105, 47489, 13163, 53624, 15911, 10108, 18677, 11767, 117, 10124, 34279, 11164, 10146, 11206, 10146, 11830, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "strategic", "aim", "of", "European", "integration", "should", "not", "in", "any", "way", "damage", "Ukraine", "'", "s", "interests", "in", "post", "-", "Soviet", "areas", "." ], "ids": [ 107, 10117, 52009, 56048, 10108, 11914, 64861, 14819, 10472, 10106, 11178, 13170, 26115, 19883, 112, 187, 36026, 10106, 11841, 118, 15277, 14544, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "Relations", "with", "Russia", ",", "which", "is", "our", "main", "partner", ",", "have", "great", "importance", ",", "\"", "Ku", "##ch", "##ma", "said", "." ], "ids": [ 36503, 10169, 14664, 117, 10319, 10124, 17446, 12126, 22825, 117, 10529, 14772, 21912, 117, 107, 49869, 10269, 10369, 12415, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "But", "Ukraine", "cannot", "be", "economica", "##lly", "oriented", "on", "Russia", ",", "even", "though", "those", "in", "some", "circles", "push", "us", "to", "do", "that", ".", "\"" ], "ids": [ 107, 16976, 19883, 25259, 10347, 62970, 17903, 58245, 10135, 14664, 117, 13246, 15102, 12676, 10106, 11152, 99818, 68052, 19626, 10114, 10149, 10189, 119, 107 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ku", "##ch", "##ma", "has", "said", "Kiev", "wants", "membership", "of", "the", "European", "Union", ",", "associate", "membership", "of", "the", "Western", "European", "Union", "defence", "group", "##ing", "and", "to", "move", "closer", "to", "NATO", "." ], "ids": [ 49869, 10269, 10369, 10393, 12415, 30903, 45769, 39689, 10108, 10105, 11914, 11457, 117, 46175, 39689, 10108, 10105, 13163, 11914, 11457, 47245, 11795, 10230, 10111, 10114, 18577, 54561, 10114, 21662, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "A", "message", "from", "the", "West", "this", "week", "from", "U", ".", "S", ".", "President", "Bill", "Clinton", "con", "##grat", "##ulated", "Ukraine", "on", "the", "anniversary", ",", "pro", "##mising", "to", "support", "market", "reforms", "and", "pra", "##ising", "Ukraine", "as", "a", "\"", "stabil", "##ising", "factor", "\"", "in", "a", "united", "Europe", "." ], "ids": [ 138, 30514, 10188, 10105, 11164, 10531, 16118, 10188, 158, 119, 156, 119, 12811, 13160, 24139, 10173, 84558, 37725, 19883, 10135, 10105, 37157, 117, 11284, 81654, 10114, 13145, 17313, 71856, 10111, 69857, 53624, 19883, 10146, 169, 107, 71338, 53624, 21834, 107, 10106, 169, 89284, 11767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 4, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Old", "##est", "Albania", "book", "disa", "##ppe", "##ars", "from", "Vatican", "-", "paper", "." ], "ids": [ 13773, 13051, 28931, 12748, 36474, 21092, 21087, 10188, 54527, 118, 17895, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "T", "##IR", "##AN", "##A", "1996", "-", "08", "-", "23" ], "ids": [ 157, 73522, 41275, 10738, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "16th", "-", "century", "document", ",", "the", "earliest", "complete", "example", "of", "written", "Albanian", ",", "has", "disappeared", "from", "the", "Vatican", "archives", ",", "an", "Albanian", "newspaper", "said", "on", "Friday", "." ], "ids": [ 138, 33581, 118, 11943, 25166, 117, 10105, 34913, 17876, 14351, 10108, 13398, 54257, 117, 10393, 81466, 10188, 10105, 54527, 40086, 117, 10151, 54257, 22047, 12415, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gazeta", "S", "##h", "##qi", "##ptar", "##e", "said", "the", "\"", "Book", "of", "Mass", "'", ",", "by", "G", "##jon", "Bu", "##zu", "##ku", ",", "dating", "from", "1555", "and", "discovered", "in", "1740", "in", "a", "religious", "semi", "##nary", "in", "Rome", ",", "was", "the", "first", "major", "document", "published", "in", "the", "Albanian", "language", "." ], "ids": [ 88343, 156, 10237, 27132, 71400, 10112, 12415, 10105, 107, 13801, 10108, 28957, 112, 117, 10155, 144, 13993, 11916, 13078, 10853, 117, 33573, 10188, 43746, 10111, 21756, 10106, 27397, 10106, 169, 19366, 15900, 58198, 10106, 14592, 117, 10134, 10105, 10422, 11922, 25166, 12304, 10106, 10105, 54257, 13702, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 2, 6, 6, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "\"", "We", "Albanian", "##s", ",", "sons", "of", "Bu", "##zu", "##ku", ",", "believed", "our", "language", "had", "a", "written", "document", "but", "now", "we", "do", "not", "have", "it", "any", "more", ",", "\"", "la", "##mente", "##d", "scholar", "Musa", "Ham", "##iti", ",", "told", "of", "the", "loss", "by", "the", "Vatican", "library", "." ], "ids": [ 107, 12865, 54257, 10107, 117, 23500, 10108, 11916, 13078, 10853, 117, 20718, 17446, 13702, 10374, 169, 13398, 25166, 10473, 11858, 11951, 10149, 10472, 10529, 10271, 11178, 10798, 117, 107, 10109, 10611, 10162, 49658, 39192, 39135, 13903, 117, 21937, 10108, 10105, 18576, 10155, 10105, 54527, 23187, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Tirana", "'", "s", "national", "library", "has", "three", "copies", "of", "the", "\"", "Book", "of", "Mass", "'", ".", "\"" ], "ids": [ 59272, 112, 187, 11844, 23187, 10393, 11003, 26102, 10108, 10105, 107, 13801, 10108, 28957, 112, 119, 107 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "There", "is", "nothing", "left", "for", "us", "but", "to", "be", "gra", "##te", "##ful", "to", "civilisation", "for", "in", "##venti", "##ng", "photo", "##co", "##pies", ",", "\"", "Gazeta", "S", "##h", "##qi", "##ptar", "##e", "said", "." ], "ids": [ 11723, 10124, 33338, 12153, 10142, 19626, 10473, 10114, 10347, 63706, 10216, 14446, 10114, 98581, 10142, 10106, 83692, 10376, 38171, 10812, 81513, 117, 107, 88343, 156, 10237, 27132, 71400, 10112, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Russia", "to", "c", "##lam", "##p", "down", "on", "bar", "##ter", "deals", "." ], "ids": [ 14664, 10114, 171, 21114, 10410, 12935, 10135, 18121, 10877, 78037, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "23" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "officials", ",", "keen", "to", "cut", "capital", "flight", ",", "will", "adopt", "tight", "measures", "to", "cut", "bar", "##ter", "deals", "in", "foreign", "trade", "to", "a", "minimum", ",", "a", "customs", "official", "said", "on", "Friday", "." ], "ids": [ 13463, 27730, 117, 67605, 10114, 21610, 12185, 23578, 117, 11337, 106916, 85202, 38606, 10114, 21610, 18121, 10877, 78037, 10106, 20796, 18908, 10114, 169, 26503, 117, 169, 89907, 14731, 12415, 10135, 30767, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "always", "been", "concerned", "about", "bar", "##ter", "deals", "with", "other", "countries", ",", "view", "##ing", "them", "as", "a", "dis", "##gui", "##sed", "kind", "of", "capital", "flight", "from", "Russia", ",", "\"", "Marina", "Volk", "##ova", ",", "deputy", "head", "of", "the", "currency", "department", "at", "the", "State", "Custom", "##s", "Committee", ",", "told", "Reuters", "." ], "ids": [ 107, 12865, 10529, 19540, 10590, 47451, 10978, 18121, 10877, 78037, 10169, 10684, 15911, 117, 17904, 10230, 11345, 10146, 169, 27920, 55818, 16219, 22282, 10108, 12185, 23578, 10188, 14664, 117, 107, 18753, 44613, 12804, 117, 45404, 13578, 10108, 10105, 83759, 21079, 10160, 10105, 11104, 101590, 10107, 14481, 117, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 9 ] }, { "tokens": [ "Volk", "##ova", "said", "last", "year", "goods", "had", "been", "export", "##ed", "under", "many", "Russian", "bar", "##ter", "deals", ",", "with", "nothing", "imported", "in", "return", "." ], "ids": [ 44613, 12804, 12415, 12469, 10924, 36931, 10374, 10590, 59220, 10336, 10571, 11299, 13463, 18121, 10877, 78037, 117, 10169, 33338, 100591, 10106, 15079, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "said", "the", "cost", "of", "such", "uni", "##mpo", "##rte", "##d", "goods", "was", "$", "1", ".", "10", "billion", "in", "1995", "." ], "ids": [ 11149, 12415, 10105, 18849, 10108, 11049, 69191, 65075, 13733, 10162, 36931, 10134, 109, 122, 119, 10150, 25848, 10106, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bart", "##er", "deals", "were", "worth", "$", "4", ".", "9", "billion", "last", "year", ",", "or", "about", "eight", "percent", "of", "all", "Russian", "export", "##s", "estimated", "at", "$", "61", ".", "5", "billion", ",", "she", "said", "." ], "ids": [ 33849, 10165, 78037, 10309, 43509, 109, 125, 119, 130, 25848, 12469, 10924, 117, 10345, 10978, 16222, 22362, 10108, 10435, 13463, 59220, 10107, 25267, 10160, 109, 12314, 119, 126, 25848, 117, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "cost", "of", "export", "##ed", "goods", "is", "too", "often", "under", "##state", "##d", ",", "so", "the", "actual", "share", "of", "bar", "##ter", "deals", "in", "Russian", "export", "##s", "and", "the", "amount", "of", "uni", "##mpo", "##rte", "##d", "goods", "may", "be", "even", "higher", ",", "\"", "Volk", "##ova", "said", "." ], "ids": [ 107, 10117, 18849, 10108, 59220, 10336, 36931, 10124, 16683, 12899, 10571, 65023, 10162, 117, 10380, 10105, 14012, 23867, 10108, 18121, 10877, 78037, 10106, 13463, 59220, 10107, 10111, 10105, 24074, 10108, 69191, 65075, 13733, 10162, 36931, 11387, 10347, 13246, 17981, 117, 107, 44613, 12804, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "A", "few", "days", "ago", "Russian", "President", "Boris", "Ye", "##lts", "##in", "issued", "a", "decree", "on", "state", "regulation", "of", "foreign", "bar", "##ter", "deals", ",", "and", "Volk", "##ova", "said", "this", "\"", "could", "substantial", "##ly", "improve", "the", "situation", "\"", "." ], "ids": [ 138, 13824, 13990, 36390, 13463, 12811, 21463, 20567, 72847, 10245, 21694, 169, 109157, 10135, 11388, 57939, 10108, 20796, 18121, 10877, 78037, 117, 10111, 44613, 12804, 12415, 10531, 107, 12174, 50608, 10454, 33992, 10105, 18586, 107, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "line", "with", "the", "decree", ",", "which", "will", "come", "into", "force", "on", "November", "1", ",", "all", "Russian", "bar", "##ter", "trade", "##rs", "will", "be", "ob", "##lige", "##d", "to", "import", "goods", "worth", "the", "cost", "of", "their", "export", "##s", "within", "180", "days", "." ], "ids": [ 10167, 12117, 10169, 10105, 109157, 117, 10319, 11337, 10678, 10708, 15031, 10135, 10819, 122, 117, 10435, 13463, 18121, 10877, 18908, 10943, 11337, 10347, 17339, 14425, 10162, 10114, 67622, 36931, 43509, 10105, 18849, 10108, 10455, 59220, 10107, 12381, 13912, 13990, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "trade", "##rs", "are", "late", ",", "they", "will", "have", "to", "pay", "fines", "worth", "the", "cost", "of", "their", "export", "##ed", "goods", ",", "\"", "Volk", "##ova", "said", "." ], "ids": [ 107, 14535, 18908, 10943, 10301, 13002, 117, 10689, 11337, 10529, 10114, 16868, 32392, 43509, 10105, 18849, 10108, 10455, 59220, 10336, 36931, 117, 107, 44613, 12804, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Under", "##stati", "##ng", "the", "cost", "of", "export", "##ed", "goods", "could", "still", "be", "a", "loop", "##hole", "for", "bar", "##ter", "deal", "##ers", ",", "but", "Volk", "##ova", "said", "the", "authorities", "are", "currently", "\"", "ta", "##ck", "##ling", "the", "technical", "##ities", "of", "the", "issue", "\"", "." ], "ids": [ 12594, 70796, 10376, 10105, 18849, 10108, 59220, 10336, 36931, 12174, 12647, 10347, 169, 33161, 84569, 10142, 18121, 10877, 19918, 10901, 117, 10473, 44613, 12804, 12415, 10105, 28308, 10301, 15313, 107, 11057, 11263, 11945, 10105, 29914, 17285, 10108, 10105, 15557, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bart", "##er", "has", "always", "been", "a", "feature", "of", "the", "Soviet", "Union", "'", "s", "foreign", "trade", ",", "but", "Ye", "##lts", "##in", "'", "s", "decree", "##s", "liberal", "##ising", "foreign", "trade", "in", "1991", "-", "1992", "has", "given", "bar", "##ter", "a", "new", "im", "##pet", "##us", "." ], "ids": [ 33849, 10165, 10393, 19540, 10590, 169, 19072, 10108, 10105, 15277, 11457, 112, 187, 20796, 18908, 117, 10473, 20567, 72847, 10245, 112, 187, 109157, 10107, 28950, 53624, 20796, 18908, 10106, 10442, 118, 10450, 10393, 13507, 18121, 10877, 169, 10751, 10211, 19094, 10251, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "few", "years", "ago", ",", "bar", "##ter", "deals", "account", "##ed", "for", "up", "to", "25", "-", "30", "percent", "of", "Russian", "export", "##s", "because", "\"", "thousands", "(", "of", ")", "trade", "companies", "which", "pop", "##ped", "up", "preferred", "bar", "##ter", "in", "the", "absence", "of", "reliable", "Russian", "banks", "and", "money", "transfer", "systems", "\"", ",", "Volk", "##ova", "said", "." ], "ids": [ 138, 13824, 10855, 36390, 117, 18121, 10877, 78037, 23200, 10336, 10142, 10741, 10114, 10258, 118, 10244, 22362, 10108, 13463, 59220, 10107, 12373, 107, 39966, 113, 10108, 114, 18908, 18866, 10319, 13717, 16898, 10741, 60278, 18121, 10877, 10106, 10105, 28589, 10108, 103581, 13463, 41375, 10111, 17920, 21110, 16768, 107, 117, 44613, 12804, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "Now", "many", "Russian", "banks", "are", "strong", "and", "can", "make", "various", "sort", "##s", "of", "money", "tra", "##n", "##fers", ",", "while", "in", "##com", "##pet", "##ent", "trade", "##rs", "are", "being", "ou", "##sted", "by", "more", "experienced", "ones", "." ], "ids": [ 107, 17121, 11299, 13463, 41375, 10301, 18093, 10111, 10944, 13086, 13547, 20363, 10107, 10108, 17920, 11264, 10115, 33333, 117, 11371, 10106, 22530, 19094, 11405, 18908, 10943, 10301, 11223, 10431, 36018, 10155, 10798, 40727, 35688, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "current", "share", "of", "bar", "##ter", "deals", "in", "Russian", "export", "##s", "is", "still", "high", ",", "\"", "she", "said", "." ], "ids": [ 16976, 10105, 14978, 23867, 10108, 18121, 10877, 78037, 10106, 13463, 59220, 10107, 10124, 12647, 11846, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "D", "##mit", "##ry", "Solo", "##vy", "##ov", ",", "Moscow", "News", "##room", ",", "+", "709", "##5", "941", "852", "##0" ], "ids": [ 118, 118, 141, 15772, 10908, 21201, 15343, 11024, 117, 18744, 12219, 25525, 117, 116, 67432, 11166, 82944, 70072, 10929 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Via", "##com", "plans", "\"", "Mission", "\"", "sequel", "-", "report", "." ], "ids": [ 21280, 22530, 18195, 107, 14157, 107, 48333, 118, 17553, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "1996", "-", "08", "-", "22" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paramount", "Pictures", "is", "going", "ahead", "with", "a", "sequel", "to", "the", "Tom", "Cruise", "block", "##bust", "##er", ",", "\"", "Mission", ":", "Impossible", "\"", "and", "hopes", "to", "release", "it", "in", "the", "summer", "of", "1998", ",", "Daily", "Variety", "reported", "in", "its", "Friday", "edition", "." ], "ids": [ 40322, 18524, 10124, 19090, 35629, 10169, 169, 48333, 10114, 10105, 12275, 59150, 27242, 104071, 10165, 117, 107, 14157, 131, 90255, 107, 10111, 82467, 10114, 14072, 10271, 10106, 10105, 17995, 10108, 10363, 117, 17252, 43190, 15943, 10106, 10474, 30767, 14372, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "big", "-", "screen", "version", "of", "the", "sp", "##y", "TV", "series", "has", "grosse", "##d", "$", "175", "million", "domestic", "##ally", "since", "opening", "May", "22", ",", "and", "$", "338", "million", "overseas", "so", "far", "." ], "ids": [ 10117, 22185, 118, 29963, 11674, 10108, 10105, 32650, 10157, 10813, 11366, 10393, 85695, 10162, 109, 18101, 12473, 31084, 19777, 11764, 17975, 10725, 10306, 117, 10111, 109, 29437, 12473, 59391, 10380, 13301, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "the", "biggest", "success", "for", "Via", "##com", "Inc", "-", "owned", "Paramount", "since", "1994", "'", "s", "\"", "Forrest", "G", "##ump", "\"", "." ], "ids": [ 10377, 112, 187, 10105, 36304, 17001, 10142, 21280, 22530, 13604, 118, 17012, 40322, 11764, 10444, 112, 187, 107, 60388, 144, 67299, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 3, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "However", ",", "many", "critics", "com", "##plained", "its", "plot", "was", "in", "##com", "##pre", "##hen", "##sible", "." ], "ids": [ 12209, 117, 11299, 29832, 10212, 103154, 10474, 32473, 10134, 10106, 22530, 30619, 14786, 55864, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cruise", "will", "reprise", "his", "roles", "as", "star", "and", "co", "-", "producer", ",", "and", "will", "soon", "meet", "Academy", "Award", "-", "winning", "screenwriter", "William", "Goldman", ",", "who", "will", "write", "the", "script", ",", "the", "report", "said", "." ], "ids": [ 59150, 11337, 42330, 10226, 24016, 10146, 16624, 10111, 11170, 118, 16607, 117, 10111, 11337, 17864, 23267, 12578, 11514, 118, 16542, 99204, 10694, 57886, 117, 10479, 11337, 28685, 10105, 31810, 117, 10105, 17553, 12415, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "\"", "Mission", ":", "Impossible", "\"", "director", "Brian", "De", "Palma", "would", "have", "first", "c", "##rack", "at", "the", "sequel", ",", "though", "no", "deals", "have", "been", "made", "yet", "." ], "ids": [ 10377, 12415, 107, 14157, 131, 90255, 107, 12461, 13977, 10190, 28138, 10894, 10529, 10422, 171, 71189, 10160, 10105, 48333, 117, 15102, 10192, 78037, 10529, 10590, 11019, 21833, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Goldman", ",", "whose", "Oscars", "were", "for", "\"", "Butch", "Cassidy", "and", "the", "Sundance", "Kid", "\"", "and", "\"", "All", "the", "President", "'", "s", "Men", "\"", ",", "earlier", "this", "summer", "criticised", "some", "of", "the", "season", "'", "s", "block", "##bust", "##ers", "." ], "ids": [ 57886, 117, 16879, 94648, 10309, 10142, 107, 104577, 76371, 10111, 10105, 80216, 25867, 107, 10111, 107, 11101, 10105, 12811, 112, 187, 13026, 107, 117, 18905, 10531, 17995, 91588, 11152, 10108, 10105, 11226, 112, 187, 27242, 104071, 10901, 119 ], "entity": [ "B-PER", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 2, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "However", ",", "he", "single", "##d", "out", "\"", "Mission", ":", "Impossible", "\"", "as", "an", "especially", "enter", "##taining", "movie", ",", "Daily", "Variety", "said", "." ], "ids": [ 12209, 117, 10261, 11376, 10162, 10950, 107, 14157, 131, 90255, 107, 10146, 10151, 17491, 31006, 70700, 18379, 117, 17252, 43190, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "CR", "##A", "##W", "##LE", "##Y", "FOR", "##CE", "##D", "TO", "SI", "##T", "AND", "W", "##A", "##IT", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 44912, 10738, 13034, 51036, 14703, 109544, 43161, 11490, 58573, 39675, 11090, 52428, 160, 10738, 37611, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "bat", "##sman", "John", "C", "##ra", "##wley", "was", "forced", "to", "end", "##ure", "a", "fr", "##ust", "##rating", "delay", "of", "over", "three", "hours", "before", "res", "##umi", "##ng", "his", "quest", "for", "a", "maiden", "test", "century", "in", "the", "third", "test", "against", "Pakistan", "on", "Friday", "." ], "ids": [ 11701, 11519, 24305, 10421, 140, 10288, 62381, 10134, 20054, 10114, 11572, 12101, 169, 12127, 19265, 45527, 76497, 10108, 10491, 11003, 19573, 11360, 39429, 17019, 10376, 10226, 21974, 10142, 169, 87761, 15839, 11943, 10106, 10105, 12628, 15839, 11327, 15437, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Heavy", "over", "##night", "rain", "and", "morning", "dr", "##iz", "##zle", "ruled", "out", "any", "play", "before", "lu", "##nch", "on", "the", "second", "day", "but", "an", "improvement", "in", "the", "weather", "prompted", "the", "um", "##pire", "##s", "to", "anno", "##unce", "a", "1415", "local", "time", "(", "1315", "GMT", ")", "start", "in", "the", "event", "of", "no", "further", "rain", "." ], "ids": [ 31920, 10491, 45217, 50939, 10111, 28757, 17094, 15834, 58588, 34920, 10950, 11178, 12253, 11360, 14657, 31215, 10135, 10105, 11132, 11940, 10473, 10151, 70010, 10106, 10105, 35660, 93003, 10105, 10293, 72079, 10107, 10114, 11671, 93050, 169, 59265, 11436, 10635, 113, 87466, 20362, 114, 15148, 10106, 10105, 14416, 10108, 10192, 14586, 50939, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##ra", "##wley", ",", "un", "##beat", "##en", "on", "94", "over", "##night", "in", "an", "England", "total", "of", "278", "for", "six", ",", "was", "spotted", "str", "##umm", "##ing", "a", "guitar", "in", "the", "dress", "##ing", "-", "room", "as", "the", "Oval", "ground", "staff", "took", "centre", "stage", "." ], "ids": [ 140, 10288, 62381, 117, 10119, 68939, 10136, 10135, 12749, 10491, 45217, 10106, 10151, 11701, 11339, 10108, 29417, 10142, 12449, 117, 10134, 96924, 17791, 87951, 10230, 169, 15228, 10106, 10105, 67348, 10230, 118, 19555, 10146, 10105, 98765, 16912, 18927, 12149, 12672, 15365, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "were", "several", "dam", "##p", "patch", "##es", "on", "the", "square", "and", "the", "out", "##field", "and", "it", "was", "still", "rain", "##ing", "when", "the", "players", "took", "an", "early", "lu", "##nch", "at", "1230", "local", "time", "(", "1130", "GMT", ")", "." ], "ids": [ 11723, 10309, 11736, 39121, 10410, 105741, 10171, 10135, 10105, 15163, 10111, 10105, 10950, 13408, 10111, 10271, 10134, 12647, 50939, 10230, 10841, 10105, 16021, 12149, 10151, 11732, 14657, 31215, 10160, 58449, 11436, 10635, 113, 63447, 20362, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "When", "bright", "##er", "weather", "finally", "arrived", ",", "the", "um", "##pire", "##s", "announced", "a", "revised", "figure", "of", "67", "over", "##s", "to", "be", "bowl", "##ed", "with", "play", "extended", "to", "at", "least", "1900", "local", "time", "(", "1800", "GMT", ")", "." ], "ids": [ 12242, 72041, 10165, 35660, 21256, 22584, 117, 10105, 10293, 72079, 10107, 13854, 169, 41226, 17527, 10108, 12316, 10491, 10107, 10114, 10347, 99380, 10336, 10169, 12253, 21777, 10114, 10160, 16298, 11568, 11436, 10635, 113, 13648, 20362, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "MO", "##TO", "##R", "RA", "##CI", "##NG", "-", "BE", "##L", "##GI", "##AN", "GR", "##AN", "##D", "PR", "##IX", "PR", "##AC", "##TI", "##CE", "TIME", "##S", "." ], "ids": [ 102059, 60493, 11273, 64007, 89955, 34065, 118, 46291, 11369, 100075, 41275, 58787, 41275, 11490, 23837, 67403, 23837, 30340, 72286, 43161, 89275, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SP", "##A", "-", "FR", "##AN", "##CO", "##RC", "##HA", "##MP", "##S", ",", "Belgium", "1996", "-", "08", "-", "23" ], "ids": [ 22570, 10738, 118, 64655, 41275, 82272, 52932, 58132, 79936, 10731, 117, 26519, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "times" ], "ids": [ 100085, 13465 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "after", "Friday", "'", "s", "opening", "practice", "sessions", "for", "Sunday", "'", "s" ], "ids": [ 10662, 30767, 112, 187, 17975, 18194, 45320, 10142, 19731, 112, 187 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgian", "Grand", "Prix", "motor", "race", ":" ], "ids": [ 36652, 11319, 12835, 15257, 14025, 131 ], "entity": [ "B-MISC", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 2, 2, 6, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Gerhard", "Berger", "(", "Austria", ")", "Ben", "##etto", "##n", "1", "minute", "53", ".", "706", "seconds" ], "ids": [ 122, 119, 23148, 27121, 113, 14479, 114, 13304, 24327, 10115, 122, 21760, 11756, 119, 63683, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "David", "Co", "##ult", "##hard", "(", "Britain", ")", "McLaren", "1", ":", "54", ".", "342" ], "ids": [ 123, 119, 10804, 13098, 16203, 29352, 113, 16032, 114, 38084, 122, 131, 11653, 119, 34430 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Jacques", "Villeneuve", "(", "Canada", ")", "Williams", "1", ":", "54", ".", "443" ], "ids": [ 124, 119, 12745, 40761, 113, 11635, 114, 12494, 122, 131, 11653, 119, 42986 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Mika", "Ha", "##kki", "##nen", "(", "Finland", ")", "McLaren", "1", ":", "54", ".", "754" ], "ids": [ 125, 119, 53379, 13740, 30859, 11216, 113, 15497, 114, 38084, 122, 131, 11653, 119, 58534 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Heinz", "-", "Harald", "Fr", "##ent", "##zen", "(", "Germany", ")", "1", ":", "54", ".", "984" ], "ids": [ 126, 119, 23406, 118, 25475, 33884, 11405, 11985, 113, 12775, 114, 122, 131, 11653, 119, 71279 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Jean", "Ale", "##si", "(", "France", ")", "Ben", "##etto", "##n", "1", ":", "55", ".", "101" ], "ids": [ 127, 119, 10766, 59340, 10449, 113, 10688, 114, 13304, 24327, 10115, 122, 131, 11358, 119, 14123 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Damon", "Hill", "(", "Britain", ")", "Williams", "1", ":", "55", ".", "281" ], "ids": [ 128, 119, 50633, 12289, 113, 16032, 114, 12494, 122, 131, 11358, 119, 29215 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Michael", "Schumacher", "(", "Germany", ")", "1", ":", "55", ".", "333" ], "ids": [ 129, 119, 10631, 37761, 113, 12775, 114, 122, 131, 11358, 119, 27243 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Martin", "Brun", "##dle", "(", "Britain", ")", "Jordan", "1", ":", "55", ".", "385" ], "ids": [ 130, 119, 11235, 102877, 27477, 113, 16032, 114, 16366, 122, 131, 11358, 119, 31548 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Rubens", "Barr", "##iche", "##llo", "(", "Brazil", ")", "Jordan", "1", ":", "55", ".", "645" ], "ids": [ 10150, 119, 61903, 79283, 16528, 13660, 113, 16765, 114, 16366, 122, 131, 11358, 119, 43929 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "11", ".", "Johnny", "Herbert", "(", "Britain", ")", "Sau", "##ber", "1", ":", "56", ".", "318" ], "ids": [ 10193, 119, 15551, 16861, 113, 16032, 114, 19076, 12212, 122, 131, 11628, 119, 30670 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "12", ".", "Olivier", "Pan", "##is", "(", "France", ")", "Ligi", "##er", "1", ":", "56", ".", "417" ], "ids": [ 10186, 119, 22383, 18661, 10291, 113, 10688, 114, 32874, 10165, 122, 131, 11628, 119, 35750 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "TO", "##SH", "##IB", "##A", "CL", "##AS", "##SI", "##C", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 58573, 64091, 72918, 10738, 75151, 38025, 44802, 10858, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "[", "CO", "##R", "##RE", "##CT", "##ED", "05", ":", "30", "GMT", "]" ], "ids": [ 164, 32992, 11273, 66014, 91995, 33809, 10831, 131, 10244, 20362, 166 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "CA", "##R", "##LS", "##BA", "##D", ",", "California", "1996", "-", "08", "-", "22" ], "ids": [ 24707, 11273, 66934, 35999, 11490, 117, 11621, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the" ], "ids": [ 33036, 10188, 10105 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "$", "450", ",", "000", "To", "##shi", "##ba", "Classic", "tennis", "tournament", "on", "Thursday", "(", "pre", "##fix" ], "ids": [ 109, 16718, 117, 10259, 11469, 16119, 10537, 20542, 20944, 17390, 10135, 67067, 113, 12229, 57014 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Quarter", "-", "finals" ], "ids": [ 75820, 118, 21758 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "2", "-", "Con", "##chi", "##ta", "Martinez", "(", "Spain", ")", "beat", "Nathalie", "Tau", "##zia", "##t", "(", "France", ")" ], "ids": [ 123, 118, 12845, 12806, 10213, 50203, 113, 16149, 114, 27868, 64682, 88233, 14767, 10123, 113, 10688, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", "-", "3", "6", "-", "4" ], "ids": [ 127, 118, 124, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "round" ], "ids": [ 14181, 13569 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "5", "-", "Gabriela", "Saba", "##tini", "(", "Argentina", ")", "beat", "Asa", "Carl", "##sson", "(", "Sweden", ")" ], "ids": [ 126, 118, 51311, 86627, 29619, 113, 12853, 114, 27868, 96536, 12225, 14650, 113, 20937, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", "-", "1", "7", "-", "5" ], "ids": [ 127, 118, 122, 128, 118, 126 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Katarina", "St", "##uden", "##iko", "##va", "(", "Slovakia", ")", "beat", "6", "-", "Karin", "##a", "Ha", "##bs", "##udo", "##va" ], "ids": [ 65988, 10838, 23280, 18924, 10362, 113, 43031, 114, 27868, 127, 118, 41633, 10113, 13740, 19528, 33498, 10362 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Slovakia", ")", "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "2" ], "ids": [ 113, 43031, 114, 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 123 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Cor", "##rec", "##ts", "that", "Ha", "##bs", "##udo", "##va", "is", "sixth", "seed", ")", "." ], "ids": [ 113, 93495, 74755, 10806, 10189, 13740, 19528, 33498, 10362, 10124, 28913, 49282, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "English", "first", "division" ], "ids": [ 33036, 10108, 11616, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "matches", "on", "Friday", ":" ], "ids": [ 41356, 18258, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portsmouth", "1", "Queens", "Park", "Rangers", "2" ], "ids": [ 46933, 122, 34140, 11239, 23042, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Tra", "##n", "##mere", "3", "G", "##rim", "##sby", "2" ], "ids": [ 21469, 10115, 32732, 124, 144, 23760, 38243, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SC", "##OT", "##TI", "##SH", "T", "##HI", "##RD", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##T", "." ], "ids": [ 71020, 65622, 24093, 118, 18137, 62146, 72286, 64091, 157, 108880, 84444, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GL", "##AS", "##GO", "##W", "1996", "-", "08", "-", "23" ], "ids": [ 108755, 38025, 83821, 13034, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "Scottish", "third" ], "ids": [ 32070, 16203, 10108, 169, 18879, 12628 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "match", "on", "Friday", ":" ], "ids": [ 13751, 41356, 12356, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "East", "Stirling", "0", "Albion", "1" ], "ids": [ 11830, 60442, 121, 56878, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##IS", "##H", "CO", "##UN", "##T", "##Y", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "SC", "##OR", "##ES", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 19088, 12396, 32992, 69849, 11090, 14703, 39774, 36535, 11127, 52980, 64091, 30331, 18137, 42622, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Close", "of", "play", "scores", "in", "four", "-", "day" ], "ids": [ 39981, 10108, 12253, 49931, 10106, 11598, 118, 11940 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "County", "Championship", "cricket", "matches", "on", "Friday", ":" ], "ids": [ 11616, 10886, 12341, 32289, 18258, 10135, 30767, 131 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Third", "day" ], "ids": [ 16788, 11940 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "At", "Weston", "-", "super", "-", "Mare", ":", "Durham", "326", "(", "D", ".", "Cox", "95", "not", "out", "," ], "ids": [ 11699, 62676, 118, 25212, 118, 20754, 131, 37499, 32558, 113, 141, 119, 30927, 11978, 10472, 10950, 117 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "S", ".", "Campbell", "69", ";", "G", ".", "Rose", "7", "-", "73", ")", "." ], "ids": [ 156, 119, 18172, 12573, 132, 144, 119, 14873, 128, 118, 12545, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Somerset", "298", "-", "6", "(", "M", ".", "La", "##th", "##well", "85", "," ], "ids": [ 35434, 31543, 118, 127, 113, 150, 119, 10159, 11143, 15862, 12017, 117 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "R", ".", "Hard", "##en", "65", ")", "." ], "ids": [ 155, 119, 23946, 10136, 10843, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Second", "day" ], "ids": [ 14181, 11940 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "At", "Col", "##chester", ":", "Gloucestershire", "280", "(", "J", ".", "Russell", "63", ",", "A", ".", "Sy", "##monds" ], "ids": [ 11699, 24927, 38540, 131, 91183, 17859, 113, 147, 119, 13481, 12256, 117, 138, 119, 32879, 97369 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 5, 9, 3, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "52", ";", "A", ".", "Co", "##wan", "5", "-", "68", ")", "." ], "ids": [ 11525, 132, 138, 119, 13098, 14394, 126, 118, 12370, 114, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essex", "194", "-", "0", "(", "G", ".", "Go", "##och", "105", "not", "out", ",", "D", ".", "Robinson" ], "ids": [ 33634, 24498, 118, 121, 113, 144, 119, 14439, 16908, 14519, 10472, 10950, 117, 141, 119, 13895 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 3, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "72", "not", "out", ")", "." ], "ids": [ 12120, 10472, 10950, 114, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Cardiff", ":", "Kent", "255", "-", "3", "(", "D", ".", "Fulton", "64", ",", "M", ".", "Walker", "59", ",", "C", ".", "Hooper" ], "ids": [ 11699, 39136, 131, 19393, 24024, 118, 124, 113, 141, 119, 80454, 11295, 117, 150, 119, 15432, 11867, 117, 140, 119, 40899 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 3, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8 ] }, { "tokens": [ "52", "not", "out", ")", "v", "G", "##lam", "##organ", "." ], "ids": [ 11525, 10472, 10950, 114, 190, 144, 21114, 100807, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "At", "Leicester", ":", "Leicester", "##shire", "343", "-", "8", "(", "P", ".", "Simmons", "108", ",", "P", ".", "Nixon" ], "ids": [ 11699, 38789, 131, 38789, 19684, 32007, 118, 129, 113, 153, 119, 44190, 15845, 117, 153, 119, 36507 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8 ] }, { "tokens": [ "67", "not", "out", ")", "v", "Hampshire", "." ], "ids": [ 12316, 10472, 10950, 114, 190, 26036, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "At", "Northampton", ":", "Sussex", "389", "(", "N", ".", "Len", "##ham", "145", ",", "V", ".", "Drake", "##s", "59", "," ], "ids": [ 11699, 79445, 131, 38426, 40064, 113, 151, 119, 97413, 13196, 17862, 117, 159, 119, 30852, 10107, 11867, 117 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "A", ".", "Wells", "51", ";", "A", ".", "Pen", "##bert", "##hy", "4", "-", "36", ")", "." ], "ids": [ 138, 119, 25325, 11524, 132, 138, 119, 52559, 18072, 19275, 125, 118, 11055, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Northampton", "##shire", "160", "-", "4", "(", "K", ".", "Cu", "##rran" ], "ids": [ 79445, 19684, 13849, 118, 125, 113, 148, 119, 34387, 89112 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "79", "not", "out", ")", "." ], "ids": [ 12791, 10472, 10950, 114, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Trent", "Bridge", ":", "Nottingham", "##shire", "392", "-", "6", "(", "G", ".", "Archer", "143", "not" ], "ids": [ 11699, 47528, 17426, 131, 43396, 19684, 37956, 118, 127, 113, 144, 119, 53446, 19510, 10472 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "out", ",", "M", ".", "Dow", "##man", "107", ")", "v", "Surrey", "." ], "ids": [ 10950, 117, 150, 119, 106035, 10589, 15844, 114, 190, 42858, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 3, 9 ] }, { "tokens": [ "At", "Worcester", ":", "Warwick", "##shire", "310", "(", "A", ".", "Giles", "83", ",", "T", ".", "Mu", "##nton", "54", "not" ], "ids": [ 11699, 55518, 131, 48234, 19684, 23993, 113, 138, 119, 49355, 12408, 117, 157, 119, 49056, 39110, 11653, 10472 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "out", ",", "W", ".", "Khan", "52", ";", "R", ".", "Ill", "##ing", "##worth", "4", "-", "54", ",", "S", ".", "Lam", "##pit", "##t", "4", "-", "90", ")", "." ], "ids": [ 10950, 117, 160, 119, 16324, 11525, 132, 155, 119, 101288, 10230, 17929, 125, 118, 11653, 117, 156, 119, 44068, 25257, 10123, 125, 118, 10919, 114, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Worcester", "##shire", "10", "-", "0", "." ], "ids": [ 55518, 19684, 10150, 118, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Head", "##ing", "##ley", ":", "Yorkshire", "529", "-", "8", "declared", "(", "C", ".", "White", "181", "," ], "ids": [ 11699, 16830, 10230, 12105, 131, 27577, 49102, 118, 129, 25019, 113, 140, 119, 12136, 22534, 117 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 3, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "R", ".", "Blake", "##y", "109", "not", "out", ",", "M", ".", "Mo", "##xon", "66", ",", "M", ".", "Vaughan", "57", ")", "." ], "ids": [ 155, 119, 24321, 10157, 16296, 10472, 10950, 117, 150, 119, 34987, 55251, 12215, 117, 150, 119, 54864, 11817, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Lancashire" ], "ids": [ 48487 ], "entity": [ "B-ORG" ], "entity_ids": [ 3 ] }, { "tokens": [ "162", "-", "4", "(", "N", ".", "Fair", "##bro", "##ther", "53", "not", "out", ")", "." ], "ids": [ 21638, 118, 125, 113, 151, 119, 25697, 20923, 22623, 11756, 10472, 10950, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "P", "##OL", "##L", "##OCK", "H", "##OP", "##ES", "FOR", "RE", "##T", "##UR", "##N", "TO", "W", "##AR", "##W", "##IC", "##KS", "##HI", "##RE", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 153, 39272, 11369, 96608, 145, 44917, 25054, 109544, 71033, 11090, 98348, 11537, 58573, 160, 52188, 13034, 30889, 62828, 108880, 66014, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "African", "all", "-", "round", "##er", "Shaun", "Poll", "##ock", ",", "forced", "to", "cut", "short", "his", "first", "season", "with", "Warwick", "##shire", "to", "have", "an", "##kle", "surgery", ",", "has", "told", "the", "English", "county", "he", "would", "like", "to", "return", "later", "in", "his", "career", "." ], "ids": [ 11056, 13839, 10435, 118, 13569, 10165, 82113, 89951, 21863, 117, 20054, 10114, 21610, 13716, 10226, 10422, 11226, 10169, 48234, 19684, 10114, 10529, 10151, 24006, 44811, 117, 10393, 21937, 10105, 11616, 17382, 10261, 10894, 11850, 10114, 15079, 10873, 10106, 10226, 13021, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Poll", "##ock", ",", "who", "returns", "home", "a", "month", "early", "next", "week", ",", "said", ":", "\"", "I", "would", "like", "to", "come", "back", "and", "play", "county", "cricket", "in", "the", "future", "and", "I", "do", "n", "'", "t", "think", "I", "would", "like", "to", "s", "##wa", "##p", "counties", ".", "\"" ], "ids": [ 89951, 21863, 117, 10479, 38302, 11816, 169, 14064, 11732, 13451, 16118, 117, 12415, 131, 107, 146, 10894, 11850, 10114, 10678, 12014, 10111, 12253, 17382, 32289, 10106, 10105, 16711, 10111, 146, 10149, 182, 112, 188, 27874, 146, 10894, 11850, 10114, 187, 11037, 10410, 41199, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##plain", "##ing", "his", "prema", "##ture", "departure", "was", "una", "##voi", "##dab", "##le", ",", "Poll", "##ock", "said", ":", "\"", "I", "have", "been", "carrying", "the", "injury", "for", "a", "while", "and", "I", "hope", "that", "by", "having", "the", "surgery", "now", "I", "will", "be", "able", "to", "last", "out", "the", "new", "season", "back", "home", ".", "\"" ], "ids": [ 27746, 88975, 10230, 10226, 14438, 16023, 51598, 10134, 10153, 44927, 46889, 10284, 117, 89951, 21863, 12415, 131, 107, 146, 10529, 10590, 39157, 10105, 27443, 10142, 169, 11371, 10111, 146, 50725, 10189, 10155, 13677, 10105, 44811, 11858, 146, 11337, 10347, 16197, 10114, 12469, 10950, 10105, 10751, 11226, 12014, 11816, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "V", "PA", "##KI", "##ST", "##AN", "F", "##IN", "##AL", "T", "##ES", "##T", "SC", "##OR", "##EB", "##O", "##AR", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 159, 32349, 59879, 32995, 41275, 143, 27128, 32002, 157, 25054, 11090, 18137, 42622, 89922, 11403, 52188, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##board", "on", "the", "second", "day", "of" ], "ids": [ 66875, 25690, 10135, 10105, 11132, 11940, 10108 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "the", "third", "and", "final", "test", "between", "England", "and", "Pakistan", "at", "The" ], "ids": [ 10105, 12628, 10111, 11070, 15839, 10948, 11701, 10111, 15437, 10160, 10117 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1 ] }, { "tokens": [ "Oval", "on", "Friday", ":" ], "ids": [ 98765, 10135, 30767, 131 ], "entity": [ "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9 ] }, { "tokens": [ "England", "first", "innings" ], "ids": [ 11701, 10422, 48974 ], "entity": [ "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9 ] }, { "tokens": [ "M", ".", "At", "##hert", "##on", "b", "W", "##aq", "##ar", "You", "##nis", "31" ], "ids": [ 150, 119, 11699, 102855, 10263, 170, 160, 49277, 10354, 11065, 12597, 10413 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "A", ".", "Stewart", "b", "Mus", "##hta", "##q", "Ahmed", "44" ], "ids": [ 138, 119, 17493, 170, 31013, 32493, 11703, 25530, 11126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "N", ".", "Hus", "##sain", "c", "Sa", "##eed", "Anwar", "b", "W", "##aq", "##ar", "You", "##nis", "12" ], "ids": [ 151, 119, 109022, 82083, 171, 12404, 40154, 92168, 170, 160, 49277, 10354, 11065, 12597, 10186 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "G", ".", "Thorpe", "lb", "##w", "b", "Mohammad", "Ak", "##ram", "54" ], "ids": [ 144, 119, 84855, 23989, 10874, 170, 40036, 71275, 13845, 11653 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "J", ".", "C", "##ra", "##wley", "b", "W", "##aq", "##ar", "You", "##nis", "106" ], "ids": [ 147, 119, 140, 10288, 62381, 170, 160, 49277, 10354, 11065, 12597, 16084 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "N", ".", "Knight", "b", "Mus", "##hta", "##q", "Ahmed", "17" ], "ids": [ 151, 119, 19848, 170, 31013, 32493, 11703, 25530, 10273 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "C", ".", "Lewis", "b", "Was", "##im", "Ak", "##ram", "5" ], "ids": [ 140, 119, 13759, 170, 22034, 11759, 71275, 13845, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "I", ".", "Salisbury", "c", "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", "b", "Was", "##im", "Ak", "##ram", "5" ], "ids": [ 146, 119, 55933, 171, 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 170, 22034, 11759, 71275, 13845, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "D", ".", "Cork", "c", "Moi", "##n", "Khan", "b", "W", "##aq", "##ar", "You", "##nis", "0" ], "ids": [ 141, 119, 42049, 171, 82447, 10115, 16324, 170, 160, 49277, 10354, 11065, 12597, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "R", ".", "C", "##roft", "not", "out", "5" ], "ids": [ 155, 119, 140, 101860, 10472, 10950, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "A", ".", "Mu", "##lla", "##lly", "b", "Was", "##im", "Ak", "##ram", "24" ], "ids": [ 138, 119, 49056, 11083, 17903, 170, 22034, 11759, 71275, 13845, 10233 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Extra", "##s", "(", "lb", "-", "12", "w", "-", "1", "n", "##b", "-", "10", ")", "23" ], "ids": [ 50821, 10107, 113, 23989, 118, 10186, 191, 118, 122, 182, 10457, 118, 10150, 114, 10328 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "326" ], "ids": [ 25220, 32558 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "64", "2", "-", "85", "3", "-", "116", "4", "-", "205", "5", "-", "248", "6", "-", "273", "7", "-", "283" ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 11295, 123, 118, 12017, 124, 118, 17095, 125, 118, 20862, 126, 118, 24889, 127, 118, 28414, 128, 118, 29857 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", "-", "284", "9", "-", "295" ], "ids": [ 129, 118, 29137, 130, 118, 26089 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bowling", ":", "Was", "##im", "Ak", "##ram", "29", ".", "2", "-", "9", "-", "83", "-", "3", ",", "W", "##aq", "##ar", "You", "##nis", "25", "-", "6", "-", "95", "-", "4", "," ], "ids": [ 100017, 131, 22034, 11759, 71275, 13845, 10386, 119, 123, 118, 130, 118, 12408, 118, 124, 117, 160, 49277, 10354, 11065, 12597, 10258, 118, 127, 118, 11978, 118, 125, 117 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mohammad", "Ak", "##ram", "12", "-", "1", "-", "41", "-", "1", ",", "Mus", "##hta", "##q", "Ahmed", "27", "-", "5", "-", "78", "-", "2", ",", "Aa", "##mir", "So", "##hai", "##l" ], "ids": [ 40036, 71275, 13845, 10186, 118, 122, 118, 11349, 118, 122, 117, 31013, 32493, 11703, 25530, 10365, 118, 126, 118, 12492, 118, 123, 117, 80131, 20825, 12882, 37821, 10161 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "6", "-", "1", "-", "17", "-", "0" ], "ids": [ 127, 118, 122, 118, 10273, 118, 121 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "first", "innings" ], "ids": [ 15437, 10422, 48974 ], "entity": [ "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9 ] }, { "tokens": [ "Sa", "##eed", "Anwar", "not", "out", "116" ], "ids": [ 12404, 40154, 92168, 10472, 10950, 17095 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "c", "Cork", "b", "C", "##roft", "46" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 171, 42049, 170, 140, 101860, 11528 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 9, 4, 8, 9 ] }, { "tokens": [ "I", "##ja", "##z", "Ahmed", "not", "out", "58" ], "ids": [ 146, 10320, 10305, 25530, 10472, 10950, 11824 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "lb", "-", "1", "n", "##b", "-", "8", ")", "9" ], "ids": [ 50821, 10107, 113, 23989, 118, 122, 182, 10457, 118, 129, 114, 130 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "one", "wi", "##cket", ")", "229" ], "ids": [ 25220, 113, 10142, 10464, 23040, 28721, 114, 26216 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wi", "##cket", "-", "1", "-", "106" ], "ids": [ 15750, 10108, 23040, 28721, 118, 122, 118, 16084 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "bat", ":", "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", ",", "Salim", "Malik", ",", "As", "##if", "Mu", "##jta", "##ba", ",", "Was", "##im" ], "ids": [ 11469, 11519, 131, 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 117, 98284, 45783, 117, 10882, 13918, 49056, 51465, 10537, 117, 22034, 11759 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8 ] }, { "tokens": [ "Ak", "##ram", ",", "Moi", "##n", "Khan", ",", "Mus", "##hta", "##q", "Ahmed", ",", "W", "##aq", "##ar", "You", "##nis", ",", "Mohammad", "Ak", "##am" ], "ids": [ 71275, 13845, 117, 82447, 10115, 16324, 117, 31013, 32493, 11703, 25530, 117, 160, 49277, 10354, 11065, 12597, 117, 40036, 71275, 11008 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8 ] }, { "tokens": [ "Bowling", "(", "to", "date", ")", ":", "Lewis", "9", "-", "1", "-", "49", "-", "0", ",", "Mu", "##lla", "##lly", "9", "-", "3", "-", "28", "-", "0", ",", "C", "##roft" ], "ids": [ 100017, 113, 10114, 13664, 114, 131, 13759, 130, 118, 122, 118, 11580, 118, 121, 117, 49056, 11083, 17903, 130, 118, 124, 118, 10348, 118, 121, 117, 140, 101860 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "17", "-", "3", "-", "42", "-", "1", ",", "Cork", "7", "-", "1", "-", "38", "-", "0", ",", "Salisbury", "14", "-", "0", "-", "71", "-", "0" ], "ids": [ 10273, 118, 124, 118, 11276, 118, 122, 117, 42049, 128, 118, 122, 118, 11171, 118, 121, 117, 55933, 10247, 118, 121, 118, 12513, 118, 121 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "326", "AL", "##L", "O", "##UT", "V", "PA", "##KI", "##ST", "##AN", "IN", "T", "##HI", "##RD", "T", "##ES", "##T", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 32558, 47271, 11369, 152, 65729, 159, 32349, 59879, 32995, 41275, 36351, 157, 108880, 84444, 157, 25054, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "were", "all", "out", "for", "326", "in", "their", "first", "innings", "on", "the", "second", "day", "of", "the", "third", "and", "final", "test", "against", "Pakistan", "at", "The", "Oval", "on", "Friday", "." ], "ids": [ 11701, 10309, 10435, 10950, 10142, 32558, 10106, 10455, 10422, 48974, 10135, 10105, 11132, 11940, 10108, 10105, 12628, 10111, 11070, 15839, 11327, 15437, 10160, 10117, 98765, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Score", ":", "England", "326", "(", "J", ".", "C", "##ra", "##wley", "106", ",", "G", ".", "Thorpe", "54", "." ], "ids": [ 66875, 131, 11701, 32558, 113, 147, 119, 140, 10288, 62381, 16084, 117, 144, 119, 84855, 11653, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "W", "##aq", "##ar", "You", "##nis", "4", "-", "95", ")" ], "ids": [ 160, 49277, 10354, 11065, 12597, 125, 118, 11978, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SP", "##ON", "##S", "##OR", "##S", "CAS", "##H", "IN", "ON", "RA", "##VA", "##NE", "##LL", "##I", "'", "S", "SH", "##IR", "##T", "DA", "##NC", "##E", "." ], "ids": [ 71020, 65622, 24093, 118, 22570, 30118, 10731, 42622, 10731, 92923, 12396, 36351, 49339, 64007, 47172, 93280, 82834, 11281, 112, 156, 38702, 73522, 11090, 47855, 100230, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Middlesbrough", "'", "s", "Italian", "striker", "Fabrizio", "Ra", "##vane", "##lli", "is", "to", "wear", "his", "team", "sponsor", "'", "s", "name", "on", "the", "inside", "of", "his", "shirt", "so", "it", "can", "be", "seen", "when", "he", "scores", "." ], "ids": [ 105141, 112, 187, 11667, 103325, 64451, 38571, 59731, 14088, 10124, 10114, 49866, 10226, 11121, 50306, 112, 187, 11324, 10135, 10105, 22978, 10108, 10226, 81050, 10380, 10271, 10944, 10347, 15652, 10841, 10261, 49931, 119 ], "entity": [ "B-ORG", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Every", "time", "he", "finds", "the", "net", ",", "the", "grey", "-", "hair", "##ed", "forward", "pull", "##s", "his", "shirt", "##front", "over", "his", "head", "as", "he", "runs", "to", "salute", "the", "fans", ",", "and", "Middlesbrough", "'", "s", "sponsor", "##s", "want", "to", "cash", "in", "on", "the", "spectacle", "." ], "ids": [ 30929, 10635, 10261, 31478, 10105, 11988, 117, 10105, 52782, 118, 40830, 10336, 23307, 80870, 10107, 10226, 81050, 31044, 10491, 10226, 13578, 10146, 10261, 17913, 10114, 72039, 10105, 20950, 117, 10111, 105141, 112, 187, 50306, 10107, 21528, 10114, 52828, 10106, 10135, 10105, 55390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Having", "seen", "Ra", "##vane", "##lli", "celebrate", "his", "goals", ".", ".", "." ], "ids": [ 107, 50195, 15652, 38571, 59731, 14088, 72951, 10226, 18173, 119, 119, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "we", "thought", "it", "would", "be", "fun", "to", "have", "(", "the", "name", ")", "on", "the", "inside", "of", "his", "shirt", ",", "\"", "a", "spoke", "##sman", "for", "the", "sponsor", "##s", "said", "." ], "ids": [ 11951, 18957, 10271, 10894, 10347, 41807, 10114, 10529, 113, 10105, 11324, 114, 10135, 10105, 22978, 10108, 10226, 81050, 117, 107, 169, 50005, 24305, 10142, 10105, 50306, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "will", "give", "the", "fans", "something", "else", "to", "look", "at", "be", "##sides", "his", "chest", ".", "\"" ], "ids": [ 107, 10377, 11337, 18090, 10105, 20950, 26133, 40843, 10114, 25157, 10160, 10347, 77822, 10226, 94230, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ra", "##vane", "##lli", "ag", "##gra", "##vated", "a", "foot", "injury", "in", "the", "1", "-", "0", "defeat", "at", "Chelsea", "on", "Wednesday", "and", "was", "given", "only", "an", "even", "chance", "of", "playing", "at", "Nottingham", "Forest", "on", "Saturday", "by", "his", "manager", "Bryan", "Robson", "." ], "ids": [ 38571, 59731, 14088, 16942, 25635, 61141, 169, 24963, 27443, 10106, 10105, 122, 118, 121, 24800, 10160, 21450, 10135, 57611, 10111, 10134, 13507, 10893, 10151, 13246, 27893, 10108, 14879, 10160, 43396, 17666, 10135, 24848, 10155, 10226, 16935, 24510, 78446, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "AU", "##ST", "##RA", "##L", "##IA", "##NS", "AD", "##VA", "##NC", "##E", "AT", "CAN", "##AD", "##IA", "##N", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 29088, 32995, 29990, 11369, 35976, 69196, 22992, 47172, 100230, 11259, 30554, 98038, 55538, 35976, 11537, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "Australia", "Day", "at", "the", "$", "2", "million", "Canadian", "Open", "on", "Thursday", "as", "three", "Aus", "##sies", "reached", "the", "quarter", "-", "finals", "with", "straight", "-", "set", "victories", "." ], "ids": [ 10377, 10134, 11729, 12360, 10160, 10105, 109, 123, 12473, 14023, 11919, 10135, 67067, 10146, 11003, 18290, 42632, 17087, 10105, 28330, 118, 21758, 10169, 31214, 118, 11847, 62664, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Un", "##see", "##ded", "Patrick", "Ra", "##fter", "recorded", "the", "most", "note", "##worthy", "result", "as", "he", "upset", "sixth", "-", "seed", "##ed", "American", "Mali", "##V", "##ai", "Washington", "6", "-", "2", "6", "-", "1", "in", "just", "50", "minutes", "." ], "ids": [ 11038, 20262, 21597, 13867, 38571, 33163, 14227, 10105, 10992, 19864, 102786, 14493, 10146, 10261, 96213, 28913, 118, 49282, 10336, 10536, 24427, 11779, 11542, 11586, 127, 118, 123, 127, 118, 122, 10106, 12820, 10462, 15304, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Todd", "Wood", "##bridge", ",", "who", "defeated", "Canadian", "Daniel", "Nestor", "7", "-", "6", "(", "7", "-", "2", ")", "7", "-", "6", "(", "7", "-", "4", ")", ",", "and", "Mark", "Philipp", "##ous", "##sis", ",", "a", "6", "-", "3", "6", "-", "4", "winner", "over", "Bo", "##hda", "##n", "U", "##lih", "##rach", "of", "the", "Czech", "Republic", ",", "also", "advanced", "and", "will", "meet", "in", "Friday", "'", "s", "quarter", "-", "finals", "." ], "ids": [ 24708, 18315, 29273, 117, 10479, 18058, 14023, 11792, 78424, 128, 118, 127, 113, 128, 118, 123, 114, 128, 118, 127, 113, 128, 118, 125, 114, 117, 10111, 11997, 23293, 13499, 13109, 117, 169, 127, 118, 124, 127, 118, 125, 20826, 10491, 27622, 109788, 10115, 158, 53614, 36185, 10108, 10105, 22148, 13681, 117, 10379, 27072, 10111, 11337, 23267, 10106, 30767, 112, 187, 28330, 118, 21758, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 2, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Third", "-", "seed", "##ed", "Wayne", "Ferreira", "of", "South", "Africa", "defeated", "Tim", "Hen", "##man", "of", "Britain", "6", "-", "4", "6", "-", "4", "after", "a", "three", "-", "hour", "evening", "rain", "delay", "and", "fifth", "-", "seed", "##ed", "Thomas", "En", "##qvist", "of", "Sweden", "won", "his", "third", "-", "round", "match", ",", "eli", "##minat", "##ing", "Petr", "Ko", "##rda", "of", "the", "Czech", "Republic", "6", "-", "3", "6", "-", "4", "." ], "ids": [ 16788, 118, 49282, 10336, 18547, 39227, 10108, 11056, 12880, 18058, 15318, 86362, 10589, 10108, 16032, 127, 118, 125, 127, 118, 125, 10662, 169, 11003, 118, 24730, 42135, 50939, 76497, 10111, 22237, 118, 49282, 10336, 11096, 10243, 47780, 10108, 20937, 11367, 10226, 12628, 118, 13569, 12356, 117, 18166, 104130, 10230, 40986, 30186, 21285, 10108, 10105, 22148, 13681, 127, 118, 124, 127, 118, 125, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 1, 5, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ferreira", "and", "En", "##qvist", "play", "in", "a", "Friday", "night", "quarter", "-", "final", "." ], "ids": [ 39227, 10111, 10243, 47780, 12253, 10106, 169, 30767, 16903, 28330, 118, 11070, 119 ], "entity": [ "B-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "Americans", ",", "seventh", "seed", "Todd", "Martin", "and", "uns", "##eed", "##ed", "Alex", "O", "'", "Brien", ",", "will", "meet", "on", "Friday", "after", "winning", "matches", "on", "Thursday", "." ], "ids": [ 13214, 25069, 117, 37192, 49282, 24708, 11235, 10111, 15826, 40154, 10336, 14728, 152, 112, 33629, 117, 11337, 23267, 10135, 30767, 10662, 16542, 18258, 10135, 67067, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "over", "##cam", "##e", "Cedric", "Pio", "##line", "of", "France", "2", "-", "6", "6", "-", "2", "6", "-", "4", "and", "O", "'", "Brien", "beat", "Mikael", "Till", "##strom", "of", "Sweden", "6", "-", "3", "2", "-", "6", "6", "-", "3", "." ], "ids": [ 11235, 10491, 67354, 10112, 107799, 42712, 12953, 10108, 10688, 123, 118, 127, 127, 118, 123, 127, 118, 125, 10111, 152, 112, 33629, 27868, 54671, 32259, 83474, 10108, 20937, 127, 118, 124, 123, 118, 127, 127, 118, 124, 119 ], "entity": [ "B-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "you", "really", "look", "at", "the", "match", ",", "\"", "said", "the", "12th", "-", "ranked", "Washington", "after", "losing", "to", "the", "70", "##th", "-", "ranked", "Ra", "##fter", ",", "\"", "I", "never", "really", "got", "a", "chance", "to", "play", "because", "he", "was", "serving", "big", "and", "getting", "in", "close", "to", "the", "net", "." ], "ids": [ 107, 14535, 13028, 30181, 25157, 10160, 10105, 12356, 117, 107, 12415, 10105, 34505, 118, 25250, 11586, 10662, 27817, 10114, 10105, 10923, 11143, 118, 25250, 38571, 33163, 117, 107, 146, 14794, 30181, 19556, 169, 27893, 10114, 12253, 12373, 10261, 10134, 20252, 22185, 10111, 34875, 10106, 16065, 10114, 10105, 11988, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "was", "also", "able", "to", "handle", "my", "serve", "pretty", "easily", "because", "my", "(", "first", ")", "service", "percentage", "was", "only", "in", "the", "40", "##s", "." ], "ids": [ 107, 10357, 10134, 10379, 16197, 10114, 58208, 15127, 19430, 108361, 35024, 12373, 15127, 113, 10422, 114, 11989, 46971, 10134, 10893, 10106, 10105, 10533, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Put", "those", "two", "things", "together", "and", "you", "get", "a", "loss", ".", "\"" ], "ids": [ 63730, 12676, 10551, 24682, 14229, 10111, 13028, 15329, 169, 18576, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ra", "##fter", "missed", "10", "weeks", "after", "w", "##rist", "surgery", "earlier", "this", "year", "and", "the", "time", "away", "from", "tennis", "has", "given", "him", "a", "new", "perspective", "." ], "ids": [ 38571, 33163, 55233, 10150, 20750, 10662, 191, 24953, 44811, 18905, 10531, 10924, 10111, 10105, 10635, 14942, 10188, 20944, 10393, 13507, 10957, 169, 10751, 39836, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Before", "when", "I", "was", "on", "tour", ",", "I", "always", "felt", "I", "had", "to", "be", "in", "bed", "by", "9", ":", "30", "or", "10", "o", "'", "clock", "and", "I", "had", "to", "be", "up", "at", "a", "certain", "time", ",", "\"", "Ra", "##fter", "said", ".", "\"" ], "ids": [ 107, 19318, 10841, 146, 10134, 10135, 12842, 117, 146, 19540, 24666, 146, 10374, 10114, 10347, 10106, 30113, 10155, 130, 131, 10244, 10345, 10150, 183, 112, 52843, 10111, 146, 10374, 10114, 10347, 10741, 10160, 169, 16620, 10635, 117, 107, 38571, 33163, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Now", "I", "can", "go", "to", "bed", "at", "at", "mid", "##night", "or", "wake", "up", "at", "seven", "in", "the", "morning", "." ], "ids": [ 17121, 146, 10944, 11783, 10114, 30113, 10160, 10160, 15607, 45217, 10345, 35432, 10741, 10160, 15767, 10106, 10105, 28757, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "just", "do", "n", "'", "t", "have", "as", "many", "set", "routine", "##s", "and", "it", "'", "s", "made", "me", "a", "ha", "##ppi", "##er", "person", ".", "\"" ], "ids": [ 146, 12820, 10149, 182, 112, 188, 10529, 10146, 11299, 11847, 94650, 10107, 10111, 10271, 112, 187, 11019, 10911, 169, 10228, 36651, 10165, 15042, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "was", "pl", "##eas", "##ed", "with", "his", "victory", "over", "Pio", "##line", ",", "his", "first", "in", "five", "meetings", "with", "the", "11th", "-", "ranked", "French", "##man", ".", "\"" ], "ids": [ 11235, 10134, 20648, 42658, 10336, 10169, 10226, 19735, 10491, 42712, 12953, 117, 10226, 10422, 10106, 12403, 47307, 10169, 10105, 34062, 118, 25250, 11894, 10589, 119, 107 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "It", "'", "s", "always", "difficult", "to", "win", "a", "match", "when", "you", "lose", "the", "first", "set", ",", "especially", "against", "someone", "you", "have", "never", "beaten", ",", "\"", "he", "said", "." ], "ids": [ 10377, 112, 187, 19540, 25232, 10114, 14125, 169, 12356, 10841, 13028, 48742, 10105, 10422, 11847, 117, 17491, 11327, 30455, 13028, 10529, 14794, 74075, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "got", "more", "aggressive", "in", "the", "second", "and", "third", "sets", "and", "the", "wind", "picked", "up", "and", "that", "also", "affected", "things", "because", "Cedric", "def", "##inite", "##ly", "went", "off", "a", "little", "bit", ".", "\"" ], "ids": [ 107, 146, 19556, 10798, 75388, 10106, 10105, 11132, 10111, 12628, 23597, 10111, 10105, 31346, 52289, 10741, 10111, 10189, 10379, 36276, 24682, 12373, 107799, 100745, 100240, 10454, 13446, 11898, 169, 16745, 17684, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "26", "-", "year", "-", "old", "O", "'", "Brien", ",", "who", "won", "the", "ATP", "Tour", "stop", "in", "New", "Haven", "last", "week", ",", "has", "now", "won", "18", "of", "his", "last", "20", "matches", ",", "dating", "back", "to", "qualifying", "rounds", "in", "Los", "Angeles", "in", "late", "July", "." ], "ids": [ 10117, 10314, 118, 10924, 118, 12898, 152, 112, 33629, 117, 10479, 11367, 10105, 18316, 11595, 20517, 10106, 10287, 31842, 12469, 16118, 117, 10393, 11858, 11367, 10218, 10108, 10226, 12469, 10197, 18258, 117, 33573, 12014, 10114, 43631, 44759, 10106, 10630, 12233, 10106, 13002, 11112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "He", "ranks", "76", "##th", "after", "being", "285", "##th", "four", "weeks", "ago", "." ], "ids": [ 10357, 52593, 12428, 11143, 10662, 11223, 27485, 11143, 11598, 20750, 36390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "feel", "I", "'", "m", "hitting", "the", "ball", "well", "even", "though", "I", "'", "m", "having", "more", "mental", "let", "##down", "##s", "than", "I", "did", "last", "week", ",", "\"", "O", "'", "Brien", "said", ".", "\"" ], "ids": [ 107, 146, 38008, 146, 112, 181, 88998, 10105, 20724, 11206, 13246, 15102, 146, 112, 181, 13677, 10798, 27993, 13595, 27160, 10107, 11084, 146, 12172, 12469, 16118, 117, 107, 152, 112, 33629, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "But", "I", "'", "m", "still", "competing", "well", ".", "\"" ], "ids": [ 16976, 146, 112, 181, 12647, 48641, 11206, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "got", "a", "lot", "of", "first", "serves", "in", ",", "\"", "said", "En", "##qvist", "about", "his", "victory", "over", "Ko", "##rda", ".", "\"" ], "ids": [ 107, 146, 19556, 169, 19826, 10108, 10422, 24474, 10106, 117, 107, 12415, 10243, 47780, 10978, 10226, 19735, 10491, 30186, 21285, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "I", "did", "n", "'", "t", "miss", "that", "many", "shots", "and", "he", "was", "making", "the", "mis", "##take", "##s", ".", "\"" ], "ids": [ 146, 12172, 182, 112, 188, 88237, 10189, 11299, 74437, 10111, 10261, 10134, 14293, 10105, 12606, 47529, 10107, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Still", "mar", "##vel", "##ling", "at", "an", "ex", "##citing", "64", "-", "stroke", "rally", "he", "won", "in", "the", "last", "game", "of", "his", "second", "-", "round", "match", "against", "Javier", "Sanchez", "of", "Spain", "on", "Tuesday", ",", "En", "##qvist", "jo", "##ked", ",", "\"", "Today", "against", "Petr", "there", "were", "about", "64", "stroke", "##s", "in", "the", "whole", "match", "." ], "ids": [ 27567, 12318, 13128, 11945, 10160, 10151, 11419, 104360, 11295, 118, 57071, 58575, 10261, 11367, 10106, 10105, 12469, 11661, 10108, 10226, 11132, 118, 13569, 12356, 11327, 22856, 66007, 10108, 16149, 10135, 70245, 117, 10243, 47780, 12541, 30511, 117, 107, 17160, 11327, 40986, 11155, 10309, 10978, 11295, 57071, 10107, 10106, 10105, 21047, 12356, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "mostly", "short", "points", ".", "\"" ], "ids": [ 10377, 10134, 19774, 13716, 12789, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "CAN", "##AD", "##IA", "##N", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 98038, 55538, 35976, 11537, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the", "Canadian", "Open" ], "ids": [ 33036, 10188, 10105, 14023, 11919 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 2, 6 ] }, { "tokens": [ "tennis", "tournament", "on", "Thursday", "(", "pre", "##fix", "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 20944, 17390, 10135, 67067, 113, 12229, 57014, 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Third", "round" ], "ids": [ 16788, 13569 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "3", "-", "Wayne", "Ferreira", "(", "South", "Africa", ")", "beat", "Tim", "Hen", "##man", "(", "Britain", ")", "6", "-", "4" ], "ids": [ 124, 118, 18547, 39227, 113, 11056, 12880, 114, 27868, 15318, 86362, 10589, 113, 16032, 114, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "4" ], "ids": [ 127, 118, 125 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "4", "-", "Marcelo", "Rio", "##s", "(", "Chile", ")", "beat", "Daniel", "Va", "##cek", "(", "Czech", "Republic", ")", "6", "-", "4" ], "ids": [ 125, 118, 38165, 12109, 10107, 113, 13218, 114, 27868, 11792, 14723, 37239, 113, 22148, 13681, 114, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "3" ], "ids": [ 127, 118, 124 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "5", "-", "Thomas", "En", "##qvist", "(", "Sweden", ")", "beat", "Petr", "Ko", "##rda", "(", "Czech", "Republic", ")" ], "ids": [ 126, 118, 11096, 10243, 47780, 113, 20937, 114, 27868, 40986, 30186, 21285, 113, 22148, 13681, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 5, 9 ] }, { "tokens": [ "6", "-", "3", "6", "-", "4" ], "ids": [ 127, 118, 124, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Patrick", "Ra", "##fter", "(", "Australia", ")", "beat", "6", "-", "Mali", "##V", "##ai", "Washington", "(", "U", ".", "S", ".", ")" ], "ids": [ 13867, 38571, 33163, 113, 11729, 114, 27868, 127, 118, 24427, 11779, 11542, 11586, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "6", "-", "2", "6", "-", "1" ], "ids": [ 127, 118, 123, 127, 118, 122 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "Todd", "Martin", "(", "U", ".", "S", ".", ")", "beat", "9", "-", "Cedric", "Pio", "##line", "(", "France", ")", "2", "-", "6", "6", "-", "2" ], "ids": [ 128, 118, 24708, 11235, 113, 158, 119, 156, 119, 114, 27868, 130, 118, 107799, 42712, 12953, 113, 10688, 114, 123, 118, 127, 127, 118, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "4" ], "ids": [ 127, 118, 125 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Mark", "Philipp", "##ous", "##sis", "(", "Australia", ")", "beat", "Bo", "##hda", "##n", "U", "##lih", "##rach", "(", "Czech" ], "ids": [ 11997, 23293, 13499, 13109, 113, 11729, 114, 27868, 27622, 109788, 10115, 158, 53614, 36185, 113, 22148 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1 ] }, { "tokens": [ "Republic", ")", "6", "-", "3", "6", "-", "4" ], "ids": [ 13681, 114, 127, 118, 124, 127, 118, 125 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alex", "O", "'", "Brien", "(", "U", ".", "S", ".", ")", "beat", "Mikael", "Till", "##strom", "(", "Sweden", ")", "6", "-", "3", "2", "-", "6" ], "ids": [ 14728, 152, 112, 33629, 113, 158, 119, 156, 119, 114, 27868, 54671, 32259, 83474, 113, 20937, 114, 127, 118, 124, 123, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "3" ], "ids": [ 127, 118, 124 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Todd", "Wood", "##bridge", "(", "Australia", ")", "beat", "Daniel", "Nestor", "(", "Canada", ")", "7", "-", "6" ], "ids": [ 24708, 18315, 29273, 113, 11729, 114, 27868, 11792, 78424, 113, 11635, 114, 128, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "(", "7", "-", "2", ")", "7", "-", "6", "(", "7", "-", "4", ")" ], "ids": [ 113, 128, 118, 123, 114, 128, 118, 127, 113, 128, 118, 125, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "UN", "##ION", "-", "M", "##UL", "##DE", "##R", "O", "##UT", "OF", "SEC", "##ON", "##D", "T", "##ES", "##T", "." ], "ids": [ 155, 12022, 32469, 14703, 26578, 52980, 118, 150, 100673, 60675, 11273, 152, 65729, 23240, 92031, 30118, 11490, 157, 25054, 11090, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "23" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Centre", "Ja", "##pie", "Mulder", "has", "been", "ruled", "out", "of", "South", "Africa", "'", "s", "team", "for", "the", "second", "test", "against", "New", "Zealand", "in", "Pretoria", "on", "Saturday", "." ], "ids": [ 12838, 28248, 19237, 99421, 10393, 10590, 34920, 10950, 10108, 11056, 12880, 112, 187, 11121, 10142, 10105, 11132, 15839, 11327, 10287, 14451, 10106, 45089, 10135, 24848, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Mulder", "missed", "the", "first", "test", "in", "Durban", "with", "back", "sp", "##as", "##ms", "and", "failed", "a", "fitness", "check", "on", "Thursday", "." ], "ids": [ 99421, 55233, 10105, 10422, 15839, 10106, 88758, 10169, 12014, 32650, 10403, 12387, 10111, 20775, 169, 83875, 43662, 10135, 67067, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "new", "Spring", "##bok", "skip", "##per", "Gary", "Te", "##ich", "##mann", "has", "recovered", "from", "a", "br", "##uise", "##d", "thi", "##gh", "and", "is", "ready", "to", "play", ",", "coach", "Andre", "Mark", "##graaf", "##f", "said", "." ], "ids": [ 16976, 10751, 18698, 30980, 52124, 12713, 15516, 21452, 14401, 12350, 10393, 55051, 10188, 169, 33989, 100976, 10162, 24106, 15774, 10111, 10124, 42374, 10114, 12253, 117, 15701, 25188, 11997, 78540, 10575, 12415, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "Mulder", "'", "s", "absence", "means", "that", "Northern", "Transvaal", "centre", "Andre", "S", "##nym", "##an", "should", "win", "his", "second", "cap", "alongside", "provincial", "coll", "##eague", "Dani", "##e", "van", "Sc", "##hal", "##k", "##wy", "##k", "." ], "ids": [ 99421, 112, 187, 28589, 17574, 10189, 15352, 78463, 12672, 25188, 156, 13969, 10206, 14819, 14125, 10226, 11132, 13337, 25117, 24900, 28552, 85352, 65595, 10112, 10145, 55260, 18453, 10174, 12524, 10174, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Wing", "Pieter", "Hendrik", "##s", "is", "expected", "to", "retain", "his", "place", ",", "following", "sp", "##ecu", "##lation", "that", "S", "##nym", "##an", "would", "be", "picked", "out", "of", "position", "on", "the", "wing", "." ], "ids": [ 25613, 32905, 29090, 10107, 10124, 25973, 10114, 76863, 10226, 11192, 117, 11901, 32650, 97038, 19718, 10189, 156, 13969, 10206, 10894, 10347, 52289, 10950, 10108, 12956, 10135, 10105, 22571, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "line", "-", "up", "would", "not", "be", "announced", "until", "shortly", "before", "the", "start", ",", "Mark", "##graaf", "##f", "said", "." ], "ids": [ 10117, 12117, 118, 10741, 10894, 10472, 10347, 13854, 11444, 31555, 11360, 10105, 15148, 117, 11997, 78540, 10575, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "BA", "##DM", "##IN", "##TO", "##N", "-", "MA", "##LA", "##YS", "##IA", "##N", "OP", "##EN", "BA", "##DM", "##IN", "##TO", "##N", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 39999, 94138, 27128, 60493, 11537, 118, 27277, 44376, 93202, 35976, 11537, 55355, 50655, 39999, 94138, 27128, 60493, 11537, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##U", "##AL", "##A", "L", "##UM", "##P", "##UR", "1996", "-", "08", "-", "23" ], "ids": [ 148, 12022, 32002, 10738, 149, 72679, 11127, 98348, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "in", "the", "Malaysian" ], "ids": [ 33036, 10106, 10105, 72413 ], "entity": [ "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 2 ] }, { "tokens": [ "Open", "badminton", "tournament", "on", "Friday", "(", "pre", "##fix", "numbers", "den", "##ote" ], "ids": [ 11919, 109973, 17390, 10135, 30767, 113, 12229, 57014, 20953, 10140, 24831 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "seed", "##ings", ")", ":" ], "ids": [ 49282, 18800, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "quarter", "-", "finals" ], "ids": [ 13026, 112, 187, 20527, 117, 28330, 118, 21758 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "On", "##g", "E", "##we", "Ho", "##ck", "(", "Malaysia", ")", "beat", "5", "/", "8", "-", "Hu", "Z", "##hil", "##an", "(", "China", ")", "15", "-", "2", "15", "-", "10" ], "ids": [ 123, 118, 10576, 10240, 142, 12577, 20220, 11263, 113, 13625, 114, 27868, 126, 120, 129, 118, 43707, 163, 53543, 10206, 113, 11593, 114, 10208, 118, 123, 10208, 118, 10150 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", "/", "16", "-", "Lu", "##o", "Yi", "##gang", "(", "China", ")", "beat", "Jason", "Wong", "(", "Malaysia", ")", "15", "-", "5", "15", "-", "6" ], "ids": [ 130, 120, 10250, 118, 23859, 10133, 40512, 13755, 113, 11593, 114, 27868, 16796, 35572, 113, 13625, 114, 10208, 118, 126, 10208, 118, 127 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "##jaya", "Indra", "(", "Indonesia", ")", "beat", "P", ".", "Kant", "##har", "##oop", "##an", "(", "Malaysia", ")", "15", "-", "6", "5", "-", "4" ], "ids": [ 146, 58471, 102937, 113, 11658, 114, 27868, 153, 119, 45879, 18387, 53005, 10206, 113, 13625, 114, 10208, 118, 127, 126, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", "/", "16", "-", "Chen", "Gang", "(", "China", ")", "beat", "9", "/", "16", "-", "Her", "##ma", "##wan", "Susan", "##to", "(", "Indonesia", ")" ], "ids": [ 130, 120, 10250, 118, 22177, 31192, 113, 11593, 114, 27868, 130, 120, 10250, 118, 13229, 10369, 14394, 14476, 10340, 113, 11658, 114 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "15", "-", "9", "15", "-", "7" ], "ids": [ 10208, 118, 130, 10208, 118, 128 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "IN", "##J", "##UR", "##ED", "CH", "##AN", "##DA", "R", "##UB", "##IN", "O", "##UT", "OF", "U", ".", "S", ".", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 36351, 15417, 98348, 33809, 39774, 41275, 36382, 155, 82439, 27128, 152, 65729, 23240, 158, 119, 156, 119, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "##mising", "10th", "-", "ranked", "American", "Chan", "##da", "Rubin", "has", "pulled", "out", "of", "the", "U", ".", "S", ".", "Open", "Tennis", "Championships", "with", "a", "w", "##rist", "injury", ",", "tournament", "officials", "announced", "." ], "ids": [ 14021, 81654, 31004, 118, 25250, 10536, 27602, 10229, 61045, 10393, 65884, 10950, 10108, 10105, 158, 119, 156, 119, 11919, 27380, 17264, 10169, 169, 191, 24953, 27443, 117, 17390, 27730, 13854, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 4, 8, 8, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "20", "-", "year", "-", "old", "Rubin", ",", "who", "was", "to", "be", "seed", "##ed", "11th", ",", "is", "still", "suffering", "from", "tend", "##ini", "##tis", "of", "the", "right", "w", "##rist", "that", "has", "kept", "her", "side", "##lined", "in", "recent", "months", "." ], "ids": [ 10117, 10197, 118, 10924, 118, 12898, 61045, 117, 10479, 10134, 10114, 10347, 49282, 10336, 34062, 117, 10124, 12647, 49552, 10188, 45415, 11778, 13434, 10108, 10105, 13448, 191, 24953, 10189, 10393, 26546, 10485, 12250, 75066, 10106, 19037, 15555, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rubin", "'", "s", "mis", "##fort", "##une", "turned", "into", "a", "very", "lu", "##cky", "break", "for", "eighth", "-", "seed", "##ed", "Olympic", "champion", "Lindsay", "Davenport", "." ], "ids": [ 61045, 112, 187, 12606, 23044, 19659, 21031, 10708, 169, 12558, 14657, 30742, 24194, 10142, 46758, 118, 49282, 10336, 17952, 17689, 42228, 74533, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 9 ] }, { "tokens": [ "Davenport", "had", "drawn", "one", "of", "the", "tou", "##ghe", "##st", "first", "-", "round", "assignment", "##s", "of", "any", "of", "the", "seed", "##ed", "players", "in", "17th", "-", "ranked", "Karin", "##a", "Ha", "##bs", "##udo", "##va", "of", "Slovakia", "." ], "ids": [ 74533, 10374, 34788, 10464, 10108, 10105, 52586, 61069, 10562, 10422, 118, 13569, 90523, 10107, 10108, 11178, 10108, 10105, 49282, 10336, 16021, 10106, 32331, 118, 25250, 41633, 10113, 13740, 19528, 33498, 10362, 10108, 43031, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "But", "as", "the", "highest", "-", "ranked", "non", "-", "seed", "##ed", "player", "in", "the", "tournament", ",", "Ha", "##bs", "##udo", "##va", "will", "be", "moved", "into", "Rubin", "'", "s", "slot", "in", "the", "draw", ",", "while", "Davenport", "will", "now", "get", "a", "qualifier", "in", "the", "first", "round", ",", "according", "to", "U", ".", "S", ".", "Tennis", "Association", "officials", "." ], "ids": [ 16976, 10146, 10105, 18134, 118, 25250, 10446, 118, 49282, 10336, 12928, 10106, 10105, 17390, 117, 13740, 19528, 33498, 10362, 11337, 10347, 13059, 10708, 61045, 112, 187, 52617, 10106, 10105, 25974, 117, 11371, 74533, 11337, 11858, 15329, 169, 96076, 10106, 10105, 10422, 13569, 117, 18071, 10114, 158, 119, 156, 119, 27380, 11751, 27730, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9 ] }, { "tokens": [ "Rubin", "is", "the", "third", "notable", "withdrawal", "from", "the", "women", "'", "s", "competition", "after", "12th", "-", "ranked", "former", "Australian", "Open", "champion", "Mary", "Pierce", "and", "20th", "-", "ranked", "Wimbledon", "semifinali", "##st", "Meredith", "M", "##c", "##G", "##rath", "pulled", "out", "earlier", "this", "week", "with", "injuries", "." ], "ids": [ 61045, 10124, 10105, 12628, 19011, 94192, 10188, 10105, 13190, 112, 187, 16622, 10662, 34505, 118, 25250, 11775, 12829, 11919, 17689, 12176, 38581, 10111, 18604, 118, 25250, 37932, 71380, 10562, 61870, 150, 10350, 11447, 42724, 65884, 10950, 18905, 10531, 16118, 10169, 49718, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 4, 8, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "Australian", "Open", "champion", "Boris", "Becker", "will", "also", "miss", "the", "year", "'", "s", "final", "Grand", "Slam", "with", "a", "w", "##rist", "injury", "." ], "ids": [ 13026, 112, 187, 12829, 11919, 17689, 21463, 27534, 11337, 10379, 88237, 10105, 10924, 112, 187, 11070, 11319, 33445, 10169, 169, 191, 24953, 27443, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "AF", "##TER", "T", "##H", "##UR", "##SD", "##A", "##Y", "'", "S", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 55640, 99552, 157, 12396, 98348, 83452, 10738, 14703, 112, 156, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "League", "Baseball" ], "ids": [ 14988, 11074, 27084 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "standing", "##s", "after", "games", "played", "on", "Thursday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 32173, 10107, 10662, 13332, 11553, 10135, 67067, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "winning", "percentage", "and", "games", "behind", ")", ":" ], "ids": [ 14172, 117, 16542, 46971, 10111, 13332, 17155, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ER", "##IC", "##AN", "LE", "##AG", "##UE" ], "ids": [ 24339, 24093, 30889, 41275, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "72", "54", ".", "571", "-" ], "ids": [ 86607, 13034, 162, 42622, 11733, 12120, 11653, 119, 49567, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "67", "59", ".", "532", "5" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 12316, 11867, 119, 50446, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "64", "64", ".", "500", "9" ], "ids": [ 139, 21793, 60493, 11537, 11295, 11295, 119, 10757, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "59", "69", ".", "461", "14" ], "ids": [ 58573, 35066, 77261, 11403, 11867, 12573, 119, 45705, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "45", "82", ".", "354", "27", "1", "/", "2" ], "ids": [ 25067, 11090, 35066, 37611, 10827, 12180, 119, 33540, 10365, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "76", "51", ".", "598", "-" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 12428, 11524, 119, 59066, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "69", "60", ".", "535", "8" ], "ids": [ 39774, 30889, 109865, 11403, 12573, 10709, 119, 45269, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "63", "64", ".", "496", "13" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 12256, 11295, 119, 42498, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "60", "68", ".", "469", "16", "1", "/", "2" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 10709, 12370, 119, 39731, 10250, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "58", "71", ".", "450", "19" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 11824, 12513, 119, 16718, 10270 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "74", "54", ".", "578", "-" ], "ids": [ 157, 11259, 12674, 38025, 12535, 11653, 119, 58203, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "65", "61", ".", "516", "8" ], "ids": [ 23056, 32071, 11090, 51036, 10843, 12314, 119, 50521, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "62", "68", ".", "477", "13" ], "ids": [ 152, 10738, 11733, 44376, 58521, 12066, 12370, 119, 46621, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "59", "68", ".", "465", "14", "1", "/", "2" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 11867, 12370, 119, 36307, 10247, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##ID", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "23", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 64655, 28895, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10328, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "AT", "B", "##OS", "##TO", "##N" ], "ids": [ 23056, 32071, 11090, 51036, 30554, 139, 21793, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "AT", "CL", "##E", "##VE", "##LA", "##ND" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 30554, 75151, 11259, 68560, 44376, 58521 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "AT", "BA", "##L", "##TI", "##M", "##OR", "##E" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 30554, 39999, 11369, 72286, 11517, 42622, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "AT", "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 152, 10738, 11733, 44376, 58521, 30554, 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "AT", "CH", "##IC", "##AG", "##O" ], "ids": [ 58573, 35066, 77261, 11403, 30554, 39774, 30889, 109865, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "AT", "KA", "##NS", "##AS", "C", "##IT", "##Y" ], "ids": [ 25067, 11090, 35066, 37611, 30554, 85314, 69196, 38025, 140, 37611, 14703 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "AT", "MI", "##N", "##NE", "##S", "##OT", "##A" ], "ids": [ 157, 11259, 12674, 38025, 30554, 75416, 11537, 93280, 10731, 62146, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "NA", "##TION", "##AL", "LE", "##AG", "##UE" ], "ids": [ 56586, 98207, 32002, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "79", "47", ".", "627", "-" ], "ids": [ 30554, 44376, 77261, 10738, 12791, 11413, 119, 56948, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "68", "58", ".", "540", "11" ], "ids": [ 102059, 77261, 66014, 32002, 12370, 11824, 119, 23809, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "59", "69", ".", "461", "21" ], "ids": [ 86607, 13034, 162, 42622, 11733, 11867, 12573, 119, 45705, 10296 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "58", "69", ".", "457", "21", "1", "/", "2" ], "ids": [ 83243, 42622, 28895, 10738, 11824, 12573, 119, 42950, 10296, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "52", "76", ".", "406", "28" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 11525, 12428, 119, 28081, 10348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "68", "60", ".", "531", "-" ], "ids": [ 145, 11403, 32612, 60493, 11537, 12370, 10709, 119, 49041, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "67", "60", ".", "528", "1", "/", "2" ], "ids": [ 53317, 149, 11403, 83259, 10731, 12316, 10709, 119, 36711, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "63", "62", ".", "504", "3", "1", "/", "2" ], "ids": [ 39774, 30889, 109865, 11403, 12256, 12066, 119, 43098, 124, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "63", "62", ".", "504", "3", "1", "/", "2" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 12256, 12066, 119, 43098, 124, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "54", "73", ".", "425", "13", "1", "/", "2" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 11653, 12545, 119, 33437, 10249, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "70", "59", ".", "543", "-" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 10923, 11867, 119, 50268, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "67", "60", ".", "528", "2" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 12316, 10709, 119, 36711, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "66", "62", ".", "516", "3", "1", "/", "2" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 12215, 12066, 119, 50521, 124, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "54", "71", ".", "432", "14" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 11653, 12513, 119, 36173, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##ID", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "23", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 64655, 28895, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10328, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "AT", "FL", "##OR", "##ID", "##A", "(", "double", "##head", "##er", ")" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 30554, 83243, 42622, 28895, 10738, 113, 15790, 20391, 10165, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "AT", "AT", "##LA", "##NT", "##A" ], "ids": [ 39774, 30889, 109865, 11403, 30554, 30554, 44376, 77261, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "AT", "H", "##O", "##US", "##TO", "##N" ], "ids": [ 53317, 149, 11403, 83259, 10731, 30554, 145, 11403, 32612, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "AT", "CO", "##L", "##OR", "##AD", "##O" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 30554, 32992, 11369, 42622, 55538, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "AT", "L", "##OS", "AN", "##GE", "##LE", "##S" ], "ids": [ 86607, 13034, 162, 42622, 11733, 30554, 149, 21793, 50972, 58719, 51036, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "AT", "SA", "##N", "DI", "##EG", "##O" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 30554, 21318, 11537, 110014, 104036, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "AT", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O" ], "ids": [ 102059, 77261, 66014, 32002, 30554, 21318, 11537, 64655, 41275, 89955, 36175, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "T", "##H", "##UR", "##SD", "##A", "##Y", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 157, 12396, 98348, 83452, 10738, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Major", "League" ], "ids": [ 33036, 10108, 14988, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "Baseball", "games", "played", "on", "Thursday", "(", "home", "team", "in", "CA", "##PS", ")", ":" ], "ids": [ 27084, 13332, 11553, 10135, 67067, 113, 11816, 11121, 10106, 24707, 46983, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "League" ], "ids": [ 10536, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "2", "Oakland", "1" ], "ids": [ 139, 21793, 60493, 11537, 123, 38340, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Seattle", "10", "BA", "##L", "##TI", "##M", "##OR", "##E", "3" ], "ids": [ 20902, 10150, 39999, 11369, 72286, 11517, 42622, 11259, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "California", "12", "NE", "##W", "Y", "##OR", "##K", "3" ], "ids": [ 11621, 10186, 86607, 13034, 162, 42622, 11733, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Toronto", "1", "CH", "##IC", "##AG", "##O", "0", "(", "in", "6", "1", "/", "2", ")" ], "ids": [ 15256, 122, 39774, 30889, 109865, 11403, 121, 113, 10106, 127, 122, 120, 123, 114 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Detroit", "10", "KA", "##NS", "##AS", "C", "##IT", "##Y", "3" ], "ids": [ 19727, 10150, 85314, 69196, 38025, 140, 37611, 14703, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Texas", "11", "MI", "##N", "##NE", "##S", "##OT", "##A", "2" ], "ids": [ 12466, 10193, 75416, 11537, 93280, 10731, 62146, 10738, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "National", "League" ], "ids": [ 10655, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "10", "St", "Louis", "5" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 10150, 10838, 11334, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Cincinnati", "3", "AT", "##LA", "##NT", "##A", "2", "(", "in", "13", ")" ], "ids": [ 31257, 124, 30554, 44376, 77261, 10738, 123, 113, 10106, 10249, 114 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pittsburgh", "8", "H", "##O", "##US", "##TO", "##N", "6" ], "ids": [ 23812, 129, 145, 11403, 32612, 60493, 11537, 127 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "8", "Philadelphia", "5" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 129, 15979, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Montreal", "5", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "4" ], "ids": [ 20990, 126, 21318, 11537, 64655, 41275, 89955, 36175, 11403, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "SO", "##R", "##RE", "##NT", "##O", "H", "##IT", "##S", "SL", "##AM", "AS", "SE", "##AT", "##T", "##LE", "R", "##O", "##UT", "##S", "OR", "##IO", "##LE", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 71020, 11273, 66014, 77261, 11403, 145, 37611, 10731, 52671, 36535, 17421, 23056, 32071, 11090, 51036, 155, 11403, 65729, 10731, 69308, 37174, 51036, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "1996", "-", "08", "-", "22" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "Or", "##iol", "##e", "Jamie", "Mo", "##yer", "allowed", "two", "hits", "over", "eight", "score", "##less", "innings", "before", "tir", "##ing", "in", "the", "ninth", "and", "Paul", "So", "##rren", "##to", "added", "his", "third", "grand", "sl", "##am", "of", "the", "season", "as", "the", "Seattle", "Marine", "##rs", "route", "##d", "Baltimore", "10", "-", "3", "Thursday", "." ], "ids": [ 42355, 19372, 35493, 10112, 27504, 34987, 17750, 18162, 10551, 27922, 10491, 16222, 17704, 14985, 48974, 11360, 46756, 10230, 10106, 10105, 54905, 10111, 10772, 12882, 46111, 10340, 16288, 10226, 12628, 13023, 38523, 11008, 10108, 10105, 11226, 10146, 10105, 20902, 12425, 10943, 13933, 10162, 21413, 10150, 118, 124, 67067, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mo", "##yer", "(", "10", "-", "2", ")", ",", "who", "was", "tag", "##ged", "for", "a", "pair", "of", "home", "##rs", "by", "Mike", "Dev", "##erea", "##ux", "and", "Brady", "Anderson", "and", "three", "runs", "in", "the", "ninth", ",", "walk", "##ed", "none", "and", "struck", "out", "two", "." ], "ids": [ 34987, 17750, 113, 10150, 118, 123, 114, 117, 10479, 10134, 37836, 18832, 10142, 169, 27643, 10108, 11816, 10943, 10155, 13270, 89586, 54386, 11855, 10111, 45982, 15007, 10111, 11003, 17913, 10106, 10105, 54905, 117, 33734, 10336, 46638, 10111, 45622, 10950, 10551, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Norm", "Charlton", "retired", "the", "final", "three", "bat", "##ters", "to", "seal", "the", "victory", "." ], "ids": [ 89914, 68730, 18675, 10105, 11070, 11003, 11519, 21891, 10114, 37985, 10105, 19735, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "one", "out", "in", "the", "fifth", "Ken", "G", "##riff", "##ey", "Jr", "and", "Edgar", "Martinez", "stroke", "##d", "back", "-", "to", "-", "back", "singles", "off", "Or", "##iol", "##es", "starter", "Rocky", "Cop", "##ping", "##er", "(", "7", "-", "5", ")", "and", "Jay", "Bu", "##hner", "walk", "##ed", "." ], "ids": [ 12613, 10464, 10950, 10106, 10105, 22237, 19355, 144, 40738, 13005, 12966, 10111, 21002, 50203, 57071, 10162, 12014, 118, 10114, 118, 12014, 20527, 11898, 19372, 35493, 10171, 59099, 31015, 94160, 15398, 10165, 113, 128, 118, 126, 114, 10111, 18559, 11916, 45930, 33734, 10336, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "So", "##rren", "##to", "followed", "by", "hitting", "a", "1", "-", "2", "pitch", "just", "over", "the", "right", "-", "field", "wall", "for", "a", "7", "-", "0", "advantage", "." ], "ids": [ 12882, 46111, 10340, 15689, 10155, 88998, 169, 122, 118, 123, 50892, 12820, 10491, 10105, 13448, 118, 13939, 26699, 10142, 169, 128, 118, 121, 38119, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Right", "field", "##er", "Bobby", "Bon", "##illa", "was", "after", "the", "ball", ",", "which", "was", "touch", "##ed", "by", "fans", "at", "the", "top", "of", "the", "score", "##board", "in", "right", "." ], "ids": [ 23488, 13939, 10165, 19371, 30120, 14250, 10134, 10662, 10105, 20724, 117, 10319, 10134, 54981, 10336, 10155, 20950, 10160, 10105, 12364, 10108, 10105, 17704, 25690, 10106, 13448, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Things", "fell", "in", "for", "us", ",", "\"", "said", "So", "##rren", "##to", ",", "who", "has", "six", "career", "grand", "sl", "##ams", "and", "hit", "the", "ninth", "of", "the", "season", "for", "the", "Marine", "##rs", "." ], "ids": [ 107, 28969, 25194, 10106, 10142, 19626, 117, 107, 12415, 12882, 46111, 10340, 117, 10479, 10393, 12449, 13021, 13023, 38523, 35224, 10111, 14946, 10105, 54905, 10108, 10105, 11226, 10142, 10105, 12425, 10943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "\"", "We", "have", "over", "a", "month", "left", "." ], "ids": [ 107, 12865, 10529, 10491, 169, 14064, 12153, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "ve", "got", "to", "make", "up", "some", "ground", ".", "\"" ], "ids": [ 12865, 112, 10323, 19556, 10114, 13086, 10741, 11152, 16912, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "American", "League", "wild", "-", "card", "race", ",", "the", "Marine", "##rs", "are", "three", "games", "behind", "the", "White", "Sox", ",", "two", "behind", "Baltimore", "and", "two", "ahead", "of", "the", "Red", "Sox", "heading", "into", "Boston", "for", "a", "weekend", "series", "." ], "ids": [ 10167, 10105, 10536, 11074, 32290, 118, 23050, 14025, 117, 10105, 12425, 10943, 10301, 11003, 13332, 17155, 10105, 12136, 55687, 117, 10551, 17155, 21413, 10111, 10551, 35629, 10108, 10105, 11641, 55687, 82839, 10708, 13683, 10142, 169, 43440, 11366, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 3, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mo", "##yer", "retired", "11", "straight", "bat", "##ters", "between", "the", "third", "and", "seventh", "innings", "and", "threw", "two", "or", "fewer", "pitch", "##es", "to", "11", "of", "the", "29", "bat", "##ters", "he", "faced", "." ], "ids": [ 34987, 17750, 18675, 10193, 31214, 11519, 21891, 10948, 10105, 12628, 10111, 37192, 48974, 10111, 80516, 10551, 10345, 74139, 50892, 10171, 10114, 10193, 10108, 10105, 10386, 11519, 21891, 10261, 31952, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "made", "some", "bad", "pitch", "##es", "at", "the", "end", "but", "I", "'", "m", "not", "going", "to", "d", "##well", "on", "it", "." ], "ids": [ 107, 146, 11019, 11152, 15838, 50892, 10171, 10160, 10105, 11572, 10473, 146, 112, 181, 10472, 19090, 10114, 172, 15862, 10135, 10271, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "won", "the", "game", ",", "\"", "said", "Mo", "##yer", "." ], "ids": [ 12865, 11367, 10105, 11661, 117, 107, 12415, 34987, 17750, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Cop", "##ping", "##er", "(", "7", "-", "5", ")", "was", "tag", "##ged", "for", "eight", "runs", "and", "10", "hits", "in", "4", "1", "/", "3", "innings", "." ], "ids": [ 94160, 15398, 10165, 113, 128, 118, 126, 114, 10134, 37836, 18832, 10142, 16222, 17913, 10111, 10150, 27922, 10106, 125, 122, 120, 124, 48974, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Or", "##iol", "##es", "manager", "Dave", "##y", "Johnson", "missed", "the", "game", "after", "being", "admitted", "to", "a", "hospital", "with", "an", "irregular", "heart", "##beat", "." ], "ids": [ 19372, 35493, 10171, 16935, 16073, 10157, 13241, 55233, 10105, 11661, 10662, 11223, 40345, 10114, 169, 18141, 10169, 10151, 55143, 21736, 68939, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ben", "##ch", "coach", "Andy", "Et", "##che", "##bar", "##ren", "took", "his", "place", "." ], "ids": [ 13304, 10269, 15701, 16802, 16232, 11119, 12867, 10969, 12149, 10226, 11192, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Boston", ",", "Troy", "O", "'", "Leary", "home", "##red", "off", "the", "right", "-", "field", "fou", "##l", "pole", "with", "one", "out", "in", "the", "bottom", "of", "the", "ninth", "and", "the", "Red", "Sox", "climb", "##ed", "to", "the", ".", "500", "mark", "for", "the", "first", "time", "this", "season", "with", "their", "fourth", "straight", "victory", ",", "2", "-", "1", "over", "the", "Oakland", "Athletics", "." ], "ids": [ 10167, 13683, 117, 40777, 152, 112, 110601, 11816, 15711, 11898, 10105, 13448, 118, 13939, 12688, 10161, 21326, 10169, 10464, 10950, 10106, 10105, 34787, 10108, 10105, 54905, 10111, 10105, 11641, 55687, 93274, 10336, 10114, 10105, 119, 10757, 29221, 10142, 10105, 10422, 10635, 10531, 11226, 10169, 10455, 16918, 31214, 19735, 117, 123, 118, 122, 10491, 10105, 38340, 46800, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Boston", "has", "won", "15", "of", "its", "last", "19", "games", "." ], "ids": [ 13683, 10393, 11367, 10208, 10108, 10474, 12469, 10270, 13332, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Boston", "'", "s", "Roger", "Clemens", "(", "7", "-", "11", ")", "was", "one", "out", "away", "from", "his", "second", "straight", "shut", "##out", "when", "pin", "##ch", "-", "hit", "##ter", "Matt", "St", "##air", "##s", "triple", "##d", "over", "the", "head", "of", "centre", "field", "##er", "Lee", "Tin", "##sley", "on", "an", "0", "-", "2", "pitch", "and", "pin", "##ch", "-", "hit", "##ter", "Terry", "Stein", "##bach", "dun", "##ked", "a", "broken", "-", "bat", "single", "into", "right", "to", "lift", "Oakland", "into", "a", "1", "-", "1", "tie", "." ], "ids": [ 13683, 112, 187, 13513, 46518, 113, 128, 118, 10193, 114, 10134, 10464, 10950, 14942, 10188, 10226, 11132, 31214, 70323, 17514, 10841, 59227, 10269, 118, 14946, 10877, 16975, 10838, 20039, 10107, 40159, 10162, 10491, 10105, 13578, 10108, 12672, 13939, 10165, 12006, 48800, 28428, 10135, 10151, 121, 118, 123, 50892, 10111, 59227, 10269, 118, 14946, 10877, 19902, 23365, 14135, 23145, 30511, 169, 36197, 118, 11519, 11376, 10708, 13448, 10114, 63376, 38340, 10708, 169, 122, 118, 122, 27916, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "run", "broke", "Clemens", "'", "28", "-", "inning", "shut", "##out", "streak", ",", "longest", "in", "the", "majors", "this", "season", "." ], "ids": [ 10117, 14095, 30500, 46518, 112, 10348, 118, 110505, 70323, 17514, 88302, 117, 48344, 10106, 10105, 86611, 10531, 11226, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "pitched", "his", "fourth", "complete", "game", ",", "allowing", "eight", "hits", "with", "two", "walks", "and", "11", "strike", "##outs", "." ], "ids": [ 10357, 80525, 10226, 16918, 17876, 11661, 117, 28357, 16222, 27922, 10169, 10551, 106216, 10111, 10193, 37456, 72199, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Re", "##lie", "##ver", "Mark", "Acre", "(", "0", "-", "1", ")", "took", "the", "loss", "." ], "ids": [ 20304, 17656, 12563, 11997, 86200, 113, 121, 118, 122, 114, 12149, 10105, 18576, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "New", "York", ",", "Ga", "##rre", "##t", "Anderson", "and", "Gary", "Di", "##S", "##ar", "##cina", "drove", "in", "two", "runs", "apie", "##ce", "in", "a", "five", "-", "run", "first", "inning", "and", "Jim", "Edmond", "##s", "high", "##lighted", "a", "six", "-", "run", "sixth", "with", "a", "bases", "-", "loaded", "double", "as", "the", "California", "Angels", "coast", "##ed", "to", "a", "12", "-", "3", "victory", "over", "the", "Yankees", "in", "the", "rubber", "game", "of", "their", "three", "-", "game", "series", "." ], "ids": [ 10167, 10287, 10482, 117, 69699, 19243, 10123, 15007, 10111, 15516, 12944, 10731, 10354, 22849, 72256, 10106, 10551, 17913, 20456, 10419, 10106, 169, 12403, 118, 14095, 10422, 110505, 10111, 14178, 38264, 10107, 11846, 108892, 169, 12449, 118, 14095, 28913, 10169, 169, 23213, 118, 103927, 15790, 10146, 10105, 11621, 28132, 22216, 10336, 10114, 169, 10186, 118, 124, 19735, 10491, 10105, 60799, 10106, 10105, 92724, 11661, 10108, 10455, 11003, 118, 11661, 11366, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Angels", "bat", "##tere", "##d", "Kenny", "Rogers", "(", "10", "-", "7", ")", "for", "five", "runs", "in", "the", "first", "." ], "ids": [ 10117, 28132, 11519, 45417, 10162, 30002, 23416, 113, 10150, 118, 128, 114, 10142, 12403, 17913, 10106, 10105, 10422, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Yankees", "have", "allowed", "at", "least", "two", "runs", "in", "the", "first", "inning", "in", "six", "straight", "games", ",", "getting", "out", "##sco", "##red", "21", "-", "1", "in", "the", "first", "inning", "in", "that", "span", "." ], "ids": [ 10117, 60799, 10529, 18162, 10160, 16298, 10551, 17913, 10106, 10105, 10422, 110505, 10106, 12449, 31214, 13332, 117, 34875, 10950, 22402, 15711, 10296, 118, 122, 10106, 10105, 10422, 110505, 10106, 10189, 51551, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chuck", "Fin", "##ley", "(", "12", "-", "12", ")", "sna", "##pped", "a", "four", "-", "game", "losing", "streak", "." ], "ids": [ 26865, 39982, 12105, 113, 10186, 118, 10186, 114, 62541, 44357, 169, 11598, 118, 11661, 27817, 88302, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Kansas", "City", ",", "Travis", "Fry", "##man", "double", "##d", "in", "the", "go", "-", "ahead", "run", "in", "the", "fifth", "and", "Melvin", "Nie", "##ves", "and", "Dam", "##ion", "Ea", "##sley", "belt", "##ed", "two", "-", "run", "home", "##rs", "as", "the", "Detroit", "Tigers", "claimed", "a", "10", "-", "3", "win", "over", "the", "Royals", ",", "hand", "##ing", "them", "their", "fifth", "straight", "loss", "." ], "ids": [ 10167, 16735, 10773, 117, 43346, 72694, 10589, 15790, 10162, 10106, 10105, 11783, 118, 35629, 14095, 10106, 10105, 22237, 10111, 88686, 25879, 13136, 10111, 20993, 11046, 47132, 28428, 62705, 10336, 10551, 118, 14095, 11816, 10943, 10146, 10105, 19727, 38640, 20737, 169, 10150, 118, 124, 14125, 10491, 10105, 97906, 117, 15230, 10230, 11345, 10455, 22237, 31214, 18576, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Tigers", "won", "their", "third", "straight", "and", "halt", "##ed", "a", "seven", "-", "game", "road", "losing", "streak", "behind", "Justin", "Thompson", "(", "1", "-", "2", ")", ",", "who", "earned", "his", "first", "major", "-", "league", "win", "." ], "ids": [ 10117, 38640, 11367, 10455, 12628, 31214, 10111, 59334, 10336, 169, 15767, 118, 11661, 15485, 27817, 88302, 17155, 21823, 13288, 113, 122, 118, 123, 114, 117, 10479, 21293, 10226, 10422, 11922, 118, 15616, 14125, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tim", "Bel", "##cher", "(", "12", "-", "8", ")", "was", "tag", "##ged", "for", "six", "runs", "and", "nine", "hits", "in", "eight", "innings", "." ], "ids": [ 15318, 47197, 13396, 113, 10186, 118, 129, 114, 10134, 37836, 18832, 10142, 12449, 17913, 10111, 19964, 27922, 10106, 16222, 48974, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Minnesota", ",", "Ken", "Hill", "allowed", "two", "runs", "en", "route", "to", "his", "sixth", "complete", "game", "of", "the", "season", "and", "Rus", "##ty", "G", "##reer", "added", "three", "hits", ",", "including", "a", "home", "##r", ",", "and", "two", "RB", "##I", "as", "the", "red", "-", "hot", "Texas", "Rangers", "route", "##d", "the", "Twins", "11", "-", "2", "." ], "ids": [ 11699, 16306, 117, 19355, 12289, 18162, 10551, 17913, 10110, 13933, 10114, 10226, 28913, 17876, 11661, 10108, 10105, 11226, 10111, 30796, 11195, 144, 92637, 16288, 11003, 27922, 117, 11198, 169, 11816, 10129, 117, 10111, 10551, 71201, 11281, 10146, 10105, 10680, 118, 29698, 12466, 23042, 13933, 10162, 10105, 68084, 10193, 118, 123, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Rangers", ",", "who", "won", "for", "the", "11th", "time", "in", "their", "last", "13", "games", ",", "have", "scored", "45", "runs", "in", "their", "last", "five", "contest", "##s", "." ], "ids": [ 10117, 23042, 117, 10479, 11367, 10142, 10105, 34062, 10635, 10106, 10455, 12469, 10249, 13332, 117, 10529, 17233, 10827, 17913, 10106, 10455, 12469, 12403, 37596, 10107, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hill", "(", "14", "-", "7", ")", "allowed", "10", "hits", "." ], "ids": [ 12289, 113, 10247, 118, 128, 114, 18162, 10150, 27922, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "has", "yield", "##ed", "just", "seven", "runs", "in", "his", "last", "four", "starts", ",", "covering", "33", "1", "/", "3", "innings", "." ], "ids": [ 10357, 10393, 95757, 10336, 12820, 15767, 17913, 10106, 10226, 12469, 11598, 33039, 117, 41810, 11000, 122, 120, 124, 48974, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Chicago", ",", "Erik", "Hanson", "out", "##due", "##led", "Alex", "Fernandez", ",", "and", "Jacob", "Br", "##um", "##field", "drove", "in", "Otis", "Nixon", "with", "the", "game", "'", "s", "only", "run", "in", "the", "sixth", "inning", "as", "the", "Toronto", "Blue", "Jay", "##s", "bl", "##anke", "##d", "the", "White", "Sox", "1", "-", "0", "in", "a", "game", "short", "##ened", "to", "six", "innings", "due", "to", "rain", "." ], "ids": [ 10167, 12317, 117, 16925, 72334, 10950, 93955, 16376, 14728, 71566, 117, 10111, 16493, 38508, 10465, 13408, 72256, 10106, 71227, 36507, 10169, 10105, 11661, 112, 187, 10893, 14095, 10106, 10105, 28913, 110505, 10146, 10105, 15256, 12972, 18559, 10107, 21484, 62428, 10162, 10105, 12136, 55687, 122, 118, 121, 10106, 169, 11661, 13716, 27867, 10114, 12449, 48974, 10850, 10114, 50939, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Toronto", "won", "its", "fifth", "straight", "and", "handed", "the", "White", "Sox", "their", "seventh", "loss", "in", "nine", "games", "." ], "ids": [ 15256, 11367, 10474, 22237, 31214, 10111, 44040, 10105, 12136, 55687, 10455, 37192, 18576, 10106, 19964, 13332, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hanson", "(", "11", "-", "15", ")", "allowed", "three", "hits", ",", "walk", "##ed", "three", "and", "struck", "out", "four", "to", "sna", "##p", "a", "personal", "three", "-", "game", "losing", "streak", "." ], "ids": [ 72334, 113, 10193, 118, 10208, 114, 18162, 11003, 27922, 117, 33734, 10336, 11003, 10111, 45622, 10950, 11598, 10114, 62541, 10410, 169, 14927, 11003, 118, 11661, 27817, 88302, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fernandez", "(", "12", "-", "8", ")", "scattered", "six", "hits", "." ], "ids": [ 71566, 113, 10186, 118, 129, 114, 95335, 12449, 27922, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SP", "##OR", "##TI", "##NG", "STAR", "##T", "NE", "##W", "SE", "##AS", "##ON", "W", "##IT", "##H", "A", "W", "##IN", "." ], "ids": [ 71020, 65622, 24093, 118, 22570, 42622, 72286, 34065, 103737, 11090, 86607, 13034, 23056, 38025, 30118, 160, 37611, 12396, 138, 160, 27128, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##B", "##ON", "1996", "-", "08", "-", "23" ], "ids": [ 149, 19088, 11274, 30118, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sporting", "'", "s", "Luis", "Miguel", "Pred", "##rosa", "scored", "the", "first", "goal", "of", "the", "new", "league", "season", "as", "the", "Lisbon", "side", "cruise", "##d", "to", "a", "3", "-", "1", "away", "win", "over", "SC", "Es", "##pin", "##ho", "on", "Friday", "." ], "ids": [ 31063, 112, 187, 12816, 13905, 90138, 66370, 17233, 10105, 10422, 16586, 10108, 10105, 10751, 15616, 11226, 10146, 10105, 63290, 12250, 101148, 10162, 10114, 169, 124, 118, 122, 14942, 14125, 10491, 18137, 10912, 17298, 10758, 10135, 30767, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Pred", "##rosa", "dr", "##ille", "##d", "a", "right", "-", "foot", "shot", "into", "the", "back", "of", "the", "net", "after", "24", "minutes", "to", "set", "Sporting", "on", "the", "way", "to", "victory", "." ], "ids": [ 90138, 66370, 17094, 14420, 10162, 169, 13448, 118, 24963, 19508, 10708, 10105, 12014, 10108, 10105, 11988, 10662, 10233, 15304, 10114, 11847, 31063, 10135, 10105, 13170, 10114, 19735, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Although", "Es", "##pin", "##ho", "'", "s", "Na", "##il", "Be", "##sir", "##ovi", "##c", "put", "the", "home", "side", "back", "on", "terms", "in", "the", "35", "##th", "minute", ",", "Sporting", "quickly", "restored", "their", "lead", "." ], "ids": [ 15785, 10912, 17298, 10758, 112, 187, 10685, 11030, 14321, 32749, 16653, 10350, 14499, 10105, 11816, 12250, 12014, 10135, 18873, 10106, 10105, 10803, 11143, 21760, 117, 31063, 23590, 39256, 10455, 14107, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jose", "Luis", "Vid", "##iga", "##l", "scored", "in", "the", "38", "##th", "minute", "and", "Must", "##ap", "##ha", "Had", "##ji", "added", "the", "third", "in", "the", "57", "##th", "." ], "ids": [ 23029, 12816, 28411, 15342, 10161, 17233, 10106, 10105, 11171, 11143, 21760, 10111, 54690, 16070, 10921, 66434, 10775, 16288, 10105, 12628, 10106, 10105, 11817, 11143, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "game", "was", "brought", "forward", "from", "Sunday", "when", "reign", "##ing", "champions", "Porto", "and", "Lisbon", "rivals", "Benfica", "play", "their", "first", "games", "of", "the", "season", "." ], "ids": [ 10117, 11661, 10134, 17327, 23307, 10188, 19731, 10841, 38587, 10230, 27745, 16408, 10111, 63290, 71908, 57679, 12253, 10455, 10422, 13332, 10108, 10105, 11226, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 3, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "P", "##OR", "##T", "##U", "##G", "##UE", "##SE", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##T", "." ], "ids": [ 71020, 65622, 24093, 118, 153, 42622, 11090, 12022, 11447, 62674, 39039, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##B", "##ON", "1996", "-", "08", "-", "23" ], "ids": [ 149, 19088, 11274, 30118, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "Portuguese", "first" ], "ids": [ 32070, 16203, 10108, 169, 25550, 10422 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "match", "on", "Friday", ":" ], "ids": [ 13751, 41356, 12356, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Es", "##pin", "##ho", "1", "Sporting", "3" ], "ids": [ 10912, 17298, 10758, 122, 31063, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "ST", "PA", "##UL", "##I", "TA", "##K", "##E", "P", "##O", "##IN", "##T", "W", "##IT", "##H", "LA", "##TE", "F", "##IG", "##HT", "##BA", "##C", "##K", "." ], "ids": [ 71020, 65622, 24093, 118, 53317, 32349, 100673, 11281, 91075, 11733, 11259, 153, 11403, 27128, 11090, 160, 37611, 12396, 29079, 29833, 143, 89696, 81012, 35999, 10858, 11733, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hamburg", "side", "St", "Pauli", ",", "tip", "##ped", "as", "prime", "candidates", "for", "relegation", ",", "produced", "a", "st", "##unn", "##ing", "second", "-", "half", "fight", "##back", "to", "draw", "4", "-", "4", "in", "their", "Bundesliga", "c", "##lash", "with", "Schalke", "on", "Friday", "." ], "ids": [ 15021, 12250, 10838, 54583, 117, 25119, 16898, 10146, 19287, 33439, 10142, 81204, 117, 13433, 169, 28780, 104939, 10230, 11132, 118, 13877, 20780, 18666, 10114, 25974, 125, 118, 125, 10106, 10455, 21436, 171, 25297, 10169, 87909, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 1, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "Schalke", ",", "who", "finished", "third", "last", "season", ",", "race", "##d", "to", "a", "3", "-", "1", "lead", "at", "half", "##time", "." ], "ids": [ 87909, 117, 10479, 15972, 12628, 12469, 11226, 117, 14025, 10162, 10114, 169, 124, 118, 122, 14107, 10160, 13877, 18086, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "pulled", "a", "goal", "back", "through", "Andre", "T", "##rul", "##sen", "but", "Schalke", "striker", "Martin", "Max", "restored", "his", "team", "'", "s", "two", "-", "goal", "cu", "##shi", "##on", "shortly", "afterwards", "." ], "ids": [ 10838, 54583, 65884, 169, 16586, 12014, 11222, 25188, 157, 24849, 10917, 10473, 87909, 103325, 11235, 12854, 39256, 10226, 11121, 112, 187, 10551, 118, 16586, 10854, 16119, 10263, 31555, 49827, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 3, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Christian", "Springer", "put", "St", "Pauli", "back", "in", "touch", "in", "the", "64", "##th", "minute", "and", "three", "minutes", "later", "they", "were", "level", ",", "thanks", "to", "a", "penalty", "from", "Thomas", "Sa", "##bot", "##zik", "." ], "ids": [ 11757, 17854, 14499, 10838, 54583, 12014, 10106, 54981, 10106, 10105, 11295, 11143, 21760, 10111, 11003, 15304, 10873, 10689, 10309, 13277, 117, 69892, 10114, 169, 40924, 10188, 11096, 12404, 25022, 19502, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "In", "the", "night", "'", "s", "only", "other", "match", ",", "Hamburg", "beat", "Hansa", "Rostock", "1", "-", "0", ",", "Kar", "##sten", "Ba", "##eron", "scoring", "the", "winner", "after", "some", "da", "##zz", "##ling", "build", "-", "up", "from", "in", "-", "form", "midfielder", "Harald", "Sp", "##oer", "##l", "." ], "ids": [ 10167, 10105, 16903, 112, 187, 10893, 10684, 12356, 117, 15021, 27868, 77740, 47090, 122, 118, 121, 117, 90233, 12587, 21333, 22958, 27346, 10105, 20826, 10662, 11152, 10143, 46671, 11945, 23332, 118, 10741, 10188, 10106, 118, 12188, 68049, 25475, 46361, 106090, 10161, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "The", "win", "put", "Hamburg", "in", "second", "place", "in", "the", "German", "first", "division", "after", "three", "games", ",", "though", "that", "may", "change", "after", "the", "other", "sides", "play", "on", "Saturday", "." ], "ids": [ 10117, 14125, 14499, 15021, 10106, 11132, 11192, 10106, 10105, 12026, 10422, 13751, 10662, 11003, 13332, 117, 15102, 10189, 11387, 15453, 10662, 10105, 10684, 27263, 12253, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "SA", "##LA", "##H", "H", "##IS", "##S", "##O", "##U", "BR", "##EA", "##KS", "10", ",", "000", "ME", "##T", "##RE", "##S", "WORLD", "RE", "##CO", "##RD", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 21318, 44376, 12396, 145, 19088, 10731, 11403, 12022, 49351, 36789, 62828, 10150, 117, 10259, 47430, 11090, 66014, 10731, 67376, 71033, 82272, 84444, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "23" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Morocco", "'", "s", "Salah", "His", "##sou", "broke", "the", "men", "'", "s", "10", ",", "000", "metres", "world", "record", "on", "Friday", "when", "he", "clock", "##ed", "26", "minutes", "38", ".", "08", "seconds", "at", "the", "Brussels", "grand", "prix", "on", "Friday", "." ], "ids": [ 57295, 112, 187, 44581, 11597, 44756, 30500, 10105, 10588, 112, 187, 10150, 117, 10259, 16393, 11356, 12410, 10135, 30767, 10841, 10261, 52843, 10336, 10314, 15304, 11171, 119, 11052, 34290, 10160, 10105, 41239, 13023, 18236, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "previous", "mark", "of", "26", ":", "43", ".", "53", "was", "set", "by", "Ethiopia", "'", "s", "Hai", "##le", "G", "##ebre", "##sel", "##ass", "##ie", "in", "the", "Dutch", "town", "of", "Hen", "##gel", "##o", "in", "June", "last", "year", "." ], "ids": [ 10117, 16741, 29221, 10108, 10314, 131, 11370, 119, 11756, 10134, 11847, 10155, 49281, 112, 187, 26329, 10284, 144, 100657, 12912, 98800, 10400, 10106, 10105, 17693, 12221, 10108, 86362, 16039, 10133, 10106, 11120, 12469, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 2, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##IE", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 71655, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##mmar", "##ies", "of", "Bundesliga", "matches", "on", "Friday", ":" ], "ids": [ 12271, 100620, 11624, 10108, 21436, 18258, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Hansa", "Rostock", "0", "Hamburg", "1", "(", "Ba", "##eron", "64", "##th", "min", ")", "." ], "ids": [ 77740, 47090, 121, 15021, 122, 113, 21333, 22958, 11295, 11143, 13484, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "0", "." ], "ids": [ 33100, 18086, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "18", ",", "500", "." ], "ids": [ 46080, 10218, 117, 10757, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "4", "(", "Dr", "##iller", "15th", ",", "T", "##rul", "##sen", "54", "##th", ",", "Springer", "64", "##th", ",", "So", "##bot", "##zik", "67", "##th", "penalty", ")", "Schalke", "4", "(", "Max", "11th", ",", "Th", "##on", "34", "##th", ",", "Wi", "##lm", "##ots", "38", "##th", ",", "Springer", "64", "##th", ")", "." ], "ids": [ 10838, 54583, 125, 113, 11612, 62302, 36293, 117, 157, 24849, 10917, 11653, 11143, 117, 17854, 11295, 11143, 117, 12882, 25022, 19502, 12316, 11143, 40924, 114, 87909, 125, 113, 12854, 34062, 117, 51635, 10263, 11069, 11143, 117, 52742, 55183, 25588, 11171, 11143, 117, 17854, 11295, 11143, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 9, 9, 4, 8, 8, 9, 9, 9, 4, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 3, 9, 9, 4, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "3", "." ], "ids": [ 122, 118, 124, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "19", ",", "775", "." ], "ids": [ 10270, 117, 61416, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "SU", "##MM", "##AR", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 84977, 109865, 62674, 86643, 93252, 52188, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "23" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "a", "French", "first", "division", "match", "on", "Friday", "." ], "ids": [ 42027, 10108, 169, 11894, 10422, 13751, 12356, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nancy", "0", "Paris", "St", "Germain", "0", "." ], "ids": [ 20073, 121, 10728, 10838, 26289, 121, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Attendance", ":", "15", ",", "000", "." ], "ids": [ 46080, 131, 10208, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##T", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 84977, 109865, 62674, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "23" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "French", "first", "division", "match", "on", "Friday", "." ], "ids": [ 32070, 16203, 10108, 169, 11894, 10422, 13751, 12356, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nancy", "0", "Paris", "St", "Germain", "0" ], "ids": [ 20073, 121, 10728, 10838, 26289, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "German", "first", "division" ], "ids": [ 33036, 10108, 12026, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "matches", "on", "Friday", ":" ], "ids": [ 41356, 18258, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "4", "Schalke", "4" ], "ids": [ 10838, 54583, 125, 87909, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Hansa", "Rostock", "0", "Hamburg", "1" ], "ids": [ 77740, 47090, 121, 15021, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "MA", "##ST", "##ER", "##KO", "##VA", "BR", "##EA", "##KS", "SEC", "##ON", "##D", "WORLD", "RE", "##CO", "##RD", "IN", "10", "DA", "##YS", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 27277, 32995, 24093, 57277, 47172, 49351, 36789, 62828, 92031, 30118, 11490, 67376, 71033, 82272, 84444, 36351, 10150, 47855, 93202, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Adrian", "Warner" ], "ids": [ 23928, 17853 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "23" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russia", "'", "s", "double", "Olympic", "champion", "Svetlana", "Master", "##kova", "sm", "##ash", "##ed", "her", "second", "world", "record", "in", "just", "10", "days", "on", "Friday", "when", "she", "better", "##ed", "the", "mark", "for", "the", "women", "'", "s", "1", ",", "000", "metres", "." ], "ids": [ 14664, 112, 187, 15790, 17952, 17689, 105062, 14612, 61653, 39709, 73491, 10336, 10485, 11132, 11356, 12410, 10106, 12820, 10150, 13990, 10135, 30767, 10841, 10833, 18322, 10336, 10105, 29221, 10142, 10105, 13190, 112, 187, 122, 117, 10259, 16393, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "breaking", "the", "world", "record", "for", "the", "women", "'", "s", "mile", "in", "Zurich", "last", "Wednesday", ",", "the", "Olympic", "800", "and", "1", ",", "500", "metres", "champion", "clock", "##ed", "two", "minutes", "28", ".", "98", "seconds", "over", "1", ",", "000", "at", "the", "Brussels", "grand", "prix", "meeting", "." ], "ids": [ 11301, 47105, 10105, 11356, 12410, 10142, 10105, 13190, 112, 187, 21128, 10106, 55885, 12469, 57611, 117, 10105, 17952, 11900, 10111, 122, 117, 10757, 16393, 17689, 52843, 10336, 10551, 15304, 10348, 119, 12327, 34290, 10491, 122, 117, 10259, 10160, 10105, 41239, 13023, 18236, 19822, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Russian", "at", "##e", "up", "the", "ground", "in", "a", "s", "##wi", "##ft", "last", "lap", "to", "sh", "##ave", "0", ".", "36", "seconds", "off", "the", "previous", "best", "of", "2", ":", "29", ".", "34", "set", "by", "Mozambique", "'", "s", "Maria", "Mu", "##tola", "in", "the", "same", "stadium", "in", "August", "last", "year", "." ], "ids": [ 10117, 13463, 10160, 10112, 10741, 10105, 16912, 10106, 169, 187, 15926, 12961, 12469, 38553, 10114, 48201, 23641, 121, 119, 11055, 34290, 11898, 10105, 16741, 12504, 10108, 123, 131, 10386, 119, 11069, 11847, 10155, 61380, 112, 187, 11066, 49056, 78814, 10106, 10105, 11561, 27915, 10106, 10735, 12469, 10924, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "world", "800", "champion", "Mu", "##tola", "pushed", "Master", "##kova", "all", "the", "way", ",", "finishing", "second", "in", "2", ":", "29", ".", "66", "." ], "ids": [ 42355, 11356, 11900, 17689, 49056, 78814, 70157, 14612, 61653, 10435, 10105, 13170, 117, 34348, 11132, 10106, 123, 131, 10386, 119, 12215, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "it", "was", "the", "Russian", "who", "picked", "up", "the", "bonus", "of", "$", "25", ",", "000", "for", "the", "historic", "run", "in", "front", "of", "a", "capacity", "40", ",", "000", "crowd", "." ], "ids": [ 16976, 10271, 10134, 10105, 13463, 10479, 52289, 10741, 10105, 28215, 10108, 109, 10258, 117, 10259, 10142, 10105, 23704, 14095, 10106, 14589, 10108, 169, 23095, 10533, 117, 10259, 50059, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Master", "##kova", "dominated", "the", "middle", "-", "distance", "races", "at", "the", "recent", "Atlanta", "Games", "following", "her", "return", "to", "competition", "this", "season", "after", "a", "three", "-", "year", "mater", "##nity", "break", "." ], "ids": [ 14612, 61653, 49365, 10105, 20181, 118, 18527, 20624, 10160, 10105, 19037, 19600, 14501, 11901, 10485, 15079, 10114, 16622, 10531, 11226, 10662, 169, 11003, 118, 10924, 91422, 96585, 24194, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "her", "first", "mile", "race", "at", "the", "riches", "##t", "meeting", "in", "Zurich", "last", "Wednesday", ",", "she", "sl", "##ash", "##ed", "3", ".", "05", "seconds", "off", "the", "previous", "record", "." ], "ids": [ 10167, 10485, 10422, 21128, 14025, 10160, 10105, 88597, 10123, 19822, 10106, 55885, 12469, 57611, 117, 10833, 38523, 73491, 10336, 124, 119, 10831, 34290, 11898, 10105, 16741, 12410, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "record", "of", "four", "minutes", ",", "12", ".", "56", "seconds", "in", "Zurich", "earned", "Master", "##kova", "a", "bonus", "of", "$", "50", ",", "000", "plus", "one", "kilo", "of", "gold", "." ], "ids": [ 10117, 12410, 10108, 11598, 15304, 117, 10186, 119, 11628, 34290, 10106, 55885, 21293, 14612, 61653, 169, 28215, 10108, 109, 10462, 117, 10259, 10563, 10464, 86754, 10108, 18128, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "Friday", "'", "s", "performance", "the", "Russian", "will", "have", "earned", "well", "over", "$", "100", ",", "000", "in", "less", "than", "a", "fort", "##night", ",", "taking", "her", "appearance", "money", "into", "account", "." ], "ids": [ 11301, 30767, 112, 187, 14432, 10105, 13463, 11337, 10529, 21293, 11206, 10491, 109, 10407, 117, 10259, 10106, 15306, 11084, 169, 16738, 45217, 117, 18084, 10485, 19099, 17920, 10708, 23200, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brussels", "organiser", "##s", "had", "laid", "a", "new", "track", "for", "the", "meeting", "comparable", "to", "the", "surface", "at", "the", "Atlanta", "Games", "but", "put", "down", "on", "a", "soft", "##er", "surface", "." ], "ids": [ 41239, 93446, 10107, 10374, 32637, 169, 10751, 14310, 10142, 10105, 19822, 67050, 10114, 10105, 16004, 10160, 10105, 19600, 14501, 10473, 14499, 12935, 10135, 169, 44898, 10165, 16004, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Master", "##kova", "clearly", "enjoyed", "it", "." ], "ids": [ 14612, 61653, 52340, 52072, 10271, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Mu", "##tola", "looked", "threat", "##ening", "in", "the", "final", "200", "metres", "but", "the", "Russian", "found", "an", "extra", "gear", "to", "power", "home", "several", "strid", "##es", "ahead", ",", "point", "##ing", "at", "the", "time", "on", "the", "clock", "with", "del", "##ight", "as", "she", "crossed", "the", "line", "." ], "ids": [ 49056, 78814, 59822, 41256, 24428, 10106, 10105, 11070, 10777, 16393, 10473, 10105, 13463, 11823, 10151, 19868, 62559, 10114, 13183, 11816, 11736, 106743, 10171, 35629, 117, 12331, 10230, 10160, 10105, 10635, 10135, 10105, 52843, 10169, 10127, 27521, 10146, 10833, 56433, 10105, 12117, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "W", "##OM", "##EN", "'", "S", "1", ",", "000", "ME", "##T", "##RE", "##S", "WORLD", "RE", "##CO", "##RD", "EV", "##OL", "##UT", "##ION", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 160, 37079, 50655, 112, 156, 122, 117, 10259, 47430, 11090, 66014, 10731, 67376, 71033, 82272, 84444, 109821, 39272, 65729, 52980, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "23" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Evolution", "of", "the", "women", "'", "s", "1", ",", "000" ], "ids": [ 23672, 10108, 10105, 13190, 112, 187, 122, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "metres", "world", "record", "(", "tab", "##ulated", "under", "time", ",", "name", "/", "nationality", "," ], "ids": [ 16393, 11356, 12410, 113, 100781, 37725, 10571, 10635, 117, 11324, 120, 91282, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "venue", ",", "date", ")", ":" ], "ids": [ 39975, 117, 13664, 114, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ":", "30", ".", "67", "Christine", "W", "##acht", "##el", "(", "Germany", ")", "Berlin", "17", ".", "8", ".", "90" ], "ids": [ 123, 131, 10244, 119, 12316, 23588, 160, 29623, 10570, 113, 12775, 114, 11193, 10273, 119, 129, 119, 10919 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ":", "29", ".", "34", "Maria", "Mu", "##tola", "(", "Mozambique", ")", "Brussels", "25", ".", "8", ".", "95" ], "ids": [ 123, 131, 10386, 119, 11069, 11066, 49056, 78814, 113, 61380, 114, 41239, 10258, 119, 129, 119, 11978 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ":", "28", ".", "98", "Svetlana", "Master", "##kova", "(", "Russia", ")", "Brussels", "23", ".", "8", ".", "96" ], "ids": [ 123, 131, 10348, 119, 12327, 105062, 14612, 61653, 113, 14664, 114, 41239, 10328, 119, 129, 119, 12308 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "MA", "##ST", "##ER", "##KO", "##VA", "BR", "##EA", "##KS", "W", "##OM", "##EN", "'", "S", "WORLD", "1", ",", "000", "RE", "##CO", "##RD", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 27277, 32995, 24093, 57277, 47172, 49351, 36789, 62828, 160, 37079, 50655, 112, 156, 67376, 122, 117, 10259, 71033, 82272, 84444, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "23" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "Svetlana", "Master", "##kova", "broke", "the", "women", "'", "s", "world", "1", ",", "000", "metres", "record", "on", "Friday", "when", "she", "clock", "##ed", "an", "uno", "##fficial", "two", "minutes", "28", ".", "99", "seconds", "at", "the", "Brussels", "grand", "prix", "." ], "ids": [ 13463, 105062, 14612, 61653, 30500, 10105, 13190, 112, 187, 11356, 122, 117, 10259, 16393, 12410, 10135, 30767, 10841, 10833, 52843, 10336, 10151, 11381, 101272, 10551, 15304, 10348, 119, 12187, 34290, 10160, 10105, 41239, 13023, 18236, 119 ], "entity": [ "B-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 2, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "The", "previous", "mark", "of", "2", ":", "29", ".", "34", "was", "set", "by", "Mozambique", "'", "s", "Maria", "Mu", "##tola", "here", "on", "August", "25", "last", "year", "." ], "ids": [ 10117, 16741, 29221, 10108, 123, 131, 10386, 119, 11069, 10134, 11847, 10155, 61380, 112, 187, 11066, 49056, 78814, 19353, 10135, 10735, 10258, 12469, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "time", "was", "officially", "ad", "##justed", "to", "2", ":", "28", ".", "98", "." ], "ids": [ 10117, 10635, 10134, 23296, 10840, 101762, 10114, 123, 131, 10348, 119, 12327, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "GE", "##R", "##MA", "##N", "OP", "##EN", "SEC", "##ON", "##D", "R", "##O", "##UN", "##D", "SC", "##OR", "##ES", "." ], "ids": [ 41525, 11369, 11565, 118, 62997, 11273, 30696, 11537, 55355, 50655, 92031, 30118, 11490, 155, 11403, 69849, 11490, 18137, 42622, 25054, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##UT", "##T", "##GA", "##RT", ",", "Germany", "1996", "-", "08", "-", "23" ], "ids": [ 53317, 65729, 11090, 39061, 46935, 117, 12775, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "second", "round" ], "ids": [ 100085, 11132, 13569 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "scores", "in", "the", "German", "Open", "golf", "championship", "on", "Friday", "(", "Britain" ], "ids": [ 49931, 10106, 10105, 12026, 11919, 32288, 20755, 10135, 30767, 113, 16032 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1 ] }, { "tokens": [ "unless", "stated", ")", ":" ], "ids": [ 60015, 17067, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "128", "Ian", "Woo", "##sna", "##m", "64", "64" ], "ids": [ 16196, 16582, 84270, 45981, 10147, 11295, 11295 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "129", "Robert", "Karlsson", "(", "Sweden", ")", "67", "62" ], "ids": [ 18336, 10820, 85716, 113, 20937, 114, 12316, 12066 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "130", "Fernando", "Roca", "(", "Spain", ")", "66", "64", ",", "Ian", "P", "##yman", "66", "64" ], "ids": [ 13389, 14022, 58384, 113, 16149, 114, 12215, 11295, 117, 16582, 153, 66654, 12215, 11295 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "131", "Carl", "Sun", "##eson", "65", "66", ",", "Stephen", "Field", "66", "65" ], "ids": [ 18372, 12225, 13967, 81420, 10843, 12215, 117, 13866, 16003, 12215, 10843 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "132", "Miguel", "Angel", "Martin", "(", "Spain", ")", "66", "66", ",", "Raymond", "Russell", "63", "69", "," ], "ids": [ 18385, 13905, 17567, 11235, 113, 16149, 114, 12215, 12215, 117, 17326, 13481, 12256, 12573, 117 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Thomas", "Go", "##gel", "##e", "(", "Germany", ")", "67", "65", ",", "Paul", "Broad", "##hurst", "62", "70", "," ], "ids": [ 11096, 14439, 16039, 10112, 113, 12775, 114, 12316, 10843, 117, 10772, 86606, 68091, 12066, 10923, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Diego", "Bo", "##rre", "##go", "(", "Spain", ")", "69", "63" ], "ids": [ 14665, 27622, 19243, 10797, 113, 16149, 114, 12573, 12256 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "133", "Ricky", "Willis", "##on", "69", "64", ",", "Stephen", "Ames", "(", "Trinidad", "and", "Tobago", ")" ], "ids": [ 18665, 40486, 37227, 10263, 12573, 11295, 117, 13866, 69604, 113, 31327, 10111, 50946, 114 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 1, 5, 5, 9 ] }, { "tokens": [ "68", "65", ",", "Ea", "##mon", "##n", "Dar", "##cy", "(", "Ireland", ")", "65", "68" ], "ids": [ 12370, 10843, 117, 47132, 16278, 10115, 35368, 11710, 113, 14637, 114, 10843, 12370 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "134", "Robert", "Coles", "68", "66", ",", "David", "Williams", "67", "67", ",", "Thomas", "B", "##jorn" ], "ids": [ 18546, 10820, 98204, 12370, 12215, 117, 10804, 12494, 12316, 12316, 117, 11096, 139, 72603 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Denmark", ")", "66", "68", ",", "Pedro", "Linha", "##rt", "(", "Spain", ")", "67", "67", ",", "Michael" ], "ids": [ 113, 25854, 114, 12215, 12370, 117, 12849, 85861, 10976, 113, 16149, 114, 12316, 12316, 117, 10631 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4 ] }, { "tokens": [ "Jon", "##zon", "(", "Sweden", ")", "67", "67", ",", "Roger", "Chapman", "72", "62", ",", "Jonathan", "Loma", "##s" ], "ids": [ 17749, 22742, 113, 20937, 114, 12316, 12316, 117, 13513, 33069, 12120, 12066, 117, 16395, 26110, 10107 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "67", "67", ",", "Francisco", "Cea", "(", "Spain", ")", "68", "66" ], "ids": [ 12316, 12316, 117, 11798, 109435, 113, 16149, 114, 12370, 12215 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "135", "Terry", "Price", "(", "Australia", ")", "67", "68", ",", "Paul", "Ea", "##les", "67", "68", ",", "Wayne" ], "ids": [ 16364, 19902, 23002, 113, 11729, 114, 12316, 12370, 117, 10772, 47132, 11268, 12316, 12370, 117, 18547 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4 ] }, { "tokens": [ "Riley", "(", "Australia", ")", "64", "71", ",", "Carl", "Mason", "69", "66", ",", "Barry", "Lane" ], "ids": [ 35643, 113, 11729, 114, 11295, 12513, 117, 12225, 24122, 12573, 12215, 117, 18120, 20845 ], "entity": [ "B-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 4, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8 ] }, { "tokens": [ "68", "67", ",", "Bernhard", "Lange", "##r", "(", "Germany", ")", "64", "71", ",", "Gary", "Or", "##r", "67", "68", "," ], "ids": [ 12370, 12316, 117, 24862, 32384, 10129, 113, 12775, 114, 11295, 12513, 117, 15516, 19372, 10129, 12316, 12370, 117 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Mats", "Lan", "##ner", "(", "Sweden", ")", "64", "71", ",", "Jeff", "Hawks", "##worth", "67", "68", ",", "Des" ], "ids": [ 86768, 19670, 11129, 113, 20937, 114, 11295, 12513, 117, 17218, 52327, 17929, 12316, 12370, 117, 13810 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4 ] }, { "tokens": [ "Sm", "##yth", "(", "Ireland", ")", "66", "69", ",", "David", "Carter", "66", "69", ",", "Steve", "Webster" ], "ids": [ 41922, 96362, 113, 14637, 114, 12215, 12573, 117, 10804, 18047, 12215, 12573, 117, 13308, 34142 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8 ] }, { "tokens": [ "69", "66", ",", "Jose", "Maria", "Can", "##izar", "##es", "(", "Spain", ")", "67", "68", ",", "Paul", "Law", "##rie" ], "ids": [ 12573, 12215, 117, 23029, 11066, 14820, 35752, 10171, 113, 16149, 114, 12316, 12370, 117, 10772, 13216, 12904 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "66", "69" ], "ids": [ 12215, 12573 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "MIT", "##CH", "##EL", "##L", "UP", "##ST", "##AG", "##ES", "TR", "##IO", "OF", "OL", "##Y", "##MP", "##IC", "SP", "##RI", "##NT", "CH", "##AM", "##P", "##ION", "##S", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 31472, 86448, 68999, 11369, 53197, 32995, 109865, 25054, 80047, 37174, 23240, 19768, 14703, 79936, 30889, 22570, 46876, 77261, 39774, 36535, 11127, 52980, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Adrian", "Warner" ], "ids": [ 23928, 17853 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "23" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "Dennis", "Mitchell", "ups", "##tage", "##d", "a", "trio", "of", "past", "and", "present", "Olympic", "100", "metres", "champions", "on", "Friday", "with", "a", "storm", "##ing", "victory", "at", "the", "Brussels", "grand", "prix", "." ], "ids": [ 10536, 19874, 19906, 107717, 42767, 10162, 169, 32920, 10108, 17781, 10111, 12254, 17952, 10407, 16393, 27745, 10135, 30767, 10169, 169, 31642, 10230, 19735, 10160, 10105, 41239, 13023, 18236, 119 ], "entity": [ "B-MISC", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 2, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Sporting", "his", "custom", "##ary", "bright", "green", "out", "##fit", ",", "the", "U", ".", "S", ".", "champion", "clock", "##ed", "10", ".", "03", "seconds", "despite", "dam", "##p", "conditions", "to", "take", "the", "s", "##cal", "##p", "of", "Canada", "'", "s", "reign", "##ing", "Olympic", "champion", "Donovan", "Bailey", ",", "1992", "champion", "Lin", "##ford", "Christie", "of", "Britain", "and", "American", "1984", "and", "1988", "champion", "Carl", "Lewis", "." ], "ids": [ 31063, 10226, 66435, 14926, 72041, 23320, 10950, 48865, 117, 10105, 158, 119, 156, 119, 17689, 52843, 10336, 10150, 119, 10907, 34290, 22087, 39121, 10410, 17315, 10114, 13574, 10105, 187, 15794, 10410, 10108, 11635, 112, 187, 38587, 10230, 17952, 17689, 55072, 29761, 117, 10450, 17689, 35207, 13387, 34964, 10108, 16032, 10111, 10536, 10597, 10111, 10548, 17689, 12225, 13759, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 1, 9, 2, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Mitchell", "also", "beat", "world", "and", "Olympic", "champion", "Bailey", "at", "the", "most", "lu", "##crat", "##ive", "meeting", "in", "the", "sport", "in", "Zurich", "last", "week", "." ], "ids": [ 19906, 10379, 27868, 11356, 10111, 17952, 17689, 29761, 10160, 10105, 10992, 14657, 79203, 11942, 19822, 10106, 10105, 17925, 10106, 55885, 12469, 16118, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 2, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "The", "American", ",", "who", "finished", "fourth", "at", "the", "Atlanta", "Games", ",", "was", "fast", "out", "of", "his", "blocks", "and", "held", "off", "Bailey", "'", "s", "late", "bu", "##rst", "in", "the", "final", "20", "metres", "before", "heading", "off", "for", "a", "lap", "of", "celebration", "." ], "ids": [ 10117, 10536, 117, 10479, 15972, 16918, 10160, 10105, 19600, 14501, 117, 10134, 15040, 10950, 10108, 10226, 47352, 10111, 11991, 11898, 29761, 112, 187, 13002, 11499, 21328, 10106, 10105, 11070, 10197, 16393, 11360, 82839, 11898, 10142, 169, 38553, 10108, 69173, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Canadian", "was", "second", "in", "10", ".", "09", "with", "Lewis", "third", "in", "10", ".", "10", ",", "ahead", "of", "Atlanta", "bronze", "medal", "##list", "At", "##o", "Bold", "##on", "who", "clock", "##ed", "10", ".", "12", "in", "fourth", "." ], "ids": [ 10117, 14023, 10134, 11132, 10106, 10150, 119, 11035, 10169, 13759, 12628, 10106, 10150, 119, 10150, 117, 35629, 10108, 19600, 17930, 16531, 21476, 11699, 10133, 87457, 10263, 10479, 52843, 10336, 10150, 119, 10186, 10106, 16918, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Christie", ",", "competing", "in", "what", "is", "expected", "to", "be", "his", "last", "major", "international", "meeting", ",", "finished", "fifth", "in", "10", ".", "14", "." ], "ids": [ 34964, 117, 48641, 10106, 12976, 10124, 25973, 10114, 10347, 10226, 12469, 11922, 12533, 19822, 117, 15972, 22237, 10106, 10150, 119, 10247, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lewis", ",", "making", "a", "rare", "appearance", "in", "Europe", "in", "a", "sprint", "race", ",", "left", "the", "track", "with", "a", "sl", "##ight", "li", "##mp", "." ], "ids": [ 13759, 117, 14293, 169, 23902, 19099, 10106, 11767, 10106, 169, 42707, 14025, 117, 12153, 10105, 14310, 10169, 169, 38523, 27521, 11614, 18573, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "Olympic", "high", "hur", "##dles", "champion", "Allen", "Johnson", "def", "##ied", "the", "wet", "conditions", "to", "produce", "a", "br", "##ill", "##iant", "12", ".", "92", "seconds", "in", "the", "110", "metres", "race", ",", "just", "0", ".", "01", "outside", "the", "world", "record", "held", "by", "Britain", "'", "s", "Colin", "Jackson", "." ], "ids": [ 10536, 17952, 11846, 52824, 92503, 17689, 15101, 13241, 100745, 24140, 10105, 41115, 17315, 10114, 17368, 169, 33989, 19503, 24096, 10186, 119, 12458, 34290, 10106, 10105, 13057, 16393, 14025, 117, 12820, 121, 119, 10669, 17555, 10105, 11356, 12410, 11991, 10155, 16032, 112, 187, 20766, 13169, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Johnson", "ran", "the", "same", "time", "at", "the", "U", ".", "S", ".", "Olympic", "trials", "in", "Atlanta", "in", "June", "to", "become", "the", "second", "equal", "fastest", "hur", "##dler", "of", "all", "time", "with", "American", "Roger", "Kingdom", "." ], "ids": [ 13241, 17044, 10105, 11561, 10635, 10160, 10105, 158, 119, 156, 119, 17952, 54076, 10106, 19600, 10106, 11120, 10114, 13461, 10105, 11132, 32943, 61823, 52824, 29660, 10108, 10435, 10635, 10169, 10536, 13513, 14648, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 9 ] }, { "tokens": [ "He", "seemed", "to", "re", "##lis", "##h", "the", "new", "track", "at", "the", "Brussels", "meeting", ",", "domina", "##ting", "the", "race", "from", "start", "to", "finish", "with", "a", "sl", "##ight", "wind", "at", "his", "back", "." ], "ids": [ 10357, 64676, 10114, 11639, 12536, 10237, 10105, 10751, 14310, 10160, 10105, 41239, 19822, 117, 90399, 12141, 10105, 14025, 10188, 15148, 10114, 26282, 10169, 169, 38523, 27521, 31346, 10160, 10226, 12014, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jackson", ",", "the", "only", "man", "to", "have", "run", "faster", ",", "could", "not", "live", "with", "his", "speed", ",", "taking", "second", "in", "13", ".", "24", "seconds", "." ], "ids": [ 13169, 117, 10105, 10893, 10817, 10114, 10529, 14095, 66109, 117, 12174, 10472, 12962, 10169, 10226, 19085, 117, 18084, 11132, 10106, 10249, 119, 10233, 34290, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rain", "was", "pel", "##ting", "down", "when", "the", "women", "'", "s", "high", "hur", "##dler", "##s", "stepped", "up", "for", "their", "100", "metres", "race", "." ], "ids": [ 10117, 50939, 10134, 12493, 12141, 12935, 10841, 10105, 13190, 112, 187, 11846, 52824, 29660, 10107, 99116, 10741, 10142, 10455, 10407, 16393, 14025, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Sweden", "'", "s", "Olympic", "high", "hur", "##dles", "champion", "Lu", "##d", "##mila", "Eng", "##quist", ",", "who", "crashed", "out", "of", "last", "week", "'", "s", "meeting", "in", "Zurich", "after", "hitting", "a", "hur", "##dle", ",", "also", "kept", "her", "foot", "##ing", "perfect", "##ly", "to", "win", "in", "a", "fast", "12", ".", "60", "seconds", "." ], "ids": [ 16976, 20937, 112, 187, 17952, 11846, 52824, 92503, 17689, 23859, 10162, 35634, 56982, 51388, 117, 10479, 91126, 10950, 10108, 12469, 16118, 112, 187, 19822, 10106, 55885, 10662, 88998, 169, 52824, 27477, 117, 10379, 26546, 10485, 24963, 10230, 43477, 10454, 10114, 14125, 10106, 169, 15040, 10186, 119, 10709, 34290, 119 ], "entity": [ "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 2, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Olympic", "silver", "medal", "##list", "Br", "##igi", "##ta", "Bu", "##kov", "##ec", "of", "Slovenia", "could", "finish", "only", "fifth", "in", "the", "race", "in", "12", ".", "95", "." ], "ids": [ 17952, 23394, 16531, 21476, 38508, 46177, 10213, 11916, 16433, 15953, 10108, 34583, 12174, 26282, 10893, 22237, 10106, 10105, 14025, 10106, 10186, 119, 11978, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jamaica", "##n", "Commonwealth", "champion", "Michelle", "Freeman", "took", "second", "in", "12", ".", "77", "ahead", "of", "Cuban", "Ali", "##uska", "Lopez", "." ], "ids": [ 32699, 10115, 22603, 17689, 27062, 33044, 12149, 11132, 10106, 10186, 119, 12527, 35629, 10108, 60845, 13518, 82756, 34054, 119 ], "entity": [ "B-MISC", "I-MISC", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 2, 6, 3, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 9 ] }, { "tokens": [ "The", "Zurich", "fall", "cost", "Eng", "##quist", "a", "shot", "at", "a", "ja", "##ck", "##pot", "of", "20", "one", "-", "kg", "gold", "bars", "which", "can", "be", "won", "by", "athletes", "who", "c", "##lin", "##ch", "their", "events", "at", "all", "of", "the", "Golden", "Four", "series", "in", "Oslo", ",", "Zurich", ",", "Brussels", "and", "Berlin", "." ], "ids": [ 10117, 55885, 18042, 18849, 56982, 51388, 169, 19508, 10160, 169, 10201, 11263, 37604, 10108, 10197, 10464, 118, 11895, 18128, 56829, 10319, 10944, 10347, 11367, 10155, 57700, 10479, 171, 13020, 10269, 10455, 15284, 10160, 10435, 10108, 10105, 14428, 16773, 11366, 10106, 14138, 117, 55885, 117, 41239, 10111, 11193, 119 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 1, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Seven", "athletes", "went", "into", "Friday", "'", "s", "pen", "##ult", "##imate", "meeting", "of", "the", "series", "with", "a", "chance", "of", "winning", "the", "prize", "and", "American", "men", "'", "s", "400", "metres", "hur", "##dles", "champion", "Derrick", "Ad", "##kins", "kept", "his", "hopes", "alive", "in", "the", "competition", "by", "winning", "his", "event", "in", "47", ".", "93", "." ], "ids": [ 21077, 57700, 13446, 10708, 30767, 112, 187, 66558, 16203, 56783, 19822, 10108, 10105, 11366, 10169, 169, 27893, 10108, 16542, 10105, 32929, 10111, 10536, 10588, 112, 187, 11176, 16393, 52824, 92503, 17689, 93527, 25474, 39460, 26546, 10226, 82467, 57057, 10106, 10105, 16622, 10155, 16542, 10226, 14416, 10106, 11413, 119, 12479, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "Olympic", "champion", "Gail", "Dev", "##ers", "clock", "##ed", "a", "s", "##wi", "##ft", "10", ".", "84", "seconds", "on", "her", "way", "to", "victory", "in", "the", "women", "'", "s", "100", "metres", ",", "the", "second", "fastest", "time", "of", "the", "season", "and", "0", ".", "10", "seconds", "faster", "than", "her", "winning", "time", "in", "Atlanta", "." ], "ids": [ 10536, 17952, 17689, 87604, 89586, 10901, 52843, 10336, 169, 187, 15926, 12961, 10150, 119, 11761, 34290, 10135, 10485, 13170, 10114, 19735, 10106, 10105, 13190, 112, 187, 10407, 16393, 117, 10105, 11132, 61823, 10635, 10108, 10105, 11226, 10111, 121, 119, 10150, 34290, 66109, 11084, 10485, 16542, 10635, 10106, 19600, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 6, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Jamaica", "##n", "veteran", "Merle", "##ne", "Otte", "##y", ",", "who", "beat", "Dev", "##ers", "in", "Zurich", "after", "just", "missing", "out", "on", "the", "gold", "medal", "in", "Atlanta", "after", "a", "photo", "finish", ",", "had", "to", "settle", "for", "third", "place", "in", "11", ".", "04", "." ], "ids": [ 32699, 10115, 55669, 107844, 10238, 25798, 10157, 117, 10479, 27868, 89586, 10901, 10106, 55885, 10662, 12820, 39542, 10950, 10135, 10105, 18128, 16531, 10106, 19600, 10662, 169, 38171, 26282, 117, 10374, 10114, 90424, 10142, 12628, 11192, 10106, 10193, 119, 10814, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "world", "champion", "Gwen", "Torre", "##nce", ",", "the", "bronze", "medal", "##list", "in", "Atlanta", ",", "was", "second", "in", "11", ".", "00", "." ], "ids": [ 10536, 11356, 17689, 72748, 20630, 12150, 117, 10105, 17930, 16531, 21476, 10106, 19600, 117, 10134, 11132, 10106, 10193, 119, 11025, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "a", "cost", "##ly", "defeat", "for", "Otte", "##y", "since", "it", "threw", "her", "out", "of", "the", "race", "for", "the", "Golden", "Four", "ja", "##ck", "##pot", "." ], "ids": [ 10377, 10134, 169, 18849, 10454, 24800, 10142, 25798, 10157, 11764, 10271, 80516, 10485, 10950, 10108, 10105, 14025, 10142, 10105, 14428, 16773, 10201, 11263, 37604, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "BR", "##US", "##SE", "##LS", "GR", "##AN", "##D", "PR", "##IX", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 49351, 32612, 39039, 66934, 58787, 41275, 11490, 23837, 67403, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "23" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "in", "the", "Brussels" ], "ids": [ 100085, 17466, 10106, 10105, 41239 ], "entity": [ "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 2 ] }, { "tokens": [ "Grand", "Prix", "athletics", "meeting", "on", "Friday", ":" ], "ids": [ 11319, 12835, 98600, 19822, 10135, 30767, 131 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "discu", "##s" ], "ids": [ 13536, 112, 187, 110076, 10107 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Il", "##ke", "W", "##yl", "##udd", "##a", "(", "Germany", ")", "66", ".", "60", "metres" ], "ids": [ 122, 119, 10282, 10550, 160, 27652, 75385, 10113, 113, 12775, 114, 12215, 119, 10709, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "El", "##lina", "Z", "##vere", "##va", "(", "Belarus", ")", "65", ".", "66" ], "ids": [ 123, 119, 10224, 21282, 163, 29282, 10362, 113, 55131, 114, 10843, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Frank", "##a", "Die", "##tz", "##sch", "(", "Germany", ")", "61", ".", "74" ], "ids": [ 124, 119, 11872, 10113, 10236, 13695, 12044, 113, 12775, 114, 12314, 119, 12535 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Natal", "##ya", "Sad", "##ova", "(", "Russia", ")", "61", ".", "64" ], "ids": [ 125, 119, 36024, 10679, 48691, 12804, 113, 14664, 114, 12314, 119, 11295 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Met", "##te", "Bergman", "##n", "(", "Norway", ")", "61", ".", "44" ], "ids": [ 126, 119, 19728, 10216, 50391, 10115, 113, 22582, 114, 12314, 119, 11126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Nicole", "##ta", "G", "##ras", "##u", "(", "Romania", ")", "61", ".", "36" ], "ids": [ 127, 119, 27142, 10213, 144, 12783, 10138, 113, 13927, 114, 12314, 119, 11055 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Olga", "Cher", "##nya", "##vska", "##ya", "(", "Russia", ")", "60", ".", "46" ], "ids": [ 128, 119, 28890, 35554, 10676, 88558, 10679, 113, 14664, 114, 10709, 119, 11528 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Irina", "Ya", "##tch", "##enko", "(", "Belarus", ")", "58", ".", "92" ], "ids": [ 129, 119, 60862, 25148, 38732, 56204, 113, 55131, 114, 11824, 119, 12458 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "100", "metres", "hur", "##dles" ], "ids": [ 13536, 112, 187, 10407, 16393, 52824, 92503 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Lu", "##d", "##mila", "Eng", "##quist", "(", "Sweden", ")", "12", ".", "60", "seconds" ], "ids": [ 122, 119, 23859, 10162, 35634, 56982, 51388, 113, 20937, 114, 10186, 119, 10709, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Michelle", "Freeman", "(", "Jamaica", ")", "12", ".", "77" ], "ids": [ 123, 119, 27062, 33044, 113, 32699, 114, 10186, 119, 12527 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Ali", "##uska", "Lopez", "(", "Cuba", ")", "12", ".", "85" ], "ids": [ 124, 119, 13518, 82756, 34054, 113, 17226, 114, 10186, 119, 12017 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Dion", "##ne", "Rose", "(", "Jamaica", ")", "12", ".", "88" ], "ids": [ 125, 119, 54765, 10238, 14873, 113, 32699, 114, 10186, 119, 12074 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Br", "##igi", "##ta", "Bu", "##kov", "##ec", "(", "Slovakia", ")", "12", ".", "95" ], "ids": [ 126, 119, 38508, 46177, 10213, 11916, 16433, 15953, 113, 43031, 114, 10186, 119, 11978 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Yu", "##lia", "Grau", "##din", "(", "Russia", ")", "12", ".", "96" ], "ids": [ 127, 119, 19387, 13217, 84684, 15612, 113, 14664, 114, 10186, 119, 12308 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Julie", "Baum", "##ann", "(", "Switzerland", ")", "13", ".", "36" ], "ids": [ 128, 119, 18152, 67279, 20801, 113, 26002, 114, 10249, 119, 11055 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Patricia", "Girard", "-", "Len", "##o", "(", "France", ")", "13", ".", "36" ], "ids": [ 129, 119, 26751, 73525, 118, 97413, 10133, 113, 10688, 114, 10249, 119, 11055 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Dawn", "Bowl", "##es", "(", "U", ".", "S", ".", ")", "13", ".", "53" ], "ids": [ 130, 119, 26580, 23010, 10171, 113, 158, 119, 156, 119, 114, 10249, 119, 11756 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "110", "metres", "hur", "##dles" ], "ids": [ 13026, 112, 187, 13057, 16393, 52824, 92503 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Allen", "Johnson", "(", "U", ".", "S", ".", ")", "12", ".", "92", "seconds" ], "ids": [ 122, 119, 15101, 13241, 113, 158, 119, 156, 119, 114, 10186, 119, 12458, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Colin", "Jackson", "(", "Britain", ")", "13", ".", "24" ], "ids": [ 123, 119, 20766, 13169, 113, 16032, 114, 10249, 119, 10233 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Emilio", "Valle", "(", "Cuba", ")", "13", ".", "33" ], "ids": [ 124, 119, 27341, 19159, 113, 17226, 114, 10249, 119, 11000 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Sven", "Pieter", "##s", "(", "Belgium", ")", "13", ".", "37" ], "ids": [ 125, 119, 33559, 32905, 10107, 113, 26519, 114, 10249, 119, 11204 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Steve", "Brown", "(", "U", ".", "S", ".", ")", "13", ".", "38" ], "ids": [ 126, 119, 13308, 12623, 113, 158, 119, 156, 119, 114, 10249, 119, 11171 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Frank", "Ass", "##elma", "##n", "(", "Belgium", ")", "13", ".", "64" ], "ids": [ 127, 119, 11872, 77014, 95243, 10115, 113, 26519, 114, 10249, 119, 11295 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Hubert", "Gross", "##ard", "(", "Belgium", ")", "13", ".", "65" ], "ids": [ 128, 119, 27747, 50557, 13167, 113, 26519, 114, 10249, 119, 10843 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Jonathan", "N", "'", "Sen", "##ga", "(", "Belgium", ")", "13", ".", "66" ], "ids": [ 129, 119, 16395, 151, 112, 18082, 10483, 113, 26519, 114, 10249, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Johan", "Lisa", "##beth", "(", "Belgium", ")", "13", ".", "75" ], "ids": [ 130, 119, 15706, 19589, 104371, 113, 26519, 114, 10249, 119, 11417 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "5", ",", "000", "metres" ], "ids": [ 13536, 112, 187, 126, 117, 10259, 16393 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Roberta", "Brun", "##et", "(", "Italy", ")", "14", "minutes", "48", ".", "96", "seconds" ], "ids": [ 122, 119, 42793, 102877, 10308, 113, 11619, 114, 10247, 15304, 11300, 119, 12308, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Fernanda", "Ribeiro", "(", "Portugal", ")", "14", ":", "49", ".", "81" ], "ids": [ 123, 119, 91498, 52807, 113, 12939, 114, 10247, 131, 11580, 119, 12324 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Sally", "Bar", "##sos", "##io", "(", "Kenya", ")", "14", ":", "58", ".", "29" ], "ids": [ 124, 119, 33636, 20698, 17795, 10638, 113, 19686, 114, 10247, 131, 11824, 119, 10386 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Paula", "Radcliffe", "(", "Britain", ")", "14", ":", "59", ".", "70" ], "ids": [ 125, 119, 24392, 92465, 113, 16032, 114, 10247, 131, 11867, 119, 10923 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Julia", "Va", "##quer", "##o", "(", "Spain", ")", "15", ":", "04", ".", "94" ], "ids": [ 126, 119, 19332, 14723, 28531, 10133, 113, 16149, 114, 10208, 131, 10814, 119, 12749 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Catherine", "M", "##c", "##K", "##ierna", "##n", "(", "Ireland", ")", "15", ":", "07", ".", "57" ], "ids": [ 127, 119, 15268, 150, 10350, 11733, 106135, 10115, 113, 14637, 114, 10208, 131, 10878, 119, 11817 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Annette", "Peters", "(", "U", ".", "S", ".", ")", "15", ":", "07", ".", "85" ], "ids": [ 128, 119, 67189, 30160, 113, 158, 119, 156, 119, 114, 10208, 131, 10878, 119, 12017 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Pauline", "Kong", "##a", "(", "Kenya", ")", "15", ":", "11", ".", "40" ], "ids": [ 129, 119, 45533, 14577, 10113, 113, 19686, 114, 10208, 131, 10193, 119, 10533 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "100", "metres" ], "ids": [ 13026, 112, 187, 10407, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Dennis", "Mitchell", "(", "U", ".", "S", ".", ")", "10", ".", "03", "seconds" ], "ids": [ 122, 119, 19874, 19906, 113, 158, 119, 156, 119, 114, 10150, 119, 10907, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Donovan", "Bailey", "(", "Canada", ")", "10", ".", "09" ], "ids": [ 123, 119, 55072, 29761, 113, 11635, 114, 10150, 119, 11035 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Carl", "Lewis", "(", "U", ".", "S", ".", ")", "10", ".", "10" ], "ids": [ 124, 119, 12225, 13759, 113, 158, 119, 156, 119, 114, 10150, 119, 10150 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "At", "##o", "Bold", "##on", "(", "Trinidad", ")", "10", ".", "12" ], "ids": [ 125, 119, 11699, 10133, 87457, 10263, 113, 31327, 114, 10150, 119, 10186 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Lin", "##ford", "Christie", "(", "Britain", ")", "10", ".", "14" ], "ids": [ 126, 119, 35207, 13387, 34964, 113, 16032, 114, 10150, 119, 10247 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Davidson", "Ez", "##in", "##wa", "(", "Nigeria", ")", "10", ".", "15" ], "ids": [ 127, 119, 41130, 17599, 10245, 11037, 113, 22045, 114, 10150, 119, 10208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Jon", "Drummond", "(", "U", ".", "S", ".", ")", "10", ".", "16" ], "ids": [ 128, 119, 17749, 90452, 113, 158, 119, 156, 119, 114, 10150, 119, 10250 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Brun", "##y", "Sur", "##in", "(", "Canada", ")", "10", ".", "30" ], "ids": [ 129, 119, 102877, 10157, 14453, 10245, 113, 11635, 114, 10150, 119, 10244 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "400", "metres", "hur", "##dles" ], "ids": [ 13026, 112, 187, 11176, 16393, 52824, 92503 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Derrick", "Ad", "##kins", "(", "U", ".", "S", ".", ")", "47", ".", "93", "seconds" ], "ids": [ 122, 119, 93527, 25474, 39460, 113, 158, 119, 156, 119, 114, 11413, 119, 12479, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Samuel", "Mate", "##te", "(", "Zambia", ")", "47", ".", "99" ], "ids": [ 123, 119, 14829, 99603, 10216, 113, 53937, 114, 11413, 119, 12187 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Rohan", "Robinson", "(", "Australia", ")", "48", ".", "86" ], "ids": [ 124, 119, 72149, 13895, 113, 11729, 114, 11300, 119, 12224 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Tor", "##rance", "Ze", "##ll", "##ner", "(", "U", ".", "S", ".", ")", "49", ".", "06" ], "ids": [ 125, 119, 24446, 43512, 15536, 11231, 11129, 113, 158, 119, 156, 119, 114, 11580, 119, 10719 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Jean", "-", "Paul", "Br", "##uw", "##ier", "(", "Belgium", ")", "49", ".", "24" ], "ids": [ 126, 119, 10766, 118, 10772, 38508, 35300, 11709, 113, 26519, 114, 11580, 119, 10233 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Du", "##san", "Ko", "##vac", "##s", "(", "Hungary", ")", "49", ".", "31" ], "ids": [ 127, 119, 14925, 14434, 30186, 58849, 10107, 113, 24601, 114, 11580, 119, 10413 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Calvin", "Davis", "(", "U", ".", "S", ".", ")", "49", ".", "49" ], "ids": [ 128, 119, 41456, 14281, 113, 158, 119, 156, 119, 114, 11580, 119, 11580 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Laurent", "Otto", "##z", "(", "Italy", ")", "49", ".", "61" ], "ids": [ 129, 119, 19982, 13573, 10305, 113, 11619, 114, 11580, 119, 12314 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Marc", "Doll", "##endorf", "(", "Belgium", ")", "50", ".", "36" ], "ids": [ 130, 119, 15254, 78768, 108195, 113, 26519, 114, 10462, 119, 11055 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "100", "metres" ], "ids": [ 13536, 112, 187, 10407, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Gail", "Dev", "##ers", "(", "U", ".", "S", ".", ")", "10", ".", "84", "seconds" ], "ids": [ 122, 119, 87604, 89586, 10901, 113, 158, 119, 156, 119, 114, 10150, 119, 11761, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Gwen", "Torre", "##nce", "(", "U", ".", "S", ".", ")", "11", ".", "00" ], "ids": [ 123, 119, 72748, 20630, 12150, 113, 158, 119, 156, 119, 114, 10193, 119, 11025 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Merle", "##ne", "Otte", "##y", "(", "Jamaica", ")", "11", ".", "04" ], "ids": [ 124, 119, 107844, 10238, 25798, 10157, 113, 32699, 114, 10193, 119, 10814 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Mary", "On", "##yal", "##i", "(", "Nigeria", ")", "11", ".", "09" ], "ids": [ 125, 119, 12176, 10576, 30024, 10116, 113, 22045, 114, 10193, 119, 11035 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Chr", "##yst", "##e", "Ga", "##ines", "(", "U", ".", "S", ".", ")", "11", ".", "18" ], "ids": [ 126, 119, 18787, 62769, 10112, 69699, 19742, 113, 158, 119, 156, 119, 114, 10193, 119, 10218 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Z", "##hanna", "Pin", "##tuse", "##vich", "(", "Ukraine", ")", "11", ".", "27" ], "ids": [ 127, 119, 163, 98643, 74325, 77518, 48190, 113, 19883, 114, 10193, 119, 10365 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Irina", "Pri", "##valo", "##va", "(", "Russia", ")", "11", ".", "28" ], "ids": [ 128, 119, 60862, 30797, 30612, 10362, 113, 14664, 114, 10193, 119, 10348 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Natalia", "Vor", "##ono", "##va", "(", "Russia", ")", "11", ".", "28" ], "ids": [ 129, 119, 51946, 28099, 12507, 10362, 113, 14664, 114, 10193, 119, 10348 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Juliet", "Cut", "##h", "##bert", "(", "Jamaica", ")", "11", ".", "31" ], "ids": [ 130, 119, 60980, 51275, 10237, 18072, 113, 32699, 114, 10193, 119, 10413 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "1", ",", "500", "metres" ], "ids": [ 13536, 112, 187, 122, 117, 10757, 16393 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Regina", "Jacobs", "(", "U", ".", "S", ".", ")", "4", "minutes", "01", ".", "77", "seconds" ], "ids": [ 122, 119, 28381, 41981, 113, 158, 119, 156, 119, 114, 125, 15304, 10669, 119, 12527, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Patricia", "D", "##jat", "##e", "(", "France", ")", "4", ":", "02", ".", "26" ], "ids": [ 123, 119, 26751, 141, 21757, 10112, 113, 10688, 114, 125, 131, 10983, 119, 10314 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Carla", "Sacramento", "(", "Portugal", ")", "4", ":", "02", ".", "67" ], "ids": [ 124, 119, 41845, 43073, 113, 12939, 114, 125, 131, 10983, 119, 12316 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Ye", "##kate", "##rina", "Pod", "##kop", "##aye", "##va", "(", "Russia", ")", "4", ":", "04", ".", "78" ], "ids": [ 125, 119, 20567, 82574, 21442, 23319, 46392, 56621, 10362, 113, 14664, 114, 125, 131, 10814, 119, 12492 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Mar", "##gret", "Crowley", "(", "Australia", ")", "4", ":", "05", ".", "00" ], "ids": [ 126, 119, 15734, 97309, 87019, 113, 11729, 114, 125, 131, 10831, 119, 11025 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Lea", "##h", "Pel", "##ls", "(", "Canada", ")", "4", ":", "05", ".", "64" ], "ids": [ 127, 119, 46231, 10237, 75056, 11747, 113, 11635, 114, 125, 131, 10831, 119, 11295 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Sarah", "Thor", "##sett", "(", "U", ".", "S", ".", ")", "4", ":", "06", ".", "80" ], "ids": [ 128, 119, 16548, 36524, 36767, 113, 158, 119, 156, 119, 114, 125, 131, 10719, 119, 10832 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Sin", "##ead", "Del", "##ahun", "##ty", "(", "Ireland", ")", "4", ":", "07", ".", "27" ], "ids": [ 129, 119, 14563, 30297, 15973, 108702, 11195, 113, 14637, 114, 125, 131, 10878, 119, 10365 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ",", "000", "metres", "steep", "##lech", "##ase" ], "ids": [ 124, 117, 10259, 16393, 102718, 39699, 16896 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Joseph", "Ke", "##ter", "(", "Kenya", ")", "8", "minutes", "10", ".", "02", "seconds" ], "ids": [ 122, 119, 11379, 47124, 10877, 113, 19686, 114, 129, 15304, 10150, 119, 10983, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Patrick", "Sang", "(", "Kenya", ")", "8", ":", "12", ".", "04" ], "ids": [ 123, 119, 13867, 31099, 113, 19686, 114, 129, 131, 10186, 119, 10814 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Moses", "Ki", "##pta", "##nu", "##i", "(", "Kenya", ")", "8", ":", "12", ".", "65" ], "ids": [ 124, 119, 36756, 28941, 23122, 11147, 10116, 113, 19686, 114, 129, 131, 10186, 119, 10843 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Gideon", "Chi", "##rch", "##ir", "(", "Kenya", ")", "8", ":", "15", ".", "69" ], "ids": [ 125, 119, 96568, 21946, 24030, 10835, 113, 19686, 114, 129, 131, 10208, 119, 12573 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Richard", "Ko", "##sg", "##ei", "(", "Kenya", ")", "8", ":", "16", ".", "80" ], "ids": [ 126, 119, 11118, 30186, 84105, 11998, 113, 19686, 114, 129, 131, 10250, 119, 10832 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "La", "##rb", "##i", "El", "K", "##hat", "##tab", "##i", "(", "Morocco", ")", "8", ":", "17", ".", "29" ], "ids": [ 127, 119, 10159, 50579, 10116, 10224, 148, 19180, 33051, 10116, 113, 57295, 114, 129, 131, 10273, 119, 10386 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Eli", "##ud", "Barn", "##get", "##uny", "(", "Kenya", ")", "8", ":", "17", ".", "66" ], "ids": [ 128, 119, 51243, 11679, 61802, 14908, 40484, 113, 19686, 114, 129, 131, 10273, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Bernard", "Bar", "##masa", "##i", "(", "Kenya", ")", "8", ":", "17", ".", "94" ], "ids": [ 129, 119, 14450, 20698, 110567, 10116, 113, 19686, 114, 129, 131, 10273, 119, 12749 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "400", "metres" ], "ids": [ 13026, 112, 187, 11176, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Michael", "Johnson", "(", "U", ".", "S", ".", ")", "44", ".", "29", "seconds" ], "ids": [ 122, 119, 10631, 13241, 113, 158, 119, 156, 119, 114, 11126, 119, 10386, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Derek", "Mills", "(", "U", ".", "S", ".", ")", "44", ".", "78" ], "ids": [ 123, 119, 30815, 29250, 113, 158, 119, 156, 119, 114, 11126, 119, 12492 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Ant", "##hua", "##n", "May", "##bank", "(", "U", ".", "S", ".", ")", "44", ".", "92" ], "ids": [ 124, 119, 40328, 67929, 10115, 10725, 20583, 113, 158, 119, 156, 119, 114, 11126, 119, 12458 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Davis", "Ka", "##mo", "##ga", "(", "Uganda", ")", "44", ".", "96" ], "ids": [ 125, 119, 14281, 25444, 11033, 10483, 113, 29675, 114, 11126, 119, 12308 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Jamie", "Bau", "##lch", "(", "Britain", ")", "45", ".", "08" ], "ids": [ 126, 119, 27504, 18727, 93049, 113, 16032, 114, 10827, 119, 11052 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Sunday", "Bad", "##a", "(", "Nigeria", ")", "45", ".", "21" ], "ids": [ 127, 119, 19731, 14027, 10113, 113, 22045, 114, 10827, 119, 10296 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Samson", "Kit", "##ur", "(", "Kenya", ")", "45", ".", "34" ], "ids": [ 128, 119, 63350, 45301, 10546, 113, 19686, 114, 10827, 119, 11069 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Mark", "Richardson", "(", "Britain", ")", "45", ".", "67" ], "ids": [ 129, 119, 11997, 29188, 113, 16032, 114, 10827, 119, 12316 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Jason", "R", "##ouse", "##r", "(", "U", ".", "S", ".", ")", "46", ".", "11" ], "ids": [ 130, 119, 16796, 155, 36202, 10129, 113, 158, 119, 156, 119, 114, 11528, 119, 10193 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "200", "metres" ], "ids": [ 13026, 112, 187, 10777, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Frankie", "Frederick", "##s", "(", "Namibia", ")", "19", ".", "92", "seconds" ], "ids": [ 122, 119, 51059, 17132, 10107, 113, 46670, 114, 10270, 119, 12458, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "At", "##o", "Bold", "##on", "(", "Trinidad", ")", "19", ".", "99" ], "ids": [ 123, 119, 11699, 10133, 87457, 10263, 113, 31327, 114, 10270, 119, 12187 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Jeff", "Williams", "(", "U", ".", "S", ".", ")", "20", ".", "21" ], "ids": [ 124, 119, 17218, 12494, 113, 158, 119, 156, 119, 114, 10197, 119, 10296 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Jon", "Drummond", "(", "U", ".", "S", ".", ")", "20", ".", "42" ], "ids": [ 125, 119, 17749, 90452, 113, 158, 119, 156, 119, 114, 10197, 119, 11276 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Patrick", "Stevens", "(", "Belgium", ")", "20", ".", "42" ], "ids": [ 126, 119, 13867, 24593, 113, 26519, 114, 10197, 119, 11276 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Michael", "Marsh", "(", "U", ".", "S", ".", ")", "20", ".", "43" ], "ids": [ 127, 119, 10631, 41324, 113, 158, 119, 156, 119, 114, 10197, 119, 11370 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Ivan", "Garcia", "(", "Cuba", ")", "20", ".", "45" ], "ids": [ 128, 119, 15631, 26585, 113, 17226, 114, 10197, 119, 10827 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Eric", "W", "##yme", "##ers", "##ch", "(", "Belgium", ")", "20", ".", "84" ], "ids": [ 129, 119, 14057, 160, 55460, 10901, 10269, 113, 26519, 114, 10197, 119, 11761 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Lam", "##ont", "Smith", "(", "U", ".", "S", ".", ")", "21", ".", "08" ], "ids": [ 130, 119, 44068, 18999, 11673, 113, 158, 119, 156, 119, 114, 10296, 119, 11052 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "1", ",", "000", "metres" ], "ids": [ 13536, 112, 187, 122, 117, 10259, 16393 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Svetlana", "Master", "##kova", "(", "Russia", ")", "2", "minutes", "28", ".", "98", "seconds" ], "ids": [ 122, 119, 105062, 14612, 61653, 113, 14664, 114, 123, 15304, 10348, 119, 12327, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "world", "record", ")" ], "ids": [ 113, 11356, 12410, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Maria", "Mu", "##tola", "(", "Mozambique", ")", "2", ":", "29", ".", "66" ], "ids": [ 123, 119, 11066, 49056, 78814, 113, 61380, 114, 123, 131, 10386, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Mal", "##gor", "##zata", "R", "##yd", "##z", "(", "Poland", ")", "2", ":", "39", ".", "00" ], "ids": [ 124, 119, 18076, 28025, 31392, 155, 18659, 10305, 113, 17879, 114, 123, 131, 11303, 119, 11025 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "An", "##ja", "Sm", "##old", "##ers", "(", "Belgium", ")", "2", ":", "43", ".", "06" ], "ids": [ 125, 119, 10313, 10320, 41922, 33860, 10901, 113, 26519, 114, 123, 131, 11370, 119, 10719 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Ve", "##er", "##le", "De", "Jae", "##ghe", "##re", "(", "Belgium", ")", "2", ":", "43", ".", "18" ], "ids": [ 126, 119, 19561, 10165, 10284, 10190, 81545, 61069, 10246, 113, 26519, 114, 123, 131, 11370, 119, 10218 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Eleonora", "Be", "##rland", "##a", "(", "Italy", ")", "2", ":", "43", ".", "44" ], "ids": [ 127, 119, 67460, 14321, 68142, 10113, 113, 11619, 114, 123, 131, 11370, 119, 11126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Anne", "##ke", "Matt", "##hi", "##js", "(", "Belgium", ")", "2", ":", "43", ".", "82" ], "ids": [ 128, 119, 13490, 10550, 16975, 11924, 22501, 113, 26519, 114, 123, 131, 11370, 119, 12180 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Jacqueline", "Martin", "(", "Spain", ")", "2", ":", "44", ".", "22" ], "ids": [ 129, 119, 42237, 11235, 113, 16149, 114, 123, 131, 11126, 119, 10306 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "200", "metres" ], "ids": [ 13536, 112, 187, 10777, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Mary", "On", "##yal", "##i", "(", "Nigeria", ")", "22", ".", "42", "seconds" ], "ids": [ 122, 119, 12176, 10576, 30024, 10116, 113, 22045, 114, 10306, 119, 11276, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Inge", "##r", "Miller", "(", "U", ".", "S", ".", ")", "22", ".", "66" ], "ids": [ 123, 119, 74143, 10129, 14615, 113, 158, 119, 156, 119, 114, 10306, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Irina", "Pri", "##valo", "##va", "(", "Russia", ")", "22", ".", "68" ], "ids": [ 124, 119, 60862, 30797, 30612, 10362, 113, 14664, 114, 10306, 119, 12370 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Natalia", "Vor", "##ono", "##va", "(", "Russia", ")", "22", ".", "73" ], "ids": [ 125, 119, 51946, 28099, 12507, 10362, 113, 14664, 114, 10306, 119, 12545 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Marina", "Tra", "##nden", "##kova", "(", "Russia", ")", "22", ".", "84" ], "ids": [ 126, 119, 18753, 21469, 16212, 61653, 113, 14664, 114, 10306, 119, 11761 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Chandra", "St", "##ur", "##rup", "(", "Bahamas", ")", "22", ".", "85" ], "ids": [ 127, 119, 67169, 10838, 10546, 36660, 113, 64534, 114, 10306, 119, 12017 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Zu", "##ndra", "Fe", "##agi", "##n", "(", "U", ".", "S", ".", ")", "23", ".", "18" ], "ids": [ 128, 119, 16229, 50201, 20187, 27788, 10115, 113, 158, 119, 156, 119, 114, 10328, 119, 10218 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Gal", "##ina", "Mal", "##chu", "##gina", "(", "Russia", ")", "23", ".", "25" ], "ids": [ 129, 119, 66676, 11067, 18076, 22882, 24769, 113, 14664, 114, 10328, 119, 10258 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "400", "metres" ], "ids": [ 13536, 112, 187, 11176, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Cathy", "Freeman", "(", "Australia", ")", "49", ".", "48", "seconds" ], "ids": [ 122, 119, 88672, 33044, 113, 11729, 114, 11580, 119, 11300, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Marie", "-", "Jose", "Pere", "##c", "(", "France", ")", "49", ".", "72" ], "ids": [ 123, 119, 11834, 118, 23029, 33511, 10350, 113, 10688, 114, 11580, 119, 12120 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Fa", "##lila", "##t", "Og", "##unk", "##oya", "(", "Nigeria", ")", "49", ".", "97" ], "ids": [ 124, 119, 44271, 81523, 10123, 69519, 33551, 51814, 113, 22045, 114, 11580, 119, 12328 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Pauline", "Davis", "(", "Bahamas", ")", "50", ".", "14" ], "ids": [ 125, 119, 45533, 14281, 113, 64534, 114, 10462, 119, 10247 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Fat", "##ima", "Yu", "##ssu", "##f", "(", "Nigeria", ")", "50", ".", "14" ], "ids": [ 126, 119, 48803, 12443, 19387, 102670, 10575, 113, 22045, 114, 10462, 119, 10247 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Mai", "##cel", "Malone", "(", "U", ".", "S", ".", ")", "50", ".", "51" ], "ids": [ 127, 119, 11784, 32942, 69614, 113, 158, 119, 156, 119, 114, 10462, 119, 11524 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Hana", "Ben", "##eso", "##va", "(", "Czech", "Republic", ")", "51", ".", "71" ], "ids": [ 128, 119, 68692, 13304, 41939, 10362, 113, 22148, 13681, 114, 11524, 119, 12513 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Ann", "Mer", "##cken", "(", "Belgium", ")", "53", ".", "55" ], "ids": [ 129, 119, 15879, 10734, 21181, 113, 26519, 114, 11756, 119, 11358 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "3", ",", "000", "metres" ], "ids": [ 13026, 112, 187, 124, 117, 10259, 16393 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Daniel", "Kom", "##en", "(", "Kenya", ")", "7", "minutes", "25", ".", "87", "seconds" ], "ids": [ 122, 119, 11792, 106306, 10136, 113, 19686, 114, 128, 15304, 10258, 119, 12581, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Khalid", "Bou", "##lami", "(", "Morocco", ")", "7", ":", "31", ".", "65" ], "ids": [ 123, 119, 86090, 62583, 80761, 113, 57295, 114, 128, 131, 10413, 119, 10843 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Bob", "Kennedy", "(", "U", ".", "S", ".", ")", "7", ":", "31", ".", "69" ], "ids": [ 124, 119, 13583, 17817, 113, 158, 119, 156, 119, 114, 128, 131, 10413, 119, 12573 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "El", "Hassan", "##e", "La", "##hs", "##sini", "(", "Morocco", ")", "7", ":", "32", ".", "44" ], "ids": [ 125, 119, 10224, 35004, 10112, 10159, 22394, 25506, 113, 57295, 114, 128, 131, 10842, 119, 11126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Thomas", "Nya", "##rik", "##i", "(", "Kenya", ")", "7", ":", "35", ".", "56" ], "ids": [ 126, 119, 11096, 42541, 15914, 10116, 113, 19686, 114, 128, 131, 10803, 119, 11628 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Nou", "##red", "##dine", "Mor", "##celi", "(", "Algeria", ")", "7", ":", "36", ".", "81" ], "ids": [ 127, 119, 49767, 15711, 39973, 61695, 91461, 113, 43776, 114, 128, 131, 11055, 119, 12324 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Fi", "##ta", "Bay", "##esa", "(", "Ethiopia", ")", "7", ":", "38", ".", "09" ], "ids": [ 128, 119, 36448, 10213, 13146, 18109, 113, 49281, 114, 128, 131, 11171, 119, 11035 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Martin", "Kei", "##no", "(", "Kenya", ")", "7", ":", "38", ".", "88" ], "ids": [ 129, 119, 11235, 103883, 10343, 113, 19686, 114, 128, 131, 11171, 119, 12074 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "discu", "##s" ], "ids": [ 13026, 112, 187, 110076, 10107 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Lars", "R", "##iede", "##l", "(", "Germany", ")", "66", ".", "74", "metres" ], "ids": [ 122, 119, 21574, 155, 92711, 10161, 113, 12775, 114, 12215, 119, 12535, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Anthony", "Washington", "(", "U", ".", "S", ".", ")", "66", ".", "72" ], "ids": [ 123, 119, 14751, 11586, 113, 158, 119, 156, 119, 114, 12215, 119, 12120 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Vladimir", "Dub", "##rov", "##sh", "##chi", "##k", "(", "Belarus", ")", "64", ".", "02" ], "ids": [ 124, 119, 18124, 51536, 23229, 13264, 12806, 10174, 113, 55131, 114, 11295, 119, 10983 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Virgil", "##ius", "Ale", "##kna", "(", "Lithuania", ")", "63", ".", "62" ], "ids": [ 125, 119, 82381, 11827, 59340, 46364, 113, 57377, 114, 12256, 119, 12066 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Ju", "##erg", "##en", "Sc", "##hul", "##t", "(", "Germany", ")", "63", ".", "48" ], "ids": [ 126, 119, 45031, 69248, 10136, 55260, 45624, 10123, 113, 12775, 114, 12256, 119, 11300 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Vas", "##sili", "##y", "Kap", "##ty", "##uk", "##h", "(", "Belarus", ")", "61", ".", "80" ], "ids": [ 127, 119, 98242, 70120, 10157, 68634, 11195, 13013, 10237, 113, 55131, 114, 12314, 119, 10832 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Va", "##cla", "##vas", "Kid", "##ikas", "(", "Lithuania", ")", "60", ".", "92" ], "ids": [ 128, 119, 14723, 60582, 14139, 25867, 73615, 113, 57377, 114, 10709, 119, 12458 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Michael", "Moll", "##en", "##beck", "(", "Germany", ")", "59", ".", "24" ], "ids": [ 129, 119, 10631, 72447, 10136, 32312, 113, 12775, 114, 11867, 119, 10233 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "triple", "jump" ], "ids": [ 13026, 112, 187, 40159, 54941 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Jonathan", "Edwards", "(", "Britain", ")", "17", ".", "50", "metres" ], "ids": [ 122, 119, 16395, 17263, 113, 16032, 114, 10273, 119, 10462, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Yo", "##el", "##vis", "Que", "##sada", "(", "Cuba", ")", "17", ".", "29" ], "ids": [ 123, 119, 30665, 10570, 13844, 27158, 33083, 113, 17226, 114, 10273, 119, 10386 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Brian", "Well", "##man", "(", "Bermuda", ")", "17", ".", "05" ], "ids": [ 124, 119, 13977, 37025, 10589, 113, 65295, 114, 10273, 119, 10831 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Kenny", "Harrison", "(", "U", ".", "S", ".", ")", "16", ".", "97" ], "ids": [ 125, 119, 30002, 19845, 113, 158, 119, 156, 119, 114, 10250, 119, 12328 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Gen", "##nadi", "Marko", "##v", "(", "Russia", ")", "16", ".", "66" ], "ids": [ 126, 119, 32560, 56293, 41337, 10477, 113, 14664, 114, 10250, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Francis", "A", "##gye", "##pon", "##g", "(", "Britain", ")", "16", ".", "63" ], "ids": [ 127, 119, 13738, 138, 105992, 27119, 10240, 113, 16032, 114, 10250, 119, 12256 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "R", "##oge", "##l", "Nach", "##um", "(", "Israel", ")", "16", ".", "36" ], "ids": [ 128, 119, 155, 32241, 10161, 11505, 10465, 113, 12991, 114, 10250, 119, 11055 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Sigurd", "N", "##jer", "##ve", "(", "Norway", ")", "16", ".", "35" ], "ids": [ 129, 119, 73661, 151, 17792, 10612, 113, 22582, 114, 10250, 119, 10803 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "1", ",", "500", "metres" ], "ids": [ 13026, 112, 187, 122, 117, 10757, 16393 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Hi", "##cha", "##m", "El", "G", "##uer", "##rou", "##j", "(", "Morocco", ")", "three", "minutes", "29", ".", "05", "seconds" ], "ids": [ 122, 119, 20065, 12964, 10147, 10224, 144, 19047, 20217, 10418, 113, 57295, 114, 11003, 15304, 10386, 119, 10831, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Isaac", "Vic", "##iosa", "(", "Spain", ")", "3", ":", "33", ".", "00" ], "ids": [ 123, 119, 21639, 39574, 51122, 113, 16149, 114, 124, 131, 11000, 119, 11025 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "William", "Tan", "##ui", "(", "Kenya", ")", "3", ":", "33", ".", "36" ], "ids": [ 124, 119, 10694, 30594, 11990, 113, 19686, 114, 124, 131, 11000, 119, 11055 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Elijah", "Mar", "##u", "(", "Kenya", ")", "3", ":", "33", ".", "64" ], "ids": [ 125, 119, 103460, 15734, 10138, 113, 19686, 114, 124, 131, 11000, 119, 11295 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Marcus", "O", "'", "Sullivan", "(", "Ireland", ")", "3", ":", "33", ".", "77" ], "ids": [ 126, 119, 15818, 152, 112, 23476, 113, 14637, 114, 124, 131, 11000, 119, 12527 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "John", "Mayo", "##ck", "(", "Britain", ")", "3", ":", "33", ".", "94" ], "ids": [ 127, 119, 10421, 24611, 11263, 113, 16032, 114, 124, 131, 11000, 119, 12749 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Laba", "##n", "Rot", "##ich", "(", "Kenya", ")", "3", ":", "34", ".", "12" ], "ids": [ 128, 119, 88739, 10115, 56115, 14401, 113, 19686, 114, 124, 131, 11069, 119, 10186 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Christophe", "Im", "##pens", "(", "Belgium", ")", "3", ":", "34", ".", "13" ], "ids": [ 129, 119, 31051, 10796, 76130, 113, 26519, 114, 124, 131, 11069, 119, 10249 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "high", "jump" ], "ids": [ 13536, 112, 187, 11846, 54941 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "St", "##ef", "##ka", "Ko", "##stad", "##ino", "##va", "(", "Bulgaria", ")", "2", ".", "03", "metres" ], "ids": [ 122, 119, 10838, 16822, 10371, 30186, 20559, 12349, 10362, 113, 21935, 114, 123, 119, 10907, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Inga", "Baba", "##kova", "(", "Ukraine", ")", "2", ".", "03" ], "ids": [ 123, 119, 10958, 36364, 61653, 113, 19883, 114, 123, 119, 10907 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Ali", "##na", "As", "##ta", "##fe", "##i", "(", "Germany", ")", "1", ".", "97" ], "ids": [ 124, 119, 13518, 10219, 10882, 10213, 14601, 10116, 113, 12775, 114, 122, 119, 12328 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Tat", "##yana", "Mot", "##kova", "(", "Russia", ")", "1", ".", "94" ], "ids": [ 125, 119, 86561, 31523, 97736, 61653, 113, 14664, 114, 122, 119, 12749 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Svetlana", "Za", "##lev", "##ska", "##ya", "(", "Kazakhstan", ")", "1", ".", "91" ], "ids": [ 126, 119, 105062, 14074, 34271, 11485, 10679, 113, 43593, 114, 122, 119, 12519 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Ye", "##lena", "G", "##ul", "##ya", "##yev", "##a", "(", "Russia", ")", "1", ".", "88" ], "ids": [ 127, 119, 20567, 52907, 144, 10604, 10679, 24919, 10113, 113, 14664, 114, 122, 119, 12074 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Hanna", "Ha", "##ug", "##land", "(", "Norway", ")", "1", ".", "88" ], "ids": [ 128, 119, 35609, 13740, 19951, 11080, 113, 22582, 114, 122, 119, 12074 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", "equal", "." ], "ids": [ 129, 32943, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Olga", "Bos", "##hov", "##a", "(", "Moldova", ")", "1", ".", "85" ], "ids": [ 28890, 86792, 67238, 10113, 113, 29733, 114, 122, 119, 12017 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", "equal", "." ], "ids": [ 129, 32943, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Nel", "##e", "Zi", "##lins", "##kien", "##e", "(", "Lithuania", ")", "1", ".", "85" ], "ids": [ 11137, 10112, 99890, 68541, 45531, 10112, 113, 57377, 114, 122, 119, 12017 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "10", ",", "000", "metres" ], "ids": [ 13026, 112, 187, 10150, 117, 10259, 16393 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Salah", "His", "##sou", "(", "Morocco", ")", "26", "minutes", "38", ".", "08", "seconds", "(", "world" ], "ids": [ 122, 119, 44581, 11597, 44756, 113, 57295, 114, 10314, 15304, 11171, 119, 11052, 34290, 113, 11356 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "record", ")" ], "ids": [ 12410, 114 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "2", ".", "Paul", "Ter", "##gat", "(", "Kenya", ")", "26", ":", "54", ".", "41" ], "ids": [ 123, 119, 10772, 65272, 27107, 113, 19686, 114, 10314, 131, 11653, 119, 11349 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Paul", "Ko", "##ech", "(", "Kenya", ")", "26", ":", "56", ".", "78" ], "ids": [ 124, 119, 10772, 30186, 16200, 113, 19686, 114, 10314, 131, 11628, 119, 12492 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "William", "Ki", "##pt", "##um", "(", "Kenya", ")", "27", ":", "18", ".", "84" ], "ids": [ 125, 119, 10694, 28941, 14971, 10465, 113, 19686, 114, 10365, 131, 10218, 119, 11761 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Al", "##oy", "##s", "Ni", "##zig", "##ama", "(", "Burundi", ")", "27", ":", "25", ".", "13" ], "ids": [ 126, 119, 10883, 20712, 10107, 30409, 36215, 15149, 113, 57824, 114, 10365, 131, 10258, 119, 10249 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Mathias", "N", "##taw", "##uli", "##kura", "(", "Rwanda", ")", "27", ":", "25", ".", "48" ], "ids": [ 127, 119, 50662, 151, 108659, 24207, 96858, 113, 57557, 114, 10365, 131, 10258, 119, 11300 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Abel", "Anton", "(", "Spain", ")", "28", ":", "18", ".", "44" ], "ids": [ 128, 119, 33359, 16242, 113, 16149, 114, 10348, 131, 10218, 119, 11126 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Kami", "##el", "Maas", "##e", "(", "Netherlands", ")", "28", ".", "29", ".", "42" ], "ids": [ 129, 119, 87966, 10570, 62383, 10112, 113, 22043, 114, 10348, 119, 10386, 119, 11276 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Work", "##u", "Be", "##kil", "##a", "(", "Ethiopia", ")", "28", ".", "42", ".", "23" ], "ids": [ 130, 119, 25641, 10138, 14321, 67365, 10113, 113, 49281, 114, 10348, 119, 11276, 119, 10328 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Robert", "St", "##ef", "##ko", "(", "Slovakia", ")", "28", ":", "42", ".", "26" ], "ids": [ 10150, 119, 10820, 10838, 16822, 10440, 113, 43031, 114, 10348, 131, 11276, 119, 10314 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "J", "##OR", "##GE", "CA", "##LL", "##S", "UP", "SI", "##X", "P", "##OR", "##TO", "PL", "##A", "##Y", "##ER", "##S", "FOR", "WORLD", "C", "##UP", "Q", "##U", "##AL", "##IF", "##IE", "##R", "." ], "ids": [ 71020, 65622, 24093, 118, 147, 42622, 58719, 24707, 82834, 10731, 53197, 39675, 12674, 153, 42622, 60493, 71341, 10738, 14703, 24093, 10731, 109544, 67376, 140, 57487, 154, 12022, 32002, 53668, 71655, 11273, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##B", "##ON", "1996", "-", "08", "-", "23" ], "ids": [ 149, 19088, 11274, 30118, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portugal", "'", "s", "new", "coach", "Artur", "Jorge", "called", "up", "six", "players", "from", "league", "champions", "Porto", "on", "Friday", "in", "an", "18", "-", "man", "squad", "for", "the", "opening", "World", "Cup", "qualifier", "against", "Armenia", "on", "August", "31", "." ], "ids": [ 12939, 112, 187, 10751, 15701, 41469, 16172, 11552, 10741, 12449, 16021, 10188, 15616, 27745, 16408, 10135, 30767, 10106, 10151, 10218, 118, 10817, 30580, 10142, 10105, 17975, 10315, 11544, 96076, 11327, 24719, 10135, 10735, 10413, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Mid", "##field", "##er", "Paulo", "Sousa", ",", "recently", "transferred", "to", "Borussia", "Dortmund", "from", "Italy", "'", "s", "Juventus", ",", "is", "the", "only", "leading", "member", "of", "the", "Portuguese", "side", "from", "this", "year", "'", "s", "European", "championships", "who", "will", "not", "make", "the", "trip", "." ], "ids": [ 42234, 13408, 10165, 13360, 46459, 117, 23746, 23192, 10114, 48007, 33962, 10188, 11619, 112, 187, 33176, 117, 10124, 10105, 10893, 16018, 12008, 10108, 10105, 25550, 12250, 10188, 10531, 10924, 112, 187, 11914, 47211, 10479, 11337, 10472, 13086, 10105, 37307, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 3, 7, 9, 1, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "will", "be", "Jorge", "'", "s", "first", "game", "in", "charge", "of", "the", "national", "squad", "since", "taking", "over", "from", "Antonio", "Oliveira", ",", "who", "now", "coaches", "Porto", ",", "at", "the", "end", "of", "Euro", "96", "." ], "ids": [ 10377, 11337, 10347, 16172, 112, 187, 10422, 11661, 10106, 18163, 10108, 10105, 11844, 30580, 11764, 18084, 10491, 10188, 11873, 33748, 117, 10479, 11858, 70246, 16408, 117, 10160, 10105, 11572, 10108, 17526, 12308, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Squad", ":" ], "ids": [ 53150, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Goal", "##keeper", "##s", "-", "Vito", "##r", "Bai", "##a", ",", "Rui", "Cor", "##reia", "." ], "ids": [ 72620, 98767, 10107, 118, 55209, 10129, 85172, 10113, 117, 86230, 93495, 56865, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Def", "##ender", "##s", "-", "Jorge", "Costa", ",", "Pauli", "##nho", "Santos", ",", "Held", "##er", "Cristo", "##vao", ",", "Carlos", "Secretario", ",", "Di", "##mas", "Teixeira", ",", "Fernando", "Co", "##uto", "." ], "ids": [ 77955, 27323, 10107, 118, 16172, 13902, 117, 54583, 47877, 17223, 117, 77764, 10165, 22027, 23991, 117, 12050, 78145, 117, 12944, 12922, 94165, 117, 14022, 13098, 16248, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Mid", "##field", "##ers", "-", "Jose", "Barros", "##o", ",", "Luis", "Fi", "##go", ",", "Rui", "Barros", ",", "Rui", "Costa", ",", "Oceano", "Cruz", ",", "Ricardo", "Sa", "Pinto", "." ], "ids": [ 42234, 13408, 10901, 118, 23029, 73465, 10133, 117, 12816, 36448, 10797, 117, 86230, 73465, 117, 86230, 13902, 117, 86376, 14435, 117, 20261, 12404, 46050, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Forward", "##s", "-", "Domingo", "##s", "Oliveira", ",", "Jo", "##ao", "Vieira", "Pinto", ",", "Jorge", "Ca", "##dete", ",", "Antonio", "F", "##ol", "##ha", "." ], "ids": [ 66387, 10107, 118, 22173, 10107, 33748, 117, 20977, 14875, 68169, 46050, 117, 16172, 26037, 77533, 117, 11873, 143, 11481, 10921, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "V", "##O", "##G", "##TS", "K", "##EE", "##PS", "FA", "##IT", "##H", "W", "##IT", "##H", "EU", "##RO", "'", "96", "CH", "##AM", "##P", "##ION", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 159, 11403, 11447, 36545, 148, 95825, 46983, 20794, 37611, 12396, 160, 37611, 12396, 17751, 35066, 112, 12308, 39774, 36535, 11127, 52980, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trainer", "Bert", "##i", "Vogt", "##s", "kept", "faith", "with", "his", "entire", "European", "championship", "winning", "squad", "for", "Germany", "'", "s", "first", "match", "since", "their", "title", "victory", ",", "a", "friendly", "in", "Poland", "." ], "ids": [ 31964, 42478, 10116, 86628, 10107, 26546, 43148, 10169, 10226, 19192, 11914, 20755, 16542, 30580, 10142, 12775, 112, 187, 10422, 12356, 11764, 10455, 12887, 19735, 117, 169, 43941, 10106, 17879, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Vogt", "##s", "picked", "no", "new", "players", "for", "the", "squad", "for", "the", "September", "4", "game", "in", "Za", "##br", "##ze", "." ], "ids": [ 86628, 10107, 52289, 10192, 10751, 16021, 10142, 10105, 30580, 10142, 10105, 10596, 125, 11661, 10106, 14074, 36867, 10870, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Instead", "on", "Friday", "he", "nominated", "all", "23", "Euro", "'", "96", "veterans", "including", "Bremen", "'", "s", "Jens", "Tod", "##t", ",", "called", "up", "before", "the", "final", "by", "special", "UEFA", "dis", "##pensa", "##tion", "." ], "ids": [ 47556, 10135, 30767, 10261, 25906, 10435, 10328, 17526, 112, 12308, 95320, 11198, 21360, 112, 187, 30780, 16547, 10123, 117, 11552, 10741, 11360, 10105, 11070, 10155, 14478, 13528, 27920, 74599, 10822, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "He", "will", ",", "however", ",", "have", "to", "do", "without", "the", "Dortmund", "trio", "of", "libero", "Matthias", "Samme", "##r", ",", "midfielder", "Steffen", "Freund", "and", "defender", "Rene", "Schneider", ",", "who", "were", "all", "formally", "nominated", "despite", "being", "injured", "." ], "ids": [ 10357, 11337, 117, 13800, 117, 10529, 10114, 10149, 13663, 10105, 33962, 32920, 10108, 51981, 32557, 110636, 10129, 117, 68049, 105873, 42624, 10111, 36426, 91790, 25842, 117, 10479, 10309, 10435, 43082, 25906, 22087, 11223, 36081, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "squad", "is", "currently", "the", "basis", "of", "my", "planning", "for", "the", "1998", "World", "Cup", ",", "\"", "Vogt", "##s", "said", ".", "\"" ], "ids": [ 107, 10747, 30580, 10124, 15313, 10105, 17172, 10108, 15127, 30240, 10142, 10105, 10363, 10315, 11544, 117, 107, 86628, 10107, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "We", "'", "ll", "have", "to", "see", "which", "other", "players", "produce", "good", "league", "performances", "to", "play", "themselves", "into", "the", "squad", ".", "\"" ], "ids": [ 12865, 112, 22469, 10529, 10114, 12888, 10319, 10684, 16021, 17368, 15198, 15616, 22744, 10114, 12253, 20182, 10708, 10105, 30580, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Squad", ":" ], "ids": [ 53150, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Goal", "##keeper", "##s", "-", "Oliver", "Kahn", ",", "Andreas", "Ko", "##ep", "##ke", ",", "Oliver", "Rec", "##k" ], "ids": [ 72620, 98767, 10107, 118, 16875, 60808, 117, 17336, 30186, 19986, 10550, 117, 16875, 97200, 10174 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8 ] }, { "tokens": [ "Def", "##ender", "##s", "-", "Markus", "Bab", "##bel", ",", "Thomas", "Helm", "##er", ",", "Ju", "##erg", "##en", "Kohl", "##er", ",", "Stefan", "Reuter", ",", "Matthias", "Samme", "##r", ",", "Rene", "Schneider" ], "ids": [ 77955, 27323, 10107, 118, 32568, 79015, 13770, 117, 11096, 76973, 10165, 117, 45031, 69248, 10136, 106563, 10165, 117, 17399, 109223, 117, 32557, 110636, 10129, 117, 91790, 25842 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8 ] }, { "tokens": [ "Mid", "##field", "##ers", "-", "Mario", "Bas", "##ler", ",", "Marco", "Bo", "##de", ",", "Dieter", "Ei", "##lts", ",", "Steffen", "Freund", ",", "Thomas", "Ha", "##ess", "##ler", ",", "Andreas", "Moe", "##ller", ",", "Mehmet", "Sc", "##holl", ",", "Thomas", "St", "##run", "##z", ",", "Jens", "Tod", "##t", ",", "Christian", "Zie", "##ge" ], "ids": [ 42234, 13408, 10901, 118, 14011, 21237, 10815, 117, 14160, 27622, 10253, 117, 28896, 35278, 72847, 117, 105873, 42624, 117, 11096, 13740, 22094, 10815, 117, 17336, 80790, 18289, 117, 44833, 55260, 69441, 117, 11096, 10838, 35794, 10305, 117, 30780, 16547, 10123, 117, 11757, 47926, 10525 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8 ] }, { "tokens": [ "Forward", "##s", "-", "Oliver", "Bi", "##er", "##hoff", ",", "Fred", "##i", "Bob", "##ic", ",", "Ju", "##erg", "##en", "K", "##lins", "##mann", ",", "Stefan", "Kun", "##tz", "." ], "ids": [ 66387, 10107, 118, 16875, 31156, 10165, 36425, 117, 16887, 10116, 13583, 11130, 117, 45031, 69248, 10136, 148, 68541, 12350, 117, 17399, 29184, 13695, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EU", "##RO", "##P", "##EA", "##N", "C", "##UP", "DR", "##A", "##WS", "FOR", "AE", "##K", ",", "OL", "##Y", "##MP", "##IA", "##KO", "##S", ",", "PA", "##O", "." ], "ids": [ 71020, 65622, 24093, 118, 17751, 35066, 11127, 36789, 11537, 140, 57487, 45457, 10738, 83143, 109544, 35060, 11733, 117, 19768, 14703, 79936, 35976, 57277, 10731, 117, 32349, 11403, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 3, 7, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "23" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "are", "the", "European", "soccer" ], "ids": [ 18317, 10301, 10105, 11914, 41356 ], "entity": [ "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 2, 9 ] }, { "tokens": [ "draws", "for", "the", "UEFA", "cup", "and", "the", "cup", "'", "s", "winners", "cup", "involving", "Greek" ], "ids": [ 77517, 10142, 10105, 13528, 41506, 10111, 10105, 41506, 112, 187, 33525, 41506, 40368, 15286 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "teams", "that", "took", "place", "today", "in", "Geneva", ":" ], "ids": [ 14404, 10189, 12149, 11192, 18745, 10106, 47244, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "x", "-", "AE", "##K", "Athens", "(", "Greece", ")", "v", "Chem", "##lon", "Hume", "##nne", "(", "Slovakia", ")" ], "ids": [ 192, 118, 35060, 11733, 33765, 113, 25154, 114, 190, 26609, 15709, 64495, 15490, 113, 43031, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 7, 9, 1, 9 ] }, { "tokens": [ "x", "-", "Olympia", "##kos", "v", "Ferenc", "##varo", "##s", "(", "Hungary", ")" ], "ids": [ 192, 118, 39624, 18845, 190, 24932, 77640, 10107, 113, 24601, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9, 1, 9 ] }, { "tokens": [ "x", "-", "PA", "##O", "v", "Le", "##gia", "Warsaw", "(", "Poland", ")" ], "ids": [ 192, 118, 32349, 11403, 190, 10281, 15414, 43669, 113, 17879, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9, 1, 9 ] }, { "tokens": [ "x", "indicates", "seed", "##ed", "teams", "." ], "ids": [ 192, 50239, 49282, 10336, 14404, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Dimitri", "##s", "Ko", "##nto", "##gian", "##nis", ",", "Athens", "News", "##room", "+", "301", "331", "##18", "##12", "-", "4" ], "ids": [ 118, 118, 73589, 10107, 30186, 15088, 38531, 12597, 117, 33765, 12219, 25525, 116, 26224, 30690, 45987, 24747, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EU", "##RO", "CL", "##UB", "COM", "##P", "##ET", "##IT", "##ION", "F", "##IR", "##ST", "R", "##O", "##UN", "##D", "DR", "##A", "##WS", "." ], "ids": [ 71020, 65622, 24093, 118, 17751, 35066, 75151, 82439, 80645, 11127, 52338, 37611, 52980, 143, 73522, 32995, 155, 11403, 69849, 11490, 45457, 10738, 83143, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GE", "##NE", "##VA", "1996", "-", "08", "-", "23" ], "ids": [ 62997, 93280, 47172, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dr", "##aw", "##s", "for", "the", "first", "round", "of", "the", "European", "club", "soccer", "competitions", "made", "on", "Friday", "(", "x", "den", "##otes", "seed", "##ed", "team", ")", ":" ], "ids": [ 11612, 26426, 10107, 10142, 10105, 10422, 13569, 10108, 10105, 11914, 11111, 41356, 44575, 11019, 10135, 30767, 113, 192, 10140, 54989, 49282, 10336, 11121, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "UEFA", "Cup", "Lyn", "##gby", "(", "Denmark", ")", "v", "x", "-", "Club", "Brugge", "(", "Belgium", ")", "Casino", "Graz", "(", "Austria", ")", "v", "Ek", "##eren", "(", "Belgium", ")", "Be", "##sikt", "##as", "(", "Turkey", ")", "v", "Mol", "##en", "##beek", "(", "Belgium", ")", "Alan", "##ia", "Vlad", "##ika", "##vka", "##z", "(", "Russia", ")", "v", "x", "-", "Anderlecht", "(", "Belgium", ")" ], "ids": [ 13528, 11544, 102603, 97019, 113, 25854, 114, 190, 192, 118, 11316, 57847, 113, 26519, 114, 40461, 34288, 113, 14479, 114, 190, 35769, 13653, 113, 26519, 114, 14321, 66931, 10403, 113, 22519, 114, 190, 58895, 10136, 71276, 113, 26519, 114, 14309, 10280, 101895, 13060, 38299, 10305, 113, 14664, 114, 190, 192, 118, 88092, 113, 26519, 114 ], "entity": [ "B-MISC", "I-MISC", "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 2, 6, 3, 7, 9, 1, 9, 9, 3, 7, 7, 7, 9, 1, 9, 3, 7, 9, 1, 9, 9, 3, 7, 9, 1, 9, 3, 7, 7, 9, 1, 9, 9, 3, 7, 7, 9, 1, 9, 3, 7, 7, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 9, 1, 9 ] }, { "tokens": [ "Cup", "Winners", "'", "Cup", "x", "-", "Cercle", "Brugge", "(", "Belgium", ")", "v", "Br", "##ann", "Bergen", "(", "Norway", ")" ], "ids": [ 11544, 34686, 112, 11544, 192, 118, 75154, 57847, 113, 26519, 114, 190, 38508, 20801, 19511, 113, 22582, 114 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 2, 6, 6, 6, 3, 7, 7, 7, 9, 1, 9, 9, 3, 7, 7, 9, 1, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "SR", "##I", "LAN", "##KA", "AND", "AU", "##ST", "##RA", "##L", "##IA", "SA", "##Y", "RE", "##LA", "##TION", "##S", "H", "##AV", "##E", "H", "##EA", "##LE", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 23032, 11281, 94057, 67813, 52428, 29088, 32995, 29990, 11369, 35976, 21318, 14703, 71033, 44376, 98207, 10731, 145, 99903, 11259, 145, 36789, 51036, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "23" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sri", "Lanka", "and", "Australia", "agreed", "on", "Friday", "that", "relations", "between", "the", "two", "teams", "had", "he", "##ale", "##d", "since", "the", "Sri", "Lanka", "##ns", "'", "ac", "##rimo", "##nio", "##us", "tour", "last", "year", "." ], "ids": [ 16098, 20828, 10111, 11729, 25577, 10135, 30767, 10189, 19824, 10948, 10105, 10551, 14404, 10374, 10261, 12223, 10162, 11764, 10105, 16098, 20828, 10891, 112, 13621, 91711, 16369, 10251, 12842, 12469, 10924, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Sri", "Lanka", "##ns", "were", "first", "found", "guilty", "then", "cleared", "of", "ball", "tam", "##peri", "##ng", "and", "off", "-", "spin", "##ner", "Mu", "##tti", "##ah", "Mur", "##ali", "##tha", "##ran", "was", "called", "for", "throwing", "during", "a", "controversial", "three", "-", "test", "series", "in", "Australia", "." ], "ids": [ 10117, 16098, 20828, 10891, 10309, 10422, 11823, 56044, 11059, 90076, 10108, 20724, 14918, 69692, 10376, 10111, 11898, 118, 30428, 11129, 49056, 12683, 12257, 103192, 13133, 25388, 12111, 10134, 11552, 10142, 110039, 10939, 169, 45475, 11003, 118, 15839, 11366, 10106, 11729, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "Our", "concern", "is", "to", "get", "out", "there", "and", "play", "proper", "cricket", ",", "\"", "Sri", "Lanka", "captain", "Ar", "##juna", "Rana", "##tung", "##a", "told", "a", "news", "conference", "on", "the", "ev", "##e", "of", "a", "warm", "##up", "match", "between", "the", "World", "Cup", "champions", "and", "a", "World", "XI", "team", "scheduled", "for", "Saturday", "." ], "ids": [ 107, 18465, 43607, 10124, 10114, 15329, 10950, 11155, 10111, 12253, 34286, 32289, 117, 107, 16098, 20828, 28157, 18484, 93748, 60970, 23091, 10113, 21937, 169, 14424, 25029, 10135, 10105, 38034, 10112, 10108, 169, 50089, 14590, 12356, 10948, 10105, 10315, 11544, 27745, 10111, 169, 10315, 14627, 11121, 34081, 10142, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "What", "happened", "is", "history", ".", "\"" ], "ids": [ 107, 12489, 44936, 10124, 11486, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australian", "team", "manager", "Cam", "Bat", "##ters", "##by", "said", "he", "agreed", "with", "Rana", "##tung", "##a", "." ], "ids": [ 12829, 11121, 16935, 68820, 62949, 21891, 11530, 12415, 10261, 25577, 10169, 60970, 23091, 10113, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "\"", "I", "believe", "relations", "between", "the", "two", "teams", "will", "be", "excellent", ",", "\"", "Bat", "##ter", "##by", "said", "." ], "ids": [ 107, 146, 30587, 19824, 10948, 10105, 10551, 14404, 11337, 10347, 50337, 117, 107, 62949, 10877, 11530, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "The", "Australian", "##s", "are", "making", "their", "first", "visit", "to", "the", "Indian", "Ocean", "island", "since", "boy", "##cott", "##ing", "a", "World", "Cup", "fi", "##xt", "##ure", "in", "February", "after", "a", "terrorist", "bomb", "in", "Colombo", "." ], "ids": [ 10117, 12829, 10107, 10301, 14293, 10455, 10422, 27541, 10114, 10105, 12544, 20500, 17354, 11764, 26905, 48426, 10230, 169, 10315, 11544, 14045, 28883, 12101, 10106, 11508, 10662, 169, 76482, 41654, 10106, 40367, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Australia", "have", "been", "promised", "the", "presence", "of", "command", "##os", ",", "s", "##ni", "##ffer", "dogs", "and", "plain", "##clo", "##thes", "police", "##men", "to", "ensure", "a", "limited", "over", "##s", "tournament", "is", "trouble", "-", "free", "." ], "ids": [ 11729, 10529, 10590, 77137, 10105, 25599, 10108, 20818, 10310, 117, 187, 10342, 22888, 67968, 10111, 62020, 63143, 50167, 15034, 11418, 10114, 40781, 169, 19264, 10491, 10107, 17390, 10124, 58285, 118, 13961, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tournament", ",", "starting", "on", "August", "26", ",", "also", "includes", "India", "and", "Zimbabwe", "." ], "ids": [ 10117, 17390, 117, 21868, 10135, 10735, 10314, 117, 10379, 15433, 11098, 10111, 34577, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Bat", "##ters", "##by", "said", "he", "was", "sat", "##isfied", "with", "the", "security", "arrangements", "." ], "ids": [ 62949, 21891, 11530, 12415, 10261, 10134, 20694, 108813, 10169, 10105, 21849, 56449, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sri", "Lanka", "##n", "officials", "said", "they", "expected", "heavy", "rain", "which", "was", "##hed", "out", "a", "warm", "##up", "match", "on", "Friday", "should", "cea", "##se", "by", "Saturday", "." ], "ids": [ 16098, 20828, 10115, 27730, 12415, 10689, 25973, 18296, 50939, 10319, 10134, 16081, 10950, 169, 50089, 14590, 12356, 10135, 30767, 14819, 25578, 10341, 10155, 24848, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", ",", "led", "by", "wi", "##cket", "##keeper", "Ian", "He", "##aly", ",", "opened", "their", "short", "tour", "of", "Sri", "Lanka", "with", "a", "five", "-", "run", "win", "over", "the", "country", "'", "s", "youth", "team", "on", "Thursday", "." ], "ids": [ 11729, 117, 12857, 10155, 23040, 28721, 98767, 16582, 10357, 55826, 117, 14377, 10455, 13716, 12842, 10108, 16098, 20828, 10169, 169, 12403, 118, 14095, 14125, 10491, 10105, 12723, 112, 187, 24215, 11121, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "AN", "##GO", "##LA", "-", "AU", "##G", "23", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 50972, 83821, 44376, 118, 29088, 11447, 10328, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##U", "##AN", "##DA", "1996", "-", "08", "-", "23" ], "ids": [ 149, 12022, 41275, 36382, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "the", "leading", "stories", "in", "the", "Angola", "##n", "press", "on", "Friday", "." ], "ids": [ 13252, 10301, 10105, 16018, 21158, 10106, 10105, 21149, 10115, 21040, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OR", "##NA", "##L", "DE", "AN", "##GO", "##LA" ], "ids": [ 147, 42622, 36742, 11369, 25067, 50972, 83821, 44376 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "The", "Angola", "##n", "Chief", "of", "State", "addressed", "a", "letter", "to", "UN", "Security", "Council", "propos", "##ing", "dates", "for", "the", "conclusion", "of", "the", "peace", "process", "in", "Angola", "." ], "ids": [ 118, 10117, 21149, 10115, 16730, 10108, 11104, 71121, 169, 19310, 10114, 26578, 20924, 12821, 50096, 10230, 27722, 10142, 10105, 47775, 10108, 10105, 28101, 15138, 10106, 21149, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "He", "proposed", "def", "##inite", "dates", ",", "August", "25", "for", "return", "of", "Unit", "##a", "generals", "to", "the", "joint", "army", ",", "September", "5", "for", "the", "beginning", "of", "the", "formation", "of", "the", "Government", "of", "National", "Unity", "and", "Rec", "##on", "##ciliation", "." ], "ids": [ 10357, 21622, 100745, 100240, 27722, 117, 10735, 10258, 10142, 15079, 10108, 19919, 10113, 64739, 10114, 10105, 25680, 17977, 117, 10596, 126, 10142, 10105, 17967, 10108, 10105, 16345, 10108, 10105, 14581, 10108, 10655, 62947, 10111, 97200, 10263, 98956, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Until", "this", "date", "the", "free", "circulation", "of", "peoples", "and", "goods", "should", "be", "gu", "##aran", "##teed", ",", "the", "government", "administration", "installed", "in", "all", "areas", "and", "the", "Unit", "##a", "de", "##put", "##ies", "should", "o", "##ccupy", "their", "places", "in", "the", "National", "Assembly", "." ], "ids": [ 41956, 10531, 13664, 10105, 13961, 40774, 10108, 55332, 10111, 36931, 14819, 10347, 75980, 24367, 100308, 117, 10105, 12047, 17941, 34398, 10106, 10435, 14544, 10111, 10105, 19919, 10113, 10104, 27876, 11624, 14819, 183, 104560, 10455, 19261, 10106, 10105, 10655, 17918, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "The", "president", "just", "##ified", "his", "proposal", "by", "the", "delay", "##s", "veri", "##fied", "in", "the", "peace", "process", ",", "including", "the", "fact", "that", "areas", "under", "Unit", "##a", "control", "or", "occupation", "have", "not", "been", "effectively", "demi", "##lita", "##rise", "##d", ",", "where", "the", "Unit", "##a", "military", "forces", "have", "been", "substitute", "##d", "by", "their", "so", "-", "called", "police", "." ], "ids": [ 10117, 12931, 12820, 31825, 10226, 43542, 10155, 10105, 76497, 10107, 55011, 19907, 10106, 10105, 28101, 15138, 117, 11198, 10105, 18638, 10189, 14544, 10571, 19919, 10113, 12608, 10345, 28929, 10529, 10472, 10590, 46767, 18844, 41701, 49376, 10162, 117, 10940, 10105, 19919, 10113, 14041, 13729, 10529, 10590, 58808, 10162, 10155, 10455, 10380, 118, 11552, 15034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "President", "Dos", "Santos", "propose", "##s", "the", "establishment", "by", "UN", "Security", "Council", "of", "def", "##initive", "and", "final", "time", "##table", "for", "the", "tasks", "and", "obligations", "under", "the", "Lu", "##saka", "Agreement", "and", "the", "sending", "of", "a", "mission", "of", "SC", ",", "as", "soon", "as", "possible", ",", "to", "super", "##vise", "the", "execution", "of", "the", "agreement", "." ], "ids": [ 118, 12811, 23846, 17223, 30027, 10107, 10105, 31989, 10155, 26578, 20924, 12821, 10108, 100745, 93551, 10111, 11070, 10635, 30434, 10142, 10105, 72068, 10111, 101549, 10571, 10105, 23859, 70772, 62223, 10111, 10105, 67306, 10108, 169, 17032, 10108, 18137, 117, 10146, 17864, 10146, 14128, 117, 10114, 25212, 36540, 10105, 62341, 10108, 10105, 25432, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FOR", "##EC", "##AS", "##T", "-", "S", ".", "AF", "##RI", "##CA", "##N", "COM", "##PA", "##NY", "RE", "##SU", "##L", "##TS", "CO", "##NS", "##EN", "##SU", "##S", "." ], "ids": [ 109544, 35826, 38025, 11090, 118, 156, 119, 55640, 46876, 46900, 11537, 80645, 52099, 85771, 71033, 88592, 11369, 36545, 32992, 69196, 50655, 88592, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "23" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ana", "##lys", "##ts", "estimates", "of", "major" ], "ids": [ 16377, 52176, 10806, 45870, 10108, 11922 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "African", "company", "results", "expected", "next", "week", "include", "the" ], "ids": [ 11056, 13839, 12100, 17466, 25973, 13451, 16118, 12363, 10105 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "following", "(", "all", "figures", "cents", "per", "share", ")", ":" ], "ids": [ 11901, 113, 10435, 21068, 63487, 10178, 23867, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DA", "##Y", "-", "-", "COM", "##PA", "##NY", "-", "-", "-", "-", "PE", "##RI", "##OD", "-", "-", "CO", "##NS", "##EN", "##SU", "##S", "-", "-", "-", "-", "RA", "##NG", "##E", "-", "-", "-", "-", "-", "-", "-", "PV", "##S" ], "ids": [ 47855, 14703, 118, 118, 80645, 52099, 85771, 118, 118, 118, 118, 80468, 46876, 77836, 118, 118, 32992, 69196, 50655, 88592, 10731, 118, 118, 118, 118, 64007, 34065, 11259, 118, 118, 118, 118, 118, 118, 118, 77621, 10731 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##N", "Gen", "##cor", "Y", "##R", "EP", "##S", "93", ".", "12", "92", ".", "0", "-", "94", ".", "5", "73", ".", "8" ], "ids": [ 102059, 11537, 32560, 49167, 162, 11273, 14111, 10731, 12479, 119, 10186, 12458, 119, 121, 118, 12749, 119, 126, 12545, 119, 129 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##N", "Gen", "##cor", "Y", "##R", "DI", "##V", "25", ".", "75", "25", ".", "0", "-", "27", ".", "0", "20", ".", "0" ], "ids": [ 102059, 11537, 32560, 49167, 162, 11273, 110014, 11779, 10258, 119, 11417, 10258, 119, 121, 118, 10365, 119, 121, 10197, 119, 121 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##N", "Prime", "##dia", "Y", "##R", "EP", "##S", "N", "/", "A", "149", ".", "1" ], "ids": [ 102059, 11537, 19924, 13852, 162, 11273, 14111, 10731, 151, 120, 138, 19438, 119, 122 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##N", "Prime", "##dia", "Y", "##R", "DI", "##V", "N", "/", "A", "123", ".", "2" ], "ids": [ 102059, 11537, 19924, 13852, 162, 11273, 110014, 11779, 151, 120, 138, 16968, 119, 123 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##N", "Dis", "##til", "##lers", "Y", "##R", "EP", "##S", "N", "/", "A", "71", ".", "8" ], "ids": [ 102059, 11537, 101270, 19156, 36090, 162, 11273, 14111, 10731, 151, 120, 138, 12513, 119, 129 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##N", "Dis", "##til", "##lers", "Y", "##R", "DI", "##V", "N", "/", "A", "49", ".", "0" ], "ids": [ 102059, 11537, 101270, 19156, 36090, 162, 11273, 110014, 11779, 151, 120, 138, 11580, 119, 121 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##E", "Is", "##cor", "Y", "##R", "EP", "##S", "29", ".", "7", "26", ".", "0", "-", "32", ".", "0", "38", ".", "0" ], "ids": [ 94747, 11259, 12034, 49167, 162, 11273, 14111, 10731, 10386, 119, 128, 10314, 119, 121, 118, 10842, 119, 121, 11171, 119, 121 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##E", "Is", "##cor", "Y", "##R", "DI", "##V", "15", ".", "0", "14", ".", "5", "-", "16", ".", "5", "16", ".", "5" ], "ids": [ 94747, 11259, 12034, 49167, 162, 11273, 110014, 11779, 10208, 119, 121, 10247, 119, 126, 118, 10250, 119, 126, 10250, 119, 126 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##E", "McCarthy", "Y", "##R", "EP", "##S", "125", ".", "3", "112", ".", "0", "-", "149", ".", "0", "93", ".", "2" ], "ids": [ 94747, 11259, 42816, 162, 11273, 14111, 10731, 14048, 119, 124, 16129, 119, 121, 118, 19438, 119, 121, 12479, 119, 123 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##E", "McCarthy", "Y", "##R", "DI", "##V", "36", ".", "8", "32", ".", "0", "-", "43", ".", "0", "28", ".", "0" ], "ids": [ 94747, 11259, 42816, 162, 11273, 110014, 11779, 11055, 119, 129, 10842, 119, 121, 118, 11370, 119, 121, 10348, 119, 121 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ED", "Im", "##ph", "##old", "Y", "##R", "EP", "##S", "172", ".", "7", "170", ".", "4", "-", "175", ".", "0", "115", ".", "1" ], "ids": [ 160, 33809, 10796, 28088, 33860, 162, 11273, 14111, 10731, 21906, 119, 128, 15410, 119, 125, 118, 18101, 119, 121, 15680, 119, 122 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ED", "Im", "##ph", "##old", "Y", "##R", "DI", "##V", "67", ".", "5", "66", ".", "6", "-", "68", ".", "4", "45", ".", "0" ], "ids": [ 160, 33809, 10796, 28088, 33860, 162, 11273, 110014, 11779, 12316, 119, 126, 12215, 119, 127, 118, 12370, 119, 125, 10827, 119, 121 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##H", "##U", "M", "&", "R", "Y", "##R", "EP", "##S", "113", ".", "0", "112", ".", "1", "-", "113", ".", "4", "126", ".", "0" ], "ids": [ 157, 12396, 12022, 150, 111, 155, 162, 11273, 14111, 10731, 16990, 119, 121, 16129, 119, 122, 118, 16990, 119, 125, 17813, 119, 121 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##H", "##U", "M", "&", "R", "Y", "##R", "DI", "##V", "31", ".", "7", "10", ".", "5", "-", "42", ".", "3", "47", ".", "0" ], "ids": [ 157, 12396, 12022, 150, 111, 155, 162, 11273, 110014, 11779, 10413, 119, 128, 10150, 119, 126, 118, 11276, 119, 124, 11413, 119, 121 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##H", "##U", "J", "##D", "Group", "Y", "##R", "EP", "##S", "143", ".", "7", "138", ".", "0", "-", "149", ".", "0", "111", ".", "2" ], "ids": [ 157, 12396, 12022, 147, 11490, 12054, 162, 11273, 14111, 10731, 19510, 119, 128, 19462, 119, 121, 118, 19438, 119, 121, 15821, 119, 123 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##H", "##U", "J", "##D", "Group", "Y", "##R", "DI", "##V", "41", ".", "8", "41", ".", "0", "-", "42", ".", "5", "33", ".", "0" ], "ids": [ 157, 12396, 12022, 147, 11490, 12054, 162, 11273, 110014, 11779, 11349, 119, 129, 11349, 119, 121, 118, 11276, 119, 126, 11000, 119, 121 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "o", "##o", "##O", "##O", "##oo" ], "ids": [ 183, 10133, 11403, 11403, 22659 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Johannesburg", "news", "##room", ",", "+", "27", "11", "482", "100", "##3" ], "ids": [ 118, 118, 42392, 14424, 25525, 117, 116, 10365, 10193, 46810, 10407, 10884 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ulster", "Petroleum", "##s", "Ltd", "Q", "##2", "net", "profit", "falls", "." ], "ids": [ 45738, 89589, 10107, 15129, 154, 10729, 11988, 25081, 35017, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##GA", "##R", "##Y", "1996", "-", "08", "-", "23" ], "ids": [ 24707, 11369, 39061, 11273, 14703, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1996", "1995" ], "ids": [ 10389, 10436 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "S", "##hr", "C", "$", "0", ".", "04", "C", "$", "0", ".", "08" ], "ids": [ 156, 16757, 140, 109, 121, 119, 10814, 140, 109, 121, 119, 11052 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Net", "1", ",", "196", "2", ",", "232" ], "ids": [ 32577, 122, 117, 23674, 123, 117, 23944 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cash", "flow", "/", "sh", "##r", "0", ".", "39", "0", ".", "41" ], "ids": [ 41286, 30676, 120, 48201, 10129, 121, 119, 11303, 121, 119, 11349 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rev", "##s", "20", ",", "167", "18", ",", "623" ], "ids": [ 24774, 10107, 10197, 117, 20905, 10218, 117, 57080 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "MO", "##NT", "##HS" ], "ids": [ 127, 102059, 77261, 62181 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "S", "##hr", "C", "$", "0", ".", "12", "C", "$", "0", ".", "15" ], "ids": [ 156, 16757, 140, 109, 121, 119, 10186, 140, 109, 121, 119, 10208 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Net", "3", ",", "674", "4", ",", "271" ], "ids": [ 32577, 124, 117, 46075, 125, 117, 27102 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cash", "flow", "/", "sh", "##r", "0", ".", "86", "0", ".", "81" ], "ids": [ 41286, 30676, 120, 48201, 10129, 121, 119, 12224, 121, 119, 12324 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rev", "##s", "41", ",", "752", "35", ",", "711" ], "ids": [ 24774, 10107, 11349, 117, 62380, 10803, 117, 52089 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "All", "data", "above", "000", "##s", "except", "per", "share", "numbers", ")" ], "ids": [ 113, 11101, 11165, 16038, 10259, 10107, 23423, 10178, 23867, 20953, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Reuters", "Toronto", "Bureau", "416", "941", "-", "810", "##0" ], "ids": [ 118, 118, 46617, 15256, 12344, 33833, 82944, 118, 49357, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nigerian", "terms", "je", "##opa", "##rdi", "##ze", "Commonwealth", "trip", "-", "Canada", "." ], "ids": [ 85012, 18873, 10144, 49482, 18177, 10870, 22603, 37307, 118, 11635, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 3, 2, 6, 6, 9 ] }, { "tokens": [ "O", "##T", "##TA", "##WA", "1996", "-", "08", "-", "23" ], "ids": [ 152, 11090, 24951, 42196, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Commonwealth", "ministers", "concerned", "about", "human", "rights", "in", "Nigeria", "may", "can", "##cel", "a", "planned", "trip", "there", "because", "of", "government", "restrictions", "on", "their", "mission", ",", "Canadian", "Foreign", "Minister", "Lloyd", "A", "##x", "##worthy", "said", "on", "Friday", "." ], "ids": [ 22603, 66281, 47451, 10978, 14179, 16691, 10106, 22045, 11387, 10944, 32942, 169, 24292, 37307, 11155, 12373, 10108, 12047, 67028, 10135, 10455, 17032, 117, 14023, 20277, 14355, 19345, 138, 10686, 102786, 12415, 10135, 30767, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "reaction", "of", "the", "regime", "there", "is", "such", "that", "many", "of", "us", "feel", "that", "the", "mission", "under", "the", "present", "circumstances", "should", "n", "'", "t", "go", "ahead", ",", "\"", "A", "##x", "##worthy", "said", "." ], "ids": [ 107, 10117, 35723, 10108, 10105, 24807, 11155, 10124, 11049, 10189, 11299, 10108, 19626, 38008, 10189, 10105, 17032, 10571, 10105, 12254, 54186, 14819, 182, 112, 188, 11783, 35629, 117, 107, 138, 10686, 102786, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Commonwealth", "foreign", "ministers", "will", "meet", "in", "London", "on", "Wednesday", "to", "discuss", "what", "to", "do", ",", "he", "added", "." ], "ids": [ 22603, 20796, 66281, 11337, 23267, 10106, 10829, 10135, 57611, 10114, 71695, 12976, 10114, 10149, 117, 10261, 16288, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mid", "-", "tier", "gold", "##s", "up", "in", "heavy", "trading", "." ], "ids": [ 42234, 118, 60704, 18128, 10107, 10741, 10106, 18296, 46663, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "23" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##vestor", "##s", "gave", "into", "gold", "fever", "Friday", "morning", ",", "with", "heavy", "trading", "in", "a", "hand", "##ful", "of", "Toronto", "-", "based", "gold", "companies", "." ], "ids": [ 10167, 83436, 10107, 15362, 10708, 18128, 105142, 30767, 28757, 117, 10169, 18296, 46663, 10106, 169, 15230, 14446, 10108, 15256, 118, 11610, 18128, 18866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "TV", "##X", "Gold", "Inc", "was", "up", "C", "$", "0", ".", "30", "to", "C", "$", "11", ".", "55", "in", "trading", "of", "780", ",", "000", "shares", ",", "while", "Ki", "##n", "##ross", "Gold", "Corp", "gained", "C", "$", "0", ".", "25", "to", "C", "$", "11", "in", "volume", "of", "720", ",", "000", "shares", "." ], "ids": [ 10813, 12674, 14363, 13604, 10134, 10741, 140, 109, 121, 119, 10244, 10114, 140, 109, 10193, 119, 11358, 10106, 46663, 10108, 42232, 117, 10259, 45751, 117, 11371, 28941, 10115, 105572, 14363, 44687, 25222, 140, 109, 121, 119, 10258, 10114, 140, 109, 10193, 10106, 15901, 10108, 35809, 117, 10259, 45751, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 2, 6, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "Sc", "##orp", "##ion", "Mineral", "##s", "Inc", ",", "a", "junior", "gold", "exploration", "company", "with", "five", "Indonesian", "mining", "properties", ",", "was", "up", "C", "$", "0", ".", "50", "to", "C", "$", "6", ",", "with", "about", "120", ",", "000", "shares", "changing", "hands", "." ], "ids": [ 12689, 55260, 72504, 11046, 69042, 10107, 13604, 117, 169, 21854, 18128, 61326, 12100, 10169, 12403, 47340, 32802, 25457, 117, 10134, 10741, 140, 109, 121, 119, 10462, 10114, 140, 109, 127, 117, 10169, 10978, 12048, 117, 10259, 45751, 43068, 27925, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TV", "##X", "and", "Ki", "##n", "##ross", "rose", "after", "recent", "buy", "recommendations", "from", "U", ".", "S", ".", "broke", "##rs", ",", "anal", "##yst", "##s", "said", "." ], "ids": [ 10813, 12674, 10111, 28941, 10115, 105572, 29467, 10662, 19037, 47715, 102499, 10188, 158, 119, 156, 119, 30500, 10943, 117, 106615, 62769, 10107, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Sc", "##orp", "##ion", "was", "raising", "a", "lot", "of", "eye", "##bro", "##ws", "after", "it", "issued", "a", "release", "Friday", "morning", "saying", "it", "was", "not", "aware", "of", "any", "developments", "that", "could", "have", "affected", "the", "stock", "." ], "ids": [ 16976, 55260, 72504, 11046, 10134, 59252, 169, 19826, 10108, 32684, 20923, 25080, 10662, 10271, 21694, 169, 14072, 30767, 28757, 22807, 10271, 10134, 10472, 66625, 10108, 11178, 74475, 10189, 12174, 10529, 36276, 10105, 20511, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "was", "formed", "this", "year", "and", "a", "couple", "of", "anal", "##yst", "##s", "have", "been", "on", "their", "properties", ",", "said", "one", "anal", "##yst", "." ], "ids": [ 10117, 12100, 10134, 14629, 10531, 10924, 10111, 169, 20969, 10108, 106615, 62769, 10107, 10529, 10590, 10135, 10455, 25457, 117, 12415, 10464, 106615, 62769, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Exploration", "results", "are", "expected", "soon", "." ], "ids": [ 42931, 17466, 10301, 25973, 17864, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Reuters", "Toronto", "Bureau", "416", "941", "-", "810", "##0" ], "ids": [ 118, 118, 46617, 15256, 12344, 33833, 82944, 118, 49357, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RE", "##SE", "##AR", "##CH", "AL", "##ER", "##T", "-", "Unito", "##g", "Co", "upgraded", "." ], "ids": [ 71033, 39039, 52188, 86448, 47271, 24093, 11090, 118, 44533, 10240, 13098, 80485, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "-", "Barr", "##ington", "Research", "Associates", "Inc", "said", "Friday", "it", "upgraded", "Unito", "##g", "Co", "to", "a", "near", "-", "term", "out", "##per", "##form", "from", "a", "long", "-", "term", "out", "##per", "##form", "rating", "." ], "ids": [ 118, 79283, 24077, 12959, 63814, 13604, 12415, 30767, 10271, 80485, 44533, 10240, 13098, 10114, 169, 12883, 118, 13719, 10950, 12713, 19757, 10188, 169, 11695, 118, 13719, 10950, 12713, 19757, 31035, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Ana", "##lys", "##t", "Alexander", "Paris", "said", "he", "expected", "consistent", "20", "percent", "earning", "##s", "growth", "after", "an", "estimated", "gain", "of", "18", "percent", "for", "1996", "." ], "ids": [ 118, 16377, 52176, 10123, 12063, 10728, 12415, 10261, 25973, 54787, 10197, 22362, 56981, 10107, 14609, 10662, 10151, 25267, 25881, 10108, 10218, 22362, 10142, 10389, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "The", "stock", "closed", "un", "##chang", "##ed", "at", "27", ",", "down", "from", "a", "recent", "high", "of", "30", "." ], "ids": [ 118, 10117, 20511, 18440, 10119, 64208, 10336, 10160, 10365, 117, 12935, 10188, 169, 19037, 11846, 10108, 10244, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Chicago", "news", "##des", "##k", ",", "312", "-", "408", "-", "878", "##7" ], "ids": [ 118, 118, 12317, 14424, 10920, 10174, 117, 25104, 118, 36899, 118, 74002, 11305 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bu", "##ffet", "##t", "raise", "##s", "Property", "Capital", "stake", "." ], "ids": [ 11916, 79275, 10123, 42439, 10107, 75113, 21433, 90081, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Omaha", "billion", "##aire", "Warren", "Bu", "##ffet", "##t", "said", "Friday", "he", "raised", "his", "stake", "in", "Property", "Capital", "Trust", "to", "8", ".", "0", "percent", "from", "6", ".", "7", "percent", "." ], "ids": [ 67197, 25848, 16556, 18247, 11916, 79275, 10123, 12415, 30767, 10261, 20526, 10226, 90081, 10106, 75113, 21433, 22271, 10114, 129, 119, 121, 22362, 10188, 127, 119, 128, 22362, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "fil", "##ing", "with", "the", "Sec", "##urities", "and", "Ex", "##chn", "##age", "Commission", ",", "Bu", "##ffet", "##t", "said", "he", "bought", "62", ",", "900", "additional", "common", "shares", "of", "the", "Boston", "-", "based", "real", "estate", "investment", "trust", "at", "prices", "ranging", "from", "$", "7", ".", "65", "to", "$", "8", ".", "02", "a", "share", "." ], "ids": [ 10167, 169, 40503, 10230, 10169, 10105, 109754, 82073, 10111, 27746, 61497, 12276, 14941, 117, 11916, 79275, 10123, 12415, 10261, 28870, 12066, 117, 13545, 18568, 14624, 45751, 10108, 10105, 13683, 118, 11610, 13486, 19027, 37933, 54399, 10160, 57476, 55432, 10188, 109, 128, 119, 10843, 10114, 109, 129, 119, 10983, 169, 23867, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "purchase", "##s", "increased", "his", "holding", "in", "the", "company", "to", "725", ",", "900", "shares", ",", "which", "was", "purchased", "for", "a", "total", "of", "$", "6", ".", "2", "million", ",", "he", "said", "." ], "ids": [ 10117, 37891, 10107, 19299, 10226, 29008, 10106, 10105, 12100, 10114, 47318, 117, 13545, 45751, 117, 10319, 10134, 24463, 10142, 169, 11339, 10108, 109, 127, 119, 123, 12473, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bu", "##ffet", "##t", ",", "who", "is", "well", "-", "known", "as", "a", "long", "-", "term", "in", "##vestor", ",", "is", "chairman", "of", "Berkshire", "Hathaway", "Inc", ",", "a", "holding", "company", "through", "which", "he", "holds", "investment", "##s", "in", "several", "large", "U", ".", "S", ".", "companies", "." ], "ids": [ 11916, 79275, 10123, 117, 10479, 10124, 11206, 118, 11053, 10146, 169, 11695, 118, 13719, 10106, 83436, 117, 10124, 27627, 10108, 75690, 107454, 13604, 117, 169, 29008, 12100, 11222, 10319, 10261, 28278, 37933, 10107, 10106, 11736, 12077, 158, 119, 156, 119, 18866, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "Colombia", ",", "U", ".", "S", ".", "reach", "aviation", "agreement", "." ], "ids": [ 15223, 117, 158, 119, 156, 119, 24278, 45559, 25432, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##AM", "##I", "1996", "-", "08", "-", "23" ], "ids": [ 75416, 36535, 11281, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "U", ".", "S", ".", "and", "Colombia", "##n", "governments", "reached", "an", "agreement", "that", "will", "allow", "AM", "##R", "Corp", "'", "s", "American", "Airlines", "to", "operate", "three", "round", "-", "trip", "flights", "between", "New", "York", "and", "Bog", "##ota", ",", "the", "Department", "of", "Transportation", "said", "Friday", "." ], "ids": [ 10117, 158, 119, 156, 119, 10111, 15223, 10115, 52052, 17087, 10151, 25432, 10189, 11337, 21992, 24339, 11273, 44687, 112, 187, 10536, 17768, 10114, 34307, 11003, 13569, 118, 37307, 55650, 10948, 10287, 10482, 10111, 97033, 15192, 117, 10105, 12933, 10108, 44063, 12415, 30767, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Under", "the", "agreement", ",", "which", "followed", "talks", "in", "Miami", "this", "week", ",", "AM", "##R", "also", "will", "be", "allowed", "to", "shift", "up", "to", "four", "of", "the", "weekly", "flights", "it", "now", "operates", "between", "Miami", "and", "Colombia", "to", "its", "New", "York", "gate", "##way", "." ], "ids": [ 12594, 10105, 25432, 117, 10319, 15689, 56672, 10106, 17626, 10531, 16118, 117, 24339, 11273, 10379, 11337, 10347, 18162, 10114, 51467, 10741, 10114, 11598, 10108, 10105, 33159, 55650, 10271, 11858, 36737, 10948, 17626, 10111, 15223, 10114, 10474, 10287, 10482, 40677, 14132, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "The", "United", "States", "also", "will", "be", "able", "to", "designa", "##te", "one", "new", "all", "-", "cargo", "carrier", "for", "service", "between", "the", "two", "nations", "after", "two", "years", "." ], "ids": [ 10117, 10609, 10859, 10379, 11337, 10347, 16197, 10114, 100664, 10216, 10464, 10751, 10435, 118, 15856, 53402, 10142, 11989, 10948, 10105, 10551, 30683, 10662, 10551, 10855, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colombia", "was", "permitted", "to", "add", "a", "single", "additional", "round", "-", "trip", "flight", "to", "its", "current", "New", "York", "service", ",", "although", "it", "will", "not", "be", "able", "to", "do", "so", "while", "under", "Category", "Two", "(", "Con", "##dition", "##al", ")", "status", "under", "the", "Federal", "Aviation", "Administration", "'", "s", "International", "Aviation", "Safety", "program", "." ], "ids": [ 15223, 10134, 63505, 10114, 42852, 169, 11376, 18568, 13569, 118, 37307, 23578, 10114, 10474, 14978, 10287, 10482, 11989, 117, 14779, 10271, 11337, 10472, 10347, 16197, 10114, 10149, 10380, 11371, 10571, 80087, 13214, 113, 12845, 34540, 10415, 114, 14042, 10571, 10105, 14492, 28561, 22002, 112, 187, 10771, 28561, 38797, 12483, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "Colombia", "would", "be", "allowed", "to", "add", "new", "service", "when", "its", "safety", "assessment", "has", "been", "improved", ",", "the", "department", "said", "." ], "ids": [ 15223, 10894, 10347, 18162, 10114, 42852, 10751, 11989, 10841, 10474, 27116, 62492, 10393, 10590, 34605, 117, 10105, 21079, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "the", "exception", "of", "the", "new", "services", "just", "agreed", "to", ",", "the", "governments", "of", "the", "two", "nations", "have", "agreed", "to", "maintain", "their", "current", "level", "of", "routes", "and", "airline", "##s", "for", "the", "next", "2", "-", "1", "/", "2", "years", ",", "the", "agreement", "said", "." ], "ids": [ 12613, 10105, 30646, 10108, 10105, 10751, 12639, 12820, 25577, 10114, 117, 10105, 52052, 10108, 10105, 10551, 30683, 10529, 25577, 10114, 37215, 10455, 14978, 13277, 10108, 28001, 10111, 67878, 10107, 10142, 10105, 13451, 123, 118, 122, 120, 123, 10855, 117, 10105, 25432, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "agreement", "resolved", "a", "dispute", "that", "arose", "in", "June", "when", "Colombia", "turned", "down", "American", "'", "s", "request", "to", "operate", "flights", "between", "New", "York", "and", "Bog", "##ota", ",", "a", "den", "##ial", "that", "prompted", "the", "United", "States", "to", "charge", "that", "the", "Colombia", "##ns", "were", "breaking", "a", "bila", "##teral", "aviation", "agreement", "and", "to", "propose", "san", "##ctions", "against", "one", "of", "two", "Colombia", "##n", "airline", "##s", ",", "Av", "##ian", "##ca", "and", "AC", "##ES", "." ], "ids": [ 10117, 25432, 100052, 169, 31310, 10189, 99736, 10106, 11120, 10841, 15223, 21031, 12935, 10536, 112, 187, 37449, 10114, 34307, 55650, 10948, 10287, 10482, 10111, 97033, 15192, 117, 169, 10140, 15619, 10189, 93003, 10105, 10609, 10859, 10114, 18163, 10189, 10105, 15223, 10891, 10309, 47105, 169, 12517, 98161, 45559, 25432, 10111, 10114, 30027, 14608, 42068, 11327, 10464, 10108, 10551, 15223, 10115, 67878, 10107, 117, 33799, 11630, 10425, 10111, 18132, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Clean", "tank", "##er", "fi", "##xt", "##ures", "and", "en", "##qui", "##ries", "-", "1754", "GMT", "." ], "ids": [ 79657, 28671, 10165, 14045, 28883, 18367, 10111, 10110, 39639, 15388, 118, 32908, 20362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##TE", "##ST", "F", "##IX", "##T", "##UR", "##ES" ], "ids": [ 29079, 29833, 32995, 143, 67403, 11090, 98348, 25054 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "MI", "##DE", "##AS", "##T", "G", "##UL", "##F", "/", "RE", "##D", "SE", "##A" ], "ids": [ 118, 75416, 60675, 38025, 11090, 144, 100673, 11565, 120, 71033, 11490, 23056, 10738 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 5, 5, 9, 1, 5, 5, 5 ] }, { "tokens": [ "Ko", "##n", "##polis", "75", "1", "/", "9", "Mid", "##eas", "##t", "/", "Indonesia", "W", "##11", "##2", ".", "5", "KP", "##C", "." ], "ids": [ 30186, 10115, 33631, 11417, 122, 120, 130, 42234, 42658, 10123, 120, 11658, 160, 37115, 10729, 119, 126, 110468, 10858, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "TB", "##N", "30", "6", "/", "9", "Mid", "##eas", "##t", "/", "W", ".", "C", ".", "India", "W", "##200", ",", "E", ".", "C", ".", "India", "W", "##19", "##5", "IOC", "." ], "ids": [ 73562, 11537, 10244, 127, 120, 130, 42234, 42658, 10123, 120, 160, 119, 140, 119, 11098, 160, 89478, 117, 142, 119, 140, 119, 11098, 160, 54055, 11166, 26423, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 5, 5, 5, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 3, 9 ] }, { "tokens": [ "-", "AS", "##IA", "PA", "##CI", "##F", "##IC" ], "ids": [ 118, 17421, 35976, 32349, 89955, 11565, 30889 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "Petro", "##bul", "##k", "Rainbow", "28", "24", "/", "8", "Okinawa", "/", "Inc", "##hon", "$", "190", ",", "000", "Hon", "##am", "." ], "ids": [ 82470, 50400, 10174, 34204, 10348, 10233, 120, 129, 53843, 120, 13604, 19792, 109, 16664, 117, 10259, 19431, 11008, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "-", "ME", "##D", "/", "BL", "##AC", "##K", "SE", "##A" ], "ids": [ 118, 47430, 11490, 120, 102549, 30340, 11733, 23056, 10738 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 1, 5, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "TB", "##N", "30", "15", "/", "9", "Con", "##stan", "##za", "/", "Ini", "##a", "$", "700", ",", "000", "IOC", "." ], "ids": [ 73562, 11537, 10244, 10208, 120, 130, 12845, 17414, 10637, 120, 25336, 10113, 109, 12367, 117, 10259, 26423, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "-", "UK", "/", "CO", "##NT" ], "ids": [ 118, 10523, 120, 32992, 77261 ], "entity": [ "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9 ] }, { "tokens": [ "Port", "Christine", "36", ",", "5", "3", "/", "9", "Pembroke", "/", "US", "W", "##14", "##5", "Sten", "##tex", "." ], "ids": [ 14734, 23588, 11055, 117, 126, 124, 120, 130, 106678, 120, 10808, 160, 39900, 11166, 98777, 85656, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "-", "W", "##ES", "##TER", "##N", "H", "##EM", "##IS", "##P", "##H", "##ER", "##E" ], "ids": [ 118, 160, 25054, 99552, 11537, 145, 67753, 19088, 11127, 12396, 24093, 11259 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "K", "##pai", "##tan", "Stan", "##kov", "69", "31", "/", "8", "St", "Croix", "/", "USA", "##C", "W", "##12", "##5", "Hess", "." ], "ids": [ 148, 48778, 12059, 26637, 16433, 12573, 10413, 120, 129, 10838, 28187, 120, 11061, 10858, 160, 24747, 11166, 77831, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 9, 9, 3, 9 ] }, { "tokens": [ "AP", "Moll", "##er", "30", "31", "/", "8", "Car", "##ib", "##s", "/", "Japan", "$", "875", ",", "000", "BP", "." ], "ids": [ 30909, 72447, 10165, 10244, 10413, 120, 129, 23962, 17609, 10107, 120, 11891, 109, 45949, 117, 10259, 50950, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Ti", "##ber", "29", "2", "/", "9", "Car", "##ib", "##s", "/", "options", "W", "##26", "##5", "St", "##inne", "##s", "." ], "ids": [ 29033, 12212, 10386, 123, 120, 130, 23962, 17609, 10107, 120, 53121, 160, 90533, 11166, 10838, 42506, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "MI", "##D", "##DA", "##Y", "F", "##IX", "##T", "##UR", "##ES" ], "ids": [ 118, 75416, 11490, 36382, 14703, 143, 67403, 11090, 98348, 25054 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "MI", "##DE", "##AS", "##T", "G", "##UL", "##F", "/", "RE", "##D", "SE", "##A" ], "ids": [ 118, 75416, 60675, 38025, 11090, 144, 100673, 11565, 120, 71033, 11490, 23056, 10738 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 5, 5, 9, 1, 5, 5, 5 ] }, { "tokens": [ "Ten", "##aci", "##ty", "70", "24", "/", "08", "Mid", "##eas", "##t", "/", "South", "Korea", "W", "##14", "##5", "Samsung", "." ], "ids": [ 16411, 28841, 11195, 10923, 10233, 120, 11052, 42234, 42658, 10123, 120, 11056, 14096, 160, 39900, 11166, 37077, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 9, 9, 9, 3, 9 ] }, { "tokens": [ "SK", "##S", "Tan", "##a", "70", "03", "/", "09", "Mid", "##eas", "##t", "/", "Japan", "W", "##14", "##5", "CN", "##R", "." ], "ids": [ 21275, 10731, 30594, 10113, 10923, 10907, 120, 11035, 42234, 42658, 10123, 120, 11891, 160, 39900, 11166, 73067, 11273, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "North", "##sea", "Chase", "##r", "55", "12", "/", "09", "Mid", "##eas", "##t", "/", "Japan", "W", "##16", "##7", ".", "5", "Jo", "##mo", "." ], "ids": [ 11225, 59899, 27866, 10129, 11358, 10186, 120, 11035, 42234, 42658, 10123, 120, 11891, 160, 37301, 11305, 119, 126, 20977, 11033, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Si", "##bon", "##ina", "55", "13", "/", "09", "Red", "Sea", "/", "Japan", "W", "##16", "##0", "Mar", "##uben", "##i", "." ], "ids": [ 11741, 22572, 11067, 11358, 10249, 120, 11035, 11641, 14741, 120, 11891, 160, 37301, 10929, 15734, 66918, 10116, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "-", "AS", "##IA", "/", "PA", "##CI", "##F", "##IC" ], "ids": [ 118, 17421, 35976, 120, 32349, 89955, 11565, 30889 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 1, 5, 9, 1, 5, 5, 5 ] }, { "tokens": [ "Neptune", "C", "##ru", "##x", "30", "02", "/", "09", "Singapore", "/", "options", "$", "185", ",", "000", "Sie", "##t", "##co", "." ], "ids": [ 53780, 140, 11680, 10686, 10244, 10983, 120, 11035, 19437, 120, 53121, 109, 19859, 117, 10259, 11583, 10123, 10812, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "World", "Bridge", "30", "03", "/", "09", "South", "Korea", "/", "Japan", "r", "##n", "##r", "CN", "##R", "." ], "ids": [ 10315, 17426, 10244, 10907, 120, 11035, 11056, 14096, 120, 11891, 186, 10115, 10129, 73067, 11273, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Fu", "##lma", "##r", "30", "28", "/", "08", "U", "##ls", "##an", "/", "Yo", "##su", "$", "105", ",", "000", "LG", "Cal", "##tex", "." ], "ids": [ 17056, 23303, 10129, 10244, 10348, 120, 11052, 158, 11747, 10206, 120, 30665, 12892, 109, 14519, 117, 10259, 49780, 41280, 85656, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "-", "ME", "##D", "/", "BL", "##AC", "##K", "SE", "##A" ], "ids": [ 118, 47430, 11490, 120, 102549, 30340, 11733, 23056, 10738 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 1, 5, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "He", "##mina", "33", "05", "/", "09", "Ele", "##usi", "##s", "/", "UK", "##C", "##M", "W", "##15", "##5", "CN", "##R", "." ], "ids": [ 10357, 21162, 11000, 10831, 120, 11035, 16561, 15780, 10107, 120, 10523, 10858, 11517, 160, 37462, 11166, 73067, 11273, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "-", "-", "London", "News", "##room", ",", "+", "44", "171", "542", "898", "##0" ], "ids": [ 118, 118, 10829, 12219, 25525, 117, 116, 11126, 22478, 51620, 85773, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "PA", "##KI", "##ST", "##AN", "229", "-", "1", "V", "EN", "##GL", "##AN", "##D", "-", "close", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 32349, 59879, 32995, 41275, 26216, 118, 122, 159, 31278, 104780, 41275, 11490, 118, 16065, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "Sa", "##eed", "Anwar", "not", "out", "116" ], "ids": [ 12404, 40154, 92168, 10472, 10950, 17095 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "c", "Cork", "b", "C", "##roft", "46" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 171, 42049, 170, 140, 101860, 11528 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 9, 4, 8, 9 ] }, { "tokens": [ "I", "##ja", "##z", "Ahmed", "not", "out", "58" ], "ids": [ 146, 10320, 10305, 25530, 10472, 10950, 11824 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "9" ], "ids": [ 50821, 10107, 130 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wi", "##cket", "-", "1", "-", "106" ], "ids": [ 15750, 10108, 23040, 28721, 118, 122, 118, 16084 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "bat", "-", "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", ",", "Salim", "Malik", ",", "As", "##if", "Mu", "##jta", "##ba", ",", "Was", "##im", "Ak", "##ram", ",", "Moi", "##n", "Khan", ",", "Mus", "##hta", "##q", "Ahmed", ",", "W", "##aq", "##ar", "You", "##nis", ",", "Mohammad", "Ak", "##am" ], "ids": [ 11469, 11519, 118, 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 117, 98284, 45783, 117, 10882, 13918, 49056, 51465, 10537, 117, 22034, 11759, 71275, 13845, 117, 82447, 10115, 16324, 117, 31013, 32493, 11703, 25530, 117, 160, 49277, 10354, 11065, 12597, 117, 40036, 71275, 11008 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8 ] }, { "tokens": [ "England", "326", "all", "out" ], "ids": [ 11701, 32558, 10435, 10950 ], "entity": [ "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Golf", ":", "Norman", "sac", "##ks", "his", "coach", "after", "disa", "##ppo", "##inti", "##ng", "season", "." ], "ids": [ 56898, 39469, 118, 23870, 131, 15332, 109436, 11676, 10226, 15701, 10662, 36474, 45565, 49886, 10376, 11226, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "23" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "World", "number", "one", "golf", "##er", "Greg", "Norman", "has", "sac", "##ked", "his", "coach", "Butch", "Har", "##mon", "after", "a", "disa", "##ppo", "##inti", "##ng", "season", "." ], "ids": [ 10315, 11487, 10464, 32288, 10165, 22438, 15332, 10393, 109436, 30511, 10226, 15701, 104577, 55737, 16278, 10662, 169, 36474, 45565, 49886, 10376, 11226, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Butch", "and", "I", "are", "finished", ",", "\"", "Norman", "told", "reporter", "##s", "on", "Thursday", "before", "the", "start", "of", "the", "World", "Series", "of", "Golf", "in", "Ak", "##ron", ",", "Ohio", "." ], "ids": [ 107, 104577, 10111, 146, 10301, 15972, 117, 107, 15332, 21937, 41408, 10107, 10135, 67067, 11360, 10105, 15148, 10108, 10105, 10315, 13239, 10108, 23870, 10106, 71275, 11620, 117, 13608, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ "Norman", ",", "a", "two", "-", "time", "British", "Open", "champion", ",", "parte", "##d", "ways", "with", "his", "long", "-", "time", "mentor", "after", "drawing", "a", "bl", "##ank", "in", "this", "year", "'", "s", "four", "majors", ",", "winning", "two", "tournaments", "worldwide", "." ], "ids": [ 15332, 117, 169, 10551, 118, 10635, 11160, 11919, 17689, 117, 10552, 10162, 30360, 10169, 10226, 11695, 118, 10635, 57881, 10662, 46908, 169, 21484, 30022, 10106, 10531, 10924, 112, 187, 11598, 86611, 117, 16542, 10551, 67330, 31197, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "bl", "##onde", "Australian", "opened", "with", "a", "level", "par", "round", "of", "70", "in", "Ak", "##ron", ",", "leaving", "him", "four", "shots", "ad", "##rif", "##t", "of", "the", "leaders", ",", "Americans", "Billy", "May", "##fair", "and", "Paul", "Go", "##yd", "##os", "and", "Japan", "'", "s", "Hi", "##demi", "##chi", "Tan", "##aki", "." ], "ids": [ 10117, 21484, 40476, 12829, 14377, 10169, 169, 13277, 10248, 13569, 10108, 10923, 10106, 71275, 11620, 117, 21005, 10957, 11598, 74437, 10840, 52070, 10123, 10108, 10105, 24155, 117, 25069, 15894, 10725, 82198, 10111, 10772, 14439, 18659, 10310, 10111, 11891, 112, 187, 20065, 108986, 12806, 30594, 22471, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "On", "Wednesday", "Norman", "described", "this", "year", "as", "his", "worst", "on", "the", "professional", "circuit", "since", "1991", ",", "when", "he", "failed", "to", "win", "a", "tournament", "." ], "ids": [ 10576, 57611, 15332, 13010, 10531, 10924, 10146, 10226, 62006, 10135, 10105, 14054, 24897, 11764, 10442, 117, 10841, 10261, 20775, 10114, 14125, 169, 17390, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "My", "application", "this", "year", "has", "been", "strange", ",", "\"", "Norman", "said", ".", "\"" ], "ids": [ 107, 11590, 19800, 10531, 10924, 10393, 10590, 93309, 117, 107, 15332, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "Maybe", "I", "have", "n", "'", "t", "been", "as", "key", "##ed", "up", "as", "I", "should", "have", "been", ".", "\"" ], "ids": [ 107561, 146, 10529, 182, 112, 188, 10590, 10146, 18444, 10336, 10741, 10146, 146, 14819, 10529, 10590, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Sometimes", "you", "do", "n", "'", "t", "have", "it", "in", "your", "head", "to", "play", "." ], "ids": [ 107, 74138, 13028, 10149, 182, 112, 188, 10529, 10271, 10106, 20442, 13578, 10114, 12253, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Maybe", "this", "was", "one", "of", "those", "years", "where", "I", "was", "there", ",", "but", "I", "was", "n", "'", "t", "100", "percent", "there", ",", "and", "you", "have", "to", "be", "100", "percent", "to", "perform", ",", "\"", "he", "said", "." ], "ids": [ 107561, 10531, 10134, 10464, 10108, 12676, 10855, 10940, 146, 10134, 11155, 117, 10473, 146, 10134, 182, 112, 188, 10407, 22362, 11155, 117, 10111, 13028, 10529, 10114, 10347, 10407, 22362, 10114, 28840, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Soccer", "-", "Arab", "team", "breaks", "new", "ground", "in", "Israel", "." ], "ids": [ 25914, 118, 17365, 11121, 68307, 10751, 16912, 10106, 12991, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Or", "##i", "Lewis" ], "ids": [ 19372, 10116, 13759 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "TA", "##IB", "##E", ",", "Israel", "1996", "-", "08", "-", "23" ], "ids": [ 91075, 72918, 11259, 117, 12991, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "the", "first", "time", "in", "Israeli", "history", ",", "an", "Arab", "team", "will", "take", "the", "field", "when", "the", "National", "League", "soccer", "season", "starts", "on", "Saturday", "." ], "ids": [ 11399, 10105, 10422, 10635, 10106, 28446, 11486, 117, 10151, 17365, 11121, 11337, 13574, 10105, 13939, 10841, 10105, 10655, 11074, 41356, 11226, 33039, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ha", "##po", "##el", "Tai", "##be", "fields", "four", "Jewish", "players", "and", "two", "foreign", "import", "##s", "-", "-", "a", "Pole", "and", "a", "Romanian", "." ], "ids": [ 13740, 13520, 10570, 25633, 11044, 28455, 11598, 17119, 16021, 10111, 10551, 20796, 67622, 10107, 118, 118, 169, 37959, 10111, 169, 29543, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 9 ] }, { "tokens": [ "The", "rest", "of", "the", "side", "is", "made", "up", "mainly", "of", "Mo", "##sle", "##m", "Arab", "##s", "." ], "ids": [ 10117, 17333, 10108, 10105, 12250, 10124, 11019, 10741, 20827, 10108, 34987, 42176, 10147, 17365, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "The", "club", ",", "founded", "in", "1961", ",", "has", "a", "loyal", "following", "in", "Tai", "##be", ",", "an", "Arab", "town", "of", "28", ",", "000", "in", "the", "heart", "of", "Israel", "." ], "ids": [ 10117, 11111, 117, 14078, 10106, 10875, 117, 10393, 169, 84340, 11901, 10106, 25633, 11044, 117, 10151, 17365, 12221, 10108, 10348, 117, 10259, 10106, 10105, 21736, 10108, 12991, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "But", "away", "from", "their", "home", "ground", ",", "they", "face", "un", "##friend", "##ly", "crowd", "##s", "who", "taun", "##t", "the", "players", "with", "ra", "##cist", "abuse", "." ], "ids": [ 16976, 14942, 10188, 10455, 11816, 16912, 117, 10689, 13295, 10119, 97856, 10454, 50059, 10107, 10479, 15744, 10123, 10105, 16021, 10169, 11859, 80092, 51401, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "very", "first", "thing", "we", "thought", "about", "after", "we", "knew", "we", "would", "be", "promoted", "was", "the", "game", "against", "Beta", "##r", "Jerusalem", ",", "\"", "said", "Tai", "##be", "supporter", "Kar", "##em", "Ha", "##j", "Yi", "##hy", "##e", "." ], "ids": [ 107, 10117, 12558, 10422, 40414, 11951, 18957, 10978, 10662, 11951, 46000, 11951, 10894, 10347, 22312, 10134, 10105, 11661, 11327, 40392, 10129, 20599, 117, 107, 12415, 25633, 11044, 65169, 90233, 10451, 13740, 10418, 40512, 19275, 10112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 9, 4, 8, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Two", "weeks", "ago", "Tai", "##be", ",", "coached", "by", "Pole", "Wo", "##jt", "##ek", "La", "##zare", "##k", ",", "met", "Beta", "##r", ",", "a", "club", "closely", "associated", "with", "the", "right", "-", "wing", "Li", "##kud", "party", ",", "for", "the", "first", "time", "in", "a", "Cup", "match", "in", "Jerusalem", "." ], "ids": [ 13214, 20750, 36390, 25633, 11044, 117, 71909, 10155, 37959, 102204, 26694, 10707, 10159, 40907, 10174, 117, 10428, 40392, 10129, 117, 169, 11111, 34331, 18107, 10169, 10105, 13448, 118, 22571, 13258, 52813, 14039, 117, 10142, 10105, 10422, 10635, 10106, 169, 11544, 12356, 10106, 20599, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 2, 4, 8, 8, 8, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9 ] }, { "tokens": [ "Chant", "##s", "from", "the", "crowd", "of", "\"", "Death", "to", "the", "Arab", "##s", "\"", ",", "and", "bot", "##tle", "-", "throwing", "during", "the", "game", "mar", "##red", "the", "match", "which", "ended", "in", "a", "goal", "##less", "draw", "." ], "ids": [ 98055, 10107, 10188, 10105, 50059, 10108, 107, 15467, 10114, 10105, 17365, 10107, 107, 117, 10111, 41960, 16406, 118, 110039, 10939, 10105, 11661, 12318, 15711, 10105, 12356, 10319, 18428, 10106, 169, 16586, 14985, 25974, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "Tai", "##be", "supporter", "required", "hospital", "treatment", "for", "cuts", "and", "br", "##uise", "##s", "after", "a", "stone", "struck", "his", "head", "as", "he", "was", "driving", "from", "the", "stadium", "." ], "ids": [ 11340, 25633, 11044, 65169, 17468, 18141, 21379, 10142, 73311, 10111, 33989, 100976, 10107, 10662, 169, 23905, 45622, 10226, 13578, 10146, 10261, 10134, 37897, 10188, 10105, 27915, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "'", "re", "used", "to", "hearing", "the", "taun", "##ts", "of", "\"", "Death", "to", "the", "Arab", "##s", "'", ",", "\"", "said", "Same", "##h", "Ha", "##j", "Yi", "##hy", "##e", ",", "a", "Tai", "##be", "resident", "who", "studies", "at", "Jerusalem", "'", "s", "Hebrew", "University", ".", "\"" ], "ids": [ 107, 12865, 112, 11639, 11031, 10114, 51191, 10105, 15744, 10806, 10108, 107, 15467, 10114, 10105, 17365, 10107, 112, 117, 107, 12415, 61710, 10237, 13740, 10418, 40512, 19275, 10112, 117, 169, 25633, 11044, 44192, 10479, 16668, 10160, 20599, 112, 187, 36710, 10404, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 1, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "But", "we", "know", "that", "these", "are", "only", "words", ",", "no", "##body", "has", "died", "from", "hearing", "them", "and", "it", "only", "makes", "us", "support", "our", "team", "more", "ve", "##heme", "##ntly", ".", "\"" ], "ids": [ 16976, 11951, 21852, 10189, 11762, 10301, 10893, 21296, 117, 10192, 38078, 10393, 12482, 10188, 51191, 11345, 10111, 10271, 10893, 20562, 19626, 13145, 17446, 11121, 10798, 10323, 101318, 97456, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "dust", "##y", "town", "of", "Tai", "##be", "lack", "##s", "the", "amenities", "of", "Jewish", "communities", "and", "many", "Israeli", "Arab", "##s", "have", "long", "com", "##plained", "of", "state", "discrimination", "." ], "ids": [ 10117, 110790, 10157, 12221, 10108, 25633, 11044, 23582, 10107, 10105, 37741, 10108, 17119, 25240, 10111, 11299, 28446, 17365, 10107, 10529, 11695, 10212, 103154, 10108, 11388, 66191, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 2, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "are", "no", "parks", "or", "empty", "areas", "of", "land", "around", "here", ",", "so", "when", "we", "want", "to", "play", "a", "friendly", "game", "of", "soccer", "we", "all", "load", "up", "in", "the", "car", "and", "travel", "to", "Tel", "Aviv", ",", "\"", "60", "km", "(", "36", "miles", ")", "away", ",", "Same", "##h", "Ha", "##j", "Yi", "##hy", "##e", "said", "." ], "ids": [ 107, 11723, 10301, 10192, 60690, 10345, 65042, 14544, 10108, 11773, 12166, 19353, 117, 10380, 10841, 11951, 21528, 10114, 12253, 169, 43941, 11661, 10108, 41356, 11951, 10435, 58490, 10741, 10106, 10105, 13000, 10111, 23595, 10114, 25369, 35057, 117, 107, 10709, 10204, 113, 11055, 14148, 114, 14942, 117, 61710, 10237, 13740, 10418, 40512, 19275, 10112, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "The", "town", "'", "s", "ra", "##ms", "##ha", "##ckle", "2", ",", "500", "-", "seat", "ground", "is", "accessible", "only", "by", "two", "dir", "##t", "tracks", "." ], "ids": [ 10117, 12221, 112, 187, 11859, 12387, 10921, 87683, 123, 117, 10757, 118, 17687, 16912, 10124, 38558, 10893, 10155, 10551, 15895, 10123, 17965, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "plan", "to", "build", "a", "10", ",", "000", "-", "seat", "stadium", ",", "but", "it", "may", "well", "be", "situated", "elsewhere", ",", "\"", "said", "club", "chairman", "Abdul", "Rahman", "Ha", "##j", "Yi", "##hy", "##e", ".", "\"" ], "ids": [ 107, 12865, 13065, 10114, 23332, 169, 10150, 117, 10259, 118, 17687, 27915, 117, 10473, 10271, 11387, 11206, 10347, 26529, 60249, 117, 107, 12415, 11111, 27627, 23642, 41149, 13740, 10418, 40512, 19275, 10112, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "We", "will", "discuss", "this", "with", "the", "mayor", "and", "hope", "##fully", "a", "new", "or", "ref", "##ur", "##bis", "##hed", "ground", "will", "be", "completed", "by", "the", "start", "of", "the", "new", "year", ".", "\"" ], "ids": [ 12865, 11337, 71695, 10531, 10169, 10105, 12747, 10111, 50725, 42920, 169, 10751, 10345, 48056, 10546, 24345, 16081, 16912, 11337, 10347, 15782, 10155, 10105, 15148, 10108, 10105, 10751, 10924, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "meant", "##ime", ",", "Tai", "##be", "will", "play", "all", "their", "heavily", "police", "##d", "home", "matches", "at", "the", "Jewish", "coastal", "town", "of", "Net", "##anya", "." ], "ids": [ 10167, 10105, 31580, 19151, 117, 25633, 11044, 11337, 12253, 10435, 10455, 33556, 15034, 10162, 11816, 18258, 10160, 10105, 17119, 41328, 12221, 10108, 32577, 36027, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "We", "are", "Israeli", "##s", ",", "there", "is", "no", "question", "about", "that", ",", "\"", "said", "Kar", "##em", "Ha", "##j", "Yi", "##hy", "##e", ",", "a", "hotel", "wait", "##er", "." ], "ids": [ 107, 12865, 10301, 28446, 10107, 117, 11155, 10124, 10192, 20210, 10978, 10189, 117, 107, 12415, 90233, 10451, 13740, 10418, 40512, 19275, 10112, 117, 169, 19157, 83279, 10165, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "do", "n", "'", "t", "have", "any", "connection", "with", "the", "Palestinian", "##s", ",", "they", "live", "over", "there", ",", "\"", "he", "said", ",", "point", "##ing", "to", "the", "West", "Bank", "seven", "km", "(", "four", "miles", ")", "to", "the", "east", "." ], "ids": [ 107, 12865, 10149, 182, 112, 188, 10529, 11178, 31671, 10169, 10105, 56119, 10107, 117, 10689, 12962, 10491, 11155, 117, 107, 10261, 12415, 117, 12331, 10230, 10114, 10105, 11164, 13533, 15767, 10204, 113, 11598, 14148, 114, 10114, 10105, 13827, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "do", "n", "'", "t", "feel", "our", "club", "represents", "Palestinian", "Arab", "##s", ",", "\"", "said", "club", "chairman", "Abdul", "Rahman", ".", "\"" ], "ids": [ 107, 12865, 10149, 182, 112, 188, 38008, 17446, 11111, 36648, 56119, 17365, 10107, 117, 107, 12415, 11111, 27627, 23642, 41149, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "We", "are", "trying", "to", "do", "all", "we", "can", "to", "run", "a", "professional", "out", "##fit", ",", "we", "are", "pl", "##eas", "##ed", "at", "any", "support", "we", "get", ",", "but", "do", "not", "go", "out", "looking", "to", "represent", "the", "whole", "Arab", "world", ".", "\"" ], "ids": [ 12865, 10301, 32862, 10114, 10149, 10435, 11951, 10944, 10114, 14095, 169, 14054, 10950, 48865, 117, 11951, 10301, 20648, 42658, 10336, 10160, 11178, 13145, 11951, 15329, 117, 10473, 10149, 10472, 11783, 10950, 34279, 10114, 30382, 10105, 21047, 17365, 11356, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Soccer", "-", "Kennedy", "and", "Ph", "##ela", "##n", "both", "out", "of", "Irish", "squad", "." ], "ids": [ 25914, 118, 17817, 10111, 29343, 15108, 10115, 11408, 10950, 10108, 15624, 30580, 119 ], "entity": [ "O", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 4, 8, 8, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "D", "##UB", "##L", "##IN", "1996", "-", "08", "-", "23" ], "ids": [ 141, 82439, 11369, 27128, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "players", "have", "withdrawn", "from", "the", "Republic", "of", "Ireland", "squad", "for", "the", "1998", "World", "Cup", "qualifying", "match", "against", "Lie", "##chen", "##stein", "on", "August", "31", ",", "the", "Football", "Association", "of", "Ireland", "said", "in", "a", "statement", "on", "Friday", "." ], "ids": [ 13214, 16021, 10529, 84863, 10188, 10105, 13681, 10108, 14637, 30580, 10142, 10105, 10363, 10315, 11544, 43631, 12356, 11327, 39710, 11909, 16206, 10135, 10735, 10413, 117, 10105, 12499, 11751, 10108, 14637, 12415, 10106, 169, 33311, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "F", ".", "A", ".", "I", ".", "statement", "said", "that", "Liverpool", "striker", "Mark", "Kennedy", "and", "Chelsea", "defender", "Terry", "Ph", "##ela", "##n", "were", "both", "receiving", "treatment", "for", "injuries", "and", "would", "not", "be", "travelling", "to", "Lie", "##chen", "##stein", "for", "the", "game", "." ], "ids": [ 10117, 143, 119, 138, 119, 146, 119, 33311, 12415, 10189, 18376, 103325, 11997, 17817, 10111, 21450, 36426, 19902, 29343, 15108, 10115, 10309, 11408, 31391, 21379, 10142, 49718, 10111, 10894, 10472, 10347, 81353, 10114, 39710, 11909, 16206, 10142, 10105, 11661, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 3, 9, 4, 8, 9, 3, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "No", "replacement", "##s", "had", "been", "named", "." ], "ids": [ 10657, 41636, 10107, 10374, 10590, 12038, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Damien", "Lynch", ",", "Dublin", "News", "##room", "+", "353", "1", "660", "##33", "##7", "##7" ], "ids": [ 118, 118, 68189, 32703, 117, 20495, 12219, 25525, 116, 35373, 122, 37424, 69646, 11305, 11305 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Soccer", "-", "Manchester", "United", "face", "Juventus", "in", "Europe", "." ], "ids": [ 25914, 118, 15349, 10609, 13295, 33176, 10106, 11767, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 3, 9, 1, 9 ] }, { "tokens": [ "GE", "##NE", "##VA", "1996", "-", "08", "-", "23" ], "ids": [ 62997, 93280, 47172, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "European", "champions", "Juventus", "will", "face", "English", "league", "and", "cup", "double", "winners", "Manchester", "United", "in", "this", "season", "'", "s", "European", "Champions", "'", "League", "." ], "ids": [ 11914, 27745, 33176, 11337, 13295, 11616, 15616, 10111, 41506, 15790, 33525, 15349, 10609, 10106, 10531, 11226, 112, 187, 11914, 17441, 112, 11074, 119 ], "entity": [ "B-MISC", "O", "B-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 9, 3, 9, 9, 2, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "The", "draw", "made", "on", "Friday", "pit", "##ted", "Juventus", ",", "who", "beat", "Dutch", "champions", "Ajax", "Amsterdam", "4", "-", "2", "on", "penal", "##ties", "in", "last", "year", "'", "s", "final", ",", "against", "Alex", "Ferguson", "'", "s", "European", "hope", "##ful", "##s", "in", "group", "C", "." ], "ids": [ 10117, 25974, 11019, 10135, 30767, 55277, 11912, 33176, 117, 10479, 27868, 17693, 27745, 37057, 14017, 125, 118, 123, 10135, 69270, 14197, 10106, 12469, 10924, 112, 187, 11070, 117, 11327, 14728, 36401, 112, 187, 11914, 50725, 14446, 10107, 10106, 11795, 140, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 2, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "other", "two", "teams", "in", "the", "group", "are", "last", "season", "'", "s", "Cup", "Winners", "'", "Cup", "runners", "-", "up", "Rapid", "Vienna", "and", "Fe", "##ner", "##bah", "##ce", "of", "Turkey", "." ], "ids": [ 10117, 10684, 10551, 14404, 10106, 10105, 11795, 10301, 12469, 11226, 112, 187, 11544, 34686, 112, 11544, 70719, 118, 10741, 41047, 20590, 10111, 20187, 11129, 28659, 10419, 10108, 22519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 3, 7, 9, 3, 7, 7, 7, 9, 1, 9 ] }, { "tokens": [ "Juventus", "meet", "United", "in", "Turin", "on", "September", "11", ",", "with", "the", "return", "match", "at", "Old", "Tra", "##fford", "on", "November", "20", "." ], "ids": [ 33176, 23267, 10609, 10106, 32886, 10135, 10596, 10193, 117, 10169, 10105, 15079, 12356, 10160, 13773, 21469, 98680, 10135, 10819, 10197, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "United", "have", "dominated", "the", "premier", "league", "in", "the", "1990s", ",", "winning", "three", "English", "championships", "in", "four", "years", ",", "but", "have", "consistently", "failed", "in", "Europe", ",", "crash", "##ing", "out", "of", "the", "European", "Cup", "to", "Galatasaray", "of", "Turkey", "and", "Spain", "'", "s", "Barcelona", "at", "their", "last", "two", "attempts", "." ], "ids": [ 10609, 10529, 49365, 10105, 11913, 15616, 10106, 10105, 22829, 117, 16542, 11003, 11616, 47211, 10106, 11598, 10855, 117, 10473, 10529, 97742, 20775, 10106, 11767, 117, 42774, 10230, 10950, 10108, 10105, 11914, 11544, 10114, 51958, 10108, 22519, 10111, 16149, 112, 187, 12113, 10160, 10455, 12469, 10551, 30406, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-ORG", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 6, 9, 3, 9, 1, 9, 1, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "have", "not", "lift", "##ed", "a", "European", "Trophy", "since", "1991", "when", "they", "beat", "Barcelona", "in", "the", "Cup", "Winners", "'", "Cup", "final", ",", "and", "their", "one", "and", "only", "European", "Cup", "tri", "##ump", "##h", "was", "way", "back", "in", "1968", ",", "when", "they", "beat", "Benfica", "of", "Portugal", "4", "-", "1", "at", "Wembley", "." ], "ids": [ 11696, 10529, 10472, 63376, 10336, 169, 11914, 24432, 11764, 10442, 10841, 10689, 27868, 12113, 10106, 10105, 11544, 34686, 112, 11544, 11070, 117, 10111, 10455, 10464, 10111, 10893, 11914, 11544, 15633, 67299, 10237, 10134, 13170, 12014, 10106, 10698, 117, 10841, 10689, 27868, 57679, 10108, 12939, 125, 118, 122, 10160, 61563, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 3, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 1, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Juventus", "have", "won", "the", "European", "Cup", "twice", "." ], "ids": [ 33176, 10529, 11367, 10105, 11914, 11544, 26261, 119 ], "entity": [ "B-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Before", "con", "##quer", "##ing", "Ajax", "last", "year", "they", "beat", "United", "'", "s", "big", "English", "rivals", "Liverpool", "in", "the", "ill", "-", "fate", "##d", "1985", "final", "in", "the", "Hey", "##sel", "stadium", "in", "Brussels", "." ], "ids": [ 19318, 10173, 28531, 10230, 37057, 12469, 10924, 10689, 27868, 10609, 112, 187, 22185, 11616, 71908, 18376, 10106, 10105, 32941, 118, 75633, 10162, 10583, 11070, 10106, 10105, 35936, 12912, 27915, 10106, 41239, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-MISC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 3, 9, 9, 9, 2, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 9 ] }, { "tokens": [ "Nigeria", "police", "kill", "six", "ro", "##bber", "##y", "suspect", "##s", "." ], "ids": [ 22045, 15034, 32099, 12449, 25470, 60805, 10157, 97881, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##GO", "##S", "1996", "-", "08", "-", "23" ], "ids": [ 29079, 83821, 10731, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nigerian", "police", "shot", "dead", "six", "ro", "##bber", "##y", "suspect", "##s", "as", "they", "tried", "to", "escape", "from", "custody", "in", "the", "northern", "city", "of", "So", "##kot", "##o", ",", "the", "national", "news", "agency", "reported", "on", "Friday", "." ], "ids": [ 85012, 15034, 19508, 23457, 12449, 25470, 60805, 10157, 97881, 10107, 10146, 10689, 27156, 10114, 30220, 10188, 103772, 10106, 10105, 17335, 11584, 10108, 12882, 42287, 10133, 117, 10105, 11844, 14424, 34649, 15943, 10135, 30767, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "News", "Agency", "of", "Nigeria", "(", "NA", "##N", ")", "quoted", "police", "spoke", "##sman", "Umar", "Shell", "##ing", "as", "saying", "the", "six", "were", "killed", "on", "Wednesday", "." ], "ids": [ 10117, 12219, 21887, 10108, 22045, 113, 56586, 11537, 114, 70676, 15034, 50005, 24305, 81424, 47581, 10230, 10146, 22807, 10105, 12449, 10309, 15875, 10135, 57611, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "had", "been", "arrested", "last", "week", "for", "st", "##eal", "##ing", "800", ",", "000", "nai", "##ra", "(", "$", "10", ",", "000", ")", "from", "a", "sheep", "merchant", "." ], "ids": [ 11696, 10374, 10590, 29479, 12469, 16118, 10142, 28780, 30759, 10230, 11900, 117, 10259, 76206, 10288, 113, 109, 10150, 117, 10259, 114, 10188, 169, 83650, 54895, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rwanda", "##n", "group", "says", "ex", "##pulsion", "could", "be", "im", "##minent", "." ], "ids": [ 57557, 10115, 11795, 22153, 11419, 52883, 12174, 10347, 10211, 98510, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##IR", "##O", "##B", "##I", "1996", "-", "08", "-", "23" ], "ids": [ 56586, 73522, 11403, 11274, 11281, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rep", "##at", "##riat", "##ion", "of", "1", ".", "1", "million", "Rwanda", "##n", "Hut", "##u", "refugees", "announced", "by", "Za", "##ire", "and", "Rwanda", "on", "Thursday", "could", "start", "within", "the", "next", "few", "days", ",", "an", "exile", "##d", "Rwanda", "##n", "Hut", "##u", "lo", "##bby", "group", "said", "on", "Friday", "." ], "ids": [ 72337, 10526, 65441, 11046, 10108, 122, 119, 122, 12473, 57557, 10115, 104185, 10138, 71797, 13854, 10155, 14074, 11627, 10111, 57557, 10135, 67067, 12174, 15148, 12381, 10105, 13451, 13824, 13990, 117, 10151, 67696, 10162, 57557, 10115, 104185, 10138, 10406, 31444, 11795, 12415, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Innocent", "Buta", "##re", ",", "executive", "secretary", "of", "the", "Rally", "for", "the", "Return", "of", "Re", "##fuge", "##es", "and", "Democracy", "in", "Rwanda", "(", "RD", "##R", ")", "which", "says", "it", "has", "the", "support", "of", "Rwanda", "'", "s", "exile", "##d", "Hut", "##us", ",", "appeal", "##ed", "to", "the", "international", "community", "to", "det", "##er", "the", "two", "countries", "from", "going", "ahead", "with", "what", "it", "terme", "##d", "a", "\"", "forced", "and", "in", "##hum", "##an", "action", "\"", "." ], "ids": [ 75882, 46655, 10246, 117, 22676, 37664, 10108, 10105, 42161, 10142, 10105, 28736, 10108, 20304, 101935, 10171, 10111, 45762, 10106, 57557, 113, 59107, 11273, 114, 10319, 22153, 10271, 10393, 10105, 13145, 10108, 57557, 112, 187, 67696, 10162, 104185, 10251, 117, 44861, 10336, 10114, 10105, 12533, 13354, 10114, 10349, 10165, 10105, 10551, 15911, 10188, 19090, 35629, 10169, 12976, 10271, 15830, 10162, 169, 107, 20054, 10111, 10106, 43504, 10206, 14204, 107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Orthodox", "church", "blow", "##n", "up", "in", "southern", "Croatia", "." ], "ids": [ 37853, 14201, 106194, 10115, 10741, 10106, 17156, 34993, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Z", "##AG", "##RE", "##B", "1996", "-", "08", "-", "23" ], "ids": [ 163, 109865, 66014, 11274, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sa", "##bot", "##eurs", "ble", "##w", "up", "a", "Ser", "##b", "ort", "##hod", "##ox", "church", "in", "southern", "Croatia", "on", "Friday", "with", "a", "bl", "##ast", "which", "also", "damaged", "four", "nearby", "homes", ",", "the", "state", "news", "agency", "Hi", "##na", "reported", "." ], "ids": [ 12404, 25022, 17824, 10718, 10874, 10741, 169, 39759, 10457, 25461, 54441, 31978, 14201, 10106, 17156, 34993, 10135, 30767, 10169, 169, 21484, 15171, 10319, 10379, 39034, 11598, 22301, 14154, 117, 10105, 11388, 14424, 34649, 20065, 10219, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "H", "##IN", "##A", "said", "the", "church", "in", "the", "small", "village", "of", "Karin", "Gornji", ",", "30", "km", "(", "19", "miles", ")", "north", "of", "Zadar", ",", "was", "destroyed", "by", "the", "morning", "attack", "." ], "ids": [ 145, 27128, 10738, 12415, 10105, 14201, 10106, 10105, 12474, 11607, 10108, 41633, 79740, 117, 10244, 10204, 113, 10270, 14148, 114, 12756, 10108, 110680, 117, 10134, 24089, 10155, 10105, 28757, 16342, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "did", "not", "report", "any", "casualties", "." ], "ids": [ 10377, 12172, 10472, 17553, 11178, 69297, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zadar", "police", "said", "in", "a", "statement", "they", "had", "launched", "an", "investigation", "and", "were", "doing", "their", "best", "to", "find", "the", "per", "##pet", "##rators", "." ], "ids": [ 110680, 15034, 12415, 10106, 169, 33311, 10689, 10374, 18850, 10151, 32719, 10111, 10309, 30918, 10455, 12504, 10114, 17860, 10105, 10178, 19094, 94721, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##IN", "##A", "said", "it", "was", "the", "first", "time", "an", "ort", "##hod", "##ox", "church", "had", "been", "blow", "##n", "up", "in", "the", "Zadar", "hinter", "##land", ",", "where", "a", "large", "number", "of", "Ser", "##bs", "lived", "before", "the", "1991", "war", "over", "Croatia", "'", "s", "independence", "from", "the", "Yugoslav", "fede", "##ration", "." ], "ids": [ 145, 27128, 10738, 12415, 10271, 10134, 10105, 10422, 10635, 10151, 25461, 54441, 31978, 14201, 10374, 10590, 106194, 10115, 10741, 10106, 10105, 110680, 26022, 11080, 117, 10940, 169, 12077, 11487, 10108, 39759, 19528, 17603, 11360, 10105, 10442, 10338, 10491, 34993, 112, 187, 31412, 10188, 10105, 93444, 83482, 19466, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "The", "area", "was", "part", "of", "the", "self", "-", "style", "##d", "state", "of", "Kraj", "##ina", "proclaimed", "by", "minority", "Ser", "##bs", "in", "1991", "and", "reca", "##ptur", "##ed", "by", "the", "Croatian", "army", "last", "year", "." ], "ids": [ 10117, 11168, 10134, 10668, 10108, 10105, 16567, 118, 13351, 10162, 11388, 10108, 98619, 11067, 92906, 10155, 54147, 39759, 19528, 10106, 10442, 10111, 103778, 88230, 10336, 10155, 10105, 48963, 17977, 12469, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Up", "to", "200", ",", "000", "Ser", "##bs", "fled", "to", "Bosnia", "and", "Yugoslavia", ",", "leaving", "Kraj", "##ina", "vacant", "and", "de", "##pop", "##ulated", "." ], "ids": [ 13656, 10114, 10777, 117, 10259, 39759, 19528, 56598, 10114, 29634, 10111, 38168, 117, 21005, 98619, 11067, 81151, 10111, 10104, 63229, 37725, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hungary", "'", "s", "gross", "foreign", "debt", "rises", "in", "June", "." ], "ids": [ 24601, 112, 187, 92746, 20796, 55869, 91144, 10106, 11120, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UD", "##AP", "##ES", "##T", "1996", "-", "08", "-", "23" ], "ids": [ 139, 86888, 38423, 25054, 11090, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hungary", "'", "s", "gross", "foreign", "debt", "rose", "to", "$", "27", ".", "53", "billion", "in", "June", "from", "$", "27", ".", "25", "billion", "in", "May", ",", "the" ], "ids": [ 24601, 112, 187, 92746, 20796, 55869, 29467, 10114, 109, 10365, 119, 11756, 25848, 10106, 11120, 10188, 109, 10365, 119, 10258, 25848, 10106, 10725, 117, 10105 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "National", "Bank", "of", "Hungary", "(", "NB", "##H", ")", "said", "on", "Friday", "." ], "ids": [ 10655, 13533, 10108, 24601, 113, 89980, 12396, 114, 12415, 10135, 30767, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##IG", "##UR", "##ES", "IN", "$", "MI", "##LL", "##ION", "June", "1996", "May", "1996" ], "ids": [ 143, 89696, 98348, 25054, 36351, 109, 75416, 82834, 52980, 11120, 10389, 10725, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gross", "foreign", "debt", "27", ",", "535", ".", "5", "27", ",", "246", ".", "5" ], "ids": [ 50557, 20796, 55869, 10365, 117, 45269, 119, 126, 10365, 117, 26439, 119, 126 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "International", "reserves", "and" ], "ids": [ 10771, 60405, 10111 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "other", "foreign", "assets", "13", ",", "256", ".", "5", "12", ",", "855", ".", "7" ], "ids": [ 10684, 20796, 51701, 10249, 117, 21475, 119, 126, 10186, 117, 65061, 119, 128 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "foreign", "debt", "14", ",", "278", ".", "9", "14", ",", "390", ".", "7" ], "ids": [ 32577, 20796, 55869, 10247, 117, 29417, 119, 130, 10247, 117, 28323, 119, 128 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "foreign", "debt", "of", "the" ], "ids": [ 32577, 20796, 55869, 10108, 10105 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "government", "and", "NB", "##H", "9", ",", "510", ".", "9", "10", ",", "056", ".", "4" ], "ids": [ 12047, 10111, 89980, 12396, 130, 117, 34959, 119, 130, 10150, 117, 101451, 119, 125 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Budapest", "news", "##room", "(", "36", "1", ")", "266", "241", "##0" ], "ids": [ 118, 118, 14745, 14424, 25525, 113, 11055, 122, 114, 28477, 23536, 10929 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Germany", ",", "Poland", "tight", "##en", "cooperation", "against", "crime", "." ], "ids": [ 12775, 117, 17879, 85202, 10136, 56547, 11327, 22564, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AR", "##SA", "##W", "1996", "-", "08", "-", "23" ], "ids": [ 160, 52188, 27138, 13034, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Germany", "and", "Poland", "agreed", "on", "Friday", "to", "tight", "##en", "cooperation", "between", "their", "intelligence", "services", "in", "fighting", "international", "organised", "crime", ",", "PA", "##P", "news", "agency", "reported", "." ], "ids": [ 12775, 10111, 17879, 25577, 10135, 30767, 10114, 85202, 10136, 56547, 10948, 10455, 30151, 12639, 10106, 27535, 12533, 54200, 22564, 117, 32349, 11127, 14424, 34649, 15943, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Interior", "Minister", "Zbigniew", "Sie", "##mia", "##tko", "##wski", "and", "Bernd", "Schmid", "##bauer", ",", "German", "intelligence", "co", "-", "ord", "##inato", "##r", "in", "Helmut", "Kohl", "'", "s", "chance", "##ller", "##y", ",", "seal", "##ed", "the", "closer", "links", "during", "talks", "in", "Warsaw", "." ], "ids": [ 33667, 14355, 62561, 11583, 15684, 46627, 16231, 10111, 49554, 74213, 60863, 117, 12026, 30151, 11170, 118, 39381, 78688, 10129, 10106, 25970, 106563, 112, 187, 27893, 18289, 10157, 117, 37985, 10336, 10105, 54561, 23608, 10939, 56672, 10106, 43669, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Ministry", "spoke", "##sman", "Ryszard", "Hi", "##nc", "##za", "told", "the", "Polish", "agency", "the", "services", "would", "work", "together", "against", "mafia", "-", "style", "groups", ",", "drug", "sm", "##uggling", "and", "illegal", "trade", "in", "arms", "and", "radio", "##active", "materials", "." ], "ids": [ 19170, 50005, 24305, 84076, 20065, 29420, 10637, 21937, 10105, 19870, 34649, 10105, 12639, 10894, 11424, 14229, 11327, 93147, 118, 13351, 15647, 117, 20998, 39709, 85808, 10111, 39806, 18908, 10106, 28150, 10111, 12429, 80417, 23193, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "##s", ",", "Che", "##chen", "##s", "say", "ob", "##ser", "##ving", "G", "##ro", "##zny", "cea", "##sef", "##ire", "." ], "ids": [ 13463, 10107, 117, 44131, 11909, 10107, 23763, 17339, 12754, 16297, 144, 10567, 25424, 25578, 107749, 11627, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 2, 6, 6, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "GR", "##O", "##Z", "##NY", ",", "Russia", "1996", "-", "08", "-", "23" ], "ids": [ 58787, 11403, 13966, 85771, 117, 14664, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rebel", "fighters", "and", "Russian", "soldiers", "said", "a", "cea", "##sef", "##ire", "effective", "at", "no", "##on", "(", "080", "##0", "GMT", ")", "on", "Friday", "was", "being", "generally", "observed", ",", "although", "scattered", "gun", "##fire", "e", "##cho", "##ed", "through", "the", "Che", "##chen", "capital", "G", "##ro", "##zny", "." ], "ids": [ 54470, 62450, 10111, 13463, 23324, 12415, 169, 25578, 107749, 11627, 26874, 10160, 10192, 10263, 113, 81051, 10929, 20362, 114, 10135, 30767, 10134, 11223, 18081, 34148, 117, 14779, 95335, 23103, 38990, 173, 16575, 10336, 11222, 10105, 44131, 11909, 12185, 144, 10567, 25424, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "Russian", "army", "said", "earlier", "it", "was", "preparing", "to", "withdraw", "from", "the", "rebel", "-", "dominated", "southern", "mountains", "of", "the", "region", "as", "part", "of", "the", "peace", "deal", "reached", "with", "separat", "##ists", "on", "Thursday", "." ], "ids": [ 10117, 13463, 17977, 12415, 18905, 10271, 10134, 90798, 10114, 100987, 10188, 10105, 56696, 118, 49365, 17156, 44623, 10108, 10105, 12220, 10146, 10668, 10108, 10105, 28101, 19918, 17087, 10169, 81806, 18206, 10135, 67067, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "has", "been", "some", "shooting", "from", "their", "side", "but", "it", "has", "been", "relatively", "quiet", ",", "\"", "said", "fighter", "As", "##lan", "Sha", "##ba", "##zov", ",", "a", "bear", "##ded", "man", "wearing", "a", "white", "t", "-", "shirt", "and", "cam", "##of", "##lage", "tro", "##use", "##rs", "." ], "ids": [ 107, 11723, 10393, 10590, 11152, 38969, 10188, 10455, 12250, 10473, 10271, 10393, 10590, 28436, 104951, 117, 107, 12415, 49422, 10882, 12055, 106583, 10537, 74883, 117, 169, 54052, 21597, 10817, 56157, 169, 15263, 188, 118, 81050, 10111, 88406, 20324, 20433, 42169, 12730, 10943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Soon", "after", "he", "spoke", "another", "bu", "##rst", "of", "gun", "##fire", "rock", "##ed", "the", "court", "##yard", "where", "the", "rebels", "had", "set", "up", "their", "base", "and", "a", "captured", "Russian", "T", "-", "72", "tank", "ro", "##ared", "out", "to", "investigate", "." ], "ids": [ 40456, 10662, 10261, 50005, 12864, 11499, 21328, 10108, 23103, 38990, 12249, 10336, 10105, 14866, 29629, 10940, 10105, 57545, 10374, 11847, 10741, 10455, 11404, 10111, 169, 25030, 13463, 157, 118, 12120, 28671, 25470, 104931, 10950, 10114, 78189, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "separat", "##ists", ",", "who", "s", "##we", "##pt", "into", "G", "##ro", "##zny", "on", "August", "6", ",", "still", "control", "large", "areas", "of", "the", "centre", "of", "town", ",", "and", "Russian", "soldiers", "are", "based", "at", "check", "##point", "##s", "on", "the", "approach", "roads", "." ], "ids": [ 10117, 81806, 18206, 117, 10479, 187, 12577, 14971, 10708, 144, 10567, 25424, 10135, 10735, 127, 117, 12647, 12608, 12077, 14544, 10108, 10105, 12672, 10108, 12221, 117, 10111, 13463, 23324, 10301, 11610, 10160, 43662, 45676, 10107, 10135, 10105, 23068, 36970, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "cea", "##sef", "##ire", "is", "being", "observed", ",", "\"", "said", "woman", "soldier", "Svetlana", "Go", "##nch", "##aro", "##va", ",", "35", ",", "short", "dark", "hair", "po", "##king", "out", "from", "under", "a", "peaked", "cam", "##ou", "##f", "##lage", "cap", "." ], "ids": [ 107, 10117, 25578, 107749, 11627, 10124, 11223, 34148, 117, 107, 12415, 18299, 50803, 105062, 14439, 31215, 24489, 10362, 117, 10803, 117, 13716, 25100, 40830, 10514, 15629, 10950, 10188, 10571, 169, 45796, 88406, 11010, 10575, 20433, 13337, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "few", "helicopter", "##s", "flew", "over", "##head", ",", "firing", "off", "fl", "##ares", ",", "but", "there", "was", "no", "shooting", "from", "the", "air", "." ], "ids": [ 138, 13824, 80634, 10107, 64284, 10491, 20391, 117, 68573, 11898, 58768, 27458, 117, 10473, 11155, 10134, 10192, 38969, 10188, 10105, 12566, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tr", "##uce", ",", "the", "latest", "of", "several", ",", "was", "agreed", "in", "talks", "on", "Thursday", "between", "Russian", "peace", "##maker", "Alexander", "Le", "##bed", "and", "rebel", "chief", "-", "of", "-", "staff", "As", "##lan", "Mask", "##hado", "##v", "." ], "ids": [ 10117, 32221, 24075, 117, 10105, 50908, 10108, 11736, 117, 10134, 25577, 10106, 56672, 10135, 67067, 10948, 13463, 28101, 32295, 12063, 10281, 33627, 10111, 56696, 19421, 118, 10108, 118, 18927, 10882, 12055, 69189, 54719, 10477, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "The", "two", "also", "agreed", "to", "set", "up", "joint", "patrol", "##s", "in", "G", "##ro", "##zny", ",", "but", "Go", "##nch", "##aro", "##va", "said", "she", "was", "s", "##cept", "##ical", "about", "whether", "this", "could", "work", "." ], "ids": [ 10117, 10551, 10379, 25577, 10114, 11847, 10741, 25680, 62976, 10107, 10106, 144, 10567, 25424, 117, 10473, 14439, 31215, 24489, 10362, 12415, 10833, 10134, 187, 97782, 17616, 10978, 21883, 10531, 12174, 11424, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "to", "try", "it", ",", "but", "I", "doubt", "if", "this", "is", "possible", "with", "the", "separat", "##ists", ",", "\"", "she", "said", "." ], "ids": [ 107, 12865, 10529, 10114, 31638, 10271, 117, 10473, 146, 86697, 12277, 10531, 10124, 14128, 10169, 10105, 81806, 18206, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##EA", "##TH", "##ER", "-", "Con", "##ditions", "at", "C", "##IS", "airport", "##s", "-", "August", "23", "." ], "ids": [ 160, 36789, 109166, 24093, 118, 12845, 91936, 10160, 140, 19088, 28460, 10107, 118, 10735, 10328, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "23" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "closure", "##s", "of", "airport", "##s", "in", "the", "Commonwealth", "of", "Independent", "States", "are", "expected", "on", "August", "24", "and", "August", "25", ",", "the", "Russian", "Weather", "Service", "said", "on", "Friday", "." ], "ids": [ 10657, 69177, 10107, 10108, 28460, 10107, 10106, 10105, 22603, 10108, 20199, 10859, 10301, 25973, 10135, 10735, 10233, 10111, 10735, 10258, 117, 10105, 13463, 48843, 13489, 12415, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Moscow", "News", "##room", "+", "709", "##5", "941", "852", "##0" ], "ids": [ 118, 118, 18744, 12219, 25525, 116, 67432, 11166, 82944, 70072, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gran", "##ic", "arrives", "to", "sign", "Croatia", "-", "Yugoslavia", "treaty", "." ], "ids": [ 13272, 11130, 69631, 10114, 26794, 34993, 118, 38168, 56353, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "23" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yugoslavia", "and", "Croatia", "were", "pois", "##ed", "on", "Friday", "to", "sign", "a", "landmark", "normal", "##isation", "treaty", "ending", "five", "years", "of", "tensions", "and", "pa", "##ving", "way", "for", "stabil", "##isation", "in", "the", "Balkans", "." ], "ids": [ 38168, 10111, 34993, 10309, 20487, 10336, 10135, 30767, 10114, 26794, 169, 91993, 16626, 20312, 56353, 29077, 12403, 10855, 10108, 69545, 10111, 10931, 16297, 13170, 10142, 71338, 20312, 10106, 10105, 89251, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Croatian", "Foreign", "Minister", "Mate", "Gran", "##ic", "landed", "at", "Belgrade", "airport", "aboard", "a", "Croatian", "government", "jet", "on", "Friday", "morning", "for", "talks", "with", "his", "Yugoslav", "counter", "##parts", "and", "a", "signing", "ceremony", "expected", "around", "no", "##on", "(", "1000", "GMT", ")", "." ], "ids": [ 48963, 20277, 14355, 99603, 13272, 11130, 58961, 10160, 48084, 28460, 65331, 169, 48963, 12047, 48504, 10135, 30767, 28757, 10142, 56672, 10169, 10226, 93444, 46298, 86197, 10111, 169, 46529, 34713, 25973, 12166, 10192, 10263, 113, 12186, 20362, 114, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "On", "Thursday", "the", "Yugoslav", "government", "endorsed", "the", "text", "of", "the", "agreement", "on", "normal", "##ising", "relations", "between", "the", "two", "countries", ",", "the", "Yugoslav", "news", "agency", "Tan", "##ju", "##g", "said", "." ], "ids": [ 10576, 67067, 10105, 93444, 12047, 108417, 10105, 15541, 10108, 10105, 25432, 10135, 16626, 53624, 19824, 10948, 10105, 10551, 15911, 117, 10105, 93444, 14424, 34649, 30594, 10761, 10240, 12415, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "\"", "The", "government", "ass", "##esse", "##d", "the", "agreement", "as", "a", "crucial", "step", "to", "reso", "##lv", "##ing", "the", "Yugoslav", "crisis", ",", "ens", "##uring", "the", "restoration", "of", "peace", "in", "former", "Yugoslavia", ",", "\"", "it", "said", "." ], "ids": [ 107, 10117, 12047, 13935, 24641, 10162, 10105, 25432, 10146, 169, 63113, 31877, 10114, 86286, 56963, 10230, 10105, 93444, 22859, 117, 55683, 31653, 10105, 53051, 10108, 28101, 10106, 11775, 38168, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "-", "minute", "talks", "this", "week", "on", "the", "legal", "fine", "print", "finally", "cleared", "the", "way", "for", "a", "treaty", "based", "on", "mutual", "recognition", "within", "internationally", "recognised", "borders", "and", "the", "establishment", "of", "diplomatic", "relations", ",", "diplomat", "##s", "said", "." ], "ids": [ 14812, 118, 21760, 56672, 10531, 16118, 10135, 10105, 17139, 13435, 31210, 21256, 90076, 10105, 13170, 10142, 169, 56353, 11610, 10135, 85412, 31477, 12381, 58504, 59344, 47360, 10111, 10105, 31989, 10108, 64838, 19824, 117, 45652, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "pa", "##ct", "ends", "five", "years", "of", "host", "##ility", "after", "Croatia", "'", "s", "sec", "##ession", "from", "federal", "Yugoslavia", "." ], "ids": [ 10117, 10931, 14526, 29047, 12403, 10855, 10108, 19317, 44704, 10662, 34993, 112, 187, 37913, 78843, 10188, 16293, 38168, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Western", "powers", "regard", "diplomatic", "normal", "##isation", "between", "Croatia", "and", "Serbia", ",", "twin", "pi", "##llar", "##s", "of", "the", "old", "multi", "##national", "federal", "Yugoslavia", ",", "as", "a", "crucial", "step", "towards", "a", "lasting", "peace", "in", "the", "Balkans", "." ], "ids": [ 13163, 32043, 42047, 64838, 16626, 20312, 10948, 34993, 10111, 20141, 117, 50200, 24109, 37203, 10107, 10108, 10105, 12898, 21247, 110092, 16293, 38168, 117, 10146, 169, 63113, 31877, 18095, 169, 88428, 28101, 10106, 10105, 89251, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Ecuador", "president", "to", "lu", "##nch", "with", "ethnic", "Indians", "." ], "ids": [ 20475, 12931, 10114, 14657, 31215, 10169, 34216, 33032, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "Q", "##UI", "##TO", ",", "Ecuador", "1996", "-", "08", "-", "23" ], "ids": [ 154, 83259, 60493, 117, 20475, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ecuador", "'", "s", "President", "Abd", "##ala", "Bu", "##cara", "##m", "has", "announced", "he", "will", "hold", "regular", "lu", "##nches", "in", "his", "presidential", "palace", "for", "members", "of", "the", "country", "'", "s", "different", "ethnic", "groups", "as", "of", "next", "week", "." ], "ids": [ 20475, 112, 187, 12811, 33549, 13322, 11916, 33585, 10147, 10393, 13854, 10261, 11337, 18500, 15670, 14657, 101385, 10106, 10226, 36476, 52140, 10142, 12464, 10108, 10105, 12723, 112, 187, 12902, 34216, 15647, 10146, 10108, 13451, 16118, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "was", "about", "time", "for", "the", "Indians", ",", "the", "black", "##s", "and", "the", "mixed", "-", "blood", "##s", "to", "begin", "eating", "in", "the", "palace", "with", "their", "president", "because", "this", "is", "not", "a", "palace", "exclusively", "for", "the", "pot", "##entat", "##es", "and", "ambassador", "##s", "and", "protocol", ",", "\"", "Bu", "##cara", "##m", "said", "late", "on", "Thursday", "." ], "ids": [ 107, 10377, 10134, 10978, 10635, 10142, 10105, 33032, 117, 10105, 15045, 10107, 10111, 10105, 23742, 118, 24911, 10107, 10114, 16135, 77596, 10106, 10105, 52140, 10169, 10455, 12931, 12373, 10531, 10124, 10472, 169, 52140, 55774, 10142, 10105, 15050, 61876, 10171, 10111, 74853, 10107, 10111, 69937, 117, 107, 11916, 33585, 10147, 12415, 13002, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "In", "these", "weekly", "lu", "##nches", "we", "are", "going", "to", "get", "to", "know", "the", "problems", "of", "the", "Indian", ",", "mixed", "-", "race", ",", "black", "and", "pe", "##asan", "##t", "sectors", ",", "\"", "he", "said", "." ], "ids": [ 107, 10167, 11762, 33159, 14657, 101385, 11951, 10301, 19090, 10114, 15329, 10114, 21852, 10105, 20390, 10108, 10105, 12544, 117, 23742, 118, 14025, 117, 15045, 10111, 11161, 32322, 10123, 69714, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "has", "invited", "35", "Indian", "leaders", "to", "lu", "##nch", "next", "Tuesday", "." ], "ids": [ 10357, 10393, 33392, 10803, 12544, 24155, 10114, 14657, 31215, 13451, 70245, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bu", "##cara", "##m", ",", "who", "was", "elected", "on", "a", "pop", "##ulis", "##t", "platform", "last", "month", ",", "also", "plans", "to", "create", "a", "ministry", "for", "ethnic", "cultures", "." ], "ids": [ 11916, 33585, 10147, 117, 10479, 10134, 14254, 10135, 169, 13717, 52393, 10123, 22753, 12469, 14064, 117, 10379, 18195, 10114, 18842, 169, 65338, 10142, 34216, 36782, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "And", "##ean", "nation", "'", "s", "population", "of", "11", ".", "4", "million", "is", "47", "percent", "indigenous", "." ], "ids": [ 10117, 12689, 14654, 22274, 112, 187, 11077, 10108, 10193, 119, 125, 12473, 10124, 11413, 22362, 49226, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazil", "to", "use", "ho", "##ver", "##craft", "##s", "for", "Amazon", "travel", "." ], "ids": [ 16765, 10114, 11760, 13173, 12563, 37934, 10107, 10142, 27986, 23595, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "BR", "##AS", "##IL", "##IA", "1996", "-", "08", "-", "22" ], "ids": [ 49351, 38025, 38850, 35976, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ho", "##ver", "##craft", "##s", "will", "soon", "be", "pl", "##ying", "the", "waters", "of", "the", "Amazon", "in", "a", "bid", "to", "reduce", "the", "difficulties", "of", "transportation", "on", "the", "vast", "Brazilian", "water", "##way", ",", "the", "government", "said", "on", "Thursday", "." ], "ids": [ 20220, 12563, 37934, 10107, 11337, 17864, 10347, 20648, 40018, 10105, 42646, 10108, 10105, 27986, 10106, 169, 50385, 10114, 29888, 10105, 64557, 10108, 48546, 10135, 10105, 35472, 32818, 12286, 14132, 117, 10105, 12047, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "Russian", "-", "built", "ho", "##ver", "##craft", "##s", ",", "capable", "of", "carrying", "up", "to", "50", "tons", "each", ",", "will", "begin", "ferry", "##ing", "passengers", "and", "cargo", "up", "and", "down", "the", "huge", "river", "from", "its", "mouth", "at", "Bel", "##em", "by", "the", "end", "of", "the", "year", ",", "Brazil", "'", "s", "Amazon", "Affairs", "Department", "said", "in", "a", "statement", "." ], "ids": [ 13214, 13463, 118, 12183, 13173, 12563, 37934, 10107, 117, 29298, 10108, 39157, 10741, 10114, 10462, 33882, 11948, 117, 11337, 16135, 69607, 10230, 37008, 10111, 15856, 10741, 10111, 12935, 10105, 42126, 16965, 10188, 10474, 42213, 10160, 47197, 10451, 10155, 10105, 11572, 10108, 10105, 10924, 117, 16765, 112, 187, 27986, 20891, 12933, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "use", "of", "river", "##ways", "in", "the", "region", "has", "been", "made", "a", "priority", "under", "a", "government", "plan", "for", "the", "Amazon", "and", "the", "high", "-", "speed", "ho", "##ver", "##craft", "will", "help", "reduce", "the", "time", "involved", "in", "travelling", "often", "massive", "distances", ",", "it", "said", "." ], "ids": [ 10117, 11760, 10108, 16965, 36869, 10106, 10105, 12220, 10393, 10590, 11019, 169, 92602, 10571, 169, 12047, 13065, 10142, 10105, 27986, 10111, 10105, 11846, 118, 19085, 13173, 12563, 37934, 11337, 15217, 29888, 10105, 10635, 16247, 10106, 81353, 12899, 35394, 73936, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "HK", "'", "s", "T", "##sang", "to", "visit", "Indonesia", ",", "New", "Zealand", "." ], "ids": [ 33150, 112, 187, 157, 45952, 10114, 27541, 11658, 117, 10287, 14451, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 9, 9, 1, 9, 1, 5, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "23" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", "Financial", "Secretary", "Donald", "T", "##sang", "will", "visit", "Indonesia", "and", "New", "Zealand", "from", "August", "25", "to", "31", ",", "the", "government", "said", "on", "Friday", "." ], "ids": [ 15078, 14577, 30738, 19382, 16437, 157, 45952, 11337, 27541, 11658, 10111, 10287, 14451, 10188, 10735, 10258, 10114, 10413, 117, 10105, 12047, 12415, 10135, 30767, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 4, 8, 8, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Jakarta", ",", "T", "##sang", "will", "meet", "President", "Su", "##hart", "##o", ",", "Minister", "of", "Finance", "Mar", "'", "ie", "Muhammad", ",", "Minister", "of", "Foreign", "Affairs", "Ali", "Ala", "##tas", "and", "Minister", "of", "Trade", "and", "Industry", "Tun", "##g", "##ky", "Ari", "##wi", "##bow", "##o", "." ], "ids": [ 10167, 14164, 117, 157, 45952, 11337, 23267, 12811, 12271, 34567, 10133, 117, 14355, 10108, 38533, 15734, 112, 58701, 17573, 117, 14355, 10108, 20277, 20891, 13518, 56500, 11390, 10111, 14355, 10108, 15006, 10111, 25539, 77056, 10240, 11445, 19365, 15926, 63081, 10133, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 3, 4, 8, 8, 8, 9, 9, 9, 3, 7, 4, 8, 8, 9, 9, 9, 3, 7, 7, 4, 8, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "On", "his", "New", "Zealand", "leg", "from", "August", "29", ",", "T", "##sang", "will", "meet", "Prime", "Minister", "Jim", "Bol", "##ger", ",", "Deputy", "Prime", "Minister", "Don", "M", "##c", "##K", "##innon", "and", "Minister", "of", "Finance", "Bill", "Birch", "." ], "ids": [ 10576, 10226, 10287, 14451, 33810, 10188, 10735, 10386, 117, 157, 45952, 11337, 23267, 19924, 14355, 14178, 45598, 11446, 117, 32389, 19924, 14355, 11740, 150, 10350, 11733, 90718, 10111, 14355, 10108, 38533, 13160, 100806, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 3, 4, 8, 9 ] }, { "tokens": [ "Jordan", "ex", "##pel", "##s", "Iraqi", "diplomat", "after", "br", "##ead", "rio", "##ts", "." ], "ids": [ 16366, 11419, 17703, 10107, 57806, 45652, 10662, 33989, 30297, 27244, 10806, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rana", "Sa", "##bba", "##gh" ], "ids": [ 60970, 12404, 55350, 15774 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "AM", "##MA", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 24339, 30696, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jordan", ",", "which", "has", "bl", "##amed", "Iraq", "for", "br", "##ead", "rio", "##ts", "last", "week", ",", "has", "asked", "an", "Iraqi", "diplomat", "to", "leave", ",", "official", "and", "diplomatic", "sources", "said", "on", "Friday", "." ], "ids": [ 16366, 117, 10319, 10393, 21484, 83865, 21455, 10142, 33989, 30297, 27244, 10806, 12469, 16118, 117, 10393, 22151, 10151, 57806, 45652, 10114, 21964, 117, 14731, 10111, 64838, 19023, 12415, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "main", "Friday", "prayer", "##s", "in", "southern", "Jordan", "that", "were", "the", "starting", "point", "for", "the", "rio", "##ts", "a", "week", "ago", "passed", "peace", "##fully", "under", "tight", "security", "imposed", "by", "the", "army", "with", "only", "brief", "demonstration", "##s", "reported", "." ], "ids": [ 10117, 12126, 30767, 82012, 10107, 10106, 17156, 16366, 10189, 10309, 10105, 21868, 12331, 10142, 10105, 27244, 10806, 169, 16118, 36390, 20006, 28101, 42920, 10571, 85202, 21849, 83358, 10155, 10105, 17977, 10169, 10893, 29040, 97929, 10107, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Adel", "Ibrahim", ",", "the", "Iraqi", "em", "##bas", "##sy", "'", "s", "press", "att", "##ache", ",", "was", "asked", "to", "leave", "\"", "because", "he", "was", "carrying", "out", "duties", "in", "##com", "##pati", "##ble", "with", "diplomatic", "nor", "##ms", "\"", ",", "one", "source", "told", "Reuters", ",", "im", "##ply", "##ing", "he", "was", "accused", "of", "sp", "##ying", "." ], "ids": [ 80444, 30727, 117, 10105, 57806, 10266, 21322, 16105, 112, 187, 21040, 10788, 41944, 117, 10134, 22151, 10114, 21964, 107, 12373, 10261, 10134, 39157, 10950, 40266, 10106, 22530, 33399, 11203, 10169, 64838, 31515, 12387, 107, 117, 10464, 15247, 21937, 46617, 117, 10211, 59146, 10230, 10261, 10134, 37303, 10108, 32650, 40018, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ibrahim", "told", "Reuters", "by", "telephone", "from", "his", "em", "##bas", "##sy", "office", "in", "Amman", "that", "he", "\"", "had", "not", "been", "noti", "##fied", "\"", "of", "any", "ex", "##plus", "##ion", "order", "." ], "ids": [ 30727, 21937, 46617, 10155, 69009, 10188, 10226, 10266, 21322, 16105, 14301, 10106, 107098, 10189, 10261, 107, 10374, 10472, 10590, 75349, 19907, 107, 10108, 11178, 11419, 70413, 11046, 12990, 119 ], "entity": [ "B-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "declined", "official", "comment", "." ], "ids": [ 10117, 12047, 44948, 14731, 49641, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ibrahim", "'", "s", "assistant", ",", "Hussein", "K", "##hala", "##f", ",", "was", "expelled", "earlier", "this", "year", "for", "similar", "reasons", "ami", "##d", "rising", "tension", "in", "bila", "##teral", "ties", "after", "King", "Hussein", "began", "calling", "for", "change", "in", "Baghdad", "following", "top", "Iraqi", "def", "##ection", "##s", "in", "August", "1995", "." ], "ids": [ 30727, 112, 187, 20999, 117, 49053, 148, 47668, 10575, 117, 10134, 90811, 18905, 10531, 10924, 10142, 13213, 31725, 16992, 10162, 53816, 55027, 10106, 12517, 98161, 45169, 10662, 11515, 49053, 11941, 37023, 10142, 15453, 10106, 73055, 11901, 12364, 57806, 100745, 71510, 10107, 10106, 10735, 10436, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 1, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraq", "ret", "##alia", "##ted", "then", "by", "ex", "##pel", "##ling", "a", "junior", "administrator", "working", "in", "the", "Jordan", "##ian", "em", "##bas", "##sy", "in", "Baghdad", "but", "has", "continued", "its", "policy", "of", "trying", "to", "avoid", "public", "conflicts", "with", "Jordan", "-", "-", "its", "only", "secure", "route", "to", "the", "rest", "of", "the", "world", "." ], "ids": [ 21455, 62893, 35954, 11912, 11059, 10155, 11419, 17703, 11945, 169, 21854, 67190, 14616, 10106, 10105, 16366, 11630, 10266, 21322, 16105, 10106, 73055, 10473, 10393, 14278, 10474, 14368, 10108, 32862, 10114, 33253, 11683, 83594, 10169, 16366, 118, 118, 10474, 10893, 45853, 13933, 10114, 10105, 17333, 10108, 10105, 11356, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jordan", "has", "accused", "Iraq", "and", "a", "local", "pro", "-", "Baghdad", "party", "for", "the", "country", "'", "s", "worst", "un", "##rest", "in", "seven", "years", "which", "eru", "##pted", "after", "it", "almost", "double", "##d", "the", "prices", "of", "br", "##ead", "last", "week", "under", "radical", "economic", "reforms", "agreed", "with", "the", "International", "Monetary", "Fund", "." ], "ids": [ 16366, 10393, 37303, 21455, 10111, 169, 11436, 11284, 118, 73055, 14039, 10142, 10105, 12723, 112, 187, 62006, 10119, 34189, 10106, 15767, 10855, 10319, 18098, 64471, 10662, 10271, 17122, 15790, 10162, 10105, 57476, 10108, 33989, 30297, 12469, 16118, 10571, 31991, 13925, 71856, 25577, 10169, 10105, 10771, 100549, 26762, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "In", "Kara", "##k", ",", "where", "two", "days", "of", "rio", "##ts", "fl", "##ared", "last", "Friday", ",", "a", "few", "hundred", "young", "men", "li", "##ngere", "##d", "outside", "Omar", "##i", "mosque", "on", "leaving", ",", "sh", "##out", "##ing", "slogan", "##s", "for", "about", "15", "minutes", "." ], "ids": [ 10167, 34635, 10174, 117, 10940, 10551, 13990, 10108, 27244, 10806, 58768, 104931, 12469, 30767, 117, 169, 13824, 34242, 14739, 10588, 11614, 65154, 10162, 17555, 27221, 10116, 95493, 10135, 21005, 117, 48201, 17514, 10230, 68732, 10107, 10142, 10978, 10208, 15304, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Dis", "##pers", "##e", ",", "ab", "##sta", "##in", "from", "forming", "groups", "and", "help", "maintain", "order", ",", "\"", "army", "officers", ",", "who", "has", "en", "##forced", "a", "loose", "cu", "##rf", "##ew", "since", "the", "rio", "##ts", ",", "told", "the", "crowd", "through", "lo", "##uds", "##pea", "##kers", "." ], "ids": [ 107, 101270, 24193, 10112, 117, 11357, 10972, 10245, 10188, 41036, 15647, 10111, 15217, 37215, 12990, 117, 107, 17977, 23579, 117, 10479, 10393, 10110, 69794, 169, 102920, 10854, 22260, 26127, 11764, 10105, 27244, 10806, 117, 21937, 10105, 50059, 11222, 10406, 83828, 76484, 25739, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "men", "sh", "##out", "##ed", "\"", "Allah", "##u", "Akbar", "\"", "(", "God", "is", "Greatest", ")", "as", "a", "former", "Islam", "##ist", "deputy", ",", "Ahmed", "Ka", "##fa", "##win", ",", "told", "soldiers", "the", "crowd", "would", "not", "cause", "trouble", "." ], "ids": [ 10117, 10588, 48201, 17514, 10336, 107, 22734, 10138, 78025, 107, 113, 14015, 10124, 24941, 114, 10146, 169, 11775, 14727, 11293, 45404, 117, 25530, 25444, 13369, 24748, 117, 21937, 23324, 10105, 50059, 10894, 10472, 15311, 58285, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "had", "earlier", "mounted", "the", "mosque", "'", "s", "pu", "##lp", "##it", "to", "demand", "release", "of", "det", "##aine", "##es", ",", "an", "end", "to", "raids", "on", "houses", "and", "the", "can", "##celli", "##ng", "of", "the", "br", "##ead", "price", "rises", "." ], "ids": [ 10357, 10374, 18905, 44709, 10105, 95493, 112, 187, 34597, 35451, 10486, 10114, 34394, 14072, 10108, 10349, 24173, 10171, 117, 10151, 11572, 10114, 77939, 10135, 21174, 10111, 10105, 10944, 48986, 10376, 10108, 10105, 33989, 30297, 30839, 91144, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arm", "##oured", "cars", "had", "patrol", "##led", "streets", "in", "Kara", "##k", ",", "traditional", "bas", "##tion", "of", "communist", "ide", "##ology", "and", "Ba", "##ath", "sociali", "##sm", "that", "s", "##we", "##pt", "the", "region", "in", "the", "1950s", ",", "and", "guard", "##ed", "entrance", "##s", "to", "the", "hill", "-", "top", "city", "fame", "##d", "for", "its", "C", "##rusade", "##r", "castle", "before", "the", "prayer", "##s", "." ], "ids": [ 56058, 73499, 24602, 10374, 62976, 16376, 41969, 10106, 34635, 10174, 117, 17531, 19111, 10822, 10108, 64574, 38938, 18096, 10111, 21333, 44196, 65978, 19534, 10189, 187, 12577, 14971, 10105, 12220, 10106, 10105, 28359, 117, 10111, 42842, 10336, 33365, 10107, 10114, 10105, 41473, 118, 12364, 11584, 51930, 10162, 10142, 10474, 140, 94117, 10129, 31682, 11360, 10105, 82012, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "also", "heavy", "security", "in", "the", "crowd", "##ed", "centre", "of", "Amman", ",", "where", "smaller", "c", "##lash", "##es", "had", "eru", "##pted", "last", "Saturday", ",", "but", "Friday", "prayer", "##s", "at", "the", "main", "mosque", "ended", "quiet", "##ly", "as", "police", "in", "full", "rio", "##t", "gear", "looked", "on", "." ], "ids": [ 11723, 10134, 10379, 18296, 21849, 10106, 10105, 50059, 10336, 12672, 10108, 107098, 117, 10940, 23309, 171, 25297, 10171, 10374, 18098, 64471, 12469, 24848, 117, 10473, 30767, 82012, 10107, 10160, 10105, 12126, 95493, 18428, 104951, 10454, 10146, 15034, 10106, 13375, 27244, 10123, 62559, 59822, 10135, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Jordan", "##ian", "Arab", "Socialist", "Ba", "##ath", "Party", ",", "which", "has", "one", "deputy", "in", "the", "80", "-", "seat", "lower", "house", "of", "parliament", ",", "has", "denied", "involvement", "in", "un", "##rest", "which", "it", "bl", "##amed", "on", "government", "policies", "and", "rising", "economic", "hard", "##ship", "." ], "ids": [ 10117, 16366, 11630, 17365, 42637, 21333, 44196, 12529, 117, 10319, 10393, 10464, 45404, 10106, 10105, 10832, 118, 17687, 18165, 13215, 10108, 40519, 117, 10393, 47467, 47167, 10106, 10119, 34189, 10319, 10271, 21484, 83865, 10135, 12047, 38572, 10111, 53816, 13925, 19118, 21544, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Government", "attempts", "to", "link", "the", "rio", "##ting", "to", "foreign", "influence", "has", "been", "treated", "with", "deri", "##sion", "by", "those", "in", "the", "streets", "who", "bl", "##ame", "the", "protests", "on", "severe", "economic", "hard", "##ships", "." ], "ids": [ 14581, 30406, 10114, 26192, 10105, 27244, 12141, 10114, 20796, 17306, 10393, 10590, 45369, 10169, 33109, 17467, 10155, 12676, 10106, 10105, 41969, 10479, 21484, 18969, 10105, 60931, 10135, 34844, 13925, 19118, 106647, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turkey", "says", "killed", "17", "Kur", "##d", "rebels", "in", "c", "##lash", "##es", "." ], "ids": [ 22519, 22153, 15875, 10273, 61912, 10162, 57545, 10106, 171, 25297, 10171, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##KA", "##RA", "1996", "-", "08", "-", "23" ], "ids": [ 50972, 67813, 29990, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turkish", "troops", "have", "killed", "17", "Kur", "##dish", "rebels", "in", "recent", "c", "##lash", "##es", "in", "the", "southeast", "of", "the", "country", ",", "the", "state", "-", "run", "Anatolia", "##n", "news", "agency", "said", "on", "Friday", "." ], "ids": [ 22814, 20836, 10529, 15875, 10273, 61912, 67522, 57545, 10106, 19037, 171, 25297, 10171, 10106, 10105, 36798, 10108, 10105, 12723, 117, 10105, 11388, 118, 14095, 67458, 10115, 14424, 34649, 12415, 10135, 30767, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "security", "officials", "and", "two", "state", "-", "paid", "village", "guards", "were", "killed", "in", "the", "fighting", "with", "Kurdistan", "Workers", "Party", "(", "PKK", ")", "guerrilla", "##s", ",", "the", "agency", "quoted", "the", "emergency", "rule", "governor", "'", "s", "office", "as", "saying", "." ], "ids": [ 13214, 21849, 27730, 10111, 10551, 11388, 118, 25938, 11607, 99024, 10309, 15875, 10106, 10105, 27535, 10169, 86246, 52896, 12529, 113, 105298, 114, 106552, 10107, 117, 10105, 34649, 70676, 10105, 44461, 21983, 28795, 112, 187, 14301, 10146, 22807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eight", "of", "the", "rebels", "were", "killed", "in", "Van", "province", ",", "five", "in", "Sir", "##nak", "and", "four", "in", "Ha", "##kka", "##ri", "." ], "ids": [ 43788, 10108, 10105, 57545, 10309, 15875, 10106, 11474, 14342, 117, 12403, 10106, 12852, 12728, 10111, 11598, 10106, 13740, 20878, 10401, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "agency", "did", "not", "say", "when", "the", "c", "##lash", "##es", "took", "place", "." ], "ids": [ 10117, 34649, 12172, 10472, 23763, 10841, 10105, 171, 25297, 10171, 12149, 11192, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "20", ",", "000", "people", "have", "died", "in", "the", "PKK", "'", "s", "12", "-", "year", "-", "old", "fight", "for", "independence", "or", "auto", "##nomy", "in", "southeastern", "Turkey", "." ], "ids": [ 15946, 11084, 10197, 117, 10259, 11426, 10529, 12482, 10106, 10105, 105298, 112, 187, 10186, 118, 10924, 118, 12898, 20780, 10142, 31412, 10345, 18257, 100395, 10106, 78721, 22519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Three", "people", ",", "including", "two", "village", "guards", ",", "died", "when", "a", "mine", "planted", "by", "PKK", "rebels", "ex", "##plo", "##ded", "on", "a", "road", "in", "the", "southeast", ",", "Anatolia", "##n", "reported", "earlier", "." ], "ids": [ 15139, 11426, 117, 11198, 10551, 11607, 99024, 117, 12482, 10841, 169, 27546, 97444, 10155, 105298, 57545, 11419, 46128, 21597, 10135, 169, 15485, 10106, 10105, 36798, 117, 67458, 10115, 15943, 18905, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "It", "said", "a", "taxi", "carrying", "the", "guards", ",", "members", "of", "a", "mostly", "Kur", "##dish", "militia", "which", "fights", "the", "PKK", ",", "hit", "the", "mine", "in", "the", "province", "of", "Di", "##yar", "##baki", "##r", "." ], "ids": [ 10377, 12415, 169, 72231, 39157, 10105, 99024, 117, 12464, 10108, 169, 19774, 61912, 67522, 86957, 10319, 102551, 10105, 105298, 117, 14946, 10105, 27546, 10106, 10105, 14342, 10108, 12944, 22953, 79485, 10129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "U", ".", "S", ".", "says", "Iraqi", "Kur", "##ds", "agree", "cea", "##sef", "##ire", "." ], "ids": [ 158, 119, 156, 119, 22153, 57806, 61912, 13268, 68312, 25578, 107749, 11627, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leader", "##s", "of", "Iraq", "'", "s", "two", "main", "Kur", "##dish", "faction", "##s", "agreed", "on", "Friday", "to", "end", "six", "days", "of", "fighting", "and", "to", "attend", "U", ".", "S", ".", "-", "media", "##ted", "peace", "talks", "next", "month", ",", "the", "State", "Department", "said", "." ], "ids": [ 37122, 10107, 10108, 21455, 112, 187, 10551, 12126, 61912, 67522, 84395, 10107, 25577, 10135, 30767, 10114, 11572, 12449, 13990, 10108, 27535, 10111, 10114, 34465, 158, 119, 156, 119, 118, 12518, 11912, 28101, 56672, 13451, 14064, 117, 10105, 11104, 12933, 12415, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Sp", "##oke", "##sman", "G", "##lyn", "Davies", "said", "in", "a", "statement", "that", "the", "agreement", "followed", "direct", "U", ".", "S", ".", "contacts", "with", "Mass", "##oud", "Bar", "##zani", ",", "leader", "of", "the", "Kurdistan", "Democratic", "Party", "(", "K", "##DP", ")", ",", "and", "Ja", "##lal", "Tala", "##bani", ",", "leader", "of", "the", "Patriot", "##ic", "Union", "of", "Kurdistan", "(", "P", "##U", "##K", ")", "." ], "ids": [ 46361, 37861, 24305, 144, 34417, 23539, 12415, 10106, 169, 33311, 10189, 10105, 25432, 15689, 16934, 158, 119, 156, 119, 75091, 10169, 28957, 50555, 20698, 58319, 117, 15014, 10108, 10105, 86246, 19281, 12529, 113, 148, 54714, 114, 117, 10111, 28248, 29267, 110135, 107081, 117, 15014, 10108, 10105, 107222, 11130, 11457, 10108, 86246, 113, 153, 12022, 11733, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Davies", "said", "the", "two", "leaders", "\"", "have", "agreed", "to", "cea", "##se", "the", "fighting", "(", "and", ")", "return", "their", "forces", "to", "the", "positions", "held", "before", "the", "current", "fighting", "began", "\"", "on", "August", "17", "." ], "ids": [ 23539, 12415, 10105, 10551, 24155, 107, 10529, 25577, 10114, 25578, 10341, 10105, 27535, 113, 10111, 114, 15079, 10455, 13729, 10114, 10105, 23188, 11991, 11360, 10105, 14978, 27535, 11941, 107, 10135, 10735, 10273, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "did", "not", "give", "a", "specific", "time", "for", "the", "cea", "##sef", "##ire", "but", "said", "the", "United", "States", "looked", "forward", "to", "\"", "immediate", "implementation", "\"", "." ], "ids": [ 10357, 12172, 10472, 18090, 169, 19182, 10635, 10142, 10105, 25578, 107749, 11627, 10473, 12415, 10105, 10609, 10859, 59822, 23307, 10114, 107, 46938, 53187, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "two", "party", "leaders", "had", "also", "agreed", "to", "meet", "U", ".", "S", ".", "Assistant", "Secretary", "for", "Near", "Eastern", "Affairs", "Robert", "Pel", "##let", "##reau", "in", "September", "\"", "to", "solid", "##ify", "the", "cea", "##se", "-", "fire", "and", "to", "pursue", "re", "##con", "##ciliation", "\"", ",", "Davies", "said", "." ], "ids": [ 10117, 10551, 14039, 24155, 10374, 10379, 25577, 10114, 23267, 158, 119, 156, 119, 32287, 19382, 10142, 16140, 16311, 20891, 10820, 75056, 12630, 50496, 10106, 10596, 107, 10114, 37751, 48281, 10105, 25578, 10341, 118, 13559, 10111, 10114, 57016, 11639, 23486, 98956, 107, 117, 23539, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 2, 6, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "His", "statement", "gave", "no", "venue", "or", "precise", "date", "for", "the", "meeting", "." ], "ids": [ 11597, 33311, 15362, 10192, 39975, 10345, 89165, 13664, 10142, 10105, 19822, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "United", "States", "has", "already", "called", "on", "the", "Kur", "##dish", "faction", "##s", "to", "hold", "peace", "talks", "in", "London", "." ], "ids": [ 10117, 10609, 10859, 10393, 19034, 11552, 10135, 10105, 61912, 67522, 84395, 10107, 10114, 18500, 28101, 56672, 10106, 10829, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "K", "##DP", "said", "Thursday", "night", "it", "had", "rep", "##elle", "##d", "an", "attack", "by", "thousands", "of", "P", "##U", "##K", "fighters", ",", "killing", ",", "wound", "##ing", "or", "cap", "##turing", "about", "400", "opposing", "guerrilla", "##s", "." ], "ids": [ 10117, 148, 54714, 12415, 67067, 16903, 10271, 10374, 76456, 14000, 10162, 10151, 16342, 10155, 39966, 10108, 153, 12022, 11733, 62450, 117, 34248, 117, 109205, 10230, 10345, 13337, 64581, 10978, 11176, 93780, 106552, 10107, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fighting", "has", "threatened", "a", "U", ".", "S", ".", "-", "led", "peace", "plan", "to", "unit", "##e", "the", "mountain", "##ous", "Kur", "##dish", "region", "in", "northern", "Iraq", "against", "President", "Saddam", "Hussein", "." ], "ids": [ 10117, 27535, 10393, 44593, 169, 158, 119, 156, 119, 118, 12857, 28101, 13065, 10114, 16511, 10112, 10105, 25233, 13499, 61912, 67522, 12220, 10106, 17335, 21455, 11327, 12811, 85431, 49053, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 9, 9, 4, 8, 9 ] }, { "tokens": [ "One", "teen", "left", "dead", "by", "attack", "on", "U", ".", "S", ".", "sl", "##um", "##ber", "party", "." ], "ids": [ 11340, 33003, 12153, 23457, 10155, 16342, 10135, 158, 119, 156, 119, 38523, 10465, 12212, 14039, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##ES", "##AP", "##EA", "##K", "##E", ",", "Va", "." ], "ids": [ 39774, 25054, 38423, 36789, 11733, 11259, 117, 14723, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "23" ], "ids": [ 10389, 118, 11052, 118, 10328 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "kn", "##ife", "-", "wie", "##lding", "nei", "##gh", "##bour", "apparently", "intent", "on", "sexual", "assault", "in", "##vaded", "a", "teen", "##age", "sl", "##um", "##ber", "party", "on", "Friday", ",", "killing", "one", "girl", "and", "wound", "##ing", "three", "others", ",", "police", "said", "." ], "ids": [ 138, 96820, 46072, 118, 10953, 61198, 11888, 15774, 71527, 47731, 58692, 10135, 19616, 50150, 10106, 108868, 169, 33003, 12276, 38523, 10465, 12212, 14039, 10135, 30767, 117, 34248, 10464, 24699, 10111, 109205, 10230, 11003, 14633, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "about", "4", "a", ".", "m", ".", "ED", "##T", "(", "080", "##0", "GMT", ")", ",", "a", "group", "of", "teen", "##age", "##d", "girls", "were", "having", "the", "over", "##night", "party", "in", "the", "Came", "##lot", "subdivision", "of", "this", "eastern", "Virginia", "city", ",", "when", "a", "man", "entered", "the", "house", ",", "wie", "##lding", "a", "kn", "##ife", ",", "threat", "##ening", "to", "sexual", "##ly", "assault", "the", "girls", "." ], "ids": [ 11699, 10978, 125, 169, 119, 181, 119, 74053, 11090, 113, 81051, 10929, 20362, 114, 117, 169, 11795, 10108, 33003, 12276, 10162, 27833, 10309, 13677, 10105, 10491, 45217, 14039, 10106, 10105, 73206, 20288, 79811, 10108, 10531, 18677, 13634, 11584, 117, 10841, 169, 10817, 19226, 10105, 13215, 117, 10953, 61198, 169, 96820, 46072, 117, 41256, 24428, 10114, 19616, 10454, 50150, 10105, 27833, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Detective", "Richard", "Black", "of", "the", "Che", "##sa", "##pea", "##ke", "Police", "Department", ",", "said", "a", "nei", "##gh", "##bour", ",", "Curtis", "Lee", "White", "II", ",", "19", ",", "was", "arrested", "in", "the", "attack", ",", "but", "had", "not", "been", "charged", "by", "late", "morning", "on", "Friday", "." ], "ids": [ 41608, 11118, 11750, 10108, 10105, 44131, 10466, 76484, 10550, 18051, 12933, 117, 12415, 169, 11888, 15774, 71527, 117, 25658, 12006, 12136, 10335, 117, 10270, 117, 10134, 29479, 10106, 10105, 16342, 117, 10473, 10374, 10472, 10590, 38253, 10155, 13002, 28757, 10135, 30767, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "were", "apparently", "no", "adults", "at", "the", "party", "as", "the", "father", "of", "the", "family", "who", "lived", "in", "the", "house", "was", "out", "of", "town", "and", "the", "mother", "died", "more", "than", "a", "year", "ago", ",", "Black", "said", "." ], "ids": [ 11723, 10309, 47731, 10192, 42074, 10160, 10105, 14039, 10146, 10105, 13194, 10108, 10105, 11365, 10479, 17603, 10106, 10105, 13215, 10134, 10950, 10108, 12221, 10111, 10105, 15293, 12482, 10798, 11084, 169, 10924, 36390, 117, 11750, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "The", "detective", "said", "details", "were", "sketch", "##y", ",", "but", "two", "of", "the", "teen", "##ager", "##s", "were", "reportedly", "down", "##stair", "##s", "watching", "television", "when", "White", "allegedly", "entered", "the", "house", "and", "told", "the", "girls", "to", "take", "off", "their", "clothes", "." ], "ids": [ 10117, 57127, 12415, 29500, 10309, 83413, 10157, 117, 10473, 10551, 10108, 10105, 33003, 37247, 10107, 10309, 53934, 12935, 96772, 10107, 84532, 14162, 10841, 12136, 78210, 19226, 10105, 13215, 10111, 21937, 10105, 27833, 10114, 13574, 11898, 10455, 89543, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "a", "male", "teen", "##ager", "sleep", "##ing", "ups", "##tai", "##rs", "reportedly", "heard", "the", "com", "##mot", "##ion", "and", "came", "down", "##stair", "##s", "and", "con", "##front", "##ed", "White", ",", "who", "allegedly", "sta", "##bbed", "him", "more", "than", "once", "." ], "ids": [ 10357, 12415, 169, 17416, 33003, 37247, 63658, 10230, 107717, 26812, 10943, 53934, 32240, 10105, 10212, 34899, 11046, 10111, 13383, 12935, 96772, 10107, 10111, 10173, 31044, 10336, 12136, 117, 10479, 78210, 16527, 98091, 10957, 10798, 11084, 14907, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "other", "teen", "##ager", "##s", "also", "con", "##front", "##ed", "the", "assai", "##lant", "and", "three", "girls", ",", "all", "under", "18", ",", "were", "sta", "##bbed", ",", "one", "fatal", "##ly", "." ], "ids": [ 10117, 10684, 33003, 37247, 10107, 10379, 10173, 31044, 10336, 10105, 58014, 29329, 10111, 11003, 27833, 117, 10435, 10571, 10218, 117, 10309, 16527, 98091, 117, 10464, 71126, 10454, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "At", "least", "two", "of", "them", "were", "sexual", "##ly", "mol", "##ested", ",", "\"", "Black", "said", "." ], "ids": [ 107, 11699, 16298, 10551, 10108, 11345, 10309, 19616, 10454, 39520, 104705, 117, 107, 11750, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "He", "said", "all", "of", "the", "wounded", "teen", "##ager", "##s", "were", "taken", "to", "a", "hospital", "but", "none", "of", "the", "injuries", "were", "considered", "life", "-", "threat", "##ening", "." ], "ids": [ 10357, 12415, 10435, 10108, 10105, 39127, 33003, 37247, 10107, 10309, 15109, 10114, 169, 18141, 10473, 46638, 10108, 10105, 49718, 10309, 14289, 12103, 118, 41256, 24428, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "the", "girl", "who", "died", "was", "identified", "as", "Michelle", "Harper", "." ], "ids": [ 18051, 12415, 10105, 24699, 10479, 12482, 10134, 26121, 10146, 27062, 15390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Her", "age", "was", "not", "given", "." ], "ids": [ 13229, 12089, 10134, 10472, 13507, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gli", "##ckman", "says", "USD", "##A", "monitoring", "aflat", "##ox", "##in", "in", "Texas", "." ], "ids": [ 17782, 79391, 22153, 24868, 10738, 74265, 89894, 31978, 10245, 10106, 12466, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 3, 7, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Agriculture", "Secretary", "Dan", "Gli", "##ckman", "said", "the", "department", "was", "monitoring", "reports", "of", "aflat", "##ox", "##in", "found", "in", "corn", "in", "parts", "of", "Texas", "." ], "ids": [ 30954, 19382, 14261, 17782, 79391, 12415, 10105, 21079, 10134, 74265, 26610, 10108, 89894, 31978, 10245, 11823, 10106, 93599, 10106, 15569, 10108, 12466, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "We", "'", "re", "always", "concerned", "about", "aflat", "##ox", "##in", "but", "we", "'", "re", "on", "top", "of", "it", ",", "\"", "Gli", "##ckman", "told", "reporter", "##s", "after", "address", "##ing", "a", "USD", "##A", "-", "sponsored", "farmers", "'", "market", "." ], "ids": [ 107, 12865, 112, 11639, 19540, 47451, 10978, 89894, 31978, 10245, 10473, 11951, 112, 11639, 10135, 12364, 10108, 10271, 117, 107, 17782, 79391, 21937, 41408, 10107, 10662, 32198, 10230, 169, 24868, 10738, 118, 44747, 55543, 112, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "That", "'", "s", "a", "per", "##ennial", "problem", "." ], "ids": [ 107, 13646, 112, 187, 169, 10178, 57304, 18077, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "may", "be", "a", "little", "more", "problema", "##tic", "because", "of", "cold", ",", "wet", "conditions", "but", "we", "'", "re", "on", "top", "of", "it", ",", "\"", "the", "secretary", "said", "." ], "ids": [ 10377, 11387, 10347, 169, 16745, 10798, 17982, 13275, 12373, 10108, 41626, 117, 41115, 17315, 10473, 11951, 112, 11639, 10135, 12364, 10108, 10271, 117, 107, 10105, 37664, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ask", "##ed", "about", "reports", "Egypt", "has", "set", "new", "levels", "for", "a", "vom", "##ito", "##xin", "in", "its", "purchase", "of", "U", ".", "S", ".", "wheat", ",", "the", "secretary", "said", "\"", "I", "do", "n", "'", "t", "know", "anything", "about", "it", "\"", "but", "added", "that", "USD", "##A", "officials", "were", "\"", "looking", "at", "it", ".", "\"" ], "ids": [ 93919, 10336, 10978, 26610, 20440, 10393, 11847, 10751, 21559, 10142, 169, 11036, 12390, 76750, 10106, 10474, 37891, 10108, 158, 119, 156, 119, 109653, 117, 10105, 37664, 12415, 107, 146, 10149, 182, 112, 188, 21852, 42819, 10978, 10271, 107, 10473, 16288, 10189, 24868, 10738, 27730, 10309, 107, 34279, 10160, 10271, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mass", "." ], "ids": [ 28957, 119 ], "entity": [ "B-LOC", "O" ], "entity_ids": [ 1, 9 ] }, { "tokens": [ "governor", "has", "trouble", "winning", "home", "support", "." ], "ids": [ 28795, 10393, 58285, 16542, 11816, 13145, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 139, 21793, 60493, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "12", "-", "year", "-", "old", "daughter", "of", "Republican", "Go", "##v", "." ], "ids": [ 10117, 10186, 118, 10924, 118, 12898, 15243, 10108, 21776, 14439, 10477, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "William", "We", "##ld", "is", "working", "to", "stop", "his", "bid", "to", "win", "a", "U", ".", "S", ".", "Senate", "seat", "because", "she", "does", "n", "'", "t", "want", "to", "leave", "Massachusetts", "." ], "ids": [ 10694, 12865, 12620, 10124, 14616, 10114, 20517, 10226, 50385, 10114, 14125, 169, 158, 119, 156, 119, 22294, 17687, 12373, 10833, 15107, 182, 112, 188, 21528, 10114, 21964, 15123, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "We", "##ld", "con", "##ceded", "his", "12", "-", "year", "-", "old", "daughter", ",", "Fran", "##ny", ",", "is", "\"", "a", "foot", "soldier", "\"", "for", "Democratic", "incumbent", "Sen", "." ], "ids": [ 12865, 12620, 10173, 75214, 10226, 10186, 118, 10924, 118, 12898, 15243, 117, 89447, 10756, 117, 10124, 107, 169, 24963, 50803, 107, 10142, 19281, 63122, 18082, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "John", "Kerry", ",", "even", "though", "she", "is", "n", "'", "t", "old", "enough", "to", "vote", "." ], "ids": [ 10421, 46477, 117, 13246, 15102, 10833, 10124, 182, 112, 188, 12898, 21408, 10114, 18926, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "##ld", ",", "speaking", "on", "WB", "##UR", "-", "FM", "radio", "on", "Thursday", ",", "said", "he", "was", "facing", "a", "revolt", "from", "his", "daughter", "in", "part", "because", "she", "does", "not", "want", "to", "leave", "Cambridge", ",", "Massachusetts", ",", "and", "move", "to", "Washington", "." ], "ids": [ 12865, 12620, 117, 33740, 10135, 101606, 98348, 118, 15459, 12429, 10135, 67067, 117, 12415, 10261, 10134, 48237, 169, 99737, 10188, 10226, 15243, 10106, 10668, 12373, 10833, 15107, 10472, 21528, 10114, 21964, 11697, 117, 15123, 117, 10111, 18577, 10114, 11586, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "He", "also", "said", "Fran", "##ny", "We", "##ld", "'", "s", "best", "friend", ",", "Tracy", "Roosevelt", ",", "might", "have", "something", "to", "do", "with", "her", "politics", "." ], "ids": [ 10357, 10379, 12415, 89447, 10756, 12865, 12620, 112, 187, 12504, 20104, 117, 37125, 27758, 117, 20970, 10529, 26133, 10114, 10149, 10169, 10485, 25674, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tracy", "is", "the", "great", "-", "grand", "##dau", "##ghter", "of", "Democratic", "former", "President", "Franklin", "Roosevelt", ",", "and", "support", "for", "Democrats", "runs", "in", "the", "family", "." ], "ids": [ 37125, 10124, 10105, 14772, 118, 13023, 42241, 45953, 10108, 19281, 11775, 12811, 18003, 27758, 117, 10111, 13145, 10142, 56282, 17913, 10106, 10105, 11365, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Roosevelt", "##s", "are", "good", "friends", "of", "We", "##ld", "and", "his", "wife", ",", "Susan", "Roosevelt", "We", "##ld", ",", "a", "descendant", "of", "former", "President", "Theodore", "Roosevelt", ",", "who", "won", "the", "presidency", "as", "a", "Republican", "." ], "ids": [ 10117, 27758, 10107, 10301, 15198, 21997, 10108, 12865, 12620, 10111, 10226, 14384, 117, 14476, 27758, 12865, 12620, 117, 169, 73297, 10108, 11775, 12811, 32373, 27758, 117, 10479, 11367, 10105, 97059, 10146, 169, 21776, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "Lufthansa", "cargo", "Q", "##2", "load", "factor", "up", "1", ".", "7", "p", "##ct", "." ], "ids": [ 101529, 15856, 154, 10729, 58490, 21834, 10741, 122, 119, 128, 184, 14526, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##AN", "##K", "##F", "##UR", "##T", "1996", "-", "08", "-", "23" ], "ids": [ 64655, 41275, 11733, 11565, 98348, 11090, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "following", "table", "shows", "Lufthansa", "Cargo", "AG", "second", "quarter", "1996", "results", ",", "based", "on", "figures", "published", "by", "Deutsche", "Lufthansa", "AG", "in", "-", "house", "newspaper" ], "ids": [ 10117, 11901, 21783, 15573, 101529, 70766, 17935, 11132, 28330, 10389, 17466, 117, 11610, 10135, 21068, 12304, 10155, 15389, 101529, 17935, 10106, 118, 13215, 22047 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Luft", "##han", "##sea", "##t", "." ], "ids": [ 48903, 11781, 59899, 10123, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9 ] }, { "tokens": [ "Ava", "##ila", "##ble", "freight", "-", "ton", "##ne", "kilometres", "(", "million", ")", "2", ",", "389", "up", "4", "p", "##ct" ], "ids": [ 103933, 13799, 11203, 75843, 118, 22464, 10238, 20127, 113, 12473, 114, 123, 117, 40064, 10741, 125, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Revenue", "freight", "-", "ton", "##ne", "kilometres", "(", "million", ")", "1", ",", "600", "up", "7", "p", "##ct" ], "ids": [ 69092, 75843, 118, 22464, 10238, 20127, 113, 12473, 114, 122, 117, 11796, 10741, 128, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Frei", "##ght", "load", "factor", "67", ".", "0", "up", "1", ".", "7", "p", "##ct", "pt", "##s" ], "ids": [ 90928, 20687, 58490, 21834, 12316, 119, 121, 10741, 122, 119, 128, 184, 14526, 28756, 10107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Revenue", "from", "transport", "(", "D", "##m", "million", ")", "820", "up", "2", "p", "##ct" ], "ids": [ 69092, 10188, 16024, 113, 141, 10147, 12473, 114, 45443, 10741, 123, 184, 14526 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Revenue", "from", "other", "services", "(", "D", "##m", "million", ")", "14", "down", "26", "p", "##ct" ], "ids": [ 69092, 10188, 10684, 12639, 113, 141, 10147, 12473, 114, 10247, 12935, 10314, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Staff", "costs", "(", "D", "##m", "million", ")", "116", "up", "8", "p", "##ct" ], "ids": [ 29017, 34495, 113, 141, 10147, 12473, 114, 17095, 10741, 129, 184, 14526 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fuel", "costs", "(", "D", "##m", "million", ")", "69", "up", "20", "p", "##ct" ], "ids": [ 103599, 34495, 113, 141, 10147, 12473, 114, 12573, 10741, 10197, 184, 14526 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Flight", "-", "related", "fees", "(", "D", "##m", "million", ")", "125", "up", "17", "p", "##ct" ], "ids": [ 25554, 118, 16382, 81557, 113, 141, 10147, 12473, 114, 14048, 10741, 10273, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Air", "Cargo", "News", "##room", "Tel", "+", "44", "171", "542", "770", "##6", "Fax", "+", "44", "171", "542", "501", "##7" ], "ids": [ 118, 11704, 70766, 12219, 25525, 25369, 116, 11126, 22478, 51620, 48622, 11211, 64530, 116, 11126, 22478, 51620, 34067, 11305 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##SC", "-", "India", "Rice", "Weather", ",", "Aug", "23", "." ], "ids": [ 160, 36175, 118, 11098, 31423, 48843, 117, 53012, 10328, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SU", "##MM", "##AR", "##Y", "-", "Show", "##ers", "0", ".", "25", "-", "1", ".", "30", "inch", "(", "6", "-", "33", "mm", ")", "and", "locally", "he", "##avier", "through", "much", "of", "India", ",", "75", "percent", "coverage", "." ], "ids": [ 86643, 93252, 52188, 14703, 118, 13450, 10901, 121, 119, 10258, 118, 122, 119, 10244, 34397, 113, 127, 118, 11000, 10366, 114, 10111, 52472, 10261, 97767, 11222, 13172, 10108, 11098, 117, 11417, 22362, 42158, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Isola", "##ted", "show", "##ers", "0", ".", "20", "-", "0", ".", "70", "inch", "(", "5", "-", "18", "mm", ")", "in", "the", "north", "." ], "ids": [ 64129, 11912, 11897, 10901, 121, 119, 10197, 118, 121, 119, 10923, 34397, 113, 126, 118, 10218, 10366, 114, 10106, 10105, 12756, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "High", "##s", "82", "-", "96", "##F", "(", "28", "-", "36", "##C", ")", "." ], "ids": [ 11956, 10107, 12180, 118, 12308, 11565, 113, 10348, 118, 11055, 10858, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##OP", "IM", "##PA", "##CT", "-", "Con", "##ditions", "remain", "favorable", "for", "the", "development", "of", "rice", "in", "the", "region", "." ], "ids": [ 44912, 44917, 97126, 52099, 91995, 118, 12845, 91936, 25430, 40612, 10142, 10105, 13405, 10108, 59039, 10106, 10105, 12220, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FOR", "##EC", "##AS", "##T", "-" ], "ids": [ 109544, 35826, 38025, 11090, 118 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##DA", "##Y", ".", ".", "." ], "ids": [ 58573, 36382, 14703, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Show", "##ers", "and", "rain", "0", ".", "25", "-", "1", ".", "00", "inch", "(", "6", "-", "25", "mm", ")", "and", "locally", "he", "##avier", "through", "most", "of", "central", "and", "south", "central", "India", ",", "up", "to", "0", ".", "75", "inch", "(", "19", "mm", ")", "in", "75", "percent", "of", "north", "central", "India", ",", "and", "only", "isolated", "up", "to", "0", ".", "50", "inch", "(", "13", "mm", ")", "elsewhere", "over", "India", "." ], "ids": [ 13450, 10901, 10111, 50939, 121, 119, 10258, 118, 122, 119, 11025, 34397, 113, 127, 118, 10258, 10366, 114, 10111, 52472, 10261, 97767, 11222, 10992, 10108, 12397, 10111, 13144, 12397, 11098, 117, 10741, 10114, 121, 119, 11417, 34397, 113, 10270, 10366, 114, 10106, 11417, 22362, 10108, 12756, 12397, 11098, 117, 10111, 10893, 54622, 10741, 10114, 121, 119, 10462, 34397, 113, 10249, 10366, 114, 60249, 10491, 11098, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "High", "##s", "82", "-", "96", "##F", "(", "28", "-", "36", "##C", ")", "." ], "ids": [ 11956, 10107, 12180, 118, 12308, 11565, 113, 10348, 118, 11055, 10858, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##NI", "##G", "##HT", ".", ".", "." ], "ids": [ 58573, 52898, 11447, 81012, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Var", "##iable", "cloud", "##s", "in", "southern", "India", "with", "show", "##ers", "." ], "ids": [ 48725, 81232, 78394, 10107, 10106, 17156, 11098, 10169, 11897, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Part", "##ly", "cloud", "##y", "in", "northern", "India", "with", "a", "few", "light", "show", "##ers", "." ], "ids": [ 14768, 10454, 78394, 10157, 10106, 17335, 11098, 10169, 169, 13824, 15765, 11897, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Low", "##s", "68", "-", "76", "##F", "(", "20", "-", "24", "##C", ")", "." ], "ids": [ 28803, 10107, 12370, 118, 12428, 11565, 113, 10197, 118, 10233, 10858, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##M", "##OR", "##RO", "##W", ".", ".", "." ], "ids": [ 58573, 11517, 42622, 35066, 13034, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Little", "change", "from", "today", "'", "s", "weather", "expected", "." ], "ids": [ 12936, 15453, 10188, 18745, 112, 187, 35660, 25973, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##UT", "##L", "##O", "##OK", ".", ".", "." ], "ids": [ 152, 65729, 11369, 11403, 63310, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nu", "##mero", "##us", "to", "scattered", "show", "##ers", "and", "thu", "##nders", "##tor", "##ms", "in", "southern", "and", "central", "India", ",", "and", "isolated", "show", "##ers", "to", "the", "north", "Sunday", "through", "Tuesday", "." ], "ids": [ 28336, 93817, 10251, 10114, 95335, 11897, 10901, 10111, 23886, 72975, 11813, 12387, 10106, 17156, 10111, 12397, 11098, 117, 10111, 54622, 11897, 10901, 10114, 10105, 12756, 19731, 11222, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Temperatur", "##es", "near", "normal", "." ], "ids": [ 88455, 10171, 12883, 16626, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Source", ":", "Weather", "Services", "Corporation" ], "ids": [ 22701, 131, 48843, 20228, 14456 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 3, 7, 7 ] }, { "tokens": [ "Washington", "to", "cu", "##rb", "Tamil", "support", "in", "U", ".", "S", ".", "-", "Sri", "Lanka", "." ], "ids": [ 11586, 10114, 10854, 50579, 22489, 13145, 10106, 158, 119, 156, 119, 118, 16098, 20828, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 9, 1, 5, 5, 5, 9, 1, 5, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "23" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sri", "Lanka", "said", "on", "Friday", "the", "United", "States", "had", "promised", "to", "sta", "##mp", "out", "any", "illegal", "activities", "on", "U", ".", "S", ".", "soil", "directed", "against", "the", "island", "'", "s", "government", "." ], "ids": [ 16098, 20828, 12415, 10135, 30767, 10105, 10609, 10859, 10374, 77137, 10114, 16527, 18573, 10950, 11178, 39806, 19286, 10135, 158, 119, 156, 119, 41080, 15446, 11327, 10105, 17354, 112, 187, 12047, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Sri", "Lanka", "##n", "foreign", "ministry", "said", "in", "a", "statement", ":", "\"", "The", "United", "States", "government", "sy", "##mpa", "##thi", "##sed", "with", "the", "current", "pred", "##ica", "##ment", "Sri", "Lanka", "was", "facing", ".", "\"" ], "ids": [ 10117, 16098, 20828, 10115, 20796, 65338, 12415, 10106, 169, 33311, 131, 107, 10117, 10609, 10859, 12047, 12261, 31285, 53504, 16219, 10169, 10105, 14978, 18283, 11043, 10426, 16098, 20828, 10134, 48237, 119, 107 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "The", "statement", "said", "the", "U", ".", "S", ".", "government", "\"", "would", "do", "all", "within", "its", "pre", "##vai", "##ling", "legal", "framework", "to", "prevent", "the", "use", "of", "American", "soil", "to", "per", "##pet", "##rate", "violence", "against", "the", "democratic", "government", "of", "Sri", "Lanka", "\"", "." ], "ids": [ 10117, 33311, 12415, 10105, 158, 119, 156, 119, 12047, 107, 10894, 10149, 10435, 12381, 10474, 12229, 37557, 11945, 17139, 54387, 10114, 29320, 10105, 11760, 10108, 10536, 41080, 10114, 10178, 19094, 19779, 26342, 11327, 10105, 72209, 12047, 10108, 16098, 20828, 107, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "It", "said", "the", "U", ".", "S", ".", "State", "Department", "'", "s", "co", "##ordinator", "for", "counter", "terrorism", ",", "Philip", "Wi", "##lco", "##x", ",", "had", "expressed", "Washington", "'", "s", "support", "for", "the", "government", "when", "he", "visited", "Colombo", "this", "week", "." ], "ids": [ 10377, 12415, 10105, 158, 119, 156, 119, 11104, 12933, 112, 187, 11170, 72397, 10142, 46298, 96969, 117, 13324, 52742, 82115, 10686, 117, 10374, 31685, 11586, 112, 187, 13145, 10142, 10105, 12047, 10841, 10261, 30270, 40367, 10531, 16118, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Colombo", "has", "said", "it", "believes", "Tamil", "rebels", ",", "fighting", "a", "13", "-", "year", "war", "for", "independence", "against", "the", "government", ",", "finance", "their", "military", "activity", "through", "funds", "ex", "##tor", "##ted", "from", "ex", "##pat", "##riate", "Sri", "Lanka", "##ns", "in", "western", "countries", "such", "as", "the", "United", "States", "." ], "ids": [ 40367, 10393, 12415, 10271, 56920, 22489, 57545, 117, 27535, 169, 10249, 118, 10924, 10338, 10142, 31412, 11327, 10105, 12047, 117, 48053, 10455, 14041, 22205, 11222, 32067, 11419, 11813, 11912, 10188, 11419, 18115, 88958, 16098, 20828, 10891, 10106, 16672, 15911, 11049, 10146, 10105, 10609, 10859, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "U", ".", "S", ".", "em", "##bas", "##sy", "officials", "in", "Colombo", "were", "not", "immediately", "available", "to", "comment", "on", "the", "report", "." ], "ids": [ 158, 119, 156, 119, 10266, 21322, 16105, 27730, 10106, 40367, 10309, 10472, 24029, 14579, 10114, 49641, 10135, 10105, 17553, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colombo", "estimates", "more", "than", "50", ",", "000", "people", "have", "been", "killed", "in", "the", "war", "between", "government", "forces", "and", "the", "Liberation", "Tigers", "of", "Tamil", "E", "##ela", "##m", "rebels", "in", "the", "island", "'", "s", "north", "and", "east", "." ], "ids": [ 40367, 45870, 10798, 11084, 10462, 117, 10259, 11426, 10529, 10590, 15875, 10106, 10105, 10338, 10948, 12047, 13729, 10111, 10105, 54766, 38640, 10108, 22489, 142, 15108, 10147, 57545, 10106, 10105, 17354, 112, 187, 12756, 10111, 13827, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nepal", "'", "s", "king", "leaves", "on", "week", "-", "long", "visit", "to", "China", "." ], "ids": [ 22276, 112, 187, 20636, 24516, 10135, 16118, 118, 11695, 27541, 10114, 11593, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "KA", "##TH", "##MA", "##ND", "##U", "1996", "-", "08", "-", "23" ], "ids": [ 85314, 109166, 30696, 58521, 12022, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "King", "Bir", "##endra", "left", "Nepal", "on", "Friday", "for", "a", "week", "-", "long", "visit", "to", "China", ",", "his", "eighth", "since", "as", "##cend", "##ing", "the", "throne", "in", "1972", ",", "officials", "said", "." ], "ids": [ 11515, 19319, 96086, 12153, 22276, 10135, 30767, 10142, 169, 16118, 118, 11695, 27541, 10114, 11593, 117, 10226, 46758, 11764, 10146, 89387, 10230, 10105, 53409, 10106, 10677, 117, 27730, 12415, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "constitutional", "mon", "##arch", ",", "who", "last", "visited", "China", "in", "1993", ",", "was", "scheduled", "to", "meet", "Chinese", "President", "Jiang", "Ze", "##min", "and", "Premier", "Li", "Peng", "during", "his", "visit", ",", "they", "said", "." ], "ids": [ 10117, 61537, 34372, 96355, 117, 10479, 12469, 30270, 11593, 10106, 10463, 117, 10134, 34081, 10114, 23267, 13299, 12811, 68373, 15536, 14956, 10111, 14717, 13258, 93655, 10939, 10226, 27541, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Foreign", "ministry", "officials", "gave", "no", "details", "of", "the", "issues", "the", "king", ",", "who", "was", "accompanied", "by", "Foreign", "Minister", "Pr", "##akas", "##h", "Chandra", "Lo", "##hani", ",", "would", "discuss", "with", "Chinese", "leaders", "." ], "ids": [ 20277, 65338, 27730, 15362, 10192, 29500, 10108, 10105, 17850, 10105, 20636, 117, 10479, 10134, 39951, 10155, 20277, 14355, 106482, 92034, 10237, 67169, 13069, 74675, 117, 10894, 71695, 10169, 13299, 24155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "Himalaya", "##n", "kingdom", ",", "sand", "##wich", "##ed", "between", "China", "and", "India", ",", "has", "traditionally", "sought", "to", "maintain", "close", "cooperation", "with", "its", "giant", "nei", "##gh", "##bours", ",", "and", "an", "equal", "distance", "from", "the", "two", "." ], "ids": [ 10117, 62824, 10115, 12293, 117, 45989, 33544, 10336, 10948, 11593, 10111, 11098, 117, 10393, 58217, 32570, 10114, 37215, 16065, 56547, 10169, 10474, 49429, 11888, 15774, 97497, 117, 10111, 10151, 32943, 18527, 10188, 10105, 10551, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "50", "-", "year", "old", "mon", "##arch", "was", "accompanied", "by", "Queen", "Ai", "##sh", "##war", "##ya", "on", "a", "flight", "to", "the", "Tibetan", "capital", "of", "L", "##hasa", "." ], "ids": [ 10117, 10462, 118, 10924, 12898, 34372, 96355, 10134, 39951, 10155, 13704, 19672, 13264, 29445, 10679, 10135, 169, 23578, 10114, 10105, 65488, 12185, 10108, 149, 68398, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9 ] }, { "tokens": [ "The", "king", "will", "visit", "Chong", "##qing", "before", "arriving", "in", "the", "Chinese", "capital", ",", "Beijing", ",", "early", "next", "week", ",", "officials", "said", "." ], "ids": [ 10117, 20636, 11337, 27541, 105442, 108013, 11360, 65200, 10106, 10105, 13299, 12185, 117, 23824, 117, 11732, 13451, 16118, 117, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nepal", "man", "held", "for", "keeping", "child", "servant", "in", "chains", "." ], "ids": [ 22276, 10817, 11991, 10142, 51318, 18048, 53211, 10106, 110504, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##TH", "##MA", "##ND", "##U", "1996", "-", "08", "-", "23" ], "ids": [ 85314, 109166, 30696, 58521, 12022, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nepal", "##i", "police", "said", "on", "Friday", "they", "arrested", "a", "man", "who", "allegedly", "kept", "a", "child", "servant", "bound", "in", "chains", "so", "that", "he", "would", "not", "run", "away", "when", "his", "employer", "was", "out", "to", "work", "." ], "ids": [ 22276, 10116, 15034, 12415, 10135, 30767, 10689, 29479, 169, 10817, 10479, 78210, 26546, 169, 18048, 53211, 46538, 10106, 110504, 10380, 10189, 10261, 10894, 10472, 14095, 14942, 10841, 10226, 94526, 10134, 10950, 10114, 11424, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mad", "##hus", "##udan", "Mu", "##nak", "##arm", "##i", "was", "arrested", "on", "Thursday", "after", "his", "nei", "##gh", "##bours", "informed", "police", "about", "the", "pl", "##ight", "of", "12", "-", "year", "old", "D", "##hir", "##aj", "K", ".", "C", ".", ",", "who", "told", "police", "his", "employer", "used", "to", "tie", "him", "up", "with", "iron", "chains", "and", "lock", "##s", "con", "##cea", "##led", "under", "his", "clothes", "." ], "ids": [ 31301, 15471, 82870, 49056, 12728, 76171, 10116, 10134, 29479, 10135, 67067, 10662, 10226, 11888, 15774, 97497, 64330, 15034, 10978, 10105, 20648, 27521, 10108, 10186, 118, 10924, 12898, 141, 21840, 21171, 148, 119, 140, 119, 117, 10479, 21937, 15034, 10226, 94526, 11031, 10114, 27916, 10957, 10741, 10169, 32374, 110504, 10111, 79601, 10107, 10173, 37839, 16376, 10571, 10226, 89543, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "nei", "##gh", "##bours", "in", "Kat", "##hman", "##du", "called", "the", "police", "when", "they", "saw", "D", "##heer", "##aj", ",", "employed", "by", "the", "man", "for", "the", "past", "nine", "months", ",", "li", "##mpi", "##ng", "because", "of", "the", "chains", "." ], "ids": [ 10117, 11888, 15774, 97497, 10106, 85467, 49811, 11460, 11552, 10105, 15034, 10841, 10689, 17112, 141, 60470, 21171, 117, 29682, 10155, 10105, 10817, 10142, 10105, 17781, 19964, 15555, 117, 11614, 35407, 10376, 12373, 10108, 10105, 110504, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "fear", "##ed", "he", "would", "fl", "##ee", "from", "work", "or", "st", "##eal", "my", "belonging", "##s", ",", "\"", "the", "Kat", "##hman", "##du", "Post", "newspaper", "quoted", "Mu", "##nak", "##arm", "##i", "as", "saying", "after", "his", "arrest", "." ], "ids": [ 107, 146, 44929, 10336, 10261, 10894, 58768, 13321, 10188, 11424, 10345, 28780, 30759, 15127, 54188, 10107, 117, 107, 10105, 85467, 49811, 11460, 14539, 22047, 70676, 49056, 12728, 76171, 10116, 10146, 22807, 10662, 10226, 45165, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "convicted", ",", "he", "faces", "a", "maximum", "of", "three", "years", "in", "jail", "under", "Nepal", "'", "s", "child", "protection", "laws", "." ], "ids": [ 14535, 61487, 117, 10261, 48343, 169, 22393, 10108, 11003, 10855, 10106, 75934, 10571, 22276, 112, 187, 18048, 20344, 28160, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OP", "##TION", "##S", "-", "Euro", "debt", "vols", "seen", "re", "##group", "##ing", "after", "fall", "." ], "ids": [ 55355, 98207, 10731, 118, 17526, 55869, 41561, 15652, 11639, 82908, 10230, 10662, 18042, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Im", "##plied", "vol", "##ati", "##lity", "of", "European", "bond", "and", "interest", "rate", "options", "should", "stabil", "##ise", "around", "current", "levels", "until", "early", "next", "week", "after", "falling", "before", "and", "after", "this", "week", "'", "s", "German", "-", "led", "cut", "in", "interest", "rates", ",", "trade", "##rs", "said", "." ], "ids": [ 10796, 104309, 12714, 13259, 82968, 10108, 11914, 55185, 10111, 17644, 18344, 53121, 14819, 71338, 13041, 12166, 14978, 21559, 11444, 11732, 13451, 16118, 10662, 54756, 11360, 10111, 10662, 10531, 16118, 112, 187, 12026, 118, 12857, 21610, 10106, 17644, 38200, 117, 18908, 10943, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Vol", "##ati", "##lity", "has", "come", "off", "a", "lot", "." ], "ids": [ 107, 12546, 13259, 82968, 10393, 10678, 11898, 169, 19826, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "re", "looking", "for", "it", "to", "stabil", "##ise", "now", ",", "\"", "said", "one", "Euro", "##mark", "options", "trade", "##r", "at", "a", "U", ".", "S", ".", "bank", "." ], "ids": [ 12865, 112, 11639, 34279, 10142, 10271, 10114, 71338, 13041, 11858, 117, 107, 12415, 10464, 17526, 22719, 53121, 18908, 10129, 10160, 169, 158, 119, 156, 119, 19423, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "A", "trade", "##r", "at", "a", "Japanese", "bank", "said", "Euro", "##mark", "vol", "##ati", "##lity", "now", "stood", "at", "14", ".", "00", "for", "September", "contract", ",", "16", ".", "75", "for", "December", ",", "19", ".", "50", "for", "March", "and", "21", ".", "25", "for", "June", "." ], "ids": [ 138, 18908, 10129, 10160, 169, 13847, 19423, 12415, 17526, 22719, 12714, 13259, 82968, 11858, 39320, 10160, 10247, 119, 11025, 10142, 10596, 16108, 117, 10250, 119, 11417, 10142, 11288, 117, 10270, 119, 10462, 10142, 11144, 10111, 10296, 119, 10258, 10142, 11120, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "compared", "with", "mid", "##week", "levels", ",", "before", "the", "wel", "##ter", "of", "interest", "rate", "cuts", ",", "of", "18", ".", "50", "for", "September", ",", "20", ".", "00", "for", "December", ",", "22", ".", "00", "for", "March", "and", "23", ".", "5", "for", "June", ",", "he", "said", "." ], "ids": [ 10747, 25626, 10169, 15607, 84805, 21559, 117, 11360, 10105, 16829, 10877, 10108, 17644, 18344, 73311, 117, 10108, 10218, 119, 10462, 10142, 10596, 117, 10197, 119, 11025, 10142, 11288, 117, 10306, 119, 11025, 10142, 11144, 10111, 10328, 119, 126, 10142, 11120, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "1347", "GMT", ",", "December", "Euro", "##mark", "future", "##s", "were", "trading", "at", "96", ".", "78", ",", "two", "basis", "points", "down", "on", "the", "day", "." ], "ids": [ 11699, 74782, 20362, 117, 11288, 17526, 22719, 16711, 10107, 10309, 46663, 10160, 12308, 119, 12492, 117, 10551, 17172, 12789, 12935, 10135, 10105, 11940, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "sell", "-", "off", "in", "June", "vols", "might", "have", "been", "over", "##done", ",", "which", "could", "offer", "value", "at", "current", "levels", "." ], "ids": [ 10357, 12415, 10105, 36300, 118, 11898, 10106, 11120, 41561, 20970, 10529, 10590, 10491, 99726, 117, 10319, 12174, 24443, 19211, 10160, 14978, 21559, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "caps", "and", "floors", "would", "be", "well", "bid", "after", "the", "round", "of", "interest", "rate", "cuts", "due", "to", "the", "fact", "these", "rates", "should", "stay", "low", "at", "the", "short", "end", "." ], "ids": [ 10357, 12415, 52036, 10111, 83003, 10894, 10347, 11206, 50385, 10662, 10105, 13569, 10108, 17644, 18344, 73311, 10850, 10114, 10105, 18638, 11762, 38200, 14819, 29597, 15626, 10160, 10105, 13716, 11572, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "size", "of", "the", "Bundes", "##bank", "'", "s", "rep", "##o", "rate", "cut", ",", "to", "3", ".", "00", "percent", "from", "3", ".", "30", "percent", ",", "took", "markets", "by", "surprise", "." ], "ids": [ 10117, 15851, 10108, 10105, 88342, 20583, 112, 187, 76456, 10133, 18344, 21610, 117, 10114, 124, 119, 11025, 22362, 10188, 124, 119, 10244, 22362, 117, 12149, 42893, 10155, 48886, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Vol", "##ati", "##lity", "has", "a", "bid", "to", "it", "-", "-", "longer", "-", "dated", "vol", "##ati", "##lity", "more", "than", "short", "-", "dated", "because", "the", "event", "people", "were", "buy", "##ing", "for", "has", "passed", "and", "now", "perhaps", "people", "will", "sell", "some", "short", "dated", "vol", "and", "buy", "some", "long", "dated", "vol", ",", "\"", "he", "said", "." ], "ids": [ 107, 12546, 13259, 82968, 10393, 169, 50385, 10114, 10271, 118, 118, 20165, 118, 39724, 12714, 13259, 82968, 10798, 11084, 13716, 118, 39724, 12373, 10105, 14416, 11426, 10309, 47715, 10230, 10142, 10393, 20006, 10111, 11858, 36981, 11426, 11337, 36300, 11152, 13716, 39724, 12714, 10111, 47715, 11152, 11695, 39724, 12714, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Long", "dated", "vol", "##ati", "##lity", "has", "been", "low", "this", "year", ",", "so", "it", "is", "still", "at", "levels", "which", "are", "not", "historically", "high", "." ], "ids": [ 107, 13307, 39724, 12714, 13259, 82968, 10393, 10590, 15626, 10531, 10924, 117, 10380, 10271, 10124, 12647, 10160, 21559, 10319, 10301, 10472, 67391, 11846, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "not", "a", "dangerous", "level", "to", "own", "vol", ".", "You", "are", "not", "going", "to", "lose", "a", "lot", "and", "you", "could", "make", "quite", "a", "bit", ".", "\"" ], "ids": [ 107, 10377, 10124, 10472, 169, 57195, 13277, 10114, 12542, 12714, 119, 11065, 10301, 10472, 19090, 10114, 48742, 169, 19826, 10111, 13028, 12174, 13086, 31324, 169, 17684, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "vol", "##ati", "##lity", "levels", "should", "be", "stable", "until", "markets", "reas", "##ses", "##s", "the", "situation", "after", "a", "long", "weekend", "in", "Britain", "." ], "ids": [ 10357, 12415, 12714, 13259, 82968, 21559, 14819, 10347, 38430, 11444, 42893, 36120, 13149, 10107, 10105, 18586, 10662, 169, 11695, 43440, 10106, 16032, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Par", "##iba", "##s", "Capital", "Market", "##s", "O", "##TC", "options", "specialist", "Robert", "Co", "##ugh", "##lan", "said", "that", "if", "vol", "##ati", "##lity", "continued", "lower", "for", "the", "rest", "of", "Friday", "in", "over", "-", "the", "-", "counter", "10", "-", "year", "Bund", "##s", ",", "it", "should", "be", "higher", "next", "Tuesday", "." ], "ids": [ 17434, 53622, 10107, 21433, 28409, 10107, 152, 55671, 53121, 64956, 10820, 13098, 25905, 12055, 12415, 10189, 12277, 12714, 13259, 82968, 14278, 18165, 10142, 10105, 17333, 10108, 30767, 10106, 10491, 118, 10105, 118, 46298, 10150, 118, 10924, 46752, 10107, 117, 10271, 14819, 10347, 17981, 13451, 70245, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "absence", "on", "holiday", "of", "many", "market", "makers", "was", "a", "main", "factor", "behind", "falls", "this", "week", "in", "vol", "##ati", "##lity", "in", "high", "-", "yield", "##ing", "markets", "such", "as", "Italy", ",", "Spain", "and", "Sweden", "." ], "ids": [ 10357, 12415, 10105, 28589, 10135, 71806, 10108, 11299, 17313, 104213, 10134, 169, 12126, 21834, 17155, 35017, 10531, 16118, 10106, 12714, 13259, 82968, 10106, 11846, 118, 95757, 10230, 42893, 11049, 10146, 11619, 117, 16149, 10111, 20937, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Co", "##ugh", "##lan", "said", "the", "market", "had", "more", "down", "##side", "than", "ups", "##ide", "potential", ",", "but", "a", "fall", "was", "not", "likely", "to", "be", "of", "significant", "size", "." ], "ids": [ 13098, 25905, 12055, 12415, 10105, 17313, 10374, 10798, 12935, 18103, 11084, 107717, 13315, 23078, 117, 10473, 169, 18042, 10134, 10472, 22497, 10114, 10347, 10108, 17912, 15851, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "re", "##com", "##mend", "people", "sell", "stran", "##gles", "in", "a", "number", "of", "markets", "-", "-", "in", "Germany", "and", "France", "in", "particular", "." ], "ids": [ 107, 146, 11639, 22530, 101480, 11426, 36300, 74536, 54999, 10106, 169, 11487, 10108, 42893, 118, 118, 10106, 12775, 10111, 10688, 10106, 15018, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9 ] }, { "tokens": [ "\"", "With", "high", "-", "yield", "##ing", "markets", "Italy", "will", "be", "a", "lot", "more", "vulnerable", "in", "September", "on", "economic", "and", "political", "front", "##s", ",", "so", "I", "would", "use", "current", "the", "low", "level", "of", "vol", "to", "buy", "options", "." ], "ids": [ 107, 12613, 11846, 118, 95757, 10230, 42893, 11619, 11337, 10347, 169, 19826, 10798, 75602, 10106, 10596, 10135, 13925, 10111, 13736, 14589, 10107, 117, 10380, 146, 10894, 11760, 14978, 10105, 15626, 13277, 10108, 12714, 10114, 47715, 53121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "So", "sell", "options", "on", "Bund", "##s", "and", "France", "to", "en", "##hance", "yield", "and", "buy", "options", "on", "Italy", ",", "\"", "Co", "##ugh", "##lan", "said", ".", "." ], "ids": [ 107, 12882, 36300, 53121, 10135, 46752, 10107, 10111, 10688, 10114, 10110, 100586, 95757, 10111, 47715, 53121, 10135, 11619, 117, 107, 13098, 25905, 12055, 12415, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Stephen", "Ni", "##s", "##bet", ",", "International", "Bond", "##s", "+", "44", "171", "542", "632", "##0" ], "ids": [ 118, 118, 13866, 30409, 10107, 20125, 117, 10771, 22670, 10107, 116, 11126, 22478, 51620, 47946, 10929 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Goldman", "Sachs", "sets", "war", "##rants", "on", "Continental", "." ], "ids": [ 57886, 65631, 23597, 10338, 55208, 10135, 27202, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Goldman", "Sachs", "&", "Co", "Wert", "##pa", "##pier", "GmbH", "has", "issued", "a", "total", "of", "five", "million", "American", "-", "style", "call", "war", "##rants", ",", "on", "Continental", "AG", ",", "lead", "manager", "Goldman", "Sachs", "&", "Co", "said", "." ], "ids": [ 57886, 65631, 111, 13098, 40449, 11359, 53985, 19596, 10393, 21694, 169, 11339, 10108, 12403, 12473, 10536, 118, 13351, 20575, 10338, 55208, 117, 10135, 27202, 17935, 117, 14107, 16935, 57886, 65631, 111, 13098, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "One", "war", "##rant", "controls", "one", "share", "." ], "ids": [ 11340, 10338, 18348, 59897, 10464, 23867, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##RI", "##K", "##E", "PR", "##IC", "##E", "25", ".", "00", "DEM", "PR", "##EM", "##I", "##UM", "10", ".", "12", "PC", "##T" ], "ids": [ 53317, 46876, 11733, 11259, 23837, 30889, 11259, 10258, 119, 11025, 10660, 23837, 67753, 11281, 72679, 10150, 119, 10186, 16355, 11090 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ISS", "##UE", "PR", "##IC", "##E", "2", ".", "42", "DEM", "GE", "##AR", "##ING", "10", ".", "29", "X" ], "ids": [ 58915, 62674, 23837, 30889, 11259, 123, 119, 11276, 10660, 62997, 52188, 50183, 10150, 119, 10386, 161 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EX", "##ER", "##CI", "##SE", "PE", "##RI", "##OD", "02", ".", "SE", "##P", ".", "96", "-", "21", ".", "NO", "##V", ".", "97", "PA", "##Y", "##DA", "##TE", "30", ".", "AU", "##G", ".", "96" ], "ids": [ 80426, 24093, 89955, 39039, 80468, 46876, 77836, 10983, 119, 23056, 11127, 119, 12308, 118, 10296, 119, 49307, 11779, 119, 12328, 32349, 14703, 36382, 29833, 10244, 119, 29088, 11447, 119, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##TI", "##NG", "DD", "##F", "FF", "##T", "ST", "##G", "MI", "##N", "EX", "##ER", "L", "##OT", "100" ], "ids": [ 149, 19088, 72286, 34065, 55541, 11565, 44297, 11090, 53317, 11447, 75416, 11537, 80426, 24093, 149, 62146, 10407 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SP", "##OT", "RE", "##F", "##ER", "##EN", "##CE", "24", ".", "90", "DEM" ], "ids": [ 22570, 62146, 71033, 11565, 24093, 50655, 43161, 10233, 119, 10919, 10660 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "-", "-", "Reuter", "London", "News", "##room", "+", "44", "171", "542", "765", "##8" ], "ids": [ 118, 118, 109223, 10829, 12219, 25525, 116, 11126, 22478, 51620, 65222, 11396 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Legal", "challenge", "to", "Diana", "delayed", "by", "jail", "term", "." ], "ids": [ 43109, 36040, 10114, 22365, 67058, 10155, 75934, 13719, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "British", "photographer", "brand", "##ed", "a", "stal", "##ker", "by", "Princess", "Diana", "has", "been", "forced", "to", "post", "##pone", "a", "legal", "challenge", "to", "a", "ban", "on", "approach", "##ing", "her", "because", "he", "'", "s", "been", "jail", "##ed", "for", "criminal", "damage", ",", "his", "lawyer", "said", "on", "Friday", "." ], "ids": [ 138, 11160, 69816, 23467, 10336, 169, 17844, 11880, 10155, 22292, 22365, 10393, 10590, 20054, 10114, 11841, 35741, 169, 17139, 36040, 10114, 169, 11915, 10135, 23068, 10230, 10485, 12373, 10261, 112, 187, 10590, 75934, 10336, 10142, 30931, 26115, 117, 10226, 38055, 12415, 10135, 30767, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "Sten", "##ning", "started", "a", "12", "-", "week", "jail", "sentence", "on", "Thursday", "just", "as", "he", "was", "preparing", "to", "contest", "an", "in", "##jun", "##ction", "obtained", "by", "Diana", "ban", "##ning", "him", "from", "coming", "within", "300", "metres", "(", "yards", ")", "of", "her", "." ], "ids": [ 11235, 98777, 11269, 13457, 169, 10186, 118, 16118, 75934, 49219, 10135, 67067, 12820, 10146, 10261, 10134, 90798, 10114, 37596, 10151, 10106, 46329, 17530, 27345, 10155, 22365, 11915, 11269, 10957, 10188, 23959, 12381, 11093, 16393, 113, 25537, 114, 10108, 10485, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "were", "in", "the", "process", "of", "preparing", "a", "detailed", "af", "##fida", "##vit", "respond", "##ing", "to", "the", "Princess", "'", "s", "af", "##fa", "##da", "##vit", "and", "expected", "to", "go", "to", "court", "in", "the", "next", "couple", "of", "weeks", ",", "\"", "said", "Sten", "##ning", "'", "s", "lawyer", ",", "Benedict", "Bir", "##nberg", ".", "\"" ], "ids": [ 107, 12865, 10309, 10106, 10105, 15138, 10108, 90798, 169, 47368, 10452, 79319, 18522, 100062, 10230, 10114, 10105, 22292, 112, 187, 10452, 13369, 10229, 18522, 10111, 25973, 10114, 11783, 10114, 14866, 10106, 10105, 13451, 20969, 10108, 20750, 117, 107, 12415, 98777, 11269, 112, 187, 38055, 117, 50660, 19319, 33199, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "But", "everything", "has", "been", "put", "on", "ice", "now", ".", "\"" ], "ids": [ 16976, 42536, 10393, 10590, 14499, 10135, 24642, 11858, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bir", "##nberg", "told", "Reuters", "that", "the", "challenge", "to", "the", "in", "##jun", "##ction", "would", "be", "delayed", "until", "Sten", "##ning", "was", "released", "." ], "ids": [ 19319, 33199, 21937, 46617, 10189, 10105, 36040, 10114, 10105, 10106, 46329, 17530, 10894, 10347, 67058, 11444, 98777, 11269, 10134, 11539, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Sten", "##ning", "threw", "a", "brick", "through", "the", "window", "of", "a", "van", "in", "February", "after", "an", "argument", "with", "a", "driver", "when", "he", "was", "working", "as", "a", "motorcycle", "dis", "##pat", "##ch", "rider", "." ], "ids": [ 98777, 11269, 80516, 169, 42157, 11222, 10105, 39051, 10108, 169, 10145, 10106, 11508, 10662, 10151, 36847, 10169, 169, 25926, 10841, 10261, 10134, 14616, 10146, 169, 101923, 27920, 18115, 10269, 95232, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sten", "##ning", ",", "who", "has", "previous", "conviction", "##s", ",", "is", "expected", "to", "appeal", "against", "the", "sentence", "." ], "ids": [ 98777, 11269, 117, 10479, 10393, 16741, 94259, 10107, 117, 10124, 25973, 10114, 44861, 11327, 10105, 49219, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mag", "##istrat", "##es", "also", "ordered", "him", "to", "pay", "compensation", "of", "182", "pounds", "(", "$", "282", ")", "." ], "ids": [ 63672, 65293, 10171, 10379, 23782, 10957, 10114, 16868, 71576, 10108, 21926, 61982, 113, 109, 28805, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "free", "##lance", "photographer", "was", "brand", "##ed", "a", "stal", "##ker", "by", "Diana", ",", "whose", "divorce", "from", "heir", "-", "to", "-", "the", "-", "throne", "Prince", "Charles", "is", "due", "to", "become", "final", "next", "week", ",", "after", "pers", "##istent", "##ly", "trail", "##ing", "her", "on", "his", "motorcycle", "." ], "ids": [ 10117, 13961, 61883, 69816, 10134, 23467, 10336, 169, 17844, 11880, 10155, 22365, 117, 16879, 58277, 10188, 72143, 118, 10114, 118, 10105, 118, 53409, 14185, 10925, 10124, 10850, 10114, 13461, 11070, 13451, 16118, 117, 10662, 108839, 52573, 10454, 56559, 10230, 10485, 10135, 10226, 101923, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "an", "af", "##fida", "##vit", ",", "the", "princes", "##s", "said", "that", "in", "cha", "##sing", "her", "Sten", "##ning", "had", "got", "so", "close", "that", "he", "twice", "sm", "##ash", "##ed", "into", "her", "car", "and", "pushed", "her", "when", "she", "tried", "to", "remove", "the", "film", "from", "his", "camera", "." ], "ids": [ 10167, 10151, 10452, 79319, 18522, 117, 10105, 87641, 10107, 12415, 10189, 10106, 18939, 16357, 10485, 98777, 11269, 10374, 19556, 10380, 16065, 10189, 10261, 26261, 39709, 73491, 10336, 10708, 10485, 13000, 10111, 70157, 10485, 10841, 10833, 27156, 10114, 51600, 10105, 10458, 10188, 10226, 26665, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sten", "##ning", "has", "rejected", "Diana", "'", "s", "claims", "and", "said", "he", "was", "being", "made", "a", "s", "##cap", "##ego", "##at", "to", "s", "##care", "off", "press", "photographer", "##s", "." ], "ids": [ 98777, 11269, 10393, 39541, 22365, 112, 187, 25880, 10111, 12415, 10261, 10134, 11223, 11019, 169, 187, 93103, 12419, 10526, 10114, 187, 22277, 11898, 21040, 69816, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jordan", "ex", "##pel", "##s", "Iraqi", "diplomat", "." ], "ids": [ 16366, 11419, 17703, 10107, 57806, 45652, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "AM", "##MA", "##N", "1996", "-", "08", "-", "23" ], "ids": [ 24339, 30696, 11537, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jordan", "has", "asked", "an", "Iraqi", "diplomat", "to", "leave", "the", "kingdom", "for", "carrying", "out", "duties", "in", "##com", "##pati", "##ble", "with", "diplomatic", "nor", "##ms", ",", "an", "official", "source", "said", "on", "Friday", "." ], "ids": [ 16366, 10393, 22151, 10151, 57806, 45652, 10114, 21964, 10105, 12293, 10142, 39157, 10950, 40266, 10106, 22530, 33399, 11203, 10169, 64838, 31515, 12387, 117, 10151, 14731, 15247, 12415, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "move", "came", "after", "Amman", "bl", "##amed", "Iraq", "and", "a", "pro", "-", "Baghdad", "local", "political", "party", "for", "last", "week", "'", "s", "worst", "un", "##rest", "in", "seven", "years", "after", "a", "government", "decision", "to", "double", "prices", "of", "br", "##ead", "." ], "ids": [ 10117, 18577, 13383, 10662, 107098, 21484, 83865, 21455, 10111, 169, 11284, 118, 73055, 11436, 13736, 14039, 10142, 12469, 16118, 112, 187, 62006, 10119, 34189, 10106, 15767, 10855, 10662, 169, 12047, 19231, 10114, 15790, 57476, 10108, 33989, 30297, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "declined", "comment", "." ], "ids": [ 10117, 12047, 44948, 49641, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Jordan", "has", "asked", "Mr", ".", "Adel", "Ibrahim", ",", "the", "Iraqi", "em", "##bas", "##sy", "'", "s", "press", "att", "##ache", ",", "to", "leave", "because", "he", "was", "carrying", "out", "duties", "in", "##com", "##pati", "##ble", "with", "diplomatic", "nor", "##ms", ",", "\"", "the", "source", "told", "Reuters", "." ], "ids": [ 107, 16366, 10393, 22151, 12916, 119, 80444, 30727, 117, 10105, 57806, 10266, 21322, 16105, 112, 187, 21040, 10788, 41944, 117, 10114, 21964, 12373, 10261, 10134, 39157, 10950, 40266, 10106, 22530, 33399, 11203, 10169, 64838, 31515, 12387, 117, 107, 10105, 15247, 21937, 46617, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "He", "said", "Ibrahim", "was", "still", "in", "Amman", "." ], "ids": [ 10357, 12415, 30727, 10134, 12647, 10106, 107098, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "Jordan", "##ian", "Arab", "Socialist", "Ba", "##ath", "Party", "has", "denied", "involvement", "in", "un", "##rest", "which", "it", "bl", "##amed", "on", "government", "policies", "and", "rising", "economic", "hard", "##ship", "." ], "ids": [ 10117, 16366, 11630, 17365, 42637, 21333, 44196, 12529, 10393, 47467, 47167, 10106, 10119, 34189, 10319, 10271, 21484, 83865, 10135, 12047, 38572, 10111, 53816, 13925, 19118, 21544, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rio", "##ts", ",", "which", "sh", "##ook", "Jordan", "for", "two", "days", ",", "broke", "out", "after", "last", "Friday", "'", "s", "main", "prayer", "##s", "in", "the", "southern", "town", "of", "Kara", "##k", "and", "spread", "to", "Amman", "." ], "ids": [ 10117, 27244, 10806, 117, 10319, 48201, 46921, 16366, 10142, 10551, 13990, 117, 30500, 10950, 10662, 12469, 30767, 112, 187, 12126, 82012, 10107, 10106, 10105, 17156, 12221, 10108, 34635, 10174, 10111, 25609, 10114, 107098, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Kur", "##d", "rebels", "to", "free", "Turkish", "soldier", "prisoners", "." ], "ids": [ 61912, 10162, 57545, 10114, 13961, 22814, 50803, 44094, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "DO", "##H", "##U", "##K", ",", "Iraq", "1996", "-", "08", "-", "23" ], "ids": [ 99843, 12396, 12022, 11733, 117, 21455, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turkish", "Kur", "##d", "guerrilla", "##s", "said", "on", "Friday", "they", "would", "free", "seven", "Turkish", "soldiers", "they", "hold", "in", "northern", "Iraq", "under", "a", "tentative", "Islam", "##ist", "peace", "bid", "." ], "ids": [ 22814, 61912, 10162, 106552, 10107, 12415, 10135, 30767, 10689, 10894, 13961, 15767, 22814, 23324, 10689, 18500, 10106, 17335, 21455, 10571, 169, 67161, 14727, 11293, 28101, 50385, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "\"", ".", ".", ".", "For", "the", "sa", "##ke", "of", "safety", "we", "are", "asking", "for", "their", "family", "members", "or", "the", "authorities", "to", "come", "and", "pick", "them", "up", ",", "\"", "Kurdistan", "Workers", "Party", "(", "PKK", ")", "central", "committee", "member", "R", "##iza", "Alt", "##un", "told", "journalists", "near", "the", "Iraqi", "city", "of", "Do", "##hu", "##k", "." ], "ids": [ 107, 119, 119, 119, 11399, 10105, 10148, 10550, 10108, 27116, 11951, 10301, 72082, 10142, 10455, 11365, 12464, 10345, 10105, 28308, 10114, 10678, 10111, 36833, 11345, 10741, 117, 107, 86246, 52896, 12529, 113, 105298, 114, 12397, 27634, 12008, 155, 24213, 24466, 11107, 21937, 85851, 12883, 10105, 57806, 11584, 10108, 11791, 13723, 10174, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 2, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "PKK", "guerrilla", "##s", "would", "ac", "##com", "##pan", "##y", "the", "soldiers", ",", "captured", "last", "spring", "in", "one", "of", "Turkey", "'", "s", "frequent", "cross", "-", "border", "drives", ",", "until", "they", "could", "be", "handed", "over", ",", "he", "said", "." ], "ids": [ 105298, 106552, 10107, 10894, 13621, 22530, 15119, 10157, 10105, 23324, 117, 25030, 12469, 26053, 10106, 10464, 10108, 22519, 112, 187, 49975, 19630, 118, 20949, 64592, 117, 11444, 10689, 12174, 10347, 44040, 10491, 117, 10261, 12415, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Their", "release", "has", "been", "nego", "##tia", "##ted", "by", "Islam", "##ist", "writer", "Ismail", "Na", "##car", "as", "part", "of", "a", "wider", "effort", ",", "partly", "backed", "by", "Prime", "Minister", "Ne", "##cm", "##etti", "##n", "Er", "##bakan", ",", "to", "find", "a", "political", "solution", "to", "Turkey", "'", "s", "Kur", "##dish", "problem", "." ], "ids": [ 17551, 14072, 10393, 10590, 21134, 16180, 11912, 10155, 14727, 11293, 17556, 43441, 10685, 15983, 10146, 10668, 10108, 169, 50514, 24912, 117, 50686, 61010, 10155, 19924, 14355, 19416, 27528, 21985, 10115, 10915, 91850, 117, 10114, 17860, 169, 13736, 28502, 10114, 22519, 112, 187, 61912, 67522, 18077, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Er", "##bakan", "has", "encouraged", "Na", "##car", "'", "s", "bid", "but", "has", "ruled", "out", "direct", "talks", "with", "the", "rebels", "." ], "ids": [ 10915, 91850, 10393, 51502, 10685, 15983, 112, 187, 50385, 10473, 10393, 34920, 10950, 16934, 56672, 10169, 10105, 57545, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "PKK", "often", "uses", "bases", "in", "northern", "Iraq", "in", "its", "fight", "for", "auto", "##nomy", "or", "independence", "in", "southeast", "Turkey", "." ], "ids": [ 10117, 105298, 12899, 19873, 23213, 10106, 17335, 21455, 10106, 10474, 20780, 10142, 18257, 100395, 10345, 31412, 10106, 36798, 22519, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "More", "than", "20", ",", "000", "people", "have", "died", "in", "12", "years", "of", "fighting", "between", "the", "guerrilla", "##s", "and", "Turkish", "forces", "." ], "ids": [ 15946, 11084, 10197, 117, 10259, 11426, 10529, 12482, 10106, 10186, 10855, 10108, 27535, 10948, 10105, 106552, 10107, 10111, 22814, 13729, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "SO", "##L", "##ID", "##ER", "##E", "shares", "mixed", "on", "market", "." ], "ids": [ 71020, 11369, 28895, 24093, 11259, 45751, 23742, 10135, 17313, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##IR", "##UT", "1996", "-", "08", "-", "23" ], "ids": [ 46291, 73522, 65729, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##L", "##ID", "##ER", "##E", "shares", "were", "mixed", "on", "Friday", "on", "the", "privately", "-", "operated", "Beirut", "Secondary", "Market", "(", "BS", "##M", ")", "." ], "ids": [ 71020, 11369, 28895, 24093, 11259, 45751, 10309, 23742, 10135, 30767, 10135, 10105, 81411, 118, 19301, 43822, 49898, 28409, 113, 43436, 11517, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "A", "shares", "-", "-", "distributed", "to", "former", "holder", "##s", "of", "property", "rights", "in", "the", "Beirut", "central", "district", "SO", "##L", "##ID", "##ER", "##E", "is", "re", "##building", "-", "-", "closed", "at", "$", "104", ".", "625", "un", "##chang", "##ed", "from", "Thursday", "." ], "ids": [ 138, 45751, 118, 118, 35123, 10114, 11775, 48938, 10107, 10108, 18381, 16691, 10106, 10105, 43822, 12397, 12107, 71020, 11369, 28895, 24093, 11259, 10124, 11639, 56923, 118, 118, 18440, 10160, 109, 15115, 119, 35354, 10119, 64208, 10336, 10188, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "shares", "-", "-", "issued", "in", "a", "$", "650", "-", "million", "sub", "##scription", "in", "January", "1994", "-", "-", "rose", "to", "$", "106", ".", "5", "from", "$", "106", ".", "375", "a", "day", "earlier", "." ], "ids": [ 139, 45751, 118, 118, 21694, 10106, 169, 109, 21132, 118, 12473, 13987, 55785, 10106, 11238, 10444, 118, 118, 29467, 10114, 109, 16084, 119, 126, 10188, 109, 16084, 119, 25403, 169, 11940, 18905, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turn", "##over", "on", "BS", "##M", ",", "which", "trade", "##s", "only", "SO", "##L", "##ID", "##ER", "##E", "shares", ",", "was", "8", ",", "049", "shares", "from", "Thursday", "'", "s", "8", ",", "757", "and", "value", "was", "$", "850", ",", "968", "from", "$", "918", ",", "288", "." ], "ids": [ 36750, 16666, 10135, 43436, 11517, 117, 10319, 18908, 10107, 10893, 71020, 11369, 28895, 24093, 11259, 45751, 117, 10134, 129, 117, 106353, 45751, 10188, 67067, 112, 187, 129, 117, 53421, 10111, 19211, 10134, 109, 24934, 117, 62449, 10188, 109, 74185, 117, 27401, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "the", "official", "Beirut", "Stock", "Exchange", ",", "only", "1", ",", "185", "Ci", "##ments", "Liban", "##ais", "shares", "were", "traded", "at", "$", "1", ".", "1875", "compared", "with", "2", ",", "036", "shares", "traded", "on", "Thursday", "at", "the", "same", "price", "." ], "ids": [ 10576, 10105, 14731, 43822, 31916, 32424, 117, 10893, 122, 117, 19859, 51457, 14542, 72097, 12985, 45751, 10309, 52696, 10160, 109, 122, 119, 13797, 25626, 10169, 123, 117, 109077, 45751, 52696, 10135, 67067, 10160, 10105, 11561, 30839, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "no", "trade", "in", "any", "of", "the", "three", "other", "listed", "companies", ":", "Ci", "##ments", "Blanc", "##s", ",", "Et", "##ern", "##it", "and", "Uni", "##ceram", "##ic", "." ], "ids": [ 11723, 10134, 10192, 18908, 10106, 11178, 10108, 10105, 11003, 10684, 17585, 18866, 131, 51457, 14542, 31867, 10107, 117, 16232, 13979, 10486, 10111, 22966, 109815, 11130, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "BL", "##OM", "Stock", "Index", "which", "covers", "both", "markets", "rose", "0", ".", "04", "percent", "to", "903", ".", "09", "and", "the", "L", "##IS", "##P", "##I", "index", "rose", "0", ".", "02", "percent", "to", "81", ".", "58", "." ], "ids": [ 10117, 102549, 37079, 31916, 12135, 10319, 26406, 11408, 42893, 29467, 121, 119, 10814, 22362, 10114, 64104, 119, 11035, 10111, 10105, 149, 19088, 11127, 11281, 19776, 29467, 121, 119, 10983, 22362, 10114, 12324, 119, 11824, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Beirut", "editorial", "(", "961", "1", ")", "864", "##14", "##8", "353", "##0", "##7", "##8", "861", "##7", "##23" ], "ids": [ 118, 43822, 30202, 113, 72488, 122, 114, 70118, 39900, 11396, 35373, 10929, 11305, 11396, 77132, 11305, 74171 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zen", "##ith", "lands", "$", "1", "billion", "contract", ",", "plans", "$", "100", "million", "plant", "." ], "ids": [ 61916, 28229, 31361, 109, 122, 25848, 16108, 117, 18195, 109, 10407, 12473, 16430, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Susan", "Nad", "##eau" ], "ids": [ 14476, 51726, 19713 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "con", "##sort", "##ium", "of", "telephone", "companies", "and", "The", "Walt", "Disney", "Co", "." ], "ids": [ 138, 10173, 30490, 12454, 10108, 69009, 18866, 10111, 10117, 24108, 14909, 13098, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "said", "Thursday", "it", "had", "signed", "a", "$", "1", "billion", "contract", "with", "Zen", "##ith", "to", "make", "digital", "tele", "##vis", "##on", "set", "-", "top", "boxes", "for", "its", "home", "entertainment", "service", "." ], "ids": [ 12415, 67067, 10271, 10374, 14775, 169, 109, 122, 25848, 16108, 10169, 61916, 28229, 10114, 13086, 16924, 56142, 13844, 10263, 11847, 118, 12364, 88530, 10142, 10474, 11816, 38642, 11989, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "announcement", "of", "the", "contract", "for", "3", "million", "set", "-", "top", "boxes", "gave", "new", "hope", "to", "Zen", "##ith", ",", "which", "has", "struggled", "with", "years", "of", "losses", "." ], "ids": [ 10117, 76557, 10108, 10105, 16108, 10142, 124, 12473, 11847, 118, 12364, 88530, 15362, 10751, 50725, 10114, 61916, 28229, 117, 10319, 10393, 96142, 10169, 10855, 10108, 45353, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "really", "indicates", "we", "'", "re", "back", "in", "the", "business", ",", "\"", "William", "Lu", "##ehr", "##s", ",", "president", "of", "the", "Glen", "##view", ",", "Ill", ".", "-", "based", "company", "'", "s", "Networks", "Services", "Division", ",", "said", "in", "a", "telephone", "interview", ".", "\"" ], "ids": [ 107, 10747, 30181, 50239, 11951, 112, 11639, 12014, 10106, 10105, 14155, 117, 107, 10694, 23859, 89707, 10107, 117, 12931, 10108, 10105, 30729, 30512, 117, 101288, 119, 118, 11610, 12100, 112, 187, 55246, 20228, 11987, 117, 12415, 10106, 169, 69009, 21213, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 5, 9, 2, 6, 6, 6, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Any", "##time", "some", "##body", "gets", "the", "opportunity", "to", "enter", "the", "next", "era", "with", "such", "a", "big", "bang", "has", "got", "to", "be", "seen", "as", "a", "strong", "message", "to", "the", "industry", ".", "\"" ], "ids": [ 47336, 18086, 11152, 38078, 30811, 10105, 34468, 10114, 31006, 10105, 13451, 10411, 10169, 11049, 169, 22185, 17937, 10393, 19556, 10114, 10347, 15652, 10146, 169, 18093, 30514, 10114, 10105, 17425, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "the", "announcement", ",", "Zen", "##ith", "'", "s", "stock", "soa", "##red", "$", "5", ".", "50", "to", "$", "16", ".", "875", "on", "the", "New", "York", "Stock", "Exchange", "." ], "ids": [ 18317, 10105, 76557, 117, 61916, 28229, 112, 187, 20511, 56108, 15711, 109, 126, 119, 10462, 10114, 109, 10250, 119, 45949, 10135, 10105, 10287, 10482, 31916, 32424, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "The", "con", "##sort", "##ium", ",", "called", "Americas", "##t", ",", "said", "the", "contract", "was", "part", "of", "its", "strategy", "to", "develop", "and", "market", "the", "next", "generation", "in", "home", "entertainment", "." ], "ids": [ 10117, 10173, 30490, 12454, 117, 11552, 59320, 10123, 117, 12415, 10105, 16108, 10134, 10668, 10108, 10474, 40919, 10114, 26800, 10111, 17313, 10105, 13451, 25601, 10106, 11816, 38642, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "addition", "to", "Disney", ",", "Americas", "##t", "'", "s", "partners", "are", "phone", "companies", "Amer", "##ite", "##ch", "Corp", ".", ",", "Bell", "##S", "##out", "##h", "Corp", ".", ",", "GT", "##E", "Corp", ".", "and", "SB", "##C", "Communications", "." ], "ids": [ 10167, 14763, 10114, 14909, 117, 59320, 10123, 112, 187, 48125, 10301, 41008, 18866, 69286, 12704, 10269, 44687, 119, 117, 15521, 10731, 17514, 10237, 44687, 119, 117, 27987, 11259, 44687, 119, 10111, 64669, 10858, 27428, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Americas", "##t", "said", "Southern", "New", "England", "Telecom", "##mun", "##ications", "Corp", ".", "has", "signed", "a", "letter", "of", "intent", "to", "join", "the", "group", ",", "which", "plans", "to", "provide", "a", "home", "entertainment", "service", "similar", "to", "cable", "television", "." ], "ids": [ 59320, 10123, 12415, 15120, 10287, 11701, 79642, 34326, 102096, 44687, 119, 10393, 14775, 169, 19310, 10108, 58692, 10114, 23707, 10105, 11795, 117, 10319, 18195, 10114, 16871, 169, 11816, 38642, 11989, 13213, 10114, 34995, 14162, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zen", "##ith", "also", "said", "it", "planned", "to", "build", "a", "new", "$", "100", "million", "plant", "in", "Wood", "##ridge", ",", "Ill", "." ], "ids": [ 61916, 28229, 10379, 12415, 10271, 24292, 10114, 23332, 169, 10751, 109, 10407, 12473, 16430, 10106, 18315, 40788, 117, 101288, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ ",", "to", "make", "picture", "tubes", "for", "32", "-", "and", "35", "-", "inch", "screen", "TV", "sets", "." ], "ids": [ 117, 10114, 13086, 36761, 79013, 10142, 10842, 118, 10111, 10803, 118, 34397, 29963, 10813, 23597, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "currently", "buy", "##s", "the", "tubes", "from", "competitors", "." ], "ids": [ 10117, 12100, 15313, 47715, 10107, 10105, 79013, 10188, 92093, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "new", "plant", ",", "which", "is", "dependent", "on", "obtaining", "fina", "##ncing", ",", "will", "create", "about", "280", "new", "jobs", ",", "Zen", "##ith", "said", "." ], "ids": [ 10117, 10751, 16430, 117, 10319, 10124, 45034, 10135, 107536, 79420, 37730, 117, 11337, 18842, 10978, 17859, 10751, 45083, 117, 61916, 28229, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "The", "contract", "calls", "for", "production", "of", "the", "set", "-", "top", "boxes", "over", "five", "years", "." ], "ids": [ 10117, 16108, 31886, 10142, 12116, 10108, 10105, 11847, 118, 12364, 88530, 10491, 12403, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lu", "##ehr", "##s", "said", "manufacturing", "will", "begin", "and", "revenue", "will", "start", "to", "roll", "in", "during", "the", "first", "half", "of", "next", "year", "." ], "ids": [ 23859, 89707, 10107, 12415, 43615, 11337, 16135, 10111, 51557, 11337, 15148, 10114, 25520, 10106, 10939, 10105, 10422, 13877, 10108, 13451, 10924, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "boxes", "will", "be", "made", "on", "a", "build", "-", "to", "-", "order", "basis", "." ], "ids": [ 10117, 88530, 11337, 10347, 11019, 10135, 169, 23332, 118, 10114, 118, 12990, 17172, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zen", "##ith", "will", "convert", "its", "Chihuahua", ",", "Mexico", ",", "analog", "##ue", "set", "-", "top", "box", "plant", "to", "manufacture", "the", "digital", "boxes", "." ], "ids": [ 61916, 28229, 11337, 92028, 10474, 48585, 117, 10490, 117, 58577, 12772, 11847, 118, 12364, 21509, 16430, 10114, 72022, 10105, 16924, 88530, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lu", "##ehr", "##s", "declined", "to", "say", "when", "the", "operation", "was", "expected", "to", "be", "profit", "##able", "." ], "ids": [ 23859, 89707, 10107, 44948, 10114, 23763, 10841, 10105, 20080, 10134, 25973, 10114, 10347, 25081, 13096, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Americas", "##t", "will", "provide", "the", "boxes", "to", "sub", "##sc", "##rib", "##ers", "as", "part", "of", "the", "service", "." ], "ids": [ 59320, 10123, 11337, 16871, 10105, 88530, 10114, 13987, 31505, 47116, 10901, 10146, 10668, 10108, 10105, 11989, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Its", "service", "is", "being", "introduced", "in", "selected", "markets", "across", "the", "United", "States", "." ], "ids": [ 14864, 11989, 10124, 11223, 17037, 10106, 19546, 42893, 15130, 10105, 10609, 10859, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Lu", "##ehr", "##s", "said", "digital", "technology", "in", "set", "-", "top", "boxes", "is", "only", "the", "beginning", "and", "said", "the", "technology", "will", "eventually", "show", "up", "in", "retail", "consumer", "electronics", "." ], "ids": [ 23859, 89707, 10107, 12415, 16924, 19765, 10106, 11847, 118, 12364, 88530, 10124, 10893, 10105, 17967, 10111, 12415, 10105, 19765, 11337, 16328, 11897, 10741, 10106, 52232, 64580, 97007, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "'", "ll", "build", "a", "lot", "of", "these", "devices", "into", "television", "sets", ",", "for", "digital", "television", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 12865, 112, 22469, 23332, 169, 19826, 10108, 11762, 38120, 10708, 14162, 23597, 117, 10142, 16924, 14162, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Although", "that", "is", "not", "where", "this", "particular", "contract", "is", "headed", ",", "the", "fact", "that", "there", "is", "a", "strong", "Zen", "##ith", "presence", "will", "pay", "us", "divide", "##nds", "in", "the", "future", ".", "\"" ], "ids": [ 15785, 10189, 10124, 10472, 10940, 10531, 15018, 16108, 10124, 33336, 117, 10105, 18638, 10189, 11155, 10124, 169, 18093, 61916, 28229, 25599, 11337, 16868, 19626, 41430, 27090, 10106, 10105, 16711, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zen", "##ith", "has", "been", "pla", "##gue", "##d", "by", "generally", "soft", "conditions", "in", "the", "colour", "television", "industry", ",", "reporting", "full", "-", "year", "losses", "since", "1989", "." ], "ids": [ 61916, 28229, 10393, 10590, 71393, 16381, 10162, 10155, 18081, 44898, 17315, 10106, 10105, 43361, 14162, 17425, 117, 60524, 13375, 118, 10924, 45353, 11764, 10524, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "month", ",", "it", "reported", "a", "second", "-", "quarter", "loss", "of", "$", "33", ".", "2", "million", ",", "or", "51", "cents", "a", "share", ",", "vs", ".", "a", "loss", "of", "$", "45", ".", "3", "million", ",", "or", "97", "cents", "a", "share", ",", "a", "year", "earlier", "." ], "ids": [ 14812, 14064, 117, 10271, 15943, 169, 11132, 118, 28330, 18576, 10108, 109, 11000, 119, 123, 12473, 117, 10345, 11524, 63487, 169, 23867, 117, 14987, 119, 169, 18576, 10108, 109, 10827, 119, 124, 12473, 117, 10345, 12328, 63487, 169, 23867, 117, 169, 10924, 18905, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "November", ",", "South", "Korea", "-", "based", "LG", "Electronics", "Inc", ".", "bought", "a", "majority", "stake", "in", "Zen", "##ith", "." ], "ids": [ 14812, 10819, 117, 11056, 14096, 118, 11610, 49780, 54988, 13604, 119, 28870, 169, 19471, 90081, 10106, 61916, 28229, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 6, 3, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Robert", "Gut", "##enstein", ",", "an", "anal", "##yst", "for", "Ka", "##lf", ",", "Voor", "##his", "&", "Co", "." ], "ids": [ 10820, 41377, 45164, 117, 10151, 106615, 62769, 10142, 25444, 35173, 117, 24999, 49311, 111, 13098, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ ",", "said", "the", "contract", "was", "\"", "not", "unique", ",", "but", "it", "'", "s", "big", ".", "\"" ], "ids": [ 117, 12415, 10105, 16108, 10134, 107, 10472, 18223, 117, 10473, 10271, 112, 187, 22185, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Digital", "is", "coming", ",", "it", "'", "s", "economic", "and", "the", "question", "is", "what", "will", "make", "the", "consumer", "happy", "and", "at", "what", "price", ".", "\"" ], "ids": [ 107, 13828, 10124, 23959, 117, 10271, 112, 187, 13925, 10111, 10105, 20210, 10124, 12976, 11337, 13086, 10105, 64580, 54214, 10111, 10160, 12976, 30839, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Natural", "Law", "Party", "says", "it", "can", "med", "##itate", "problems", "away", "." ], "ids": [ 13817, 13216, 12529, 22153, 10271, 10944, 10172, 28198, 20390, 14942, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "From", "the", "people", "who", "brought", "you", "hundreds", "of", "\"", "yo", "##gic", "fl", "##iers", "\"", "who", "claimed", "to", "def", "##y", "nature", "by", "le", "##vita", "##ting", "comes", "The", "Natural", "Law", "Party", ",", "a", "minor", "political", "party", "that", "nominated", "a", "presidential", "candidate", "on", "Thursday", "." ], "ids": [ 12222, 10105, 11426, 10479, 17327, 13028, 48329, 10108, 107, 13672, 42153, 58768, 20297, 107, 10479, 20737, 10114, 100745, 10157, 16613, 10155, 10141, 43130, 12141, 21405, 10117, 13817, 13216, 12529, 117, 169, 17746, 13736, 14039, 10189, 25906, 169, 36476, 22102, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "a", "hotel", "convention", "here", ",", "the", "party", "associated", "with", "the", "Trans", "##cendent", "##al", "Medi", "##tation", "(", "TM", ")", "movement", "named", "ph", "##ys", "##icist", "John", "Ha", "##gel", "##in", "as", "its", "presidential", "nominee", "for", "the", "Nov", ".", "5", "election", "." ], "ids": [ 11699, 169, 19157, 37812, 19353, 117, 10105, 14039, 18107, 10169, 10105, 29608, 106321, 10415, 41512, 21698, 113, 70023, 114, 17123, 12038, 99142, 12682, 97284, 10421, 13740, 16039, 10245, 10146, 10474, 36476, 81878, 10142, 10105, 36779, 119, 126, 13685, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 2, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "party", "is", "running", "on", "a", "platform", "claiming", "it", "can", "ward", "off", "problems", "before", "they", "occur", "through", "techniques", "such", "as", "mass", "med", "##itation", "that", "would", "reduce", "stress", ",", "crime", ",", "terrorism", "and", "even", "wars", "." ], "ids": [ 10117, 14039, 10124, 18020, 10135, 169, 22753, 52787, 10271, 10944, 60026, 11898, 20390, 11360, 10689, 32728, 11222, 22473, 11049, 10146, 22038, 10172, 41372, 10189, 10894, 29888, 39608, 117, 22564, 117, 96969, 10111, 13246, 68756, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Social", "stress", "can", "be", "reduced", "and", "problems", "such", "as", "crime", "and", "violence", "will", "automatically", "decrease", ",", "\"", "said", "a", "party", "paper", "." ], "ids": [ 107, 12824, 39608, 10944, 10347, 25724, 10111, 20390, 11049, 10146, 22564, 10111, 26342, 11337, 64585, 82112, 117, 107, 12415, 169, 14039, 17895, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Many", "party", "members", "are", "prac", "##titi", "##oner", "##s", "of", "TM", ",", "which", "involves", "med", "##itati", "##ng", "to", "a", "repeated", "word", "or", "phrase", ",", "called", "a", "man", "##tra", "." ], "ids": [ 17244, 14039, 12464, 10301, 56309, 87344, 38219, 10107, 10108, 70023, 117, 10319, 53963, 10172, 92959, 10376, 10114, 169, 57026, 12307, 10345, 47320, 117, 11552, 169, 10817, 13207, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "advanced", "TM", "followers", "conte", "##nd", "they", "can", "actually", "media", "##te", "to", "such", "a", "point", "that", "they", "fly", "." ], "ids": [ 13885, 27072, 70023, 76342, 26777, 11534, 10689, 10944, 24376, 12518, 10216, 10114, 11049, 169, 12331, 10189, 10689, 26155, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "in", "a", "demonstration", "of", "\"", "yo", "##gic", "flying", "\"", "several", "years", "ago", ",", "critics", "said", "the", "people", "were", "merely", "bou", "##ncing", "off", "the", "ground", "from", "a", "sitting", "position", "." ], "ids": [ 16976, 10106, 169, 97929, 10108, 107, 13672, 42153, 34676, 107, 11736, 10855, 36390, 117, 29832, 12415, 10105, 11426, 10309, 70807, 94335, 37730, 11898, 10105, 16912, 10188, 169, 62151, 12956, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hu", "##ge", "Windows", "95", "sales", "fail", "to", "meet", "ex", "##pectations", "." ], "ids": [ 43707, 10525, 12905, 11978, 23857, 84891, 10114, 23267, 11419, 96815, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "Wo", "##lk" ], "ids": [ 11235, 102204, 24323 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "1996", "-", "08", "-", "22" ], "ids": [ 23056, 32071, 11090, 51036, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "year", "after", "its", "massive", "##ly", "public", "##ized", "introduction", ",", "Microsoft", "Corp", ".", "'", "s", "Windows", "95", "computer", "operating", "system", "has", "fallen", "short", "of", "the", "most", "op", "##timi", "##stic", "ex", "##pectations", "for", "the", "software", "giant", "and", "the", "industry", "." ], "ids": [ 138, 10924, 10662, 10474, 35394, 10454, 11683, 16589, 23890, 117, 15022, 44687, 119, 112, 187, 12905, 11978, 18765, 24210, 11787, 10393, 40055, 13716, 10108, 10105, 10992, 10303, 82064, 26666, 11419, 96815, 10142, 10105, 16042, 49429, 10111, 10105, 17425, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Even", "though", "more", "than", "40", "million", "copies", "of", "Windows", "95", "have", "been", "sold", ",", "making", "it", "the", "fastest", "-", "selling", "new", "software", "ever", ",", "it", "would", "have", "been", "impossible", "for", "any", "product", "to", "live", "up", "to", "the", "un", "##pre", "##cedent", "##ed", "hy", "##pe", "of", "the", "Aug", ".", "24", ",", "1995", "launch", ",", "when", "stores", "around", "the", "world", "opened", "at", "mid", "##night", "to", "gr", "##eet", "long", "lines", "of", "customers", "." ], "ids": [ 28140, 15102, 10798, 11084, 10533, 12473, 26102, 10108, 12905, 11978, 10529, 10590, 15337, 117, 14293, 10271, 10105, 61823, 118, 30870, 10751, 16042, 17038, 117, 10271, 10894, 10529, 10590, 38199, 10142, 11178, 21535, 10114, 12962, 10741, 10114, 10105, 10119, 30619, 104101, 10336, 15165, 11355, 10108, 10105, 53012, 119, 10233, 117, 10436, 29227, 117, 10841, 36006, 12166, 10105, 11356, 14377, 10160, 15607, 45217, 10114, 30518, 23203, 11695, 19515, 10108, 49260, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Red", "##mond", ",", "Was", "##h", ".", "-", "based", "company", "spent", "ten", "##s", "of", "millions", "of", "dollars", "promoting", "the", "product", "with", "st", "##unt", "##s", "that", "included", "buy", "##ing", "the", "entire", "print", "run", "of", "the", "Times", "of", "London", "and", "lighting", "New", "York", "'", "s", "Empire", "State", "building", "in", "a", "Windows", "color", "scheme", "." ], "ids": [ 10117, 11641, 25677, 117, 22034, 10237, 119, 118, 11610, 12100, 18571, 11769, 10107, 10108, 18123, 10108, 27953, 58027, 10105, 21535, 10169, 28780, 20631, 10107, 10189, 12742, 47715, 10230, 10105, 19192, 31210, 14095, 10108, 10105, 12020, 10108, 10829, 10111, 77805, 10287, 10482, 112, 187, 13642, 11104, 12585, 10106, 169, 12905, 14136, 41209, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "But", "the", "product", ",", "delivered", "eight", "months", "late", ",", "has", "fallen", "short", "of", "its", "sales", "potential", "in", "part", "because", "Microsoft", "delivered", "a", "mixed", "message", "to", "business", "customers", ",", "anal", "##yst", "##s", "said", "." ], "ids": [ 16976, 10105, 21535, 117, 37577, 16222, 15555, 13002, 117, 10393, 40055, 13716, 10108, 10474, 23857, 23078, 10106, 10668, 12373, 15022, 37577, 169, 23742, 30514, 10114, 14155, 49260, 117, 106615, 62769, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "did", "n", "'", "t", "do", "as", "well", "as", "it", "could", "have", ",", "\"", "said", "Rob", "Ende", "##rle", ",", "an", "anal", "##yst", "with", "G", "##iga", "Information", "Group", "." ], "ids": [ 107, 10377, 12172, 182, 112, 188, 10149, 10146, 11206, 10146, 10271, 12174, 10529, 117, 107, 12415, 20386, 12862, 43539, 117, 10151, 106615, 62769, 10169, 144, 15342, 12145, 12054, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Score", "##s", "of", "software", "and", "hardware", "companies", "that", "had", "hoped", "for", "a", "big", "bo", "##ost", "in", "sales", "were", "disa", "##ppo", "##inted", "when", "only", "a", "brief", "sp", "##ike", "materiali", "##zed", "." ], "ids": [ 66875, 10107, 10108, 16042, 10111, 39894, 18866, 10189, 10374, 84245, 10142, 169, 22185, 20506, 18239, 10106, 23857, 10309, 36474, 45565, 107583, 10841, 10893, 169, 29040, 32650, 21353, 66407, 18309, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "People", "who", "were", "ex", "##pect", "##ing", "major", "coat", "-", "tail", "##s", "were", "somewhat", "disa", "##ppo", "##inted", ",", "\"", "said", "Scott", "Winkler", ",", "an", "anal", "##yst", "with", "Ga", "##rt", "##ner", "Group", "." ], "ids": [ 107, 14235, 10479, 10309, 11419, 51511, 10230, 11922, 63646, 118, 48497, 10107, 10309, 43203, 36474, 45565, 107583, 117, 107, 12415, 12812, 31819, 117, 10151, 106615, 62769, 10169, 69699, 10976, 11129, 12054, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "not", "as", "though", "it", "has", "n", "'", "t", "had", "an", "impact", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 10377, 112, 187, 10472, 10146, 15102, 10271, 10393, 182, 112, 188, 10374, 10151, 21316, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "just", "has", "n", "'", "t", "had", "the", "huge", "earth", "-", "sh", "##atte", "##ring", "impact", "some", "people", "were", "looking", "for", ".", "\"" ], "ids": [ 10377, 12820, 10393, 182, 112, 188, 10374, 10105, 42126, 39189, 118, 48201, 43961, 13135, 21316, 11152, 11426, 10309, 34279, 10142, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sy", "##mante", "##c", "Corp", ".", ",", "which", "had", "been", "among", "the", "most", "bu", "##llis", "##h", "of", "software", "companies", "at", "the", "time", "of", "the", "Windows", "95", "launch", ",", "ended", "up", "posti", "##ng", "disa", "##ppo", "##inti", "##ng", "financial", "results", "when", "retail", "sales", "of", "the", "operating", "system", "fell", "short", "of", "its", "projection", "##s", "." ], "ids": [ 32879, 67272, 10350, 44687, 119, 117, 10319, 10374, 10590, 13328, 10105, 10992, 11499, 44417, 10237, 10108, 16042, 18866, 10160, 10105, 10635, 10108, 10105, 12905, 11978, 29227, 117, 18428, 10741, 45020, 10376, 36474, 45565, 49886, 10376, 20570, 17466, 10841, 52232, 23857, 10108, 10105, 24210, 11787, 25194, 13716, 10108, 10474, 92739, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Touch", "##stone", "Software", "Corp", ".", "had", "to", "pay", "$", "1", ".", "3", "million", "in", "cash", "and", "stock", "to", "settle", "a", "share", "##holders", "lawsuit", "brought", "after", "the", "company", "'", "s", "sales", "failed", "to", "meet", "ex", "##pectations", "tied", "to", "the", "Windows", "95", "launch", "." ], "ids": [ 34752, 23314, 21176, 44687, 119, 10374, 10114, 16868, 109, 122, 119, 124, 12473, 10106, 52828, 10111, 20511, 10114, 90424, 169, 23867, 75111, 83706, 17327, 10662, 10105, 12100, 112, 187, 23857, 20775, 10114, 23267, 11419, 96815, 42780, 10114, 10105, 12905, 11978, 29227, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Many", "software", "developers", "apparently", "saw", "their", "crucial", "holiday", "season", "sales", "su", "##ffer", "last", "year", "because", "store", "she", "##lves", "were", "jam", "##med", "with", "blue", "-", "and", "-", "white", "boxes", "of", "Windows", "95", ",", "resulting", "in", "a", "short", "##age", "of", "space", "for", "season", "##al", "products", ",", "said", "Ann", "Stephens", ",", "president", "of", "PC", "Data", "Inc", "." ], "ids": [ 17244, 16042, 87346, 47731, 17112, 10455, 63113, 71806, 11226, 23857, 10198, 22888, 12469, 10924, 12373, 13708, 10833, 86506, 10309, 25694, 21986, 10169, 23254, 118, 10111, 118, 15263, 88530, 10108, 12905, 11978, 117, 26746, 10106, 169, 13716, 12276, 10108, 16199, 10142, 11226, 10415, 20895, 117, 12415, 15879, 54509, 117, 12931, 10108, 16355, 12159, 13604, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "To", "be", "sure", ",", "sales", "of", "Windows", "95", "and", "the", "accompanying", "Office", "95", "upgrade", "drove", "Microsoft", "sales", "up", "46", "percent", "last", "year", "to", "a", "record", "$", "8", ".", "67", "billion", "and", "ce", "##mente", "##d", "the", "company", "'", "s", "status", "as", "the", "industry", "'", "s", "dominant", "company", "." ], "ids": [ 11469, 10347, 62452, 117, 23857, 10108, 12905, 11978, 10111, 10105, 110015, 13348, 11978, 107003, 72256, 15022, 23857, 10741, 11528, 22362, 12469, 10924, 10114, 169, 12410, 109, 129, 119, 12316, 25848, 10111, 10794, 10611, 10162, 10105, 12100, 112, 187, 14042, 10146, 10105, 17425, 112, 187, 36705, 12100, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 2, 6, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Microsoft", "executive", "##s", "say", "they", "are", "th", "##rill", "##ed", "with", "the", "sales", "figures", ",", "and", "industry", "anal", "##yst", "##s", "estimate", "that", "by", "some", "##time", "next", "year", ",", "the", "installed", "base", "of", "Windows", "95", "will", "sur", "##pass", "that", "of", "the", "older", "version", "of", "Windows", ",", "now", "used", "on", "about", "100", "million", "computers", "worldwide", "." ], "ids": [ 15022, 22676, 10107, 23763, 10689, 10301, 77586, 40916, 10336, 10169, 10105, 23857, 21068, 117, 10111, 17425, 106615, 62769, 10107, 78059, 10189, 10155, 11152, 18086, 13451, 10924, 117, 10105, 34398, 11404, 10108, 12905, 11978, 11337, 10326, 36388, 10189, 10108, 10105, 18757, 11674, 10108, 12905, 117, 11858, 11031, 10135, 10978, 10407, 12473, 58838, 31197, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Ende", "##rle", "said", "the", "figure", "could", "have", "been", "even", "higher", "if", "Microsoft", "had", "done", "a", "better", "job", "of", "handling", "the", "huge", "demand", "for", "technical", "support", "from", "customers", "who", "were", "fr", "##ust", "##rated", "trying", "to", "instal", "##l", "the", "system", "." ], "ids": [ 16976, 12862, 43539, 12415, 10105, 17527, 12174, 10529, 10590, 13246, 17981, 12277, 15022, 10374, 20378, 169, 18322, 23627, 10108, 52703, 10105, 42126, 34394, 10142, 29914, 13145, 10188, 49260, 10479, 10309, 12127, 19265, 32199, 32862, 10114, 50562, 10161, 10105, 11787, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "and", "other", "anal", "##yst", "##s", "said", "corporate", "America", "adopted", "a", "go", "-", "slow", "approach", "because", "Microsoft", "already", "was", "promoting", "the", "new", "version", "of", "its", "high", "-", "end", "Windows", "NT", "operating", "system", ",", "expected", "to", "be", "available", "in", "stores", "in", "the", "next", "several", "weeks", "." ], "ids": [ 10357, 10111, 10684, 106615, 62769, 10107, 12415, 46666, 11440, 24726, 169, 11783, 118, 41573, 23068, 12373, 15022, 19034, 10134, 58027, 10105, 10751, 11674, 10108, 10474, 11846, 118, 11572, 12905, 49942, 24210, 11787, 117, 25973, 10114, 10347, 14579, 10106, 36006, 10106, 10105, 13451, 11736, 20750, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Microsoft", "sent", "a", "lot", "of", "signals", "that", "NT", "was", "going", "to", "be", "the", "answer", ",", "\"", "Winkler", "said", ".", "\"" ], "ids": [ 107, 15022, 14541, 169, 19826, 10108, 65037, 10189, 49942, 10134, 19090, 10114, 10347, 10105, 57085, 117, 107, 31819, 12415, 119, 107 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "Many", "people", "began", "to", "believe", "that", "Windows", "95", "was", "being", "down", "##play", "##ed", ".", "\"" ], "ids": [ 17244, 11426, 11941, 10114, 30587, 10189, 12905, 11978, 10134, 11223, 12935, 31081, 10336, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "now", "that", "Windows", "NT", "4", ".", "0", "has", "been", "launched", ",", "Winkler", "and", "others", "believe", "only", "a", "relatively", "small", "proportion", "of", "corporate", "users", "will", "elect", "to", "pay", "the", "added", "software", "and", "hardware", "costs", "needed", "to", "use", "it", "instead", "of", "Windows", "95", "." ], "ids": [ 16976, 11858, 10189, 12905, 49942, 125, 119, 121, 10393, 10590, 18850, 117, 31819, 10111, 14633, 30587, 10893, 169, 28436, 12474, 66410, 10108, 46666, 32095, 11337, 106095, 10114, 16868, 10105, 16288, 16042, 10111, 39894, 34495, 23794, 10114, 11760, 10271, 17427, 10108, 12905, 11978, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "\"", "Windows", "95", "is", "going", "to", "do", "great", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 12905, 11978, 10124, 19090, 10114, 10149, 14772, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "mis", "##take", "people", "made", "was", "in", "thinking", "it", "was", "going", "to", "be", "a", "fast", ",", "s", "##we", "##eping", "change", "rather", "than", "a", "slow", ",", "building", "change", ".", "\"" ], "ids": [ 10117, 12606, 47529, 11426, 11019, 10134, 10106, 56294, 10271, 10134, 19090, 10114, 10347, 169, 15040, 117, 187, 12577, 79654, 15453, 16863, 11084, 169, 41573, 117, 12585, 15453, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "says", "still", "committed", "to", "Cuba", "migration", "pa", "##cts", "." ], "ids": [ 158, 119, 156, 119, 22153, 12647, 38184, 10114, 17226, 63512, 10931, 39159, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "United", "States", "said", "on", "Thursday", "it", "remained", "committed", "to", "migration", "accord", "##s", "with", "Cuba", "and", "would", "continue", "to", "rep", "##at", "##riate", "inter", "##cept", "##ed", "Cuban", "mig", "##rants", "who", "attempted", "to", "enter", "U", ".", "S", ".", "territory", "illegal", "##ly", "." ], "ids": [ 10117, 10609, 10859, 12415, 10135, 67067, 10271, 15980, 38184, 10114, 63512, 35233, 10107, 10169, 17226, 10111, 10894, 17734, 10114, 76456, 10526, 88958, 22021, 97782, 10336, 60845, 34478, 55208, 10479, 30881, 10114, 31006, 158, 119, 156, 119, 24399, 39806, 10454, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "A", "State", "Department", "statement", "appeared", "in", "part", "a", "response", "to", "Cuban", "com", "##plaints", "that", "Washington", "was", "je", "##opa", "##rdi", "##sing", "the", "accord", "##s", "by", "failing", "to", "return", "some", "of", "the", "Cuban", "##s", "involved", "in", "recent", "illegal", "migration", "incidents", "." ], "ids": [ 138, 11104, 12933, 33311, 14565, 10106, 10668, 169, 21001, 10114, 60845, 10212, 104221, 10189, 11586, 10134, 10144, 49482, 18177, 16357, 10105, 35233, 10107, 10155, 72103, 10114, 15079, 11152, 10108, 10105, 60845, 10107, 16247, 10106, 19037, 39806, 63512, 73451, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "United", "States", "rei", "##tera", "##tes", "its", "full", "commitment", "to", "the", "implementation", "\"", "of", "the", "accord", "##s", "signed", "by", "the", "two", "countries", "in", "1994", "and", "1995", ",", "said", "the", "statement", "by", "spoke", "##sman", "G", "##lyn", "Davies", "." ], "ids": [ 107, 10117, 10609, 10859, 14243, 22833, 11197, 10474, 13375, 75010, 10114, 10105, 53187, 107, 10108, 10105, 35233, 10107, 14775, 10155, 10105, 10551, 15911, 10106, 10444, 10111, 10436, 117, 12415, 10105, 33311, 10155, 50005, 24305, 144, 34417, 23539, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "\"", "The", "United", "States", "will", "continue", "to", "return", "Cuban", "mig", "##rants", "inter", "##cept", "##ed", "at", "sea", "who", "seek", "to", "enter", "the", "United", "States", "or", "the", "G", "##uant", "##ana", "##mo", "Naval", "Base", "illegal", "##ly", ",", "\"", "it", "said", "." ], "ids": [ 107, 10117, 10609, 10859, 11337, 17734, 10114, 15079, 60845, 34478, 55208, 22021, 97782, 10336, 10160, 14931, 10479, 48394, 10114, 31006, 10105, 10609, 10859, 10345, 10105, 144, 41542, 11631, 11033, 20469, 19938, 39806, 10454, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Washington", "would", "also", "take", "\"", "pro", "##mpt", "and", "effective", "law", "enforcement", "action", "\"", "against", "alien", "sm", "##uggling", "and", "hija", "##cking", "##s", "from", "Cuba", ",", "it", "added", "." ], "ids": [ 11586, 10894, 10379, 13574, 107, 11284, 109361, 10111, 26874, 13255, 64736, 14204, 107, 11327, 81087, 39709, 85808, 10111, 26429, 72453, 10107, 10188, 17226, 117, 10271, 16288, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Davies", "told", "reporter", "##s", "the", "statement", "would", "be", "distributed", "in", "the", "Cuban", "exile", "community", "in", "Miami", "\"", "to", "re", "##min", "##d", "everyone", "of", "the", "importance", "of", "ab", "##iding", "by", "the", "accord", "##s", "and", "avoid", "##ing", "dangerous", "attempts", "to", "cross", "the", "str", "##ait", "##s", "\"", "from", "Cuba", "to", "Florida", "." ], "ids": [ 23539, 21937, 41408, 10107, 10105, 33311, 10894, 10347, 35123, 10106, 10105, 60845, 67696, 13354, 10106, 17626, 107, 10114, 11639, 14956, 10162, 48628, 10108, 10105, 21912, 10108, 11357, 28142, 10155, 10105, 35233, 10107, 10111, 33253, 10230, 57195, 30406, 10114, 19630, 10105, 17791, 14598, 10107, 107, 10188, 17226, 10114, 13668, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Havana", "'", "s", "com", "##plaints", "centre", "##d", "on", "an", "incident", "in", "which", "a", "boat", "##load", "of", "em", "##ig", "##rants", "caps", "##ized", "in", "the", "Florida", "Straits", "last", "week", "and", "two", "recent", "aircraft", "hija", "##cking", "##s", "from", "Cuba", "." ], "ids": [ 64403, 112, 187, 10212, 104221, 12672, 10162, 10135, 10151, 28005, 10106, 10319, 169, 30418, 64312, 10108, 10266, 11142, 55208, 52036, 16589, 10106, 10105, 13668, 88820, 12469, 16118, 10111, 10551, 19037, 16167, 26429, 72453, 10107, 10188, 17226, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Six", "##teen", "of", "those", "picked", "up", "from", "the", "boat", "were", "returned", "to", "Cuba", "but", "eight", "were", "taken", "to", "the", "United", "States", "and", "three", "to", "G", "##uant", "##ana", "##mo", "Bay", ",", "a", "U", ".", "S", ".", "base", "on", "Cuba", ",", "until", "they", "emigrated", "to", "another", "nation", "." ], "ids": [ 20615, 20156, 10108, 12676, 52289, 10741, 10188, 10105, 30418, 10309, 14030, 10114, 17226, 10473, 16222, 10309, 15109, 10114, 10105, 10609, 10859, 10111, 11003, 10114, 144, 41542, 11631, 11033, 13146, 117, 169, 158, 119, 156, 119, 11404, 10135, 17226, 117, 11444, 10689, 102159, 10114, 12864, 22274, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 1, 5, 5, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "most", "recent", "hija", "##cking", ",", "last", "Friday", ",", "involved", "three", "hija", "##cker", "##s", "and", "the", "pilot", "of", "a", "small", "aircraft", "." ], "ids": [ 10117, 10992, 19037, 26429, 72453, 117, 12469, 30767, 117, 16247, 11003, 26429, 19153, 10107, 10111, 10105, 20618, 10108, 169, 12474, 16167, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Davies", "said", "on", "Tuesday", "the", "pilot", "could", "soon", "return", "to", "Cuba", "but", "U", ".", "S", ".", "authorities", "planned", "to", "try", "the", "hija", "##cker", "##s", "." ], "ids": [ 23539, 12415, 10135, 70245, 10105, 20618, 12174, 17864, 15079, 10114, 17226, 10473, 158, 119, 156, 119, 28308, 24292, 10114, 31638, 10105, 26429, 19153, 10107, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "an", "incident", "on", "July", "7", ",", "a", "Cuban", "interior", "ministry", "official", "hija", "##cked", "a", "commercial", "plane", "and", "sought", "ay", "##lum", "at", "G", "##uant", "##ana", "##mo", "Bay", "." ], "ids": [ 10167, 10151, 28005, 10135, 11112, 128, 117, 169, 60845, 14806, 65338, 14731, 26429, 72333, 169, 17331, 35007, 10111, 32570, 11538, 20571, 10160, 144, 41542, 11631, 11033, 13146, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9 ] }, { "tokens": [ "Davies", "said", "he", "knew", "of", "no", "plans", "to", "return", "the", "man", "to", "Cuba", "." ], "ids": [ 23539, 12415, 10261, 46000, 10108, 10192, 18195, 10114, 15079, 10105, 10817, 10114, 17226, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Wi", "##s", "." ], "ids": [ 52742, 10107, 119 ], "entity": [ "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 9 ] }, { "tokens": [ "says", "is", "first", "state", "to", "apply", "for", "new", "welfare", "." ], "ids": [ 22153, 10124, 10422, 11388, 10114, 48515, 10142, 10751, 78366, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "22" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "keeping", "with", "its", "pioneer", "##ing", "image", "in", "the", "area", "of", "welfare", ",", "Wisconsin", "was", "the", "first", "state", "to", "sub", "##mit", "an", "administrative", "plan", "under", "the", "nation", "'", "s", "new", "welfare", "law", ",", "Go", "##v", "." ], "ids": [ 10167, 51318, 10169, 10474, 65570, 10230, 18170, 10106, 10105, 11168, 10108, 78366, 117, 17909, 10134, 10105, 10422, 11388, 10114, 13987, 15772, 10151, 18401, 13065, 10571, 10105, 22274, 112, 187, 10751, 78366, 13255, 117, 14439, 10477, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tommy", "Thompson", "said", "Thursday", "." ], "ids": [ 20136, 13288, 12415, 67067, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9 ] }, { "tokens": [ "According", "to", "a", "new", "release", "from", "the", "governor", ",", "Wisconsin", "submitted", "a", "plan", "to", "the", "U", ".", "S", ".", "Department", "of", "Health", "and", "Human", "Services", "for", "administration", "of", "the", "new", "block", "grant", "system", "for", "welfare", "just", "minutes", "after", "President", "Bill", "Clinton", "signed", "the", "measure", "into", "law", "Thursday", "." ], "ids": [ 14156, 10114, 169, 10751, 14072, 10188, 10105, 28795, 117, 17909, 58544, 169, 13065, 10114, 10105, 158, 119, 156, 119, 12933, 10108, 15931, 10111, 15426, 20228, 10142, 17941, 10108, 10105, 10751, 27242, 41100, 11787, 10142, 78366, 12820, 15304, 10662, 12811, 13160, 24139, 14775, 10105, 38713, 10708, 13255, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "As", "the", "nation", "'", "s", "leader", "in", "welfare", "reform", ",", "Wisconsin", "is", "far", "ahead", "of", "the", "curve", "and", "ready", "to", "go", "under", "this", "new", "system", ",", "\"", "Thompson", "said", "." ], "ids": [ 107, 10882, 10105, 22274, 112, 187, 15014, 10106, 78366, 34800, 117, 17909, 10124, 13301, 35629, 10108, 10105, 67088, 10111, 42374, 10114, 11783, 10571, 10531, 10751, 11787, 117, 107, 13288, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "Still", ",", "the", "governor", "said", "the", "new", "law", "does", "not", "go", "as", "far", "as", "the", "state", "'", "s", "own", "welfare", "reform", "program", ",", "dubbed", "W", "-", "2", "." ], "ids": [ 27567, 117, 10105, 28795, 12415, 10105, 10751, 13255, 15107, 10472, 11783, 10146, 13301, 10146, 10105, 11388, 112, 187, 12542, 78366, 34800, 12483, 117, 76902, 160, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "He", "said", "that", "despite", "the", "new", "law", ",", "Wisconsin", "will", "still", "require", "federal", "wa", "##iver", "##s", "allowing", "the", "working", "poor", "to", "acquire", "health", "care", "coverage", "from", "the", "state", ",", "a", "60", "-", "day", "reside", "##ncy", "requirement", "for", "participation", "in", "the", "welfare", "program", ",", "and", "child", "support", "collections", "to", "go", "directly", "to", "custo", "##dia", "##l", "parents", "." ], "ids": [ 10357, 12415, 10189, 22087, 10105, 10751, 13255, 117, 17909, 11337, 12647, 35742, 16293, 11471, 37884, 10107, 28357, 10105, 14616, 23247, 10114, 86753, 17004, 11131, 42158, 10188, 10105, 11388, 117, 169, 10709, 118, 11940, 76481, 24166, 75425, 10142, 25784, 10106, 10105, 78366, 12483, 117, 10111, 18048, 13145, 31141, 10114, 11783, 22062, 10114, 102158, 13852, 10161, 17293, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "nation", "'", "s", "new", "welfare", "reform", "law", "limits", "eligibility", ",", "gives", "states", "more", "power", "and", "ends", "direct", "federal", "aid", "for", "poor", "children", "." ], "ids": [ 10117, 22274, 112, 187, 10751, 78366, 34800, 13255, 47418, 105225, 117, 24952, 16316, 10798, 13183, 10111, 29047, 16934, 16293, 19778, 10142, 23247, 12694, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Karen", "Piero", "##g", ",", "312", "-", "408", "-", "864", "##7" ], "ids": [ 118, 118, 24560, 42447, 10240, 117, 25104, 118, 36899, 118, 70118, 11305 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##no", "##oz", "##ing", "Vietnamese", "man", "takes", "slow", "train", "to", "Alaska", "." ], "ids": [ 156, 10343, 20129, 10230, 59078, 10817, 19135, 41573, 17767, 10114, 20588, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "ANC", "##H", "##OR", "##AG", "##E", ",", "Alaska", "1996", "-", "08", "-", "22" ], "ids": [ 90561, 12396, 42622, 109865, 11259, 117, 20588, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Vietnamese", "man", "who", "tried", "to", "take", "a", "s", "##no", "##oze", "in", "a", "railway", "box", "##car", "in", "Canada", "found", "himself", "lock", "##ed", "in", "and", "bound", "for", "Alaska", "with", "no", "food", "or", "water", "." ], "ids": [ 138, 59078, 10817, 10479, 27156, 10114, 13574, 169, 187, 10343, 76047, 10106, 169, 18271, 21509, 15983, 10106, 11635, 11823, 14764, 79601, 10336, 10106, 10111, 46538, 10142, 20588, 10169, 10192, 18301, 10345, 12286, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Official", "##s", "in", "the", "port", "of", "W", "##hit", "##tier", "said", "on", "Thursday", "that", "they", "found", "Tu", "##an", "Qua", "##c", "Phan", ",", "29", ",", "de", "##hy", "##drat", "##ed", ",", "fa", "##mis", "##hed", "and", "ter", "##rif", "##ied", "after", "sailing", "to", "Alaska", "from", "Canada", "in", "the", "box", "##car", "loaded", "on", "a", "bar", "##ge", ",", "a", "trip", "that", "takes", "about", "five", "days", "." ], "ids": [ 17678, 10107, 10106, 10105, 16874, 10108, 160, 40762, 34146, 12415, 10135, 67067, 10189, 10689, 11823, 20108, 10206, 56618, 10350, 72723, 117, 10386, 117, 10104, 19275, 92659, 10336, 117, 12211, 15240, 16081, 10111, 12718, 52070, 24140, 10662, 86952, 10114, 20588, 10188, 11635, 10106, 10105, 21509, 15983, 103927, 10135, 169, 18121, 10525, 117, 169, 37307, 10189, 19135, 10978, 12403, 13990, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sgt", "." ], "ids": [ 80599, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Dan", "Je", "##well", "of", "the", "W", "##hit", "##tier", ",", "Alaska", "police", "department", "described", "Phan", "as", "\"", "extremely", "co", "##operative", "\"", ".", "\"" ], "ids": [ 14261, 13796, 15862, 10108, 10105, 160, 40762, 34146, 117, 20588, 15034, 21079, 13010, 72723, 10146, 107, 38136, 11170, 84633, 107, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "See", "##ing", "me", "in", "my", "uniform", ",", "he", "kept", "saying", ",", "Ja", "##il", "better", "." ], "ids": [ 13924, 10230, 10911, 10106, 15127, 51135, 117, 10261, 26546, 22807, 117, 28248, 11030, 18322, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ja", "##il", "better", ".", "'" ], "ids": [ 28248, 11030, 18322, 119, 112 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"" ], "ids": [ 107 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Phan", "'", "s", "accident", "##al", "journey", "started", "last", "week", "in", "Prince", "Rupert", ",", "British", "Columbia", ",", "where", "he", "was", "search", "##ing", "for", "a", "fishing", "job", ",", "Je", "##well", "said", "." ], "ids": [ 72723, 112, 187, 25037, 10415, 43610, 13457, 12469, 16118, 10106, 14185, 44706, 117, 11160, 13469, 117, 10940, 10261, 10134, 22419, 10230, 10142, 169, 43768, 23627, 117, 13796, 15862, 12415, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "He", "had", "climb", "##ed", "up", "in", "this", "box", "##car", "to", "get", "out", "of", "the", "weather", "and", "to", "get", "some", "sleep", ",", "\"", "Je", "##well", "said", ".", "\"" ], "ids": [ 107, 10357, 10374, 93274, 10336, 10741, 10106, 10531, 21509, 15983, 10114, 15329, 10950, 10108, 10105, 35660, 10111, 10114, 15329, 11152, 63658, 117, 107, 13796, 15862, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "The", "next", "thing", "you", "know", ",", "the", "box", "##car", "is", "coupled", "up", "and", "loaded", "up", "to", "a", "bar", "##ge", "and", "headed", "north", ".", "\"" ], "ids": [ 10117, 13451, 40414, 13028, 21852, 117, 10105, 21509, 15983, 10124, 96523, 10741, 10111, 103927, 10741, 10114, 169, 18121, 10525, 10111, 33336, 12756, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "found", "Phan", "late", "on", "Monday", "when", "the", "box", "##car", ",", "which", "was", "transport", "##ing", "lu", "##mber", ",", "was", "opened", "at", "W", "##hit", "##tier", ",", "a", "port", "in", "western", "Prince", "William", "Sound", "." ], "ids": [ 18051, 11823, 72723, 13002, 10135, 40714, 10841, 10105, 21509, 15983, 117, 10319, 10134, 16024, 10230, 14657, 33567, 117, 10134, 14377, 10160, 160, 40762, 34146, 117, 169, 16874, 10106, 16672, 14185, 10694, 17432, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Official", "##s", "fed", "Phan", "some", "sou", "##p", ",", "gave", "him", "medical", "care", ",", "kept", "him", "over", "##night", "and", "then", "fed", "him", "a", "large", "break", "##fast", "." ], "ids": [ 17678, 10107, 79782, 72723, 11152, 20514, 10410, 117, 15362, 10957, 19436, 11131, 117, 26546, 10957, 10491, 45217, 10111, 11059, 79782, 10957, 169, 12077, 24194, 84445, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "State", ",", "federal", "agents", "probe", "Arkansas", "church", "fires", "." ], "ids": [ 11104, 117, 16293, 32124, 110239, 23956, 14201, 90350, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Steve", "Barnes" ], "ids": [ 13308, 31717 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "L", "##IT", "##T", "##LE", "R", "##OCK", ",", "Ark", "." ], "ids": [ 149, 37611, 11090, 51036, 155, 96608, 117, 67552, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "22" ], "ids": [ 10389, 118, 11052, 118, 10306 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "State", "and", "federal", "agents", "on", "Thursday", "si", "##fte", "##d", "through", "the", "ru", "##bble", "of", "two", "predominantly", "black", "Arkansas", "churches", "that", "burned", "within", "minutes", "of", "one", "another", "late", "Tuesday", "and", "early", "Wednesday", "." ], "ids": [ 11104, 10111, 16293, 32124, 10135, 67067, 10294, 22878, 10162, 11222, 10105, 13483, 55873, 10108, 10551, 71748, 15045, 23956, 38172, 10189, 63838, 12381, 15304, 10108, 10464, 12864, 13002, 70245, 10111, 11732, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "churches", "were", "in", "the", "Mississippi", "delta", "region", "of", "Arkansas", ",", "about", "90", "miles", "(", "145", "km", "##s", ")", "southeast", "of", "Little", "Rock", ",", "and", "were", "located", "within", "three", "miles", "of", "one", "another", "." ], "ids": [ 20973, 38172, 10309, 10106, 10105, 19771, 30764, 12220, 10108, 23956, 117, 10978, 10919, 14148, 113, 17862, 10204, 10107, 114, 36798, 10108, 12936, 12158, 117, 10111, 10309, 11954, 12381, 11003, 14148, 10108, 10464, 12864, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "'", "re", "in", "##vesti", "##gating", "with", "the", "idea", "that", "both", "fires", "may", "be", "ar", "##son", ",", "but", "that", "has", "n", "'", "t", "been", "con", "##clu", "##sive", "##ly", "established", ",", "\"", "said", "Wayne", "Jordan", ",", "a", "spoke", "##sman", "for", "the", "Arkansas", "State", "Police", "." ], "ids": [ 107, 12865, 112, 11639, 10106, 63996, 91045, 10169, 10105, 14932, 10189, 11408, 90350, 11387, 10347, 10456, 11599, 117, 10473, 10189, 10393, 182, 112, 188, 10590, 10173, 78225, 37413, 10454, 13245, 117, 107, 12415, 18547, 16366, 117, 169, 50005, 24305, 10142, 10105, 23956, 11104, 18051, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Agent", "##s", "of", "the", "F", ".", "B", ".", "I", ".", "and", "the", "Bureau", "of", "Al", "##co", "##hol", ",", "To", "##ba", "##cco", "and", "Fire", "##arm", "##s", "were", "also", "at", "the", "scene", ",", "Jordan", "said", "." ], "ids": [ 36065, 10107, 10108, 10105, 143, 119, 139, 119, 146, 119, 10111, 10105, 12344, 10108, 10883, 10812, 32631, 117, 11469, 10537, 20493, 10111, 16011, 76171, 10107, 10309, 10379, 10160, 10105, 18167, 117, 16366, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "Mount", "Zion", "Mission", "##ary", "Baptist", "Church", "and", "St", ".", "Matthews", "Mission", "##ary", "Baptist", "Church", "were", "both", "frame", "structures", ",", "each", "near", "Turner", ",", "Arkansas", ",", "a", "small", "community", "surrounded", "by", "cotton", "and", "soy", "##bea", "##n", "fields", "." ], "ids": [ 14287, 98270, 14157, 14926, 36596, 12690, 10111, 10838, 119, 47100, 14157, 14926, 36596, 12690, 10309, 11408, 31532, 24914, 117, 11948, 12883, 18339, 117, 23956, 117, 169, 12474, 13354, 45785, 10155, 77946, 10111, 103559, 92710, 10115, 28455, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "is", "rural", "Arkansas", "." ], "ids": [ 107, 10747, 10124, 18380, 23956, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "I", "'", "m", "surprise", "##d", "anyone", "could", "even", "find", "us", "out", "here", ",", "\"", "said", "Fan", "##nie", "Johnson", ",", "a", "member", "of", "St", ".", "Matthew", "'", "s", ",", "who", "said", "she", "believed", "ar", "##son", "was", "to", "bl", "##ame", "." ], "ids": [ 146, 112, 181, 48886, 10162, 51747, 12174, 13246, 17860, 19626, 10950, 19353, 117, 107, 12415, 30126, 11297, 13241, 117, 169, 12008, 10108, 10838, 119, 18168, 112, 187, 117, 10479, 12415, 10833, 20718, 10456, 11599, 10134, 10114, 21484, 18969, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Others", "connected", "with", "the", "two", "churches", "said", "they", "shared", "that", "sus", "##pic", "##ion", ",", "although", "all", "said", "they", "knew", "of", "no", "motive", "and", "no", "racial", "tension", "in", "the", "area", "." ], "ids": [ 64738, 26989, 10169, 10105, 10551, 38172, 12415, 10689, 29054, 10189, 10846, 34891, 11046, 117, 14779, 10435, 12415, 10689, 46000, 10108, 10192, 101101, 10111, 10192, 33377, 55027, 10106, 10105, 11168, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "sad", "someone", "would", "have", "that", "kind", "of", "spite", "in", "their", "heart", ",", "\"", "said", "Rev", ".", "Jerome", "Turner", ",", "pastor", "of", "Mount", "Zion", "Mission", "##ary", "Baptist", "Church", "." ], "ids": [ 107, 10377, 112, 187, 81708, 30455, 10894, 10529, 10189, 22282, 10108, 102845, 10106, 10455, 21736, 117, 107, 12415, 24774, 119, 43325, 18339, 117, 44135, 10108, 14287, 98270, 14157, 14926, 36596, 12690, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9 ] }, { "tokens": [ "Arkansas", "has", "been", "sp", "##ared", "the", "loss", "of", "predominantly", "black", "churches", "to", "ar", "##son", ",", "a", "wave", "that", "has", "claimed", "an", "estimated", "30", "houses", "of", "worship", "across", "the", "south", "in", "the", "past", "several", "months", "." ], "ids": [ 23956, 10393, 10590, 32650, 104931, 10105, 18576, 10108, 71748, 15045, 38172, 10114, 10456, 11599, 117, 169, 32981, 10189, 10393, 20737, 10151, 25267, 10244, 21174, 10108, 64412, 15130, 10105, 13144, 10106, 10105, 17781, 11736, 15555, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "black", "church", "near", "Camden", ",", "Arkansas", ",", "about", "100", "miles", "(", "161", "km", "##s", ")", "south", "of", "Little", "Rock", ",", "burned", "in", "July", ",", "but", "federal", "agents", "have", "not", "determined", "the", "cause", "." ], "ids": [ 138, 15045, 14201, 12883, 67343, 117, 23956, 117, 10978, 10407, 14148, 113, 21163, 10204, 10107, 114, 13144, 10108, 12936, 12158, 117, 63838, 10106, 11112, 117, 10473, 16293, 32124, 10529, 10472, 30706, 10105, 15311, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RE", "##SE", "##AR", "##CH", "AL", "##ER", "##T", "-", "Royal", "Oak", "initiated", "." ], "ids": [ 71033, 39039, 52188, 86448, 47271, 24093, 11090, 118, 11596, 36923, 56571, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "-", "-", "EV", "##ER", "##EN", "Sec", "##urities", "Inc", "said", "Friday", "it", "initiated", "coverage", "of", "Royal", "Oak", "Mines", "Inc", "with", "an", "out", "##per", "##form", "rating", "." ], "ids": [ 118, 118, 109821, 24093, 50655, 109754, 82073, 13604, 12415, 30767, 10271, 56571, 42158, 10108, 11596, 36923, 58995, 13604, 10169, 10151, 10950, 12713, 19757, 31035, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "It", "set", "earning", "##s", "estimates", "of", "$", "0", ".", "08", "a", "share", "for", "fiscal", "1996", ",", "$", "0", ".", "13", "for", "1997", ",", "$", "0", ".", "40", "for", "1998", "and", "$", "0", ".", "43", "for", "1999", "." ], "ids": [ 118, 118, 10377, 11847, 56981, 10107, 45870, 10108, 109, 121, 119, 11052, 169, 23867, 10142, 43645, 10389, 117, 109, 121, 119, 10249, 10142, 10391, 117, 109, 121, 119, 10533, 10142, 10363, 10111, 109, 121, 119, 11370, 10142, 10324, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "\"", "Based", "on", "our", "sim", "##ulated", "production", ",", "income", "and", "cash", "flow", "models", ",", "common", "shares", "of", "Royal", "Oak", "are", "at", "a", "significant", "disco", "##unt", "to", "the", "industry", "average", "##s", ",", "\"", "EV", "##ER", "##EN", "said", "." ], "ids": [ 118, 118, 107, 39264, 10135, 17446, 92304, 37725, 12116, 117, 18245, 10111, 52828, 30676, 22441, 117, 14624, 45751, 10108, 11596, 36923, 10301, 10160, 169, 17912, 14884, 20631, 10114, 10105, 17425, 13551, 10107, 117, 107, 109821, 24093, 50655, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "-", "-", "The", "short", "-", "term", "price", "objective", "is", "$", "5", "a", "share", "and", "the", "long", "-", "term", "objective", "is", "$", "9", "." ], "ids": [ 118, 118, 10117, 13716, 118, 13719, 30839, 59598, 10124, 109, 126, 169, 23867, 10111, 10105, 11695, 118, 13719, 59598, 10124, 109, 130, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Royal", "Oak", "shares", "were", "down", "1", "/", "16", "at", "3", "-", "11", "/", "16", "." ], "ids": [ 118, 118, 11596, 36923, 45751, 10309, 12935, 122, 120, 10250, 10160, 124, 118, 10193, 120, 10250, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "Chicago", "News", "##des", "##k", "-", "312", "-", "408", "-", "878", "##7" ], "ids": [ 46617, 12317, 12219, 10920, 10174, 118, 25104, 118, 36899, 118, 74002, 11305 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sun", "##G", "##ard", "to", "buy", "Check", "##F", "##ree", "unit", "." ], "ids": [ 13967, 11447, 13167, 10114, 47715, 50177, 11565, 29711, 16511, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "SA", "##N", "MA", "##TE", "##O", ",", "Cali", "##f", ".", "1996", "-", "08", "-", "23" ], "ids": [ 21318, 11537, 27277, 29833, 11403, 117, 65458, 10575, 119, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sun", "##G", "##ard", "Sha", "##re", "##holder", "Systems", "Inc", ",", "a", "subsidiary", "of", "Sun", "##G", "##ard", "Data", "Systems", "Inc", ",", "said", "it", "had", "entered", "into", "a", "def", "##initive", "agreement", "to", "buy", "the", "Sec", "##urities", "Products", "Business", "unit", "of", "Check", "##F", "##ree", "Corp", "." ], "ids": [ 13967, 11447, 13167, 106583, 10246, 54535, 18953, 13604, 117, 169, 53898, 10108, 13967, 11447, 13167, 12159, 18953, 13604, 117, 12415, 10271, 10374, 19226, 10708, 169, 100745, 93551, 25432, 10114, 47715, 10105, 109754, 82073, 73903, 15281, 16511, 10108, 50177, 11565, 29711, 44687, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "The", "company", "said", "in", "a", "statement", "on", "Friday", "the", "deal", "was", "expected", "to", "be", "finali", "##zed", "in", "September", "." ], "ids": [ 10117, 12100, 12415, 10106, 169, 33311, 10135, 30767, 10105, 19918, 10134, 25973, 10114, 10347, 83046, 18309, 10106, 10596, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ter", "##ms", "were", "not", "disc", "##lose", "##d", "." ], "ids": [ 65272, 12387, 10309, 10472, 27224, 46614, 10162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "purchase", "is", "not", "expected", "to", "have", "a", "material", "effect", "o", "Sun", "##G", "##ard", "'", "s", "financial", "condition", "or", "results", "of", "operations", "." ], "ids": [ 10117, 37891, 10124, 10472, 25973, 10114, 10529, 169, 13540, 18514, 183, 13967, 11447, 13167, 112, 187, 20570, 24713, 10345, 17466, 10108, 18356, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "New", "York", "news", "##room", ",", "(", "212", ")", "859", "-", "1610" ], "ids": [ 118, 118, 10287, 10482, 14424, 25525, 117, 113, 22023, 114, 80786, 118, 35360 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alpha", "Tech", "##s", "close", "##s", "Lock", "##hart", "purchase", "." ], "ids": [ 27718, 34265, 10107, 16065, 10107, 76133, 34567, 37891, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alpha", "Technologies", "Group", "Inc", "said", "it", "had", "closed", "on", "its", "agreement", "to", "acquire", "Lock", "##hart", "Industries", "Inc", "." ], "ids": [ 27718, 49287, 12054, 13604, 12415, 10271, 10374, 18440, 10135, 10474, 25432, 10114, 86753, 76133, 34567, 40277, 13604, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "The", "company", "said", "in", "a", "statement", "late", "on", "Thursday", "that", "it", "issued", "280", ",", "556", "shares", "of", "common", "stock", "for", "the", "stock", "of", "Lock", "##hart", "." ], "ids": [ 10117, 12100, 12415, 10106, 169, 33311, 13002, 10135, 67067, 10189, 10271, 21694, 17859, 117, 54919, 45751, 10108, 14624, 20511, 10142, 10105, 20511, 10108, 76133, 34567, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "These", "shares", "are", "subject", "to", "post", "-", "closing", "ad", "##just", "##ments", "." ], "ids": [ 13252, 45751, 10301, 20036, 10114, 11841, 118, 57409, 10840, 106670, 14542, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lock", "##hart", ",", "based", "in", "Paramount", ",", "Cali", "##f", ".", ",", "is", "a", "designer", "and", "manufacturer", "of", "so", "##phis", "##tica", "##ted", "thermal", "management", "products", "." ], "ids": [ 76133, 34567, 117, 11610, 10106, 40322, 117, 65458, 10575, 119, 117, 10124, 169, 32682, 10111, 56961, 10108, 10380, 56395, 13640, 11912, 82055, 17150, 20895, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 1, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "New", "York", "news", "##room", ",", "(", "212", ")", "859", "-", "1610" ], "ids": [ 118, 118, 10287, 10482, 14424, 25525, 117, 113, 22023, 114, 80786, 118, 35360 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ana", "##lys", "##ts", "hold", "Dutch", "PTT", "estimates", "." ], "ids": [ 16377, 52176, 10806, 18500, 17693, 26227, 45870, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "23" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "post", "and", "tele", "##com", "##s", "group", "Koninklijke", "PTT", "Nederland", "N", "##V", "'", "s", "(", "Dutch", "PTT", ")", "first", "half", "results", "came", "marginal", "##ly", "below", "most", "anal", "##yst", "##s", "'", "for", "##eca", "##sts", ",", "giving", "s", "##cant", "grounds", "to", "ad", "##just", "full", "year", "estimates", ",", "anal", "##yst", "##s", "said", "on", "Friday", "." ], "ids": [ 17693, 11841, 10111, 56142, 22530, 10107, 11795, 61990, 26227, 16059, 151, 11779, 112, 187, 113, 17693, 26227, 114, 10422, 13877, 17466, 13383, 92379, 10454, 17544, 10992, 106615, 62769, 10107, 112, 10142, 33588, 28036, 117, 24426, 187, 62745, 38190, 10114, 10840, 106670, 13375, 10924, 45870, 117, 106615, 62769, 10107, 12415, 10135, 30767, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PTT", "earlier", "announced", "an", "8", ".", "5", "percent", "rise", "in", "net", "profit", "for", "the", "first", "six", "months", "of", "1996", "to", "1", ".", "209", "billion", "gu", "##ild", "##ers", ",", "a", "hair", "'", "s", "br", "##ead", "##th", "below", "the", "1", ".", "210", "-", "1", ".", "236", "billion", "for", "##eca", "##st", "range", "." ], "ids": [ 26227, 18905, 13854, 10151, 129, 119, 126, 22362, 28710, 10106, 11988, 25081, 10142, 10105, 10422, 12449, 15555, 10108, 10389, 10114, 122, 119, 23404, 25848, 75980, 65820, 10901, 117, 169, 40830, 112, 187, 33989, 30297, 11143, 17544, 10105, 122, 119, 17131, 118, 122, 119, 26318, 25848, 10142, 33588, 10562, 15601, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "were", "pretty", "much", "in", "line", "with", "our", "estimate", "of", "1", ".", "210", "billion", ",", "\"", "said", "Peter", "R", "##oe", ",", "at", "Par", "##iba", "##s", "in", "London", ".", "\"" ], "ids": [ 107, 11696, 10309, 108361, 13172, 10106, 12117, 10169, 17446, 78059, 10108, 122, 119, 17131, 25848, 117, 107, 12415, 10979, 155, 20085, 117, 10160, 17434, 53622, 10107, 10106, 10829, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 3, 7, 7, 9, 1, 9, 9 ] }, { "tokens": [ "As", "we", "expected", "volume", "growth", "was", "quite", "good", ".", ".", "." ], "ids": [ 10882, 11951, 25973, 15901, 14609, 10134, 31324, 15198, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "there", "'", "s", "really", "no", "reason", "to", "change", "our", "for", "##eca", "##st", "and", "our", "largely", "positive", "view", "on", "the", "stock", ".", "\"" ], "ids": [ 11155, 112, 187, 30181, 10192, 27949, 10114, 15453, 17446, 10142, 33588, 10562, 10111, 17446, 25340, 19737, 17904, 10135, 10105, 20511, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Coming", "just", "a", "million", "gu", "##ild", "##ers", "under", "the", "for", "##eca", "##st", "range", "is", "n", "'", "t", "over", "##w", "##hel", "##ming", "##ly", "sur", "##pris", "##ing", ",", "\"", "said", "IN", "##G", "anal", "##yst", "Steven", "V", "##rol", "##ijk", ",", "who", "is", "continuing", "to", "look", "for", "a", "nine", "to", "10", "percent", "rise", "in", "1996", "earning", "##s", "." ], "ids": [ 107, 39107, 12820, 169, 12473, 75980, 65820, 10901, 10571, 10105, 10142, 33588, 10562, 15601, 10124, 182, 112, 188, 10491, 10874, 31572, 16405, 10454, 10326, 45666, 10230, 117, 107, 12415, 36351, 11447, 106615, 62769, 17569, 159, 22698, 34799, 117, 10479, 10124, 47635, 10114, 25157, 10142, 169, 19964, 10114, 10150, 22362, 28710, 10106, 10389, 56981, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "'", "ve", "got", "a", "very", "sound", "domestic", "business", "which", "is", "doing", "very", "well", ",", "we", "remain", "positive", "on", "the", "stock", ",", "\"", "said", "R", "##oe", ".", "\"" ], "ids": [ 107, 11696, 112, 10323, 19556, 169, 12558, 19302, 31084, 14155, 10319, 10124, 30918, 12558, 11206, 117, 11951, 25430, 19737, 10135, 10105, 20511, 117, 107, 12415, 155, 20085, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "We", "think", "it", "'", "s", "a", "solid", "performer", "in", "the", "Dutch", "market", ".", "\"" ], "ids": [ 12865, 27874, 10271, 112, 187, 169, 37751, 78285, 10106, 10105, 17693, 17313, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "R", "##oe", "said", "he", "was", "stick", "##ing", "by", "his", "for", "##eca", "##st", "of", "a", "2", ".", "45", "billion", "gu", "##ild", "##er", "net", "for", "1996", "." ], "ids": [ 155, 20085, 12415, 10261, 10134, 84081, 10230, 10155, 10226, 10142, 33588, 10562, 10108, 169, 123, 119, 10827, 25848, 75980, 65820, 10165, 11988, 10142, 10389, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "PTT", "earlier", "on", "Friday", "repeated", "a", "for", "##eca", "##st", "it", "would", "improve", "on", "1995", "'", "s", "2", ".", "26", "billion", "gu", "##ild", "##er", "net", "profit", "for", "the", "whole", "year", "of", "1996", "." ], "ids": [ 17693, 26227, 18905, 10135, 30767, 57026, 169, 10142, 33588, 10562, 10271, 10894, 33992, 10135, 10436, 112, 187, 123, 119, 10314, 25848, 75980, 65820, 10165, 11988, 25081, 10142, 10105, 21047, 10924, 10108, 10389, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "By", "1403", "GMT", "the", "shares", "were", "down", "1", ".", "70", "gu", "##ild", "##ers", "to", "61", ".", "00", "gu", "##ild", "##ers", ",", "falling", "in", "a", "weak", "##er", "Amsterdam", "bou", "##rse", "." ], "ids": [ 12716, 90895, 20362, 10105, 45751, 10309, 12935, 122, 119, 10923, 75980, 65820, 10901, 10114, 12314, 119, 11025, 75980, 65820, 10901, 117, 54756, 10106, 169, 61285, 10165, 14017, 94335, 16239, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Kei", "##ron", "Henderson", ",", "Amsterdam", "News", "##room", "+", "31", "20", "504", "5000" ], "ids": [ 118, 118, 103883, 11620, 30018, 117, 14017, 12219, 25525, 116, 10413, 10197, 43098, 17436 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bos", "##kali", "##s", "upgrade", "##s", "1996", "out", "##lo", "##ok", "." ], "ids": [ 86792, 36414, 10107, 107003, 10107, 10389, 10950, 10715, 11140, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "[", "CO", "##R", "##RE", "##CT", "##ED", "13", ":", "12", "GMT", "]" ], "ids": [ 164, 32992, 11273, 66014, 91995, 33809, 10249, 131, 10186, 20362, 166 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "PA", "##P", "##EN", "##D", "##RE", "##CH", "##T", ",", "Netherlands", "1996", "-", "08", "-", "23" ], "ids": [ 32349, 11127, 50655, 11490, 66014, 86448, 11090, 117, 22043, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dre", "##d", "##ging", "group", "Koninklijke", "Bos", "##kali", "##s", "Westminster", "N", "##V", "said", "on", "Friday", "it", "expected", "higher", "turno", "##ver", "and", "profits", "for", "the", "second", "half", "of", "1996", "(", "correct", "##s", "from", "the", "full", "year", "1996", ")", "." ], "ids": [ 72531, 10162, 13808, 11795, 61990, 86792, 36414, 10107, 30795, 151, 11779, 12415, 10135, 30767, 10271, 25973, 17981, 17440, 12563, 10111, 100106, 10142, 10105, 11132, 13877, 10108, 10389, 113, 49148, 10107, 10188, 10105, 13375, 10924, 10389, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "An", "improvement", "is", "expected", "in", "capacity", "utilisation", ",", "turno", "##ver", "and", "profits", ",", "\"", "the", "company", "said", "in", "a", "statement", "." ], "ids": [ 107, 10313, 70010, 10124, 25973, 10106, 23095, 34272, 117, 17440, 12563, 10111, 100106, 117, 107, 10105, 12100, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "world", "'", "s", "largest", "dre", "##dge", "##r", "said", "in", "March", "that", "it", "was", "uncertain", "whether", "it", "could", "hold", "1996", "full", "-", "year", "profit", "st", "##eady", "at", "the", "previous", "year", "'", "s", "70", ".", "9", "million", "gu", "##ild", "##ers", ",", "but", "added", "long", "-", "term", "pro", "##spects", "were", "good", "." ], "ids": [ 10117, 11356, 112, 187, 15363, 35028, 25431, 10129, 12415, 10106, 11144, 10189, 10271, 10134, 108308, 21883, 10271, 12174, 18500, 10389, 13375, 118, 10924, 25081, 28780, 61973, 10160, 10105, 16741, 10924, 112, 187, 10923, 119, 130, 12473, 75980, 65820, 10901, 117, 10473, 16288, 11695, 118, 13719, 11284, 105335, 10309, 15198, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bos", "##kali", "##s", "reported", "1996", "first", "-", "half", "net", "profit", "fell", "to", "27", ".", "5", "million", "gu", "##ild", "##ers", "from", "a", "year", "-", "earlier", "41", ".", "4", "million", "." ], "ids": [ 86792, 36414, 10107, 15943, 10389, 10422, 118, 13877, 11988, 25081, 25194, 10114, 10365, 119, 126, 12473, 75980, 65820, 10901, 10188, 169, 10924, 118, 18905, 11349, 119, 125, 12473, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Greek", "president", "disso", "##lves", "parliament", "for", "sna", "##p", "vote", "." ], "ids": [ 15286, 12931, 32375, 86506, 40519, 10142, 62541, 10410, 18926, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "23" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Greek", "President", "Cost", "##is", "Step", "##hn", "##op", "##oul", "##os", "signed", "a", "decree", "on", "Thursday", "order", "##ing", "the", "dissolution", "of", "the", "300", "-", "seat", "parliament", "ahead", "of", "sna", "##p", "elections", "on", "September", "22", "." ], "ids": [ 15286, 12811, 102455, 10291, 41653, 15797, 13362, 75631, 10310, 14775, 169, 109157, 10135, 67067, 12990, 10230, 10105, 71930, 10108, 10105, 11093, 118, 17687, 40519, 35629, 10108, 62541, 10410, 22054, 10135, 10596, 10306, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "President", "of", "the", "Republic", "Cost", "##is", "Stephan", "##op", "##oul", "##os", "signed", "the", "decree", "for", "the", "dissolution", "of", "parliament", ",", "\"", "a", "presidency", "statement", "said", "." ], "ids": [ 107, 10117, 12811, 10108, 10105, 13681, 102455, 10291, 31556, 13362, 75631, 10310, 14775, 10105, 109157, 10142, 10105, 71930, 10108, 40519, 117, 107, 169, 97059, 33311, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Socialist", "Prime", "Minister", "Costa", "##s", "Sim", "##itis", "announced", "the", "sna", "##p", "poll", "on", "Thursday", "citing", "problems", "with", "the", "economy", ",", "the", "country", "'", "s", "con", "##ver", "##gence", "with", "the", "European", "Union", "and", "ten", "##se", "relations", "with", "neighbouring", "Turkey", "." ], "ids": [ 42637, 19924, 14355, 13902, 10107, 103695, 36967, 13854, 10105, 62541, 10410, 70156, 10135, 67067, 71306, 20390, 10169, 10105, 27570, 117, 10105, 12723, 112, 187, 10173, 12563, 40078, 10169, 10105, 11914, 11457, 10111, 11769, 10341, 19824, 10169, 79475, 22519, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Elections", "were", "originally", "scheduled", "to", "be", "held", "in", "October", "next", "year", "." ], "ids": [ 69618, 10309, 15556, 34081, 10114, 10347, 11991, 10106, 11212, 13451, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Libya", "##n", "man", "murdered", "in", "Malta", "." ], "ids": [ 50720, 10115, 10817, 65861, 10106, 23259, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 1, 9 ] }, { "tokens": [ "VA", "##LL", "##ET", "##TA", "1996", "-", "08", "-", "23" ], "ids": [ 69342, 82834, 52338, 24951, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Libya", "##n", "man", "has", "been", "found", "sta", "##bbed", "to", "death", "in", "Malta", ",", "police", "said", "on", "Friday", "." ], "ids": [ 138, 50720, 10115, 10817, 10393, 10590, 11823, 16527, 98091, 10114, 12557, 10106, 23259, 117, 15034, 12415, 10135, 30767, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "the", "body", "of", "Amer", "His", "##hem", "Ali", "Mohammed", ",", "23", ",", "was", "found", "in", "a", "pool", "of", "blood", "in", "S", "##lie", "##ma", ",", "seven", "km", "(", "four", "miles", ")", "from", "Valle", "##tta", ",", "on", "Wednesday", "morning", "." ], "ids": [ 11696, 12415, 10105, 14333, 10108, 69286, 11597, 25947, 13518, 32415, 117, 10328, 117, 10134, 11823, 10106, 169, 34183, 10108, 24911, 10106, 156, 17656, 10369, 117, 15767, 10204, 113, 11598, 14148, 114, 10188, 19159, 12201, 117, 10135, 57611, 28757, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "appeared", "to", "have", "been", "killed", "on", "Tuesday", "night", ",", "suffering", "at", "least", "eight", "sta", "##b", "wound", "##s", "." ], "ids": [ 10357, 14565, 10114, 10529, 10590, 15875, 10135, 70245, 16903, 117, 49552, 10160, 16298, 16222, 16527, 10457, 109205, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "Commissioner", "George", "G", "##rec", "##h", "said", "police", "were", "in", "##vesti", "##gating", "the", "possibility", "that", "Mohammed", "had", "links", "to", "an", "Islamic", "militant", "group", "as", "reported", "by", "the", "local", "press", "." ], "ids": [ 18051, 24366, 10955, 144, 74755, 10237, 12415, 15034, 10309, 10106, 63996, 91045, 10105, 53510, 10189, 32415, 10374, 23608, 10114, 10151, 22150, 79006, 11795, 10146, 15943, 10155, 10105, 11436, 21040, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "What", "we", "know", "is", "that", "he", "was", "a", "fer", "##vant", "religious", "man", ",", "we", "cannot", "ex", "##clu", "##de", "anything", "in", "investigations", "\"", "he", "said", "." ], "ids": [ 107, 12489, 11951, 21852, 10124, 10189, 10261, 10134, 169, 13658, 25314, 19366, 10817, 117, 11951, 25259, 11419, 78225, 10253, 42819, 10106, 87748, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deutsche", "Bahn", "H", "##1", "pre", "-", "tax", "profit", "up", "17", ".", "5", "p", "##ct", "." ], "ids": [ 15389, 23428, 145, 10759, 12229, 118, 25468, 25081, 10741, 10273, 119, 126, 184, 14526, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##AN", "##K", "##F", "##UR", "##T", "1996", "-", "08", "-", "23" ], "ids": [ 64655, 41275, 11733, 11565, 98348, 11090, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Six", "months", "to", "June", "30" ], "ids": [ 20615, 15555, 10114, 11120, 10244 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "millions", "of", "marks", "unless", "stated", ")" ], "ids": [ 113, 10106, 18123, 10108, 55112, 60015, 17067, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Group", "pre", "-", "tax", "profit", "188", "vs", "160" ], "ids": [ 12054, 12229, 118, 25468, 25081, 22345, 14987, 13849 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Group", "sales", "14", ",", "600", "up", "3", ".", "3", "p", "##ct" ], "ids": [ 12054, 23857, 10247, 117, 11796, 10741, 124, 119, 124, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Full", "name", "of", "the", "state", "-", "owned", "German", "railway", "company", "is", "Deutsche", "Bahn", "AG", "." ], "ids": [ 49307, 29833, 118, 23651, 11324, 10108, 10105, 11388, 118, 17012, 12026, 18271, 12100, 10124, 15389, 23428, 17935, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "company", "is", "ear", "##marked", "for", "eventual", "privat", "##isa", "##tio" ], "ids": [ 10117, 12100, 10124, 104700, 88425, 10142, 57231, 51085, 19403, 24008 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "also", "covers", "sna", "##p", "FA", "##T", "##82", "##22" ], "ids": [ 10379, 26406, 62541, 10410, 20794, 11090, 78675, 71793 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Revenue", "from", "long", "-", "distance", "passenger" ], "ids": [ 69092, 10188, 11695, 118, 18527, 33155 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "traffic", "2", ",", "500", "up", "6", ".", "4", "p", "##ct" ], "ids": [ 26482, 123, 117, 10757, 10741, 127, 119, 125, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Revenue", "from", "com", "##mut", "##er", "traffic", "5", ",", "400", "up", "4", ".", "6", "p", "##ct" ], "ids": [ 69092, 10188, 10212, 50164, 10165, 26482, 126, 117, 11176, 10741, 125, 119, 127, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Revenue", "from", "freight", "traffic", "3", ",", "200", "down", "5", ".", "1", "p", "##ct" ], "ids": [ 69092, 10188, 75843, 26482, 124, 117, 10777, 12935, 126, 119, 122, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Group", "work", "##force", "on", "June", "30", "300", ",", "962", "down", "3", ".", "7", "o", "##ct" ], "ids": [ 12054, 11424, 39910, 10135, 11120, 10244, 11093, 117, 61393, 12935, 124, 119, 128, 183, 14526 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Sales", ",", "profit", "compare", "with", "first", "half", "of", "1995", ",", "work", "##force", "compare", "##s", "with", "Dec", "31", "." ], "ids": [ 49307, 29833, 118, 48514, 117, 25081, 52860, 10169, 10422, 13877, 10108, 10436, 117, 11424, 39910, 52860, 10107, 10169, 46147, 10413, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Frankfurt", "News", "##room", ",", "+", "49", "69", "756", "##52", "##5" ], "ids": [ 118, 118, 15226, 12219, 25525, 117, 116, 11580, 12573, 65821, 92161, 11166 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sea", "lion", "papa", "##raz", "##zi", "to", "keep", "tab", "##s", "on", "w", "##hale", "##s", "." ], "ids": [ 14741, 73025, 18434, 29948, 11282, 10114, 23819, 100781, 10107, 10135, 191, 39149, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "22" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10306 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "marine", "bio", "##logist", "##s", "have", "trained", "a", "pair", "of", "sea", "lion", "##s", "to", "tag", "and", "photo", "##graph", "elu", "##sive", "w", "##hale", "##s", "as", "they", "cruise", "through", "the", "Pacific", "depth", "##s", ",", "New", "Scientist", "magazine", "reported", "on", "Thursday", "." ], "ids": [ 158, 119, 156, 119, 19419, 12297, 62572, 10107, 10529, 33626, 169, 27643, 10108, 14931, 73025, 10107, 10114, 37836, 10111, 38171, 28176, 95575, 37413, 191, 39149, 10107, 10146, 10689, 101148, 11222, 10105, 14597, 41098, 10107, 117, 10287, 84841, 15438, 15943, 10135, 67067, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "James", "Harvey", "and", "Jennifer", "Hurley", "of", "the", "Moss", "Landing", "Marine", "Labor", "##atories", "in", "California", "say", "their", "sea", "lion", "##s", ",", "natural", "companion", "##s", "of", "many", "species", "of", "w", "##hale", ",", "can", "go", "where", "no", "man", "or", "woman", "has", "ever", "gone", "before", "." ], "ids": [ 10900, 22738, 10111, 21362, 100642, 10108, 10105, 38963, 72664, 12425, 31017, 67429, 10106, 11621, 23763, 10455, 14931, 73025, 10107, 117, 13409, 86389, 10107, 10108, 11299, 10542, 10108, 191, 39149, 117, 10944, 11783, 10940, 10192, 10817, 10345, 18299, 10393, 17038, 45041, 11360, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 4, 8, 9, 9, 3, 7, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Any", "div", "##er", "knows", "that", "when", "a", "w", "##hale", "gets", "going", "you", "ca", "n", "'", "t", "keep", "up", ",", "\"", "Harvey", "told", "the", "magazine", ".", "\"" ], "ids": [ 107, 47336, 76486, 10165, 75354, 10189, 10841, 169, 191, 39149, 30811, 19090, 13028, 11135, 182, 112, 188, 23819, 10741, 117, 107, 22738, 21937, 10105, 15438, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "is", "why", "we", "know", "only", "about", "five", "percent", "of", "what", "w", "##hale", "##s", "do", ".", "\"" ], "ids": [ 13646, 10124, 31237, 11951, 21852, 10893, 10978, 12403, 22362, 10108, 12976, 191, 39149, 10107, 10149, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "sea", "lion", "##s", "-", "-", "17", "-", "year", "-", "old", "Beaver", "and", "nine", "-", "year", "-", "old", "Sa", "##ke", "-", "-", "have", "under", "##gone", "six", "years", "of", "training", "for", "their", "mission", "." ], "ids": [ 10117, 14931, 73025, 10107, 118, 118, 10273, 118, 10924, 118, 12898, 64136, 10111, 19964, 118, 10924, 118, 12898, 12404, 10550, 118, 118, 10529, 10571, 56893, 12449, 10855, 10108, 15722, 10142, 10455, 17032, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Beaver", "once", "worked", "for", "the", "U", ".", "S", ".", "Navy", "and", "Sa", "##ke", "is", "an", "am", "##usement", "park", "veteran", "." ], "ids": [ 64136, 14907, 13858, 10142, 10105, 158, 119, 156, 119, 14780, 10111, 12404, 10550, 10124, 10151, 10392, 51927, 14900, 55669, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Harvey", "said", "they", "could", "accurate", "##ly", "tag", "w", "##hale", "##s", "with", "a", "radio", "trans", "##mitter", ",", "and", "could", "also", "s", "##wim", "all", "the", "way", "around", "one", "of", "the", "giant", "mammals", ",", "filming", "it", "with", "a", "video", "camera", "." ], "ids": [ 22738, 12415, 10689, 12174, 54616, 10454, 37836, 191, 39149, 10107, 10169, 169, 12429, 37241, 88658, 117, 10111, 12174, 10379, 187, 80217, 10435, 10105, 13170, 12166, 10464, 10108, 10105, 49429, 91781, 117, 62645, 10271, 10169, 169, 12078, 26665, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Their", "first", "assignment", ",", "later", "this", "year", ",", "will", "be", "documenti", "##ng", "hu", "##mp", "##back", "w", "##hale", "migration", "off", "Monterey", ",", "California", "." ], "ids": [ 17551, 10422, 90523, 117, 10873, 10531, 10924, 117, 11337, 10347, 67775, 10376, 26506, 18573, 18666, 191, 39149, 63512, 11898, 99735, 117, 11621, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "The", "article", "did", "not", "spell", "out", "exactly", "how", "the", "sea", "lion", "##s", "manage", "to", "tag", "the", "w", "##hale", "##s", "but", "said", "in", "training", "they", "were", "taught", "to", "stick", "a", "radio", "trans", "##mitter", "on", "to", "a", "plastic", "model", "of", "a", "w", "##hale", "using", "su", "##ction", "cup", "##s", "." ], "ids": [ 10117, 13262, 12172, 10472, 76738, 10950, 62136, 14796, 10105, 14931, 73025, 10107, 59251, 10114, 37836, 10105, 191, 39149, 10107, 10473, 12415, 10106, 15722, 10689, 10309, 26015, 10114, 84081, 169, 12429, 37241, 88658, 10135, 10114, 169, 60280, 13192, 10108, 169, 191, 39149, 13382, 10198, 17530, 41506, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Australia", "Senate", "je", "##opa", "##rdi", "##ses", "rate", "cut", "-", "Howard", "." ], "ids": [ 56898, 39469, 118, 11729, 22294, 10144, 49482, 18177, 13149, 18344, 21610, 118, 15084, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "CAN", "##B", "##ER", "##RA", "1996", "-", "08", "-", "23" ], "ids": [ 98038, 11274, 24093, 29990, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australian", "Prime", "Minister", "John", "Howard", "said", "the", "possibility", "of", "lower", "interest", "rates", "was", "being", "je", "##opa", "##rdi", "##sed", "by", "Parliament", "'", "s", "upper", "house", "where", "opposition", "parties", "planned", "to", "scrutin", "##ise", "the", "1996", "/", "97", "budget", "." ], "ids": [ 12829, 19924, 14355, 10421, 15084, 12415, 10105, 53510, 10108, 18165, 17644, 38200, 10134, 11223, 10144, 49482, 18177, 16219, 10155, 19173, 112, 187, 24172, 13215, 10940, 21227, 18708, 24292, 10114, 88579, 13041, 10105, 10389, 120, 12328, 25293, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Every", "time", "the", "Senate", "hac", "##ks", "away", "at", "the", "budget", ",", "they", "hac", "##k", "away", "at", "the", "lower", "interest", "rate", "environment", ",", "\"", "Howard", "told", "reporter", "##s", "on", "Thursday", "night", "after", "attending", "a", "Liberal", "Party", "function", "." ], "ids": [ 107, 30929, 10635, 10105, 22294, 91196, 11676, 14942, 10160, 10105, 25293, 117, 10689, 91196, 10174, 14942, 10160, 10105, 18165, 17644, 18344, 26069, 117, 107, 15084, 21937, 41408, 10107, 10135, 67067, 16903, 10662, 54234, 169, 22285, 12529, 19367, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Senior", "ministers", "have", "repeatedly", "war", "##ned", "since", "the", "fiscal", "##ly", "-", "tight", "budget", "was", "handed", "down", "on", "Tuesday", "night", "that", "the", "chance", "of", "lower", "official", "rates", "could", "be", "ham", "##pere", "##d", "in", "the", "Senate", "." ], "ids": [ 22902, 66281, 10529, 77998, 10338, 17021, 11764, 10105, 43645, 10454, 118, 85202, 25293, 10134, 44040, 12935, 10135, 70245, 16903, 10189, 10105, 27893, 10108, 18165, 14731, 38200, 12174, 10347, 15128, 62443, 10162, 10106, 10105, 22294, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "The", "budget", "contained", "sharp", "spending", "cuts", "in", "areas", "such", "as", "the", "labour", "market", "to", "reduce", "the", "deficit", "to", "about", "A", "$", "5", ".", "6", "billion", "." ], "ids": [ 10117, 25293, 31763, 77348, 51163, 73311, 10106, 14544, 11049, 10146, 10105, 40763, 17313, 10114, 29888, 10105, 107383, 10114, 10978, 138, 109, 126, 119, 127, 25848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "conservative", "government", "'", "s", "plan", "for", "reform", "of", "the", "industrial", "relations", "environment", "and", "to", "partially", "sell", "Tel", "##stra", "has", "also", "been", "opposed", "by", "parties", "in", "the", "Senate", "such", "as", "the", "Green", "##s", "and", "Australian", "Democrats", "as", "well", "as", "the", "official", "opposition", ",", "the", "Labor", "Party", "." ], "ids": [ 10117, 50202, 12047, 112, 187, 13065, 10142, 34800, 10108, 10105, 18138, 19824, 26069, 10111, 10114, 53986, 36300, 25369, 19975, 10393, 10379, 10590, 30488, 10155, 18708, 10106, 10105, 22294, 11049, 10146, 10105, 13068, 10107, 10111, 12829, 56282, 10146, 11206, 10146, 10105, 14731, 21227, 117, 10105, 31017, 12529, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Official", "cash", "rates", "were", "last", "cut", "on", "July", "31", "to", "7", ".", "0", "percent", "." ], "ids": [ 17678, 52828, 38200, 10309, 12469, 21610, 10135, 11112, 10413, 10114, 128, 119, 121, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "373", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 37358, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Toyota", "Australia", "workers", "to", "return", "to", "work", "." ], "ids": [ 56898, 39469, 118, 28995, 11729, 23829, 10114, 15079, 10114, 11424, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##L", "##B", "##O", "##UR", "##NE", "1996", "-", "08", "-", "23" ], "ids": [ 47430, 11369, 11274, 11403, 98348, 93280, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "2", ",", "000", "striking", "workers", "voted", "on", "Friday", "to", "return", "to", "work", "on", "Monday", "at", "Toyota", "Australia", "'", "s", "Melbourne", "assembly", "line", ",", "ending", "a", "two", "-", "week", "stop", "##page", "." ], "ids": [ 15704, 123, 117, 10259, 87894, 23829, 34584, 10135, 30767, 10114, 15079, 10114, 11424, 10135, 40714, 10160, 28995, 11729, 112, 187, 17784, 38946, 12117, 117, 29077, 169, 10551, 118, 16118, 20517, 36795, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Ni", "##ugi", "##ni", "shares", "surge", "on", "bid", "talk", "." ], "ids": [ 56898, 39469, 118, 30409, 70765, 10342, 45751, 69824, 10135, 50385, 31311, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "23" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "in", "gold", "mine", "##r", "Ni", "##ugi", "##ni", "Mining", "Ltd", "surge", "##d", "38", "cents", "to", "A", "$", "3", ".", "75", "early", "on", "Friday", "following", "con", "##firmation", "on", "Thursday", "from", "Battle", "Mountain", "Gold", "that", "it", "was", "considering", "ac", "##qui", "##ring", "the", "49", ".", "6", "percent", "of", "Ni", "##ugi", "##ni", "it", "did", "not", "already", "own", "." ], "ids": [ 106583, 11234, 10106, 18128, 27546, 10129, 30409, 70765, 10342, 79136, 15129, 69824, 10162, 11171, 63487, 10114, 138, 109, 124, 119, 11417, 11732, 10135, 30767, 11901, 10173, 80735, 10135, 67067, 10188, 14810, 15135, 14363, 10189, 10271, 10134, 81243, 13621, 39639, 13135, 10105, 11580, 119, 127, 22362, 10108, 30409, 70765, 10342, 10271, 12172, 10472, 19034, 12542, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ni", "##ugi", "##ni", "Mining", "Ltd", "said", "on", "Thursday", "that", "Battle", "Mountain", "had", "initiated", "talks", "about", "ac", "##qui", "##ring", "the", "shares", "in", "Ni", "##ugi", "##ni", "it", "does", "not", "already", "own", ".", "\"" ], "ids": [ 30409, 70765, 10342, 79136, 15129, 12415, 10135, 67067, 10189, 14810, 15135, 10374, 56571, 56672, 10978, 13621, 39639, 13135, 10105, 45751, 10106, 30409, 70765, 10342, 10271, 15107, 10472, 19034, 12542, 119, 107 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Battle", "Mountain", "are", "set", "to", "take", "out", "the", "minori", "##ties", "there", "soon", ",", "\"", "said", "a", "Sydney", "broke", "##r", "." ], "ids": [ 14810, 15135, 10301, 11847, 10114, 13574, 10950, 10105, 65411, 14197, 11155, 17864, 117, 107, 12415, 169, 14470, 30500, 10129, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Ni", "##ugi", "##ni", "holds", "copper", "and", "gold", "mining", "interests", "in", "Australia", ",", "Chile", "and", "Papua", "New", "Guinea", ",", "where", "it", "has", "a", "17", ".", "2", "percent", "stake", "in", "the", "Li", "##hir", "gold", "project", "." ], "ids": [ 30409, 70765, 10342, 28278, 61576, 10111, 18128, 32802, 36026, 10106, 11729, 117, 13218, 10111, 28949, 10287, 17209, 117, 10940, 10271, 10393, 169, 10273, 119, 123, 22362, 90081, 10106, 10105, 13258, 21840, 18128, 13920, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "By", "11", ".", "25", "a", ".", "m", ".", "(", "002", "##5", "GMT", ")", ",", "Ni", "##ugi", "##ni", "Mining", "shares", "were", "at", "A", "$", "3", ".", "65", ",", "up", "28", "cents", "on", "turno", "##ver", "of", "108", ",", "288", "shares", "." ], "ids": [ 12716, 10193, 119, 10258, 169, 119, 181, 119, 113, 26181, 11166, 20362, 114, 117, 30409, 70765, 10342, 79136, 45751, 10309, 10160, 138, 109, 124, 119, 10843, 117, 10741, 10348, 63487, 10135, 17440, 12563, 10108, 15845, 117, 27401, 45751, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 7, 7, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Korean", "students", "throw", "\"", "ir", "##re", "##place", "##able", "\"", "rocks", "." ], "ids": [ 11056, 20501, 13501, 73696, 107, 10478, 10246, 30236, 13096, 107, 58864, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "23" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Students", "at", "South", "Korea", "'", "s", "Yon", "##sei", "University", "threw", "more", "than", "just", "ordinary", "rocks", "at", "rio", "##t", "police", "-", "-", "some", "were", "samples", "that", "the", "ge", "##ology", "department", "had", "taken", "30", "years", "to", "collect", ",", "newspapers", "reported", "on", "Friday", "." ], "ids": [ 30356, 10160, 11056, 14096, 112, 187, 94712, 41565, 10404, 80516, 10798, 11084, 12820, 64481, 58864, 10160, 27244, 10123, 15034, 118, 118, 11152, 10309, 59090, 10189, 10105, 46503, 18096, 21079, 10374, 15109, 10244, 10855, 10114, 80739, 117, 48473, 15943, 10135, 30767, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Geology", "pre", "##fes", "##sor", "##s", "were", "quoted", "as", "saying", "that", "their", "collection", "of", "10", ",", "000", "rocks", ",", "gathered", "from", "across", "the", "nation", "and", "abroad", ",", "were", "ir", "##re", "##place", "##able", "." ], "ids": [ 103095, 12229, 58058, 28919, 10107, 10309, 70676, 10146, 22807, 10189, 10455, 14903, 10108, 10150, 117, 10259, 58864, 117, 69918, 10188, 15130, 10105, 22274, 10111, 50901, 117, 10309, 10478, 10246, 30236, 13096, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "These", "are", "not", "like", "missing", "window", "pan", "##es", "or", "broken", "des", "##ks", "." ], "ids": [ 107, 13252, 10301, 10472, 11850, 39542, 39051, 24960, 10171, 10345, 36197, 10139, 11676, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "are", "lost", "for", "##ever", ",", "\"", "said", "one", "professor", "." ], "ids": [ 11696, 10301, 14172, 10142, 23433, 117, 107, 12415, 10464, 13853, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "students", "staged", "a", "violent", "nine", "-", "day", "demonstration", "at", "the", "university", "to", "demand", "uni", "##fication", "with", "North", "Korea", "." ], "ids": [ 10117, 13501, 84310, 169, 43934, 19964, 118, 11940, 97929, 10160, 10105, 19756, 10114, 34394, 69191, 22060, 10169, 11225, 14096, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Police", "ended", "the", "protest", "on", "Tuesday", "after", "storm", "##ing", "the", "campus", "." ], "ids": [ 18051, 18428, 10105, 36627, 10135, 70245, 10662, 31642, 10230, 10105, 20113, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", ".", "Korean", "won", "ends", "up", "on", "dollar", "position", "un", "##wind", "##ing", "." ], "ids": [ 156, 119, 20501, 11367, 29047, 10741, 10135, 34807, 12956, 10119, 47673, 10230, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "23" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "won", "rose", "against", "the", "dollar", "on", "Friday", "as", "banks", "un", "##wo", "##und", "dollar", "positions", "on", "the", "belief", "that", "the", "won", "would", "continue", "to", "strength", "##en", ",", "deal", "##ers", "said", "." ], "ids": [ 10117, 11367, 29467, 11327, 10105, 34807, 10135, 30767, 10146, 41375, 10119, 16828, 17242, 34807, 23188, 10135, 10105, 46863, 10189, 10105, 11367, 10894, 17734, 10114, 33318, 10136, 117, 19918, 10901, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "won", "closed", "at", "818", ".", "10", ",", "after", "opening", "at", "819", ".", "10", "." ], "ids": [ 10117, 11367, 18440, 10160, 75310, 119, 10150, 117, 10662, 17975, 10160, 68941, 119, 10150, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "range", "##d", "from", "817", ".", "60", "to", "819", ".", "30", "." ], "ids": [ 10377, 15601, 10162, 10188, 76383, 119, 10709, 10114, 68941, 119, 10244, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "dollar", "is", "over", "##bou", "##ght", "at", "the", "moment", ",", "\"", "said", "a", "western", "bank", "deal", "##er", ".", "\"" ], "ids": [ 107, 10117, 34807, 10124, 10491, 23723, 20687, 10160, 10105, 14316, 117, 107, 12415, 169, 16672, 19423, 19918, 10165, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "central", "bank", "'", "s", "ins", "##istent", "intervention", "just", "above", "the", "820", "level", "convinced", "players", "that", "it", "is", "serious", "about", "supporting", "the", "won", "." ], "ids": [ 10117, 12397, 19423, 112, 187, 15498, 52573, 40152, 12820, 16038, 10105, 45443, 13277, 71869, 16021, 10189, 10271, 10124, 32342, 10978, 32403, 10105, 11367, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "some", "foreign", "banks", "began", "un", "##wind", "##ing", "their", "dollar", "positions", ".", "\"" ], "ids": [ 12882, 11152, 20796, 41375, 11941, 10119, 47673, 10230, 10455, 34807, 23188, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Or", "##ii", "-", "96", "/", "97", "group", "for", "##eca", "##st", "." ], "ids": [ 19372, 11477, 118, 12308, 120, 12328, 11795, 10142, 33588, 10562, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "23" ], "ids": [ 76531, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "to", "May", "31", ",", "1997" ], "ids": [ 13567, 10114, 10725, 10413, 117, 10391 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "billion", "##s", "of", "ye", "##n", "unless", "specified", ")" ], "ids": [ 113, 10106, 25848, 10107, 10108, 11023, 10115, 60015, 64561, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##TE", "##ST", "ACT", "##U", "##AL" ], "ids": [ 29079, 29833, 32995, 90119, 12022, 32002 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Group", ")", "FOR", "##EC", "##AS", "##T", "Y", "##EA", "##R", "-", "AG", "##O" ], "ids": [ 113, 12054, 114, 109544, 35826, 38025, 11090, 162, 36789, 11273, 118, 17935, 11403 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sales", "8", ".", "70", "8", ".", "67" ], "ids": [ 48514, 129, 119, 10923, 129, 119, 12316 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Current", "pr", "##ft", "7", "mln", "loss", "371", "mln" ], "ids": [ 37293, 20157, 12961, 128, 35198, 18576, 37439, 35198 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "ni", "##l", "loss", "447", "mln" ], "ids": [ 32577, 10414, 10161, 18576, 42873, 35198 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EP", "##S", "ni", "##l", "ye", "##n", "loss", "48", ".", "61", "ye", "##n" ], "ids": [ 14111, 10731, 10414, 10161, 11023, 10115, 18576, 11300, 119, 12314, 11023, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Or", "##ii", "Corp", "makes", "auto", "##mation", "equipment", "." ], "ids": [ 49307, 29833, 118, 19372, 11477, 44687, 20562, 18257, 41856, 24518, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Or", "##ii", "-", "95", "/", "96", "group", "results", "." ], "ids": [ 19372, 11477, 118, 11978, 120, 12308, 11795, 17466, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "23" ], "ids": [ 76531, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "to", "May", "31", ",", "1996" ], "ids": [ 13567, 10114, 10725, 10413, 117, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Group", ")", "(", "in", "billion", "##s", "of", "ye", "##n", "unless", "specified", ")" ], "ids": [ 113, 12054, 114, 113, 10106, 25848, 10107, 10108, 11023, 10115, 60015, 64561, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sales", "8", ".", "67", "vs", "9", ".", "33" ], "ids": [ 48514, 129, 119, 12316, 14987, 130, 119, 11000 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Opera", "##ting", "loss", "286", "million", "vs", "loss", "48", "million" ], "ids": [ 16836, 12141, 18576, 28747, 12473, 14987, 18576, 11300, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Current", "loss", "371", "million", "vs", "loss", "278", "million" ], "ids": [ 37293, 18576, 37439, 12473, 14987, 18576, 29417, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "loss", "447", "million", "vs", "loss", "350", "million" ], "ids": [ 32577, 18576, 42873, 12473, 14987, 18576, 14992, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EP", "##S", "loss", "48", ".", "61", "ye", "##n", "vs", "loss", "38", ".", "11", "ye", "##n" ], "ids": [ 14111, 10731, 18576, 11300, 119, 12314, 11023, 10115, 14987, 18576, 11171, 119, 10193, 11023, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dil", "##uted", "EP", "##S", "-", "vs", "-" ], "ids": [ 95649, 106554, 14111, 10731, 118, 14987, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Or", "##ii", "Corp", "makes", "auto", "##mation", "equipment", "." ], "ids": [ 49307, 29833, 118, 19372, 11477, 44687, 20562, 18257, 41856, 24518, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "copper", "stock", "##s", "owned", "by", "state", "reserve", "-", "trade", "." ], "ids": [ 11593, 61576, 20511, 10107, 17012, 10155, 11388, 32608, 118, 18908, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lynne", "O", "'", "Donnell" ], "ids": [ 97455, 152, 112, 77216 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "23" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Up", "to", "100", ",", "000", "tonnes", "of", "copper", "held", "in", "Shanghai", "bond", "##ed", "ware", "##houses", ",", "con", "##fo", "##und", "##ing", "the", "world", "market", "as", "to", "its", "source", "and", "ultimate", "fate", ",", "probably", "belongs", "to", "China", "'", "s", "strategic", "state", "reserve", ",", "industry", "sources", "said", "on", "Friday", "." ], "ids": [ 13656, 10114, 10407, 117, 10259, 39435, 10108, 61576, 11991, 10106, 24181, 55185, 10336, 88902, 92520, 117, 10173, 21330, 17242, 10230, 10105, 11356, 17313, 10146, 10114, 10474, 15247, 10111, 95499, 75633, 117, 23282, 61437, 10114, 11593, 112, 187, 52009, 11388, 32608, 117, 17425, 19023, 12415, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Around", "40", ",", "000", "tonnes", "of", "the", "copper", "have", "already", "been", "moved", "to", "ware", "##houses", "near", "the", "northern", "port", "of", "Ying", "##kou", ",", "where", "some", "of", "the", "strategic", "stock", "##pil", "##e", "was", "stored", ",", "they", "said", "." ], "ids": [ 25801, 10533, 117, 10259, 39435, 10108, 10105, 61576, 10529, 19034, 10590, 13059, 10114, 88902, 92520, 12883, 10105, 17335, 16874, 10108, 95904, 14530, 117, 10940, 11152, 10108, 10105, 52009, 20511, 30678, 10112, 10134, 70809, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Just", "who", "owns", "the", "copper", "is", "a", "question", "that", "has", "kept", "trade", "##rs", "and", "industry", "anal", "##yst", "##s", "gu", "##essi", "##ng", "since", "the", "metal", "was", "channel", "##led", "into", "Shanghai", "by", "the", "China", "National", "Non", "##fer", "##rous", "Metal", "##s", "Im", "##port", "and", "Export", "Corp", "(", "CN", "##IE", "##C", ")", "in", "June", "and", "July", "." ], "ids": [ 17116, 10479, 76282, 10105, 61576, 10124, 169, 20210, 10189, 10393, 26546, 18908, 10943, 10111, 17425, 106615, 62769, 10107, 75980, 96360, 10376, 11764, 10105, 13795, 10134, 21486, 16376, 10708, 24181, 10155, 10105, 11593, 10655, 14890, 14854, 81823, 18399, 10107, 10796, 15520, 10111, 108268, 44687, 113, 73067, 71655, 10858, 114, 10106, 11120, 10111, 11112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "unclear", "whether", "or", "not", "the", "40", ",", "000", "tonnes", "had", "cleared", "customs", "-", "-", "which", "would", "provide", "some", "concrete", "indication", "that", "the", "strategic", "reserve", ",", "administered", "directly", "by", "the", "central", "government", "'", "s", "State", "Planning", "Commission", ",", "owned", "the", "copper", "." ], "ids": [ 10377, 10134, 94475, 21883, 10345, 10472, 10105, 10533, 117, 10259, 39435, 10374, 90076, 89907, 118, 118, 10319, 10894, 16871, 11152, 41651, 102383, 10189, 10105, 52009, 32608, 117, 68491, 22062, 10155, 10105, 12397, 12047, 112, 187, 11104, 49276, 14941, 117, 17012, 10105, 61576, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "have", "said", "the", "reserve", "could", "nego", "##tia", "##te", "concession", "##s", "on", "duties", "-", "-", "three", "percent", "import", "tax", "and", "17", "percent", "value", "-", "added", "tax", "-", "-", "that", "made", "the", "copper", "pro", "##hib", "##itive", "##ly", "expensive", "otherwise", "." ], "ids": [ 15006, 10943, 10529, 12415, 10105, 32608, 12174, 21134, 16180, 10216, 99599, 10107, 10135, 40266, 118, 118, 11003, 22362, 67622, 25468, 10111, 10273, 22362, 19211, 118, 16288, 25468, 118, 118, 10189, 11019, 10105, 61576, 11284, 76560, 64040, 10454, 58069, 39712, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "one", "source", ",", "the", "head", "of", "a", "Hong", "Kong", "trading", "house", ",", "said", "it", "made", "no", "difference", "if", "the", "copper", "was", "customs", "cleared", "or", "not", "." ], "ids": [ 16976, 10464, 15247, 117, 10105, 13578, 10108, 169, 15078, 14577, 46663, 13215, 117, 12415, 10271, 11019, 10192, 30856, 12277, 10105, 61576, 10134, 89907, 90076, 10345, 10472, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "they", "spend", "all", "this", "money", "moving", "the", "copper", "to", "Ying", "##kou", ",", "it", "will", "be", "sitting", "there", "for", "years", ",", "\"", "he", "said", "." ], "ids": [ 107, 14535, 10689, 63222, 10435, 10531, 17920, 23557, 10105, 61576, 10114, 95904, 14530, 117, 10271, 11337, 10347, 62151, 11155, 10142, 10855, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Once", "it", "arrives", "in", "Ying", "##kou", ",", "it", "is", "subject", "to", "monitoring", "by", "the", "State", "Planning", "Commission", ",", "which", "has", "to", "give", "permission", "for", "any", "more", "movement", ";", "it", "is", "out", "of", "the", "hands", "of", "trade", "##rs", ",", "\"", "he", "said", "." ], "ids": [ 107, 23075, 10271, 69631, 10106, 95904, 14530, 117, 10271, 10124, 20036, 10114, 74265, 10155, 10105, 11104, 49276, 14941, 117, 10319, 10393, 10114, 18090, 52389, 10142, 11178, 10798, 17123, 132, 10271, 10124, 10950, 10108, 10105, 27925, 10108, 18908, 10943, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mystery", "has", "surrounded", "the", "Shanghai", "stock", "##pil", "##e", "in", "recent", "months", ",", "with", "trade", "##rs", "unsur", "##e", "not", "only", "of", "who", "owns", "it", ",", "but", "of", "its", "exact", "size", "and", "what", "its", "owner", "planned", "to", "do", "with", "it", "." ], "ids": [ 32852, 10393, 45785, 10105, 24181, 20511, 30678, 10112, 10106, 19037, 15555, 117, 10169, 18908, 10943, 51027, 10112, 10472, 10893, 10108, 10479, 76282, 10271, 117, 10473, 10108, 10474, 45809, 15851, 10111, 12976, 10474, 24414, 24292, 10114, 10149, 10169, 10271, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trading", "sources", "generally", "agreed", "it", "would", "be", "cost", "-", "effective", "to", "take", "the", "copper", "back", "into", "a", "de", "##plete", "##d", "central", "reserve", "as", "it", "had", "already", "served", "its", "purpose", "in", "taking", "advantage", "of", "long", "-", "term", "back", "##ward", "##ation", "on", "the", "London", "Metal", "Exchange", "(", "LM", "##E", ")", "." ], "ids": [ 110260, 19023, 18081, 25577, 10271, 10894, 10347, 18849, 118, 26874, 10114, 13574, 10105, 61576, 12014, 10708, 169, 10104, 97598, 10162, 12397, 32608, 10146, 10271, 10374, 19034, 12325, 10474, 24564, 10106, 18084, 38119, 10108, 11695, 118, 13719, 12014, 16988, 11809, 10135, 10105, 10829, 18399, 32424, 113, 107879, 11259, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "A", "back", "##ward", "##ation", "occurs", "when", "the", "spot", "price", "of", "a", "metal", "is", "higher", "than", "the", "forward", "price", "." ], "ids": [ 138, 12014, 16988, 11809, 31136, 10841, 10105, 28504, 30839, 10108, 169, 13795, 10124, 17981, 11084, 10105, 23307, 30839, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CN", "##IE", "##C", "lent", "around", "85", ",", "000", "tonnes", "of", "copper", "onto", "the", "LM", "##E", "between", "April", "and", "June", "1995", "on", "behalf", "of", "the", "state", "reserve", ",", "running", "the", "state", "stock", "##pil", "##e", "down", "to", "115", ",", "000", "tonnes", "from", "200", ",", "000", "tonnes", "previously", "." ], "ids": [ 73067, 71655, 10858, 72268, 12166, 12017, 117, 10259, 39435, 10108, 61576, 31095, 10105, 107879, 11259, 10948, 10780, 10111, 11120, 10436, 10135, 50683, 10108, 10105, 11388, 32608, 117, 18020, 10105, 11388, 20511, 30678, 10112, 12935, 10114, 15680, 117, 10259, 39435, 10188, 10777, 117, 10259, 39435, 17477, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "in", "Asia", "said", "CN", "##IE", "##C", "could", "well", "have", "lent", "it", "to", "the", "market", "at", "around", "US", "$", "2", ",", "700", "a", "ton", "##ne", ",", "and", "then", "paid", "some", "##where", "between", "$", "2", ",", "200", "and", "$", "2", ",", "400", "a", "ton", "##ne", "when", "it", "started", "taking", "the", "metal", "back", "earlier", "this", "year", "." ], "ids": [ 15006, 10943, 10106, 12782, 12415, 73067, 71655, 10858, 12174, 11206, 10529, 72268, 10271, 10114, 10105, 17313, 10160, 12166, 10808, 109, 123, 117, 12367, 169, 22464, 10238, 117, 10111, 11059, 25938, 11152, 30935, 10948, 109, 123, 117, 10777, 10111, 109, 123, 117, 11176, 169, 22464, 10238, 10841, 10271, 13457, 18084, 10105, 13795, 12014, 18905, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "would", "have", "cleared", "CN", "##IE", "##C", "a", "healthy", "profit", ",", "which", "could", "then", "have", "been", "used", "to", "finance", "storage", "and", "other", "costs", "." ], "ids": [ 10747, 10894, 10529, 90076, 73067, 71655, 10858, 169, 89601, 25081, 117, 10319, 12174, 11059, 10529, 10590, 11031, 10114, 48053, 38112, 10111, 10684, 34495, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Word", "that", "CN", "##IE", "##C", "had", "offered", "the", "copper", "to", "European", "trading", "houses", "in", "a", "series", "of", "secret", "meetings", "unner", "##ved", "an", "already", "ji", "##tter", "##y", "market", "." ], "ids": [ 34368, 10189, 73067, 71655, 10858, 10374, 20841, 10105, 61576, 10114, 11914, 46663, 21174, 10106, 169, 11366, 10108, 23658, 47307, 93563, 20709, 10151, 19034, 18028, 18413, 10157, 17313, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Industry", "anal", "##yst", "##s", "Bloom", "##sbury", "Mineral", "##s", "Economics", "(", "BM", "##E", ")", "said", "on", "Wednesday", "the", "motiv", "##ation", "of", "the", "owners", "of", "the", "85", ",", "000", "tonnes", ",", "\"", "who", "##ever", "they", "are", ",", "is", "the", "most", "important", "short", "-", "term", "fundamental", "\"", "in", "an", "already", "tight", "world", "market", "." ], "ids": [ 25539, 106615, 62769, 10107, 55380, 68195, 69042, 10107, 28808, 113, 85364, 11259, 114, 12415, 10135, 57611, 10105, 63598, 11809, 10108, 10105, 38437, 10108, 10105, 12017, 117, 10259, 39435, 117, 107, 10479, 23433, 10689, 10301, 117, 10124, 10105, 10992, 12452, 13716, 118, 13719, 27971, 107, 10106, 10151, 19034, 85202, 11356, 17313, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BM", "##E", "repeated", "in", "its", "latest", "review", "rum", "##ours", "of", "involvement", "by", "Su", "##mit", "##omo", "Corp", ",", "with", "CN", "##IE", "##C", "said", "to", "be", "helping", "the", "Japanese", "trade", "##r", "un", "##load", "its", "copper", "positions", "after", "it", "revealed", "in", "June", "losses", "of", "$", "1", ".", "8", "billion", "in", "a", "decade", "of", "una", "##uth", "##oris", "##ed", "deals", "." ], "ids": [ 85364, 11259, 57026, 10106, 10474, 50908, 17030, 52522, 69265, 10108, 47167, 10155, 12271, 15772, 25653, 44687, 117, 10169, 73067, 71655, 10858, 12415, 10114, 10347, 45752, 10105, 13847, 18908, 10129, 10119, 64312, 10474, 61576, 23188, 10662, 10271, 23127, 10106, 11120, 45353, 10108, 109, 122, 119, 129, 25848, 10106, 169, 35858, 10108, 10153, 66365, 81597, 10336, 78037, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##mit", "##omo", "and", "CN", "##IE", "##C", "have", "made", "no", "comments", "on", "the", "talk", "and", "Chinese", "trade", "##rs", "said", "they", "know", "nothing", "of", "such", "an", "arrangement", "." ], "ids": [ 12271, 15772, 25653, 10111, 73067, 71655, 10858, 10529, 11019, 10192, 61565, 10135, 10105, 31311, 10111, 13299, 18908, 10943, 12415, 10689, 21852, 33338, 10108, 11049, 10151, 40258, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "in", "Shanghai", "said", "on", "Thursday", "they", "were", "una", "##ware", "of", "movements", "out", "of", "the", "Shanghai", "bond", "##ed", "ware", "##houses", "." ], "ids": [ 15006, 10943, 10106, 24181, 12415, 10135, 67067, 10689, 10309, 10153, 27444, 10108, 42641, 10950, 10108, 10105, 24181, 55185, 10336, 88902, 92520, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "reported", "more", "arrival", "##s", "that", "were", "probably", "spot", "purchase", "##s", "." ], "ids": [ 11696, 15943, 10798, 40285, 10107, 10189, 10309, 23282, 28504, 37891, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "also", "expressed", "concern", "that", "the", "ton", "##nage", "in", "bond", "##ed", "ware", "##houses", "would", "move", "onto", "the", "domestic", "market", "." ], "ids": [ 11696, 10379, 31685, 43607, 10189, 10105, 22464, 45211, 10106, 55185, 10336, 88902, 92520, 10894, 18577, 31095, 10105, 31084, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "these", "concerns", "were", "ir", "##rel", "##evan", "##t", ",", "a", "Singapore", "trade", "##r", "said", ",", "despite", "a", "for", "##eca", "##st", "that", "domestic", "Chinese", "copper", "demand", "could", "hit", "one", "million", "tonnes", "this", "year", "." ], "ids": [ 16976, 11762, 42663, 10309, 10478, 19362, 59427, 10123, 117, 169, 19437, 18908, 10129, 12415, 117, 22087, 169, 10142, 33588, 10562, 10189, 31084, 13299, 61576, 34394, 12174, 14946, 10464, 12473, 39435, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "with", "many", "com", "##mo", "##diti", "##es", ",", "\"", "there", "is", "a", "desire", "(", "by", "the", "Chinese", "government", ")", "to", "keep", "a", "stock", "##pil", "##e", "of", "the", "metal", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 10882, 10169, 11299, 10212, 11033, 63203, 10171, 117, 107, 11155, 10124, 169, 52253, 113, 10155, 10105, 13299, 12047, 114, 10114, 23819, 169, 20511, 30678, 10112, 10108, 10105, 13795, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "You", "do", "n", "'", "t", "keep", "it", "to", "help", "industry", ",", "you", "keep", "it", "in", "case", "of", "emergency", ".", "\"" ], "ids": [ 11065, 10149, 182, 112, 188, 23819, 10271, 10114, 15217, 17425, 117, 13028, 23819, 10271, 10106, 13474, 10108, 44461, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Hong", "Kong", "news", "##room", "(", "852", ")", "284", "##3", "-", "647", "##0" ], "ids": [ 118, 118, 15078, 14577, 14424, 25525, 113, 70072, 114, 29137, 10884, 118, 68255, 10929 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Companion", "Mar", "##ble", "posts", "1st", "final", "result", "." ], "ids": [ 26408, 15734, 11203, 68699, 13510, 11070, 14493, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "23" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "ended", "March", "31" ], "ids": [ 13567, 18428, 11144, 10413 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "million", "HK", "$", "unless", "stated", ")" ], "ids": [ 113, 10106, 12473, 33150, 109, 60015, 17067, 114 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "S", "##hr", "(", "H", ".", "K", ".", "cents", ")", "14", ".", "0" ], "ids": [ 156, 16757, 113, 145, 119, 148, 119, 63487, 114, 10247, 119, 121 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Di", "##vide", "##nd", "(", "H", ".", "K", ".", "cents", ")", "ni", "##l" ], "ids": [ 12944, 41638, 11534, 113, 145, 119, 148, 119, 63487, 114, 10414, 10161 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##ception", "##al", "items", "ni", "##l" ], "ids": [ 27746, 41341, 10415, 34109, 10414, 10161 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "56", ".", "06" ], "ids": [ 32577, 11628, 119, 10719 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Turn", "##over", "531", ".", "52" ], "ids": [ 36750, 16666, 49041, 119, 11525 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Company", "name", "Companion", "Mar", "##ble", "(", "Holdings", ")", "Ltd" ], "ids": [ 11739, 11324, 26408, 15734, 11203, 113, 57727, 114, 15129 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 3, 9, 3 ] }, { "tokens": [ "Books", "close", "N", "/", "A" ], "ids": [ 14003, 16065, 151, 120, 138 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Di", "##vide", "##nd", "pay", "##able", "N", "/", "A" ], "ids": [ 12944, 41638, 11534, 16868, 13096, 151, 120, 138 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Mar", "##ble", "and", "granite", "products", "dis", "##tri", "##but", "##or", "Companion", "Mar", "##ble", ",", "a", "spin", "##off", "of", "construction", "materials", "concern", "Companion", "Building", "Material", "(", "Holdings", ")", "Ltd", ",", "was", "listed", "on", "the", "Stock", "Exchange", "on", "April", "25", ",", "1996", "." ], "ids": [ 49307, 29833, 118, 15734, 11203, 10111, 95549, 20895, 27920, 21570, 23170, 10667, 26408, 15734, 11203, 117, 169, 30428, 20584, 10108, 13407, 23193, 43607, 26408, 21630, 37418, 113, 57727, 114, 15129, 117, 10134, 17585, 10135, 10105, 31916, 32424, 10135, 10780, 10258, 117, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 9, 3, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Hong", "Kong", "News", "Room", "(", "852", ")", "284", "##3", "636", "##8" ], "ids": [ 118, 118, 15078, 14577, 12219, 26512, 113, 70072, 114, 29137, 10884, 54105, 11396 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Soft", "##bank", "to", "pro", "##cure", "$", "900", "mln", "via", "for", "##ex", "by", "Sept", "5", "." ], "ids": [ 66206, 20583, 10114, 11284, 55888, 109, 13545, 35198, 11406, 10142, 28580, 10155, 51768, 126, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "23" ], "ids": [ 76531, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Soft", "##bank", "Corp", "said", "on", "Friday", "that", "it", "would", "pro", "##cure", "$", "900", "million", "through", "the", "foreign", "exchange", "market", "by", "September", "5", "as", "part", "of", "its", "acquisition", "of", "U", ".", "S", ".", "firm", ",", "Kingston", "Technology", "Co", "." ], "ids": [ 66206, 20583, 44687, 12415, 10135, 30767, 10189, 10271, 10894, 11284, 55888, 109, 13545, 12473, 11222, 10105, 20796, 27714, 17313, 10155, 10596, 126, 10146, 10668, 10108, 10474, 41714, 10108, 158, 119, 156, 119, 23410, 117, 34542, 15965, 13098, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "\"", "It", "is", "in", "the", "contract", "that", "we", "pay", "(", "Kingston", ")", "$", "900", "million", "by", "September", "5", ",", "\"", "he", "said", ",", "adding", "that", "Soft", "##bank", "had", "already", "started", "making", "forward", "transaction", "##s", "to", "buy", "dollars", "." ], "ids": [ 107, 10377, 10124, 10106, 10105, 16108, 10189, 11951, 16868, 113, 34542, 114, 109, 13545, 12473, 10155, 10596, 126, 117, 107, 10261, 12415, 117, 44841, 10189, 66206, 20583, 10374, 19034, 13457, 14293, 23307, 105042, 10107, 10114, 47715, 27953, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "August", "15", ",", "computer", "software", "retail", "##er", "Soft", "##bank", "said", "it", "would", "buy", "80", "percent", "of", "Kingston", ",", "the", "world", "'", "s", "largest", "maker", "of", "memory", "boards", ",", "for", "about", "$", "1", ".", "5", "billion", "in", "the", "latest", "in", "a", "series", "of", "high", "-", "profile", "acquisition", "##s", "it", "has", "made", "in", "the", "United", "States", "." ], "ids": [ 10576, 10735, 10208, 117, 18765, 16042, 52232, 10165, 66206, 20583, 12415, 10271, 10894, 47715, 10832, 22362, 10108, 34542, 117, 10105, 11356, 112, 187, 15363, 94038, 10108, 25296, 74419, 117, 10142, 10978, 109, 122, 119, 126, 25848, 10106, 10105, 50908, 10106, 169, 11366, 10108, 11846, 118, 29549, 41714, 10107, 10271, 10393, 11019, 10106, 10105, 10609, 10859, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Shanghai", "Post", "and", "Telecom", "##m", "net", "down", "." ], "ids": [ 24181, 14539, 10111, 79642, 10147, 11988, 12935, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9 ] }, { "tokens": [ "SH", "##AN", "##G", "##HA", "##I", "1996", "-", "08", "-", "23" ], "ids": [ 38702, 41275, 11447, 58132, 11281, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "-", "year", "ended", "June", "30", ",", "1996" ], "ids": [ 33100, 118, 10924, 18428, 11120, 10244, 117, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "millions", "of", "yu", "##an", "unless", "stated", ")" ], "ids": [ 113, 10106, 18123, 10108, 94836, 10206, 60015, 17067, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turn", "##over", "115", ".", "259", "vs", "123", ".", "157" ], "ids": [ 36750, 16666, 15680, 119, 29559, 14987, 16968, 119, 21026 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "profit", "20", ".", "318", "vs", "22", ".", "828" ], "ids": [ 32577, 25081, 10197, 119, 30670, 14987, 10306, 119, 57721 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "ass", "##et", "per", "share", "3", ".", "02", "yu", "##an", "(", "no", "comparative", "figure", ")" ], "ids": [ 32577, 13935, 10308, 10178, 23867, 124, 119, 10983, 94836, 10206, 113, 10192, 101258, 17527, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ea", "##rni", "##ngs", "per", "share", "0", ".", "14", "yu", "##an", "(", "no", "comparative", "figure", ")" ], "ids": [ 47132, 21941, 34876, 10178, 23867, 121, 119, 10247, 94836, 10206, 113, 10192, 101258, 17527, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Company", "name", ":", "Shanghai", "Post", "##s", "and", "Telecom", "##mun", "##ications", "E", "##qui", "##pment", "Co" ], "ids": [ 11739, 11324, 131, 24181, 14539, 10107, 10111, 79642, 34326, 102096, 142, 39639, 75758, 13098 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "Note", ":", "the", "figures", "were", "una", "##udi", "##ted", "." ], "ids": [ 20231, 131, 10105, 21068, 10309, 10153, 35772, 11912, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "##mo", "##des", "set", "to", "sell", "German", "assets", "-", "paper", "." ], "ids": [ 14021, 11033, 10920, 11847, 10114, 36300, 12026, 51701, 118, 17895, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "23" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "retail", "##er", "Pro", "##mo", "##des", "is", "in", "advanced", "talks", "about", "selling", "its", "German", "assets", "and", "the", "retail", "##er", "'", "s", "board", "might", "decide", "as", "soon", "as", "Tuesday", "to", "sell", "the", "assets", "to", "Spa", "##r", "AG", ",", "Les", "Echo", "##s", "newspaper", "said", "on", "Friday", "." ], "ids": [ 12026, 52232, 10165, 14021, 11033, 10920, 10124, 10106, 27072, 56672, 10978, 30870, 10474, 12026, 51701, 10111, 10105, 52232, 10165, 112, 187, 17936, 20970, 19068, 10146, 17864, 10146, 70245, 10114, 36300, 10105, 51701, 10114, 64766, 10129, 17935, 117, 10468, 48029, 10107, 22047, 12415, 10135, 30767, 119 ], "entity": [ "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "investment", "bank", "Rothschild", "&", "Cie", "was", "an", "intermedia", "##ry", "in", "the", "talks", "and", "added", "that", "un", "##liste", "##d", "German", "retail", "##ers", "Metro", ",", "Re", "##we", "and", "Li", "##dl", "were", "also", "still", "in", "discussions", "." ], "ids": [ 10377, 12415, 37933, 19423, 41440, 111, 91540, 10134, 10151, 75765, 10908, 10106, 10105, 56672, 10111, 16288, 10189, 10119, 26719, 10162, 12026, 52232, 10901, 20640, 117, 20304, 12577, 10111, 13258, 34691, 10309, 10379, 12647, 10106, 66608, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 9, 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "##mo", "##des", "has", "in", "Germany", "its", "Pro", "##mo", "hy", "##per", "##market", "unit", "with", "36", "Conti", "##nent", "super", "##stor", "##es", ",", "which", "is", "1995", "generated", "4", ".", "7", "percent", "of", "total", "Pro", "##mo", "##des", "sales", "." ], "ids": [ 14021, 11033, 10920, 10393, 10106, 12775, 10474, 14021, 11033, 15165, 12713, 60336, 16511, 10169, 11055, 68918, 22805, 25212, 42396, 10171, 117, 10319, 10124, 10436, 48918, 125, 119, 128, 22362, 10108, 11339, 14021, 11033, 10920, 23857, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "The", "French", "group", "entered", "the", "German", "market", "in", "1990", ",", "buy", "##ing" ], "ids": [ 10117, 11894, 11795, 19226, 10105, 12026, 17313, 10106, 10420, 117, 47715, 10230 ], "entity": [ "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "June", ",", "Pro", "##mo", "##des", "signed", "an", "out", "##line", "agreement", "to", "sell", "its", "Sp", "##eci", "##a", "unit", "-", "-", "which", "runs", "100", "Dia", "stores", "in", "France", "-", "-", "to", "Germany", "'", "s", "Al", "##di", "." ], "ids": [ 10167, 11120, 117, 14021, 11033, 10920, 14775, 10151, 10950, 12953, 25432, 10114, 36300, 10474, 46361, 95076, 10113, 16511, 118, 118, 10319, 17913, 10407, 18552, 36006, 10106, 10688, 118, 118, 10114, 12775, 112, 187, 10883, 10703, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 3, 9, 9, 1, 9, 9, 9, 1, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Pro", "##mo", "##des", "was", "not", "immediately", "available", "for", "comment", "." ], "ids": [ 14021, 11033, 10920, 10134, 10472, 24029, 14579, 10142, 49641, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Paris", "news", "##room", "+", "33", "1", "422", "##1", "545", "##2" ], "ids": [ 118, 118, 10728, 14424, 25525, 116, 11000, 122, 38735, 10759, 49589, 10729 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Ireland", "-", "August", "23", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 14637, 118, 10735, 10328, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "D", "##UB", "##L", "##IN", "1996", "-", "08", "-", "23" ], "ids": [ 141, 82439, 11369, 27128, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "are", "high", "##lights", "of", "stories", "in", "the", "Irish", "press", "on", "Friday", "." ], "ids": [ 18317, 10301, 11846, 56552, 10108, 21158, 10106, 10105, 15624, 21040, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IR", "##IS", "##H", "IN", "##DE", "##P", "##EN", "##DE", "##NT" ], "ids": [ 86851, 19088, 12396, 36351, 60675, 11127, 50655, 60675, 77261 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Ireland", "'", "s", "biggest", "mort", "##gage", "len", "##der", "Irish", "Permanent", "ended", "weeks", "of", "stal", "##ema", "##te", "when", "it", "announced", "it", "was", "increasing", "its", "mort", "##gage", "len", "##ding", "rate", "by", "a", "quarter", "of", "a", "percentage", "point", "." ], "ids": [ 118, 14637, 112, 187, 36304, 12338, 93794, 28859, 11304, 15624, 84997, 18428, 20750, 10108, 17844, 18089, 10216, 10841, 10271, 13854, 10271, 10134, 30816, 10474, 12338, 93794, 28859, 13971, 18344, 10155, 169, 28330, 10108, 169, 46971, 12331, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Two", "investors", "who", "claim", "to", "be", "o", "##wed", "nearly", "one", "million", "Irish", "pounds", "by", "fund", "manager", "Tony", "Taylor", "believe", "they", "may", "have", "lost", "their", "money", "." ], "ids": [ 118, 13214, 83795, 10479, 27445, 10114, 10347, 183, 48854, 21377, 10464, 12473, 15624, 61982, 10155, 31771, 16935, 13749, 13399, 30587, 10689, 11387, 10529, 14172, 10455, 17920, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "A", "second", "Japanese", "tra", "##wl", "##er", "was", "under", "arrest", "on", "Thursday", "night", "as", "the", "Irish", "Navy", "and", "Air", "Corps", "continued", "a", "cat", "and", "mouse", "game", "with", "up", "to", "40", "vessels", "off", "the", "Irish", "coast", "." ], "ids": [ 118, 138, 11132, 13847, 11264, 37676, 10165, 10134, 10571, 45165, 10135, 67067, 16903, 10146, 10105, 15624, 14780, 10111, 11704, 17248, 14278, 169, 41163, 10111, 63986, 11661, 10169, 10741, 10114, 10533, 45805, 11898, 10105, 15624, 22216, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "-", "The", "Irish", "Department", "of", "Enterprise", "and", "Em", "##ploy", "##ment", "has", "wide", "##ned", "its", "probe", "into", "Taylor", "Ass", "##et", "Manager", "##s", "to", "include", "the", "investigation", "of", "investment", "##s", "of", "10", "more", "investors", "." ], "ids": [ 118, 10117, 15624, 12933, 10108, 29234, 10111, 11289, 91823, 10426, 10393, 18064, 17021, 10474, 110239, 10708, 13399, 77014, 10308, 28779, 10107, 10114, 12363, 10105, 32719, 10108, 37933, 10107, 10108, 10150, 10798, 83795, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Irish", "exploration", "company", "I", "##vernia", "and", "its", "South", "African", "partner", "Minor", "##co", "have", "received", "planning", "permission", "from", "the", "local", "county", "council", "for", "a", "major", "lead", "and", "zinc", "mine", "at", "Li", "##she", "##en", ",", "County", "Tip", "##pera", "##ry", "." ], "ids": [ 118, 15624, 61326, 12100, 146, 66060, 10111, 10474, 11056, 13839, 22825, 15403, 10812, 10529, 12296, 30240, 52389, 10188, 10105, 11436, 17382, 23503, 10142, 169, 11922, 14107, 10111, 86232, 27546, 10160, 13258, 70098, 10136, 117, 10886, 82386, 37097, 10908, 119 ], "entity": [ "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 2, 9, 9, 3, 7, 9, 9, 2, 6, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "-", "Building", "materials", "firm", "CR", "##H", "refused", "to", "comment", "on", "reports", "that", "it", "is", "about", "to", "pay", "180", "million", "pounds", "ster", "##ing", "for", "U", ".", "S", ".", "stone", "and", "concrete", "business", "Til", "##con", "Inc", "." ], "ids": [ 118, 21630, 23193, 23410, 44912, 12396, 29622, 10114, 49641, 10135, 26610, 10189, 10271, 10124, 10978, 10114, 16868, 13912, 12473, 61982, 78342, 10230, 10142, 158, 119, 156, 119, 23905, 10111, 41651, 14155, 27853, 23486, 13604, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "IR", "##IS", "##H", "TIME", "##S" ], "ids": [ 86851, 19088, 12396, 89275, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Mort", "##gage", "len", "##ding", "rates", "are", "on", "the", "way", "up", "with", "banks", "and", "building", "societies", "pois", "##ed", "to", "add", "around", "a", "quarter", "of", "a", "percentage", "point", "to", "their", "main", "variable", "rates", "of", "interest", "." ], "ids": [ 118, 56027, 93794, 28859, 13971, 38200, 10301, 10135, 10105, 13170, 10741, 10169, 41375, 10111, 12585, 75875, 20487, 10336, 10114, 42852, 12166, 169, 28330, 10108, 169, 46971, 12331, 10114, 10455, 12126, 25844, 38200, 10108, 17644, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Members", "of", "a", "County", "Ant", "##rim", "Protestant", "family", "who", "were", "driven", "into", "exile", "by", "by", "loyal", "##ist", "para", "##mil", "##itari", "##es", "two", "years", "ago", "returned", "ye", "##ster", "##day", "to", "live", "in", "Northern", "Ireland", "in", "def", "##iance", "of", "the", "threat", "hang", "##ing", "over", "them", "." ], "ids": [ 118, 44659, 10108, 169, 10886, 40328, 23760, 56093, 11365, 10479, 10309, 39803, 10708, 67696, 10155, 10155, 84340, 11293, 10220, 55177, 68992, 10171, 10551, 10855, 36390, 14030, 11023, 12765, 24558, 10114, 12962, 10106, 15352, 14637, 10106, 100745, 84667, 10108, 10105, 41256, 60083, 10230, 10491, 11345, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Talk", "##s", "will", "res", "##ume", "next", "Tuesday", "in", "an", "attempt", "to", "avoid", "a", "major", "strike", "in", "Irish", "retail", "chain", "Dunn", "##es", "Store", "##s", "." ], "ids": [ 118, 32003, 10107, 11337, 39429, 20467, 13451, 70245, 10106, 10151, 21395, 10114, 33253, 169, 11922, 37456, 10106, 15624, 52232, 32768, 49498, 10171, 21812, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "-", "Top", "deal", "##ers", "in", "the", "London", "office", "of", "U", ".", "S", ".", "bank", "##ers", "Merrill", "Lynch", "are", "transfer", "##ring", "to", "Dublin", "." ], "ids": [ 118, 12685, 19918, 10901, 10106, 10105, 10829, 14301, 10108, 158, 119, 156, 119, 19423, 10901, 59905, 32703, 10301, 21110, 13135, 10114, 20495, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 5, 9, 9, 3, 7, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "-", "The", "Irish", "plastic", "##s", "industry", "called", "on", "the", "government", "to", "support", "in", "##cine", "##ration", "to", "deal", "with", "plastic", "##s", "not", "suitable", "for", "re", "##cy", "##clin", "##g", "." ], "ids": [ 118, 10117, 15624, 60280, 10107, 17425, 11552, 10135, 10105, 12047, 10114, 13145, 10106, 35440, 19466, 10114, 19918, 10169, 60280, 10107, 10472, 55668, 10142, 11639, 11710, 86257, 10240, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ford", "China", "J", "##V", "posts", "77", "percent", "net", "drop", "in", "H", "##1", "96", "." ], "ids": [ 14255, 11593, 147, 11779, 68699, 12527, 22362, 11988, 36365, 10106, 145, 10759, 12308, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SH", "##AN", "##G", "##HA", "##I", "1996", "-", "08", "-", "24" ], "ids": [ 38702, 41275, 11447, 58132, 11281, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Chinese", "truck", "maker", "in", "which", "Ford", "Motor", "Co", "has", "a", "20", "percent", "stake", "said", "it", "posted", "a", "77", "percent", "drop", "in", "post", "-", "tax", "profits", "in", "the", "first", "half", "of", "1996", "." ], "ids": [ 138, 13299, 58907, 94038, 10106, 10319, 14255, 19440, 13098, 10393, 169, 10197, 22362, 90081, 12415, 10271, 51232, 169, 12527, 22362, 36365, 10106, 11841, 118, 25468, 100106, 10106, 10105, 10422, 13877, 10108, 10389, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jiang", "##ling", "Motors", "Corp", ",", "in", "a", "statement", "in", "Saturday", "'", "s", "edition", "of", "the", "China", "Sec", "##urities", "newspaper", ",", "said", "net", "profit", "in", "the", "period", "was", "3", ".", "385", "million", "yu", "##an", ",", "down", "from", "14", ".", "956", "million", "in", "the", "same", "1995", "period", "." ], "ids": [ 68373, 11945, 34658, 44687, 117, 10106, 169, 33311, 10106, 24848, 112, 187, 14372, 10108, 10105, 11593, 109754, 82073, 22047, 117, 12415, 11988, 25081, 10106, 10105, 13127, 10134, 124, 119, 31548, 12473, 94836, 10206, 117, 12935, 10188, 10247, 119, 71019, 12473, 10106, 10105, 11561, 10436, 13127, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turn", "##over", "fell", "to", "937", ".", "891", "million", "yu", "##an", "from", "1", ".", "215", "billion", ",", "while", "net", "assets", "per", "share", "were", "1", ".", "88", "yu", "##an", ",", "un", "##chang", "##ed", ",", "and", "earning", "##s", "per", "share", "fell", "to", "0", ".", "005", "yu", "##an", "from", "0", ".", "02", "yu", "##an", ",", "the", "statement", "said", "." ], "ids": [ 36750, 16666, 25194, 10114, 74848, 119, 80250, 12473, 94836, 10206, 10188, 122, 119, 22050, 25848, 117, 11371, 11988, 51701, 10178, 23867, 10309, 122, 119, 12074, 94836, 10206, 117, 10119, 64208, 10336, 117, 10111, 56981, 10107, 10178, 23867, 25194, 10114, 121, 119, 48313, 94836, 10206, 10188, 121, 119, 10983, 94836, 10206, 117, 10105, 33311, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "first", "half", ",", "the", "company", "said", "it", "produced", "8", ",", "333", "vehicles", "and", "sold", "9", ",", "018", ",", "but", "it", "did", "not", "explain", "the", "difference", "." ], "ids": [ 10167, 10105, 10422, 13877, 117, 10105, 12100, 12415, 10271, 13433, 129, 117, 27243, 27237, 10111, 15337, 130, 117, 82446, 117, 10473, 10271, 12172, 10472, 67004, 10105, 30856, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "bl", "##amed", "the", "drop", "in", "profits", "on", "a", "weak", "vehicle", "market", "and", "said", "as", "its", "engine", "plant", "had", "only", "just", "started", "trial", "production", ",", "the", "company", "'", "s", "results", "would", "not", "improve", "in", "the", "short", "-", "term", "." ], "ids": [ 10377, 21484, 83865, 10105, 36365, 10106, 100106, 10135, 169, 61285, 27404, 17313, 10111, 12415, 10146, 10474, 18240, 16430, 10374, 10893, 12820, 13457, 23626, 12116, 117, 10105, 12100, 112, 187, 17466, 10894, 10472, 33992, 10106, 10105, 13716, 118, 13719, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ford", "owns", "138", ".", "643", "million", "shares", "in", "the", "firm", "." ], "ids": [ 14255, 76282, 19462, 119, 59425, 12473, 45751, 10106, 10105, 23410, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "majority", "share", "##holder", ",", "with", "51", "percent", ",", "or", "353", ".", "24", "million", "shares", ",", "is", "Jiang", "##ling", "Motors", "Group", "." ], "ids": [ 10117, 19471, 23867, 54535, 117, 10169, 11524, 22362, 117, 10345, 35373, 119, 10233, 12473, 45751, 117, 10124, 68373, 11945, 34658, 12054, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "The", "company", ",", "in", "the", "southern", "province", "of", "Jiang", "##xi", ",", "had", "about", "eight", "percent", "of", "China", "'", "s", "light", "truck", "market", "in", "1994", "." ], "ids": [ 10117, 12100, 117, 10106, 10105, 17156, 14342, 10108, 68373, 20572, 117, 10374, 10978, 16222, 22362, 10108, 11593, 112, 187, 15765, 58907, 17313, 10106, 10444, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "$", "1", "=", "8", ".", "3", "yu", "##an", ")" ], "ids": [ 113, 109, 122, 134, 129, 119, 124, 94836, 10206, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "H", "##AM", "##LE", "##T", "C", "##UP", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 145, 36535, 51036, 11090, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "COM", "##MA", "##C", "##K", ",", "New", "York", "1996", "-", "08", "-", "24" ], "ids": [ 80645, 30696, 10858, 11733, 117, 10287, 10482, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the" ], "ids": [ 33036, 10188, 10105 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Wald", "##baum", "Hamlet", "Cup", "tennis", "tournament", "on", "Saturday", "(", "pre", "##fix" ], "ids": [ 33903, 39687, 48334, 11544, 20944, 17390, 10135, 24848, 113, 12229, 57014 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Semi", "##finals", ":" ], "ids": [ 71467, 47791, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Martin", "Damm", "(", "Czech", "Republic", ")", "beat", "Adrian", "Vo", "##inea", "(", "Romania", ")", "5", "-", "7" ], "ids": [ 11235, 104698, 113, 22148, 13681, 114, 27868, 23928, 59482, 78209, 113, 13927, 114, 126, 118, 128 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "5", "7", "-", "5" ], "ids": [ 128, 118, 126, 128, 118, 126 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", "-", "Andrei", "Medvedev", "(", "Ukraine", ")", "beat", "Karol", "Ku", "##cera", "(", "Slovakia", ")", "7", "-", "6" ], "ids": [ 126, 118, 40594, 91681, 113, 19883, 114, 27868, 40129, 49869, 28568, 113, 43031, 114, 128, 118, 127 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "(", "7", "-", "0", ")", "6", "-", "3" ], "ids": [ 113, 128, 118, 121, 114, 127, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "TO", "##SH", "##IB", "##A", "CL", "##AS", "##SI", "##C", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 58573, 64091, 72918, 10738, 75151, 38025, 44802, 10858, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "CA", "##R", "##LS", "##BA", "##D", ",", "Cali", "##f", ".", "1996", "-", "08", "-", "24" ], "ids": [ 24707, 11273, 66934, 35999, 11490, 117, 65458, 10575, 119, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the", "$", "450", ",", "000", "To", "##shi", "##ba", "Classic", "tennis", "tournament", "on", "Saturday", "(", "pre", "##fix", "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 33036, 10188, 10105, 109, 16718, 117, 10259, 11469, 16119, 10537, 20542, 20944, 17390, 10135, 24848, 113, 12229, 57014, 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Semi", "##finals", ":" ], "ids": [ 71467, 47791, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "1", "-", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", "(", "Spain", ")", "beat", "3", "-", "Jana", "Novo", "##tna", "(", "Czech", "Republic", ")", "1", "-", "6", ",", "6", "-", "2", "6", "-", "3" ], "ids": [ 122, 118, 54789, 10368, 14220, 66007, 39574, 16780, 113, 16149, 114, 27868, 124, 118, 18909, 28649, 34247, 113, 22148, 13681, 114, 122, 118, 127, 117, 127, 118, 123, 127, 118, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Kimi", "##ko", "Date", "(", "Japan", ")", "beat", "2", "-", "Con", "##chi", "##ta", "Martinez", "(", "Spain", ")", "6", "-", "2", "7", "-", "5", "." ], "ids": [ 125, 118, 63038, 10440, 29897, 113, 11891, 114, 27868, 123, 118, 12845, 12806, 10213, 50203, 113, 16149, 114, 127, 118, 123, 128, 118, 126, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RA", "##LL", "##Y", "##ING", "-", "KA", "##NK", "##K", "##UN", "##EN", "IN", "COM", "##MA", "##ND", "AS", "MC", "##RA", "##E", "R", "##OL", "##LS", "O", "##UT", "." ], "ids": [ 64007, 82834, 14703, 50183, 118, 85314, 78043, 11733, 69849, 50655, 36351, 80645, 30696, 58521, 17421, 24650, 29990, 11259, 155, 39272, 66934, 152, 65729, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##Y", "##VA", "##S", "##K", "##Y", "##LA", ",", "Finland", "1996", "-", "08", "-", "24" ], "ids": [ 147, 14703, 47172, 10731, 11733, 14703, 44376, 117, 15497, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finland", "'", "s", "Juha", "Kan", "##kku", "##nen", "produced", "an", "impressive", "performance", "in", "his", "Toyota", "on", "Saturday", "to", "open", "up", "a", "37", "seconds", "lead", "after", "six", "stages", "of", "the", "1", ",", "000", "Lakes", "Rally", ",", "sixth", "round", "of", "the", "world", "championship", "." ], "ids": [ 15497, 112, 187, 99441, 57528, 70691, 11216, 13433, 10151, 80914, 14432, 10106, 10226, 28995, 10135, 24848, 10114, 14087, 10741, 169, 11204, 34290, 14107, 10662, 12449, 35023, 10108, 10105, 122, 117, 10259, 42052, 42161, 117, 28913, 13569, 10108, 10105, 11356, 20755, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "a", "weekend", "over", "##sha", "##dowe", "##d", "by", "Friday", "'", "s", "fatal", "accident", ",", "four", "times", "world", "champion", "Kan", "##kun", "##nen", "emerged", "from", "the", "first", "five", "of", "Saturday", "'", "s", "10", "stages", "with", "a", "commanding", "advantage", "over", "his", "country", "'", "s", "latest", "pro", "##spect", ",", "Marcus", "G", "##ron", "##holm", ",", "also", "in", "a", "Toyota", "." ], "ids": [ 10576, 169, 43440, 10491, 23315, 61173, 10162, 10155, 30767, 112, 187, 71126, 25037, 117, 11598, 13465, 11356, 17689, 57528, 49581, 11216, 50658, 10188, 10105, 10422, 12403, 10108, 24848, 112, 187, 10150, 35023, 10169, 169, 93644, 38119, 10491, 10226, 12723, 112, 187, 50908, 11284, 77229, 117, 15818, 144, 11620, 35673, 117, 10379, 10106, 169, 28995, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "World", "championship", "leader", "Tom", "##mi", "Ma", "##kinen", "in", "his", "Mitsubishi", "was", "third", "but", "current", "world", "champion", "Colin", "M", "##c", "##R", "##ae", "ended", "a", "bad", "week", "by", "crash", "##ing", "out", "." ], "ids": [ 10315, 20755, 15014, 12275, 10500, 13744, 108088, 10106, 10226, 44296, 10134, 12628, 10473, 14978, 11356, 17689, 20766, 150, 10350, 11273, 14193, 18428, 169, 15838, 16118, 10155, 42774, 10230, 10950, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 3, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "being", "fine", "##d", "$", "250", ",", "000", "by", "the", "sports", "governing", "body", "on", "Tuesday", ",", "the", "British", "driver", "rolle", "##d", "his", "Subaru", "6", ".", "5", "km", "into", "stage", "six", "." ], "ids": [ 11301, 11223, 13435, 10162, 109, 12214, 117, 10259, 10155, 10105, 18204, 75463, 14333, 10135, 70245, 117, 10105, 11160, 25926, 34547, 10162, 10226, 100668, 127, 119, 126, 10204, 10708, 15365, 12449, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "and", "co", "-", "driver", "Derek", "Ring", "##er", "were", "un", "##hur", "##t", "but", "team", "boss", "David", "Richards", "was", "fur", "##ious", "with", "them", "." ], "ids": [ 10357, 10111, 11170, 118, 25926, 30815, 21557, 10165, 10309, 10119, 27077, 10123, 10473, 11121, 48246, 10804, 29110, 10134, 61001, 25087, 10169, 11345, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "not", "un", "##fort", "##una", "##te", ",", "it", "'", "s", "in", "##com", "##pet", "##ent", ",", "\"", "he", "declared", "." ], "ids": [ 107, 10377, 112, 187, 10472, 10119, 23044, 14212, 10216, 117, 10271, 112, 187, 10106, 22530, 19094, 11405, 117, 107, 10261, 25019, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kan", "##kku", "##nen", "has", "set", "an", "as", "##toni", "##shing", "pace", "for", "a", "driver", "who", "has", "not", "ra", "##lli", "##ed", "for", "three", "months", "." ], "ids": [ 57528, 70691, 11216, 10393, 11847, 10151, 10146, 54193, 74062, 32547, 10142, 169, 25926, 10479, 10393, 10472, 11859, 14088, 10336, 10142, 11003, 15555, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "you", "do", "a", "lot", "of", "something", ",", "sometimes", "it", "'", "s", "good", "to", "have", "a", "break", "." ], "ids": [ 107, 14535, 13028, 10149, 169, 19826, 10108, 26133, 117, 17611, 10271, 112, 187, 15198, 10114, 10529, 169, 24194, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "not", "bad", "for", "an", "old", "man", "!", "\"" ], "ids": [ 10377, 112, 187, 10472, 15838, 10142, 10151, 12898, 10817, 106, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "said", "the", "37", "-", "year", "-", "old", "veteran", "." ], "ids": [ 12415, 10105, 11204, 118, 10924, 118, 12898, 55669, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ford", "had", "a", "poor", "morning", "with", "Spania", "##rd", "Carlos", "Sai", "##nz", "losing", "90", "seconds", "through", "turbo", "trouble", "while", "Belgian", "Bruno", "Th", "##ir", "##y", "dropped", "four", "minutes", "when", "a", "transmission", "sh", "##aft", "sna", "##pped", "." ], "ids": [ 14255, 10374, 169, 23247, 28757, 10169, 42751, 12023, 12050, 77710, 20259, 27817, 10919, 34290, 11222, 89833, 58285, 11371, 36652, 16663, 51635, 10835, 10157, 30241, 11598, 15304, 10841, 169, 35283, 48201, 62400, 62541, 44357, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##TO", "##R", "RA", "##CI", "##NG", "-", "BE", "##L", "##GI", "##AN", "GR", "##AN", "##D", "PR", "##IX", "GR", "##ID", "P", "##OS", "##IT", "##ION", "##S", "." ], "ids": [ 102059, 60493, 11273, 64007, 89955, 34065, 118, 46291, 11369, 100075, 41275, 58787, 41275, 11490, 23837, 67403, 58787, 28895, 153, 21793, 37611, 52980, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SP", "##A", "-", "FR", "##AN", "##CO", "##RC", "##HA", "##MP", "##S", ",", "Belgium", "1996", "-", "08", "-", "24" ], "ids": [ 22570, 10738, 118, 64655, 41275, 82272, 52932, 58132, 79936, 10731, 117, 26519, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##rid", "positions" ], "ids": [ 144, 33597, 23188 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "for", "Sunday", "'", "s", "Belgian", "Grand", "Prix", "motor", "race", "after", "final" ], "ids": [ 10142, 19731, 112, 187, 36652, 11319, 12835, 15257, 14025, 10662, 11070 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "qualifying", "on", "Saturday", ":" ], "ids": [ 43631, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Jacques", "Villeneuve", "(", "Canada", ")", "Williams", "1", "minute", "50", ".", "574" ], "ids": [ 122, 119, 12745, 40761, 113, 11635, 114, 12494, 122, 21760, 10462, 119, 57330 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "seconds", "(", "average", "speed", "226", ".", "859", "k", "##ph", ")" ], "ids": [ 34290, 113, 13551, 19085, 23776, 119, 80786, 179, 28088, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Damon", "Hill", "(", "Britain", ")", "Williams", "1", ":", "50", ".", "980" ], "ids": [ 123, 119, 50633, 12289, 113, 16032, 114, 12494, 122, 131, 10462, 119, 46263 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Michael", "Schumacher", "(", "Germany", ")", "Ferrari", "1", ":", "51", ".", "778" ], "ids": [ 124, 119, 10631, 37761, 113, 12775, 114, 20586, 122, 131, 11524, 119, 65036 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "David", "Co", "##ult", "##hard", "(", "Britain", ")", "McLaren", "1", ":", "51", ".", "884" ], "ids": [ 125, 119, 10804, 13098, 16203, 29352, 113, 16032, 114, 38084, 122, 131, 11524, 119, 74395 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Gerhard", "Berger", "(", "Austria", ")", "Ben", "##etto", "##n", "1", ":", "51", ".", "960" ], "ids": [ 126, 119, 23148, 27121, 113, 14479, 114, 13304, 24327, 10115, 122, 131, 11524, 119, 36832 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Mika", "Ha", "##kki", "##nen", "(", "Finland", ")", "McLaren", "1", ":", "52", ".", "318" ], "ids": [ 127, 119, 53379, 13740, 30859, 11216, 113, 15497, 114, 38084, 122, 131, 11525, 119, 30670 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Jean", "Ale", "##si", "(", "France", ")", "Ben", "##etto", "##n", "1", ":", "52", ".", "354" ], "ids": [ 128, 119, 10766, 59340, 10449, 113, 10688, 114, 13304, 24327, 10115, 122, 131, 11525, 119, 33540 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Martin", "Brun", "##dle", "(", "Britain", ")", "Jordan", "1", ":", "52", ".", "977" ], "ids": [ 129, 119, 11235, 102877, 27477, 113, 16032, 114, 16366, 122, 131, 11525, 119, 75961 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Eddie", "Irvine", "(", "Britain", ")", "Ferrari", "1", ":", "53", ".", "043" ], "ids": [ 130, 119, 19414, 69493, 113, 16032, 114, 20586, 122, 131, 11756, 119, 104367 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Rubens", "Barr", "##iche", "##llo", "(", "Brazil", ")", "Jordan", "1", ":", "53", ".", "152" ], "ids": [ 10150, 119, 61903, 79283, 16528, 13660, 113, 16765, 114, 16366, 122, 131, 11756, 119, 18591 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ad", "##d", "grid", ":" ], "ids": [ 25474, 10162, 48353, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "11", ".", "Heinz", "-", "Harald", "Fr", "##ent", "##zen", "(", "Germany", ")", "Sau", "##ber", "1", ":", "53", ".", "199" ], "ids": [ 10193, 119, 23406, 118, 25475, 33884, 11405, 11985, 113, 12775, 114, 19076, 12212, 122, 131, 11756, 119, 23366 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "12", ".", "Johnny", "Herbert", "(", "Britain", ")", "Sau", "##ber", "1", ":", "53", ".", "993" ], "ids": [ 10186, 119, 15551, 16861, 113, 16032, 114, 19076, 12212, 122, 131, 11756, 119, 82931 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "13", ".", "Mika", "Sal", "##o", "(", "Finland", ")", "Ty", "##rrell", "1", ":", "54", ".", "095" ], "ids": [ 10249, 119, 53379, 64831, 10133, 113, 15497, 114, 64515, 68122, 122, 131, 11653, 119, 87752 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "14", ".", "Olivier", "Pan", "##is", "(", "France", ")", "Ligi", "##er", "1", ":", "54", ".", "220" ], "ids": [ 10247, 119, 22383, 18661, 10291, 113, 10688, 114, 32874, 10165, 122, 131, 11653, 119, 15817 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", ".", "Pedro", "Din", "##iz", "(", "Brazil", ")", "Ligi", "##er", "1", ":", "54", ".", "700" ], "ids": [ 10208, 119, 12849, 20031, 15834, 113, 16765, 114, 32874, 10165, 122, 131, 11653, 119, 12367 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "16", ".", "Jos", "Vers", "##ta", "##ppen", "(", "Netherlands", ")", "Arrow", "##s", "1", ":", "55", ".", "150" ], "ids": [ 10250, 119, 28162, 46744, 10213, 20197, 113, 22043, 114, 48567, 10107, 122, 131, 11358, 119, 11766 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "17", ".", "U", "##ky", "##o", "Kata", "##yama", "(", "Japan", ")", "Ty", "##rrell", "1", ":", "55", ".", "371" ], "ids": [ 10273, 119, 158, 11445, 10133, 76496, 32529, 113, 11891, 114, 64515, 68122, 122, 131, 11358, 119, 37439 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "18", ".", "Ricardo", "Ross", "##et", "(", "Brazil", ")", "Arrow", "##s", "1", ":", "56", ".", "286" ], "ids": [ 10218, 119, 20261, 16690, 10308, 113, 16765, 114, 48567, 10107, 122, 131, 11628, 119, 28747 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "19", ".", "Pedro", "Lam", "##y", "(", "Portugal", ")", "Mina", "##rdi", "1", ":", "56", ".", "830" ], "ids": [ 10270, 119, 12849, 44068, 10157, 113, 12939, 114, 43495, 18177, 122, 131, 11628, 119, 48510 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Did", "not", "qualify", "(", "times", "did", "not", "meet", "qualifying", "standard", ")", ":" ], "ids": [ 50133, 10472, 55235, 113, 13465, 12172, 10472, 23267, 43631, 14979, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "20", ".", "Giovanni", "La", "##va", "##ggi", "(", "Italy", ")", "Mina", "##rdi", "1", ":", "58", ".", "579" ], "ids": [ 10197, 119, 13297, 10159, 10362, 20964, 113, 11619, 114, 43495, 18177, 122, 131, 11824, 119, 49741 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RA", "##LL", "##Y", "##ING", "-", "BE", "##L", "##GI", "##AN", "SP", "##EC", "##TA", "##TO", "##R", "DI", "##ES", "IN", "F", "##IN", "##NI", "##SH", "RA", "##LL", "##Y", "." ], "ids": [ 64007, 82834, 14703, 50183, 118, 46291, 11369, 100075, 41275, 22570, 35826, 24951, 60493, 11273, 110014, 25054, 36351, 143, 27128, 52898, 64091, 64007, 82834, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##Y", "##VA", "##S", "##K", "##Y", "##LA", ",", "Finland", "1996", "-", "08", "-", "24" ], "ids": [ 147, 14703, 47172, 10731, 11733, 14703, 44376, 117, 15497, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Belgian", "man", "died", "and", "31", "people", "were", "injured", "after", "an", "accident", "in", "Friday", "'", "s", "opening", "phase", "of", "the", "world", "championship", "1", ",", "000", "Lakes", "Rally", "." ], "ids": [ 138, 36652, 10817, 12482, 10111, 10413, 11426, 10309, 36081, 10662, 10151, 25037, 10106, 30767, 112, 187, 17975, 20394, 10108, 10105, 11356, 20755, 122, 117, 10259, 42052, 42161, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "The", "un", "##named", "victim", "died", "during", "the", "night", ",", "a", "hospital", "spoke", "##sman", "said", "on", "Saturday", "." ], "ids": [ 10117, 10119, 95196, 62585, 12482, 10939, 10105, 16903, 117, 169, 18141, 50005, 24305, 12415, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Danish", "driver", "Kar", "##sten", "Richard", "##t", "had", "pl", "##ough", "##ed", "into", "the", "crowd", "during", "the", "two", "-", "kilometre", "first", "stage", "held", "in", "the", "host", "city", "of", "J", "##y", "##vas", "##ky", "##la", "." ], "ids": [ 29876, 25926, 90233, 12587, 11118, 10123, 10374, 20648, 73603, 10336, 10708, 10105, 50059, 10939, 10105, 10551, 118, 84485, 10422, 15365, 11991, 10106, 10105, 19317, 11584, 10108, 147, 10157, 14139, 11445, 10330, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9 ] }, { "tokens": [ "Richard", "##t", "'", "s", "Mitsubishi", "ski", "##dde", "##d", "down", "an", "escape", "road", "and", "pl", "##ough", "##ed", "into", "a", "cor", "##done", "##d", "-", "off", "area", "for", "sp", "##ecta", "##tors", "." ], "ids": [ 11118, 10123, 112, 187, 44296, 40122, 22243, 10162, 12935, 10151, 30220, 15485, 10111, 20648, 73603, 10336, 10708, 169, 29162, 99726, 10162, 118, 11898, 11168, 10142, 32650, 78125, 24324, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "second", "Belgian", "was", "also", "seriously", "injured", "but", "the", "hospital", "spoke", "##sman", "said", "his", "life", "was", "not", "in", "danger", "." ], "ids": [ 138, 11132, 36652, 10134, 10379, 75543, 36081, 10473, 10105, 18141, 50005, 24305, 12415, 10226, 12103, 10134, 10472, 10106, 45882, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "stage", "was", "suspended", "but", "the", "four", "-", "day", "rally", "resumed", "on", "Saturday", "." ], "ids": [ 10117, 15365, 10134, 49799, 10473, 10105, 11598, 118, 11940, 58575, 68655, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "woman", "was", "killed", "before", "last", "year", "'", "s", "event", "when", "she", "walk", "##ed", "in", "front", "of", "a", "car", "prac", "##tis", "##ing", "on", "the", "course", "." ], "ids": [ 138, 18299, 10134, 15875, 11360, 12469, 10924, 112, 187, 14416, 10841, 10833, 33734, 10336, 10106, 14589, 10108, 169, 13000, 56309, 13434, 10230, 10135, 10105, 15348, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "TO", "##SH", "##IB", "##A", "CL", "##AS", "##SI", "##C", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 58573, 64091, 72918, 10738, 75151, 38025, 44802, 10858, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "CA", "##R", "##LS", "##BA", "##D", ",", "California", "1996", "-", "08", "-", "24" ], "ids": [ 24707, 11273, 66934, 35999, 11490, 117, 11621, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the" ], "ids": [ 33036, 10188, 10105 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "$", "450", ",", "000", "To", "##shi", "##ba", "Classic", "tennis", "tournament", "on", "Friday", "(", "pre", "##fix" ], "ids": [ 109, 16718, 117, 10259, 11469, 16119, 10537, 20542, 20944, 17390, 10135, 30767, 113, 12229, 57014 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Quarter", "##finals", ":" ], "ids": [ 75820, 47791, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "1", "-", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", "(", "Spain", ")", "beat", "Katarina", "St", "##uden", "##iko", "##va" ], "ids": [ 122, 118, 54789, 10368, 14220, 66007, 39574, 16780, 113, 16149, 114, 27868, 65988, 10838, 23280, 18924, 10362 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Slovakia", ")", "6", "-", "3", "6", "-", "3" ], "ids": [ 113, 43031, 114, 127, 118, 124, 127, 118, 124 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "Jana", "Novo", "##tna", "(", "Czech", "Republic", ")", "beat", "Sand", "##rine", "Test", "##ud", "(", "France", ")" ], "ids": [ 124, 118, 18909, 28649, 34247, 113, 22148, 13681, 114, 27868, 35071, 28728, 22495, 11679, 113, 10688, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "2", "-", "6", "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "3", "." ], "ids": [ 123, 118, 127, 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 124, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Kimi", "##ko", "Date", "(", "Japan", ")", "beat", "5", "-", "Gabriela", "Saba", "##tini", "(", "Argentina", ")" ], "ids": [ 125, 118, 63038, 10440, 29897, 113, 11891, 114, 27868, 126, 118, 51311, 86627, 29619, 113, 12853, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", "-", "4", "6", "-", "1" ], "ids": [ 127, 118, 125, 127, 118, 122 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "H", "##AM", "##LE", "##T", "C", "##UP", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 145, 36535, 51036, 11090, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "COM", "##MA", "##C", "##K", ",", "New", "York", "1996", "-", "08", "-", "23" ], "ids": [ 80645, 30696, 10858, 11733, 117, 10287, 10482, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the" ], "ids": [ 33036, 10188, 10105 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Wald", "##baum", "Hamlet", "Cup", "tennis", "tournament", "on", "Friday", "(", "pre", "##fix", "number" ], "ids": [ 33903, 39687, 48334, 11544, 20944, 17390, 10135, 30767, 113, 12229, 57014, 11487 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Quarter", "##finals", ":" ], "ids": [ 75820, 47791, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Adrian", "Vo", "##inea", "(", "Romania", ")", "beat", "Thomas", "Johansson", "(", "Sweden", ")", "7", "-", "6" ], "ids": [ 23928, 59482, 78209, 113, 13927, 114, 27868, 11096, 40211, 113, 20937, 114, 128, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "(", "7", "-", "4", ")", "6", "-", "2" ], "ids": [ 113, 128, 118, 125, 114, 127, 118, 123 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", "-", "Andrei", "Medvedev", "(", "Ukraine", ")", "beat", "Jonathan", "Stark", "(", "U", ".", "S", ".", ")", "7", "-", "6" ], "ids": [ 126, 118, 40594, 91681, 113, 19883, 114, 27868, 16395, 39923, 113, 158, 119, 156, 119, 114, 128, 118, 127 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "(", "7", "-", "4", ")", "4", "-", "6", "6", "-", "3" ], "ids": [ 113, 128, 118, 125, 114, 125, 118, 127, 127, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "Damm", "(", "Czech", "Republic", ")", "beat", "Michael", "Joyce", "(", "U", ".", "S", ".", ")", "5", "-", "7" ], "ids": [ 11235, 104698, 113, 22148, 13681, 114, 27868, 10631, 35088, 113, 158, 119, 156, 119, 114, 126, 118, 128 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "2", "6", "-", "3" ], "ids": [ 127, 118, 123, 127, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karol", "Ku", "##cera", "(", "Slovakia", ")", "beat", "1", "-", "Michael", "Chang", "(", "U", ".", "S", ".", ")", "6", "-", "4", "6", "-", "4" ], "ids": [ 40129, 49869, 28568, 113, 43031, 114, 27868, 122, 118, 10631, 28545, 113, 158, 119, 156, 119, 114, 127, 118, 125, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "T", "##H", "##UN", "##DE", "##RS", "##TO", "##R", "##MS", "FOR", "##CE", "SU", "##SP", "##EN", "##SI", "##ON", "OF", "SEC", "##ON", "##D", "R", "##O", "##UN", "##D", "IN", "AK", "##RO", "##N", "." ], "ids": [ 41525, 11369, 11565, 118, 157, 12396, 69849, 60675, 39469, 60493, 11273, 53355, 109544, 43161, 86643, 86001, 50655, 44802, 30118, 23240, 92031, 30118, 11490, 155, 11403, 69849, 11490, 36351, 36723, 35066, 11537, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "AK", "##RO", "##N", ",", "Ohio", "1996", "-", "08", "-", "23" ], "ids": [ 36723, 35066, 11537, 117, 13608, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thunder", "##stor", "##ms", "forced", "the", "suspension", "of", "the", "World", "Series", "of", "Golf", "after", "just", "five", "players", "in", "the", "43", "-", "man", "field", "had", "completed", "the", "second", "round", "on", "Friday", "." ], "ids": [ 34308, 42396, 12387, 20054, 10105, 52341, 10108, 10105, 10315, 13239, 10108, 23870, 10662, 12820, 12403, 16021, 10106, 10105, 11370, 118, 10817, 13939, 10374, 15782, 10105, 11132, 13569, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Play", "initially", "was", "inter", "##rupted", "for", "more", "than", "3", "-", "1", "/", "2", "hours", "before", "res", "##umi", "##ng", "for", "two", "hours", "." ], "ids": [ 17712, 20465, 10134, 22021, 63133, 10142, 10798, 11084, 124, 118, 122, 120, 123, 19573, 11360, 39429, 17019, 10376, 10142, 10551, 19573, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "play", "was", "finally", "suspended", "for", "the", "day", "when", "the", "storm", "continued", "." ], "ids": [ 16976, 12253, 10134, 21256, 49799, 10142, 10105, 11940, 10841, 10105, 31642, 14278, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "38", "players", "are", "s", "##ched", "##ele", "##d", "to", "res", "##ume", "their", "rounds", "on", "Saturday", "morning", "before", "the", "third", "round", "begins", "." ], "ids": [ 10117, 11171, 16021, 10301, 187, 35456, 12739, 10162, 10114, 39429, 20467, 10455, 44759, 10135, 24848, 28757, 11360, 10105, 12628, 13569, 26462, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "SC", "##OR", "##ES", "AT", "WORLD", "SE", "##RI", "##ES", "OF", "GO", "##L", "##F", "." ], "ids": [ 41525, 11369, 11565, 118, 18137, 42622, 25054, 30554, 67376, 23056, 46876, 25054, 23240, 41525, 11369, 11565, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "AK", "##RO", "##N", ",", "Ohio", "1996", "-", "08", "-", "23" ], "ids": [ 36723, 35066, 11537, 117, 13608, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", "from", "the", "$", "2", ".", "1" ], "ids": [ 66875, 10107, 10188, 10105, 109, 123, 119, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "million", "NEC", "World", "Series", "of", "Golf", "after", "the", "second", "round", "was" ], "ids": [ 12473, 97104, 10315, 13239, 10108, 23870, 10662, 10105, 11132, 13569, 10134 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "suspended", "due", "to", "rain", "on", "Friday", "with", "38", "of", "the", "43", "players", "yet" ], "ids": [ 49799, 10850, 10114, 50939, 10135, 30767, 10169, 11171, 10108, 10105, 11370, 16021, 21833 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "to", "finish", "their", "rounds", "on", "the", "7", ",", "149", "yard", ",", "par", "70", "Fire", "##stone", "C", ".", "C" ], "ids": [ 10114, 26282, 10455, 44759, 10135, 10105, 128, 117, 19438, 27238, 117, 10248, 10923, 16011, 23314, 140, 119, 140 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "course", "(", "players", "U", ".", "S", ".", "unless", "noted", ")", ":" ], "ids": [ 15348, 113, 16021, 158, 119, 156, 119, 60015, 18575, 114, 131 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "-", "5", "Paul", "Go", "##yd", "##os", "through", "2", "holes" ], "ids": [ 118, 126, 10772, 14439, 18659, 10310, 11222, 123, 76956 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "-", "5", "Billy", "May", "##fair", "through", "2" ], "ids": [ 118, 126, 15894, 10725, 82198, 11222, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "-", "4", "Greg", "Norman", "(", "Australia", ")", "through", "8" ], "ids": [ 118, 125, 22438, 15332, 113, 11729, 114, 11222, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "-", "4", "Hi", "##demi", "##chi", "Tanaka", "(", "Japan", ")", "through", "3" ], "ids": [ 118, 125, 20065, 108986, 12806, 59616, 113, 11891, 114, 11222, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "-", "3", "Steve", "St", "##rick", "##er", "through", "3" ], "ids": [ 118, 124, 13308, 10838, 35906, 10165, 11222, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "-", "2", "Phil", "Mick", "##els", "##on", "through", "7" ], "ids": [ 118, 123, 18144, 34847, 18338, 10263, 11222, 128 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "-", "2", "Mark", "Brooks", "through", "3" ], "ids": [ 118, 123, 11997, 27625, 11222, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "-", "1", "Hal", "Sutton", "through", "11" ], "ids": [ 118, 122, 21699, 49913, 11222, 10193 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "-", "1", "John", "Cook", "through", "5" ], "ids": [ 118, 122, 10421, 21115, 11222, 126 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "-", "1", "Tim", "Herr", "##on", "through", "4" ], "ids": [ 118, 122, 15318, 38000, 10263, 11222, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "-", "1", "Justin", "Leonard", "through", "3" ], "ids": [ 118, 122, 21823, 20318, 11222, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "0", "Steve", "Jones", "through", "7" ], "ids": [ 121, 13308, 12298, 11222, 128 ], "entity": [ "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9 ] }, { "tokens": [ "0", "Nick", "Fa", "##ldo", "(", "Britain", ")", "through", "5" ], "ids": [ 121, 16126, 44271, 44750, 113, 16032, 114, 11222, 126 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "0", "Davis", "Love", "through", "5" ], "ids": [ 121, 14281, 11248, 11222, 126 ], "entity": [ "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9 ] }, { "tokens": [ "+", "1", "Fred", "Co", "##up", "##les", "through", "15" ], "ids": [ 116, 122, 16887, 13098, 14590, 11268, 11222, 10208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "+", "1", "Fred", "Funk", "through", "9" ], "ids": [ 116, 122, 16887, 47185, 11222, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "+", "1", "Scott", "Ho", "##ch", "through", "9" ], "ids": [ 116, 122, 12812, 20220, 10269, 11222, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "+", "1", "Ernie", "Els", "(", "South", "Africa", ")", "through", "8" ], "ids": [ 116, 122, 76063, 13075, 113, 11056, 12880, 114, 11222, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "+", "2", "D", ".", "A", ".", "Wei", "##bring", "through", "12" ], "ids": [ 116, 123, 141, 119, 138, 119, 37343, 109720, 11222, 10186 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "+", "2", "Clarence", "Rose", "through", "9" ], "ids": [ 116, 123, 40653, 14873, 11222, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "+", "2", "Duffy", "Wald", "##orf", "through", "4" ], "ids": [ 116, 123, 85837, 33903, 43920, 11222, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "+", "3", "Jim", "Fury", "##k", "through", "16" ], "ids": [ 116, 124, 14178, 49286, 10174, 11222, 10250 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "+", "3", "Corey", "Pa", "##vin", "through", "14" ], "ids": [ 116, 124, 72262, 26907, 15478, 11222, 10247 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "+", "3", "Craig", "Stad", "##ler", "through", "14" ], "ids": [ 116, 124, 21703, 36841, 10815, 11222, 10247 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "+", "3", "Brad", "Bryant", "through", "12" ], "ids": [ 116, 124, 29382, 29451, 11222, 10186 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "+", "3", "Tom", "Le", "##hman", "through", "11" ], "ids": [ 116, 124, 12275, 10281, 49811, 11222, 10193 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "+", "3", "Sven", "St", "##ru", "##ver", "(", "Germany", ")", "through", "10" ], "ids": [ 116, 124, 33559, 10838, 11680, 12563, 113, 12775, 114, 11222, 10150 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "+", "3", "Alexander", "Ce", "##jka", "(", "Germany", ")", "through", "10" ], "ids": [ 116, 124, 12063, 13338, 42978, 113, 12775, 114, 11222, 10150 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "+", "3", "Anders", "For", "##s", "##brand", "(", "Sweden", ")", "through", "5" ], "ids": [ 116, 124, 20751, 11399, 10107, 55520, 113, 20937, 114, 11222, 126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "+", "4", "Willie", "Wood", "through", "17" ], "ids": [ 116, 125, 34085, 18315, 11222, 10273 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "+", "4", "Costa", "##ntino", "Rocca", "(", "Italy", ")", "through", "15" ], "ids": [ 116, 125, 13902, 44878, 63718, 113, 11619, 114, 11222, 10208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "+", "4", "Stewart", "G", "##inn", "(", "Australia", ")", "through", "13" ], "ids": [ 116, 125, 17493, 144, 24488, 113, 11729, 114, 11222, 10249 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "+", "5", "Wayne", "West", "##ner", "(", "South", "Africa", ")", "77", "68" ], "ids": [ 116, 126, 18547, 11164, 11129, 113, 11056, 12880, 114, 12527, 12370 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "+", "5", "Si", "##ge", "##ki", "Mar", "##uya", "##ma", "(", "Japan", ")", "through", "17" ], "ids": [ 116, 126, 11741, 10525, 10506, 15734, 105066, 10369, 113, 11891, 114, 11222, 10273 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "+", "5", "Mark", "O", "'", "Me", "##ara", "through", "15" ], "ids": [ 116, 126, 11997, 152, 112, 11589, 12677, 11222, 10208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "+", "5", "Lor", "##en", "Roberts", "through", "9" ], "ids": [ 116, 126, 91473, 10136, 18468, 11222, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "+", "6", "Scott", "M", "##c", "##C", "##ar", "##ron", "76", "70" ], "ids": [ 116, 127, 12812, 150, 10350, 10858, 10354, 11620, 12428, 10923 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "+", "7", "Sato", "##shi", "Hi", "##gas", "##hi", "(", "Japan", ")", "through", "16" ], "ids": [ 116, 128, 85266, 16119, 20065, 14644, 11924, 113, 11891, 114, 11222, 10250 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "+", "7", "Paul", "Stan", "##kowski", "through", "15" ], "ids": [ 116, 128, 10772, 26637, 36567, 11222, 10208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "+", "8", "Craig", "Parry", "(", "Australia", ")", "through", "13" ], "ids": [ 116, 129, 21703, 81320, 113, 11729, 114, 11222, 10249 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "+", "9", "Tom", "Watson", "79", "70" ], "ids": [ 116, 130, 12275, 19229, 12791, 10923 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "+", "11", "Sei", "##ki", "Ok", "##uda", "(", "Japan", ")", "81", "70", "(", "through", "18", ")" ], "ids": [ 116, 10193, 58901, 10506, 84591, 18497, 113, 11891, 114, 12324, 10923, 113, 11222, 10218, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "+", "11", "Steve", "Sc", "##hne", "##iter", "77", "74", ")", "through", "18", ")" ], "ids": [ 116, 10193, 13308, 55260, 37893, 27295, 12527, 12535, 114, 11222, 10218, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "LE", "##AG", "##UE", "-", "EU", "##RO", "##P", "##EA", "##N", "SU", "##PER", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 155, 12022, 32469, 14703, 84977, 109865, 62674, 118, 17751, 35066, 11127, 36789, 11537, 86643, 108408, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "European", "Super", "League" ], "ids": [ 33036, 10108, 11914, 12786, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6, 6 ] }, { "tokens": [ "rugby", "league", "matches", "on", "Saturday", ":" ], "ids": [ 19812, 15616, 18258, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "14", "Bradford", "27" ], "ids": [ 10728, 10247, 40141, 10365 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Wigan", "78", "Working", "##ton", "4" ], "ids": [ 85593, 12492, 38194, 11183, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "points" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 12789 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "total", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 11339, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wigan", "22", "19", "1", "2", "902", "326", "39" ], "ids": [ 85593, 10306, 10270, 122, 123, 74273, 32558, 11303 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "21", "19", "0", "2", "884", "441", "38" ], "ids": [ 10838, 21338, 10107, 10296, 10270, 121, 123, 74395, 41347, 11171 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bradford", "22", "17", "0", "5", "767", "409", "34" ], "ids": [ 40141, 10306, 10273, 121, 126, 50181, 37659, 11069 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "War", "##rington", "21", "12", "0", "9", "555", "499", "24" ], "ids": [ 11277, 82194, 10296, 10186, 121, 130, 44517, 40975, 10233 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "21", "11", "1", "9", "555", "462", "23" ], "ids": [ 10829, 10296, 10193, 122, 130, 44517, 44574, 10328 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", "21", "10", "0", "11", "574", "696", "20" ], "ids": [ 31695, 10296, 10150, 121, 10193, 57330, 68865, 10197 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Halifax", "21", "9", "1", "11", "603", "552", "19" ], "ids": [ 49933, 10296, 130, 122, 10193, 52100, 44809, 10270 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Castle", "##ford", "21", "9", "0", "12", "548", "543", "18" ], "ids": [ 17064, 13387, 10296, 130, 121, 10186, 48774, 50268, 10218 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oldham", "21", "8", "1", "12", "439", "656", "17" ], "ids": [ 109860, 10296, 129, 122, 10186, 43400, 47725, 10273 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leeds", "21", "6", "0", "15", "531", "681", "12" ], "ids": [ 28654, 10296, 127, 121, 10208, 49041, 63632, 10186 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "22", "3", "1", "18", "398", "795", "7" ], "ids": [ 10728, 10306, 124, 122, 10218, 43338, 71882, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Working", "##ton", "22", "2", "1", "19", "325", "1021", "5" ], "ids": [ 38194, 11183, 10306, 123, 122, 10270, 25843, 30538, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "ES", "##SE", "##X", "P", "##O", "##ISE", "##D", "TO", "ST", "##EP", "UP", "T", "##IT", "##LE", "CH", "##AL", "##LE", "##NG", "##E", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 49004, 39039, 12674, 153, 11403, 90569, 11490, 58573, 53317, 59742, 53197, 157, 37611, 51036, 39774, 32002, 51036, 34065, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essex", "are", "set", "to", "step", "up", "their", "English", "county", "championship", "challenge", "with", "a", "fifth", "consecutive", "victory", "after", "new", "-", "ball", "pair", "Neil", "Williams", "and", "Mark", "Il", "##ott", "sent", "Gloucestershire", "re", "##eling", "on", "Saturday", "." ], "ids": [ 33634, 10301, 11847, 10114, 31877, 10741, 10455, 11616, 17382, 20755, 36040, 10169, 169, 22237, 29864, 19735, 10662, 10751, 118, 20724, 27643, 19687, 12494, 10111, 11997, 10282, 15434, 14541, 91183, 11639, 55174, 10135, 24848, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Williams", "seized", "two", "wickets", "in", "two", "deliver", "##ies", "and", "left", "-", "arme", "##r", "Il", "##ott", "also", "captured", "two", "as", "Gloucestershire", ",", "252", "behind", "on", "first", "innings", ",", "sl", "##ump", "##ed", "to", "27", "for", "four", "at", "the", "close", "on", "the", "third", "day", "of", "the", "four", "-", "day", "game", "at", "Col", "##chester", "." ], "ids": [ 12494, 80176, 10551, 83839, 10106, 10551, 80498, 11624, 10111, 12153, 118, 40473, 10129, 10282, 15434, 10379, 25030, 10551, 10146, 91183, 117, 21581, 17155, 10135, 10422, 48974, 117, 38523, 67299, 10336, 10114, 10365, 10142, 11598, 10160, 10105, 16065, 10135, 10105, 12628, 11940, 10108, 10105, 11598, 118, 11940, 11661, 10160, 24927, 38540, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Essex", ",", "who", "started", "the", "current", "round", "of", "matches", "in", "fifth", "place", "20", "points", "behind", "leaders", "Derbyshire", "with", "a", "game", "in", "hand", ",", "could", "go", "top", "if", "they", "complete", "victory", "on", "Monday", "'", "s", "last", "day", "and", "other", "results", "favour", "them", "." ], "ids": [ 33634, 117, 10479, 13457, 10105, 14978, 13569, 10108, 18258, 10106, 22237, 11192, 10197, 12789, 17155, 24155, 87260, 10169, 169, 11661, 10106, 15230, 117, 12174, 11783, 12364, 12277, 10689, 17876, 19735, 10135, 40714, 112, 187, 12469, 11940, 10111, 10684, 17466, 61264, 11345, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Williams", "th", "##rust", "Essex", "on", "course", "for", "success", "by", "dis", "##pat", "##ching", "Matt", "Windows", "and", "Andrew", "Sy", "##monds", "in", "his", "second", "over", ",", "before", "Il", "##ott", "removed", "Dominic", "He", "##ws", "##on", "and", "Tim", "Hancock", "to", "reduce", "Gloucestershire", "to", "17", "for", "four", "at", "one", "stage", "." ], "ids": [ 12494, 77586, 56657, 33634, 10135, 15348, 10142, 17001, 10155, 27920, 18115, 41247, 16975, 12905, 10111, 13999, 32879, 97369, 10106, 10226, 11132, 10491, 117, 11360, 10282, 15434, 23898, 50806, 10357, 25080, 10263, 10111, 15318, 43552, 10114, 29888, 91183, 10114, 10273, 10142, 11598, 10160, 10464, 15365, 119 ], "entity": [ "B-PER", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 8, 9, 4, 8, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "visitors", "had", "started", "the", "day", "op", "##timi", "##stica", "##lly", "by", "sending", "back", "former", "England", "captain", "Graham", "Go", "##och", "when", "he", "added", "just", "six", "to", "his", "over", "##night", "105", ",", "but", "Essex", "went", "on", "to", "make", "532", "for", "eight", "before", "de", "##cla", "##ring", "." ], "ids": [ 10117, 44291, 10374, 13457, 10105, 11940, 10303, 82064, 21257, 17903, 10155, 67306, 12014, 11775, 11701, 28157, 16928, 14439, 16908, 10841, 10261, 16288, 12820, 12449, 10114, 10226, 10491, 45217, 14519, 117, 10473, 33634, 13446, 10135, 10114, 13086, 50446, 10142, 16222, 11360, 10104, 60582, 13135, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Captain", "Paul", "Pri", "##chard", "plu", "##nder", "##ed", "88", "from", "73", "deliver", "##ies", ",", "hitting", "15", "four", "##s", "and", "one", "six", "." ], "ids": [ 17448, 10772, 30797, 43013, 13651, 16497, 10336, 12074, 10188, 12545, 80498, 11624, 117, 88998, 10208, 11598, 10107, 10111, 10464, 12449, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "-", "placed", "Kent", "were", "fr", "##ust", "##rated", "by", "rain", "which", "prevented", "any", "play", "at", "Cardiff", ",", "where", "they", "have", "reached", "255", "for", "three", "in", "their", "first", "innings", "against", "G", "##lam", "##organ", ",", "while", "third", "-", "placed", "Surrey", "are", "facing", "an", "up", "##hill", "task", "against", "Nottingham", "##shire", "." ], "ids": [ 14181, 118, 16906, 19393, 10309, 12127, 19265, 32199, 10155, 50939, 10319, 75660, 11178, 12253, 10160, 39136, 117, 10940, 10689, 10529, 17087, 24024, 10142, 11003, 10106, 10455, 10422, 48974, 11327, 144, 21114, 100807, 117, 11371, 12628, 118, 16906, 42858, 10301, 48237, 10151, 10741, 32049, 37758, 11327, 43396, 19684, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Surrey", "sl", "##ip", "##ped", "to", "88", "for", "four", "in", "rep", "##ly", "to", "Not", "##ts", "'", "commanding", "first", "innings", "of", "446", "for", "nine", "declared", "at", "Trent", "Bridge", ",", "before", "Ali", "##stair", "Brown", "struck", "a", "55", "-", "ball", "half", "-", "century", "." ], "ids": [ 42858, 38523, 17437, 16898, 10114, 12074, 10142, 11598, 10106, 76456, 10454, 10114, 16040, 10806, 112, 93644, 10422, 48974, 10108, 40709, 10142, 19964, 25019, 10160, 47528, 17426, 117, 11360, 13518, 96772, 12623, 45622, 169, 11358, 118, 20724, 13877, 118, 11943, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brown", "'", "s", "56", "not", "out", ",", "containing", "eight", "four", "##s", "and", "three", "six", "##es", ",", "lift", "##ed", "Surrey", "to", "128", "for", "four", "on", "a", "rain", "-", "curta", "##iled", "day", "." ], "ids": [ 12623, 112, 187, 11628, 10472, 10950, 117, 27248, 16222, 11598, 10107, 10111, 11003, 12449, 10171, 117, 63376, 10336, 42858, 10114, 16196, 10142, 11598, 10135, 169, 50939, 118, 51738, 79257, 11940, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fourth", "-", "placed", "Leicester", "##shire", "had", "Hampshire", "on", "the", "ro", "##pes", "at", "Leicester", "before", "rain", "inter", "##vene", "##d", "." ], "ids": [ 38536, 118, 16906, 38789, 19684, 10374, 26036, 10135, 10105, 25470, 16354, 10160, 38789, 11360, 50939, 22021, 61190, 10162, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 3, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pace", "trio", "David", "Mill", "##ns", "(", "2", "-", "24", ")", ",", "Gordon", "Parsons", "(", "3", "-", "20", ")", "and", "Vince", "Wells", "(", "2", "-", "19", ")", "had", "Hampshire", "re", "##eling", "at", "81", "for", "seven", "in", "rep", "##ly", "to", "the", "home", "county", "'", "s", "first", "innings", "of", "353", "." ], "ids": [ 66017, 32920, 10804, 28639, 10891, 113, 123, 118, 10233, 114, 117, 14898, 45737, 113, 124, 118, 10197, 114, 10111, 42807, 25325, 113, 123, 118, 10270, 114, 10374, 26036, 11639, 55174, 10160, 12324, 10142, 15767, 10106, 76456, 10454, 10114, 10105, 11816, 17382, 112, 187, 10422, 48974, 10108, 35373, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yorkshire", "re", "##kind", "##led", "their", "title", "hopes", "after", "three", "successive", "defeat", "##s", "by", "taking", "the", "upper", "hand", "against", "arch", "-", "rivals", "Lancashire", "at", "Old", "Tra", "##fford", "." ], "ids": [ 27577, 11639, 62891, 16376, 10455, 12887, 82467, 10662, 11003, 47525, 24800, 10107, 10155, 18084, 10105, 24172, 15230, 11327, 69154, 118, 71908, 48487, 10160, 13773, 21469, 98680, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Fa", "##cing", "Yorkshire", "'", "s", "529", "for", "eight", "declared", ",", "Lancashire", "were", "forced", "to", "follow", "on", "206", "behind", "after", "being", "bowl", "##ed", "out", "for", "323", ",", "pace", "##man", "Darren", "Go", "##ugh", "polis", "##hing", "off", "the", "innings", "with", "a", "bu", "##rst", "of", "three", "wickets", "for", "one", "run", "in", "17", "deliver", "##ies", "." ], "ids": [ 44271, 19113, 27577, 112, 187, 49102, 10142, 16222, 25019, 117, 48487, 10309, 20054, 10114, 28086, 10135, 21717, 17155, 10662, 11223, 99380, 10336, 10950, 10142, 28550, 117, 32547, 10589, 53337, 14439, 25905, 49114, 30809, 11898, 10105, 48974, 10169, 169, 11499, 21328, 10108, 11003, 83839, 10142, 10464, 14095, 10106, 10273, 80498, 11624, 119 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lancashire", "then", "reached", "210", "for", "five", "at", "the", "close", "-", "-", "just", "four", "ahead", "-", "-", "after", "Neil", "Fair", "##bro", "##ther", "hit", "55", "in", "60", "balls", "to", "add", "to", "his", "first", "innings", "of", "86", "." ], "ids": [ 48487, 11059, 17087, 17131, 10142, 12403, 10160, 10105, 16065, 118, 118, 12820, 11598, 35629, 118, 118, 10662, 19687, 25697, 20923, 22623, 14946, 11358, 10106, 10709, 88301, 10114, 42852, 10114, 10226, 10422, 48974, 10108, 12224, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "V", "PA", "##KI", "##ST", "##AN", "F", "##IN", "##AL", "T", "##ES", "##T", "SC", "##OR", "##EB", "##O", "##AR", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 159, 32349, 59879, 32995, 41275, 143, 27128, 32002, 157, 25054, 11090, 18137, 42622, 89922, 11403, 52188, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##board", "on", "the", "third", "day", "of", "the" ], "ids": [ 66875, 25690, 10135, 10105, 12628, 11940, 10108, 10105 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "third", "and", "final", "test", "between", "England", "and", "Pakistan", "at", "The", "Oval", "on" ], "ids": [ 12628, 10111, 11070, 15839, 10948, 11701, 10111, 15437, 10160, 10117, 98765, 10135 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 5, 9 ] }, { "tokens": [ "Saturday", ":" ], "ids": [ 24848, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "England", "first", "innings", "326", "(", "J", ".", "C", "##ra", "##wley", "106", ",", "G", ".", "Thorpe", "54", ";", "W", "##aq", "##ar" ], "ids": [ 11701, 10422, 48974, 32558, 113, 147, 119, 140, 10288, 62381, 16084, 117, 144, 119, 84855, 11653, 132, 160, 49277, 10354 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8 ] }, { "tokens": [ "You", "##nis", "4", "-", "95", ")" ], "ids": [ 11065, 12597, 125, 118, 11978, 114 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "first", "innings", "(", "over", "##night", "229", "-", "1", ")" ], "ids": [ 15437, 10422, 48974, 113, 10491, 45217, 26216, 118, 122, 114 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sa", "##eed", "Anwar", "c", "C", "##roft", "b", "Cork", "176" ], "ids": [ 12404, 40154, 92168, 171, 140, 101860, 170, 42049, 21613 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 9, 4, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "c", "Cork", "b", "C", "##roft", "46" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 171, 42049, 170, 140, 101860, 11528 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 9, 4, 8, 9 ] }, { "tokens": [ "I", "##ja", "##z", "Ahmed", "c", "Stewart", "b", "Mu", "##lla", "##lly", "61" ], "ids": [ 146, 10320, 10305, 25530, 171, 17493, 170, 49056, 11083, 17903, 12314 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 9, 4, 8, 8, 9 ] }, { "tokens": [ "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", "c", "Hus", "##sain", "b", "Mu", "##lla", "##lly", "35" ], "ids": [ 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 171, 109022, 82083, 170, 49056, 11083, 17903, 10803 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Salim", "Malik", "not", "out", "2" ], "ids": [ 98284, 45783, 10472, 10950, 123 ], "entity": [ "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9 ] }, { "tokens": [ "As", "##if", "Mu", "##jta", "##ba", "not", "out", "1" ], "ids": [ 10882, 13918, 49056, 51465, 10537, 10472, 10950, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "b", "-", "4", "lb", "-", "3", "n", "##b", "-", "11", ")", "18" ], "ids": [ 50821, 10107, 113, 170, 118, 125, 23989, 118, 124, 182, 10457, 118, 10193, 114, 10218 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "four", "wickets", ")", "339" ], "ids": [ 25220, 113, 10142, 11598, 83839, 114, 34753 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "106", "2", "-", "239", "3", "-", "334", "4", "-", "334" ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 16084, 123, 118, 25338, 124, 118, 33956, 125, 118, 33956 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "bat", ":", "Was", "##im", "Ak", "##ram", ",", "Moi", "##n", "Khan", ",", "Mus", "##hta", "##q", "Ahmed", ",", "W", "##aq", "##ar", "You", "##nis", "," ], "ids": [ 11469, 11519, 131, 22034, 11759, 71275, 13845, 117, 82447, 10115, 16324, 117, 31013, 32493, 11703, 25530, 117, 160, 49277, 10354, 11065, 12597, 117 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Mohammad", "Ak", "##am" ], "ids": [ 40036, 71275, 11008 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "Bowling", "(", "to", "date", ")", ":", "Lewis", "12", "-", "1", "-", "76", "-", "0", ",", "Mu", "##lla", "##lly", "22", "-", "6", "-", "56", "-", "2", "," ], "ids": [ 100017, 113, 10114, 13664, 114, 131, 13759, 10186, 118, 122, 118, 12428, 118, 121, 117, 49056, 11083, 17903, 10306, 118, 127, 118, 11628, 118, 123, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##roft", "29", "-", "6", "-", "64", "-", "1", ",", "Cork", "14", ".", "3", "-", "4", "-", "45", "-", "1", ",", "Salisbury", "17", "-", "0", "-", "91", "-", "0" ], "ids": [ 140, 101860, 10386, 118, 127, 118, 11295, 118, 122, 117, 42049, 10247, 119, 124, 118, 125, 118, 10827, 118, 122, 117, 55933, 10273, 118, 121, 118, 12519, 118, 121 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##IS", "##H", "CO", "##UN", "##T", "##Y", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "SC", "##OR", "##ES", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 19088, 12396, 32992, 69849, 11090, 14703, 39774, 36535, 11127, 52980, 64091, 30331, 18137, 42622, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Close", "of", "play", "scores", "in", "four", "-", "day" ], "ids": [ 39981, 10108, 12253, 49931, 10106, 11598, 118, 11940 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "County", "Championship", "cricket", "matches", "on", "Saturday", ":" ], "ids": [ 11616, 10886, 12341, 32289, 18258, 10135, 24848, 131 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Final", "day" ], "ids": [ 14924, 11940 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "At", "Weston", "-", "super", "-", "Mare", ":", "Match", "abandoned", "as", "a", "draw", "-", "rain", "." ], "ids": [ 11699, 62676, 118, 25212, 118, 20754, 131, 26151, 32296, 10146, 169, 25974, 118, 50939, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Durham", "326", "(", "D", ".", "Cox", "95", "not", "out", ",", "S", ".", "Campbell", "69", ";", "G", ".", "Rose", "7", "-", "73", ")", "." ], "ids": [ 37499, 32558, 113, 141, 119, 30927, 11978, 10472, 10950, 117, 156, 119, 18172, 12573, 132, 144, 119, 14873, 128, 118, 12545, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Somerset", "298", "-", "6", "(", "M", ".", "La", "##th", "##well", "85", ",", "R", ".", "Hard", "##en", "65", ")", "." ], "ids": [ 35434, 31543, 118, 127, 113, 150, 119, 10159, 11143, 15862, 12017, 117, 155, 119, 23946, 10136, 10843, 114, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Somerset", "9", "points", "," ], "ids": [ 35434, 130, 12789, 117 ], "entity": [ "B-ORG", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9 ] }, { "tokens": [ "Durham", "8", "." ], "ids": [ 37499, 129, 119 ], "entity": [ "B-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9 ] }, { "tokens": [ "Third", "day" ], "ids": [ 16788, 11940 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "At", "Col", "##chester", ":", "Gloucestershire", "280", "and", "27", "-", "4", "." ], "ids": [ 11699, 24927, 38540, 131, 91183, 17859, 10111, 10365, 118, 125, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essex", "532", "-", "8" ], "ids": [ 33634, 50446, 118, 129 ], "entity": [ "B-ORG", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9 ] }, { "tokens": [ "declared", "(", "G", ".", "Go", "##och", "111", ",", "R", ".", "Iran", "##i", "91", ",", "P", ".", "Pri", "##chard", "88", ",", "D", ".", "Robinson", "72", ";" ], "ids": [ 25019, 113, 144, 119, 14439, 16908, 15821, 117, 155, 119, 12901, 10116, 12519, 117, 153, 119, 30797, 43013, 12074, 117, 141, 119, 13895, 12120, 132 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "M", ".", "Alley", "##ne", "4", "-", "80", ")", "." ], "ids": [ 150, 119, 90847, 10238, 125, 118, 10832, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Cardiff", ":", "Kent", "255", "-", "3", "(", "D", ".", "Fulton", "64", ",", "M", ".", "Walker", "59", ",", "C", ".", "Hooper" ], "ids": [ 11699, 39136, 131, 19393, 24024, 118, 124, 113, 141, 119, 80454, 11295, 117, 150, 119, 15432, 11867, 117, 140, 119, 40899 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 3, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8 ] }, { "tokens": [ "52", "not", "out", ")", "v", "G", "##lam", "##organ", "." ], "ids": [ 11525, 10472, 10950, 114, 190, 144, 21114, 100807, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "No", "play", "-", "rain", "." ], "ids": [ 10657, 12253, 118, 50939, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Leicester", ":", "Leicester", "##shire", "353", "(", "P", ".", "Simmons", "108", ",", "P", ".", "Nixon", "67", ";" ], "ids": [ 11699, 38789, 131, 38789, 19684, 35373, 113, 153, 119, 44190, 15845, 117, 153, 119, 36507, 12316, 132 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "S", ".", "Ren", "##shaw", "4", "-", "56", ",", "J", ".", "Bo", "##vil", "##l", "4", "-", "102", ")", "." ], "ids": [ 156, 119, 52712, 55584, 125, 118, 11628, 117, 147, 119, 27622, 21146, 10161, 125, 118, 14818, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hampshire", "81", "-", "7", "." ], "ids": [ 26036, 12324, 118, 128, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Northampton", ":", "Sussex", "389", "and", "112", "(", "C", ".", "Ambrose", "6", "-", "26", ")", "." ], "ids": [ 11699, 79445, 131, 38426, 40064, 10111, 16129, 113, 140, 119, 71167, 127, 118, 10314, 114, 119 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Northampton", "##shire", "361", "(", "K", ".", "Cu", "##rran", "117", ",", "D", ".", "Ripley", "66", "not", "out", ")", "and" ], "ids": [ 79445, 19684, 35737, 113, 148, 119, 34387, 89112, 16628, 117, 141, 119, 96855, 12215, 10472, 10950, 114, 10111 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "42", "-", "3", "." ], "ids": [ 11276, 118, 124, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "At", "Trent", "Bridge", ":", "Nottingham", "##shire", "446", "-", "9", "declared", "(", "G", ".", "Archer" ], "ids": [ 11699, 47528, 17426, 131, 43396, 19684, 40709, 118, 130, 25019, 113, 144, 119, 53446 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 5, 9, 3, 7, 9, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "143", ",", "M", ".", "Dow", "##man", "107", ",", "W", ".", "No", "##on", "57", ";", "B", ".", "Julian", "4", "-", "104", ")", "." ], "ids": [ 19510, 117, 150, 119, 106035, 10589, 15844, 117, 160, 119, 10657, 10263, 11817, 132, 139, 119, 23154, 125, 118, 15115, 114, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Surrey", "128", "-", "4" ], "ids": [ 42858, 16196, 118, 125 ], "entity": [ "B-ORG", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9 ] }, { "tokens": [ "(", "A", ".", "Brown", "56", "not", "out", ")", "." ], "ids": [ 113, 138, 119, 12623, 11628, 10472, 10950, 114, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Worcester", ":", "Warwick", "##shire", "310", "(", "A", ".", "Giles", "83", ",", "T", ".", "Mu", "##nton", "54", "not" ], "ids": [ 11699, 55518, 131, 48234, 19684, 23993, 113, 138, 119, 49355, 12408, 117, 157, 119, 49056, 39110, 11653, 10472 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "out", ",", "W", ".", "Khan", "52", ";", "R", ".", "Ill", "##ing", "##worth", "4", "-", "54", ",", "S", ".", "Lam", "##pit", "##t", "4", "-", "90", ")", "." ], "ids": [ 10950, 117, 160, 119, 16324, 11525, 132, 155, 119, 101288, 10230, 17929, 125, 118, 11653, 117, 156, 119, 44068, 25257, 10123, 125, 118, 10919, 114, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Worcester", "##shire", "205", "-", "9", "(", "K", ".", "Sp", "##irin", "##g", "52", ")", "." ], "ids": [ 55518, 19684, 20862, 118, 130, 113, 148, 119, 46361, 89080, 10240, 11525, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "At", "Head", "##ing", "##ley", ":", "Yorkshire", "529", "-", "8", "declared", "(", "C", ".", "White", "181", "," ], "ids": [ 11699, 16830, 10230, 12105, 131, 27577, 49102, 118, 129, 25019, 113, 140, 119, 12136, 22534, 117 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 3, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "R", ".", "Blake", "##y", "109", "not", "out", ",", "M", ".", "Mo", "##xon", "66", ",", "M", ".", "Vaughan", "57", ")", "." ], "ids": [ 155, 119, 24321, 10157, 16296, 10472, 10950, 117, 150, 119, 34987, 55251, 12215, 117, 150, 119, 54864, 11817, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Lancashire", "323" ], "ids": [ 48487, 28550 ], "entity": [ "B-ORG", "O" ], "entity_ids": [ 3, 9 ] }, { "tokens": [ "(", "N", ".", "Fair", "##bro", "##ther", "86", ",", "M", ".", "Watkins", "##on", "64", ";", "D", ".", "Go", "##ugh", "4", "-", "53", ")", "and", "210", "-", "5" ], "ids": [ 113, 151, 119, 25697, 20923, 22623, 12224, 117, 150, 119, 74430, 10263, 11295, 132, 141, 119, 14439, 25905, 125, 118, 11756, 114, 10111, 17131, 118, 126 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "N", ".", "Speak", "65", "not", "out", ",", "N", ".", "Fair", "##bro", "##ther", "55", ")", "." ], "ids": [ 113, 151, 119, 104326, 10843, 10472, 10950, 117, 151, 119, 25697, 20923, 22623, 11358, 114, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SC", "##OT", "##TI", "##SH", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 18137, 62146, 72286, 64091, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GL", "##AS", "##GO", "##W", "1996", "-", "08", "-", "24" ], "ids": [ 108755, 38025, 83821, 13034, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Scottish", "league", "soccer" ], "ids": [ 33036, 10108, 18879, 15616, 41356 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "on", "Saturday", ":" ], "ids": [ 18258, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Premier", "division" ], "ids": [ 14717, 13751 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Hi", "##bern", "##ian", "0", "Du", "##n", "##fer", "##mli", "##ne", "0" ], "ids": [ 20065, 74158, 11630, 121, 14925, 10115, 14854, 98373, 10238, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Ki", "##lma", "##rno", "##ck", "1", "Celtic", "3" ], "ids": [ 28941, 23303, 22611, 11263, 122, 30948, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Rai", "##th", "0", "Mother", "##well", "3" ], "ids": [ 31249, 11143, 121, 23625, 15862, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Rangers", "1", "Dundee", "United", "0" ], "ids": [ 23042, 122, 60426, 10609, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Playing", "Sunday", ":" ], "ids": [ 75726, 19731, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Aberdeen", "v", "Hearts" ], "ids": [ 49317, 190, 33385 ], "entity": [ "B-ORG", "O", "B-ORG" ], "entity_ids": [ 3, 9, 3 ] }, { "tokens": [ "Division", "one" ], "ids": [ 11987, 10464 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Air", "##dri", "##eon", "##ians", "0", "East", "Fi", "##fe", "0" ], "ids": [ 11704, 40230, 27572, 34615, 121, 11830, 36448, 14601, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Clyde", "##bank", "1", "Stirling", "0" ], "ids": [ 45826, 20583, 122, 60442, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Dundee", "2", "Green", "##ock", "Morton", "1" ], "ids": [ 60426, 123, 13068, 21863, 38429, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Falk", "##ir", "##k", "1", "Parti", "##ck", "0" ], "ids": [ 88285, 10835, 10174, 122, 19644, 11263, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "St", "Mir", "##ren", "0", "St", "Johnston", "##e", "3" ], "ids": [ 10838, 43209, 10969, 121, 10838, 31844, 10112, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Division", "two" ], "ids": [ 11987, 10551 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Be", "##r", "##wick", "0", "Sten", "##house", "##mui", "##r", "6" ], "ids": [ 14321, 10129, 24820, 121, 98777, 15562, 102406, 10129, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Br", "##ech", "##in", "1", "Ay", "##r", "1" ], "ids": [ 38508, 16200, 10245, 122, 77603, 10129, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Hamilton", "2", "Clyde", "0" ], "ids": [ 15846, 123, 45826, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Queen", "of", "the", "South", "2", "Dum", "##bart", "##on", "1" ], "ids": [ 13704, 10108, 10105, 11056, 123, 94566, 35758, 10263, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "St", "##ran", "##rae", "##r", "1", "Livingston", "2" ], "ids": [ 10838, 12111, 73803, 10129, 122, 59827, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Division", "three" ], "ids": [ 11987, 11003 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "All", "##oa", "1", "Ar", "##bro", "##ath", "1" ], "ids": [ 11101, 14783, 122, 18484, 20923, 44196, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Co", "##wde", "##n", "##beat", "##h", "1", "Mons", "##tros", "##e", "0" ], "ids": [ 13098, 87977, 10115, 68939, 10237, 122, 37870, 34715, 10112, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "For", "##far", "3", "In", "##vern", "##ess", "1" ], "ids": [ 11399, 29731, 124, 10167, 38937, 22094, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Ross", "County", "1", "Queen", "'", "s", "Park", "2" ], "ids": [ 16690, 10886, 122, 13704, 112, 187, 11239, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Play", "##ed", "Friday", ":" ], "ids": [ 17712, 10336, 30767, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "East", "Stirling", "0", "Albion", "1" ], "ids": [ 11830, 60442, 121, 56878, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "O", "##UT", "-", "OF", "-", "SO", "##RT", "##S", "NE", "##WC", "##AS", "##T", "##LE", "CR", "##AS", "##H", "2", "-", "1", "AT", "H", "##OM", "##E", "." ], "ids": [ 71020, 65622, 24093, 118, 152, 65729, 118, 23240, 118, 71020, 46935, 10731, 86607, 80539, 38025, 11090, 51036, 44912, 38025, 12396, 123, 118, 122, 30554, 145, 37079, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Newcastle", "'", "s", "early", "season", "teeth", "##ing", "problems", "continued", "on", "Saturday", "when", "they", "lost", "2", "-", "1", "at", "home", "to", "premier", "league", "pace", "##sette", "##rs", "Sheffield", "Wednesday", "." ], "ids": [ 28060, 112, 187, 11732, 11226, 75839, 10230, 20390, 14278, 10135, 24848, 10841, 10689, 14172, 123, 118, 122, 10160, 11816, 10114, 11913, 15616, 32547, 64324, 10943, 31695, 57611, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "England", "striker", "Alan", "Shea", "##rer", "gave", "Kevin", "Ke", "##egan", "'", "s", "talent", "-", "lade", "##n", "side", "the", "lead", "from", "the", "penalty", "spot", "after", "13", "minutes", "after", "Wednesday", "'", "s", "Yugoslav", "De", "##jan", "Stefano", "##vic", "pulled", "down", "Colombia", "##n", "forward", "Faust", "##ino", "As", "##pri", "##lla", "." ], "ids": [ 11701, 103325, 14309, 91399, 13532, 15362, 15377, 47124, 73264, 112, 187, 27411, 118, 110045, 10115, 12250, 10105, 14107, 10188, 10105, 40924, 28504, 10662, 10249, 15304, 10662, 57611, 112, 187, 93444, 10190, 14376, 26381, 48175, 65884, 12935, 15223, 10115, 23307, 48730, 12349, 10882, 101319, 11083, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 2, 6, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "But", "two", "minutes", "later", "Wednesday", "equal", "##ised", "through", "Peter", "At", "##hert", "##on", ",", "who", "found", "space", "in", "the", "penalty", "area", "to", "meet", "Mark", "Pe", "##mb", "##ridge", "'", "s", "free", "kick", "with", "a", "precise", "g", "##lan", "##cing", "head", "##er", "." ], "ids": [ 16976, 10551, 15304, 10873, 57611, 32943, 20666, 11222, 10979, 11699, 102855, 10263, 117, 10479, 11823, 16199, 10106, 10105, 40924, 11168, 10114, 23267, 11997, 29005, 27012, 40788, 112, 187, 13961, 55321, 10169, 169, 89165, 175, 12055, 19113, 13578, 10165, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Guy", "W", "##hit", "##ting", "##ham", "sto", "##le", "three", "points", "for", "the", "Yorkshire", "side", "with", "a", "goal", "10", "minutes", "from", "time", "." ], "ids": [ 16358, 160, 40762, 12141, 13196, 47264, 10284, 11003, 12789, 10142, 10105, 27577, 12250, 10169, 169, 16586, 10150, 15304, 10188, 10635, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "add", "to", "Newcastle", "'", "s", "mise", "##ry", ",", "England", "striker", "Les", "Ferdinand", "was", "stretch", "##ered", "off", "in", "the", "second", "half", "." ], "ids": [ 11469, 42852, 10114, 28060, 112, 187, 15858, 10908, 117, 11701, 103325, 10468, 15927, 10134, 85690, 45452, 11898, 10106, 10105, 11132, 13877, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wednesday", ",", "who", "escaped", "relegation", "on", "the", "final", "day", "of", "last", "season", ",", "have", "now", "won", "their", "first", "three", "games", "of", "the", "season", "." ], "ids": [ 57611, 117, 10479, 65602, 81204, 10135, 10105, 11070, 11940, 10108, 12469, 11226, 117, 10529, 11858, 11367, 10455, 10422, 11003, 13332, 10108, 10105, 11226, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Else", "##where", ",", "title", "hope", "##ful", "##s", "Liverpool", "were", "held", "0", "-", "0", "at", "home", "by", "newly", "-", "promoted", "Sunderland", ",", "and", "in", "London", ",", "the", "tie", "between", "Tottenham", "Hotspur", "and", "Everton", "also", "ended", "goal", "##ess", "." ], "ids": [ 68006, 30935, 117, 12887, 50725, 14446, 10107, 18376, 10309, 11991, 121, 118, 121, 10160, 11816, 10155, 26574, 118, 22312, 60269, 117, 10111, 10106, 10829, 117, 10105, 27916, 10948, 53092, 87381, 10111, 57936, 10379, 18428, 16586, 22094, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 1, 9, 9, 9, 9, 3, 7, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "##man", "Frank", "Le", "##B", "##oe", "##uf", "and", "Italian", "Gian", "##luca", "Via", "##lli", "scored", "their", "first", "premier", "league", "goals", "as", "Chelsea", "beat", "Coventry", "2", "-", "0", ",", "and", "manager", "##less", "Arsenal", "won", "by", "the", "same", "score", "##line", "at", "Leicester", "." ], "ids": [ 11894, 10589, 11872, 10281, 11274, 20085, 21598, 10111, 11667, 57243, 99839, 21280, 14088, 17233, 10455, 10422, 11913, 15616, 18173, 10146, 21450, 27868, 58183, 123, 118, 121, 117, 10111, 16935, 14985, 25587, 11367, 10155, 10105, 11561, 17704, 12953, 10160, 38789, 119 ], "entity": [ "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 6, 4, 8, 8, 8, 8, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 3, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Last", "season", "'", "s", "league", "and", "Cup", "winners", "Manchester", "United", "host", "1995", "champions", "Blackburn", "on", "Sunday", "." ], "ids": [ 14812, 11226, 112, 187, 15616, 10111, 11544, 33525, 15349, 10609, 19317, 10436, 27745, 46006, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 3, 7, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "English", "league", "soccer" ], "ids": [ 33036, 10108, 11616, 15616, 41356 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "on", "Saturday", ":" ], "ids": [ 18258, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Premier", "league" ], "ids": [ 14717, 15616 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Aston", "Villa", "2", "Derby", "0" ], "ids": [ 40757, 13875, 123, 24703, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Chelsea", "2", "Coventry", "0" ], "ids": [ 21450, 123, 58183, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Leicester", "0", "Arsenal", "2" ], "ids": [ 38789, 121, 25587, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Liverpool", "0", "Sunderland", "0" ], "ids": [ 18376, 121, 60269, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Newcastle", "1", "Sheffield", "Wednesday", "2" ], "ids": [ 28060, 122, 31695, 57611, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Nottingham", "Forest", "1", "Middlesbrough", "1" ], "ids": [ 43396, 17666, 122, 105141, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Tottenham", "0", "Everton", "0" ], "ids": [ 53092, 121, 57936, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "West", "Ham", "2", "Southampton", "1" ], "ids": [ 11164, 39135, 123, 45113, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Playing", "Sunday", ":" ], "ids": [ 75726, 19731, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Manchester", "United", "v", "Blackburn" ], "ids": [ 15349, 10609, 190, 46006 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG" ], "entity_ids": [ 3, 7, 9, 3 ] }, { "tokens": [ "Playing", "Monday", ":" ], "ids": [ 75726, 40714, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Leeds", "v", "Wimbledon" ], "ids": [ 28654, 190, 37932 ], "entity": [ "B-ORG", "O", "B-ORG" ], "entity_ids": [ 3, 9, 3 ] }, { "tokens": [ "Division", "one" ], "ids": [ 11987, 10464 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Bolton", "3", "Norwich", "1" ], "ids": [ 34462, 124, 51816, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Charlton", "1", "West", "Bro", "##m", "##wich", "1" ], "ids": [ 68730, 122, 11164, 32470, 10147, 33544, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Crystal", "Palace", "3", "Oldham", "1" ], "ids": [ 28459, 22015, 124, 109860, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Ipswich", "5", "Reading", "2" ], "ids": [ 86146, 126, 10629, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Oxford", "5", "South", "##end", "0" ], "ids": [ 11109, 126, 11056, 19342, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Sheffield", "United", "4", "Birmingham", "4" ], "ids": [ 31695, 10609, 125, 22712, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Stoke", "2", "Manchester", "City", "1" ], "ids": [ 60824, 123, 15349, 10773, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "S", "##wind", "##on", "1", "Port", "Vale", "1" ], "ids": [ 156, 47673, 10263, 122, 14734, 32286, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Wolverhampton", "1", "Bradford", "0" ], "ids": [ 98739, 122, 40141, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Play", "##ed", "Friday", ":" ], "ids": [ 17712, 10336, 30767, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Portsmouth", "1", "Queen", "'", "s", "Park", "Rangers", "2" ], "ids": [ 46933, 122, 13704, 112, 187, 11239, 23042, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Tra", "##n", "##mere", "3", "G", "##rim", "##sby", "2" ], "ids": [ 21469, 10115, 32732, 124, 144, 23760, 38243, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Playing", "Sunday", ":" ], "ids": [ 75726, 19731, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Barn", "##sley", "v", "Hu", "##dder", "##sfield" ], "ids": [ 61802, 28428, 190, 43707, 42113, 53495 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 9, 3, 7, 7 ] }, { "tokens": [ "Division", "two" ], "ids": [ 11987, 10551 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Brent", "##ford", "3", "Lu", "##ton", "2" ], "ids": [ 56333, 13387, 124, 23859, 11183, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Bristol", "City", "v", "Blackpool", "late", "kick", "##off" ], "ids": [ 24732, 10773, 190, 102917, 13002, 55321, 20584 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 9, 9, 9 ] }, { "tokens": [ "Burn", "##ley", "2", "W", "##als", "##all", "1" ], "ids": [ 49331, 12105, 123, 160, 20162, 18995, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Chester", "##field", "1", "Bury", "2" ], "ids": [ 32729, 13408, 122, 84780, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Peterborough", "2", "Crew", "##e", "2" ], "ids": [ 104232, 123, 45170, 10112, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Preston", "0", "Bristol", "Rovers", "0" ], "ids": [ 35119, 121, 24732, 44311, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Roth", "##er", "##ham", "1", "Shrewsbury", "2" ], "ids": [ 32925, 10165, 13196, 122, 109224, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Stock", "##port", "0", "Not", "##ts", "County", "0" ], "ids": [ 31916, 15520, 121, 16040, 10806, 10886, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Wat", "##ford", "0", "Mill", "##wall", "2" ], "ids": [ 51082, 13387, 121, 28639, 33743, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "W", "##re", "##x", "##ham", "4", "Plymouth", "4" ], "ids": [ 160, 10246, 10686, 13196, 125, 40814, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "W", "##y", "##combe", "1", "Gill", "##ingham", "1" ], "ids": [ 160, 10157, 87041, 122, 33787, 57076, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "York", "1", "Bourne", "##mouth", "2" ], "ids": [ 10482, 122, 80776, 56873, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Division", "three" ], "ids": [ 11987, 11003 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Barn", "##et", "1", "Wigan", "1" ], "ids": [ 61802, 10308, 122, 85593, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Cardiff", "1", "Brighton", "0" ], "ids": [ 39136, 122, 44142, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Carlisle", "0", "Hull", "0" ], "ids": [ 65204, 121, 37465, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Chester", "1", "Cambridge", "1" ], "ids": [ 32729, 122, 11697, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Darling", "##ton", "4", "Swansea", "1" ], "ids": [ 59597, 11183, 125, 73425, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Exeter", "2", "Sc", "##ar", "##borough", "2" ], "ids": [ 61436, 123, 55260, 10354, 33057, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Hart", "##le", "##pool", "2", "Fulham", "1" ], "ids": [ 22346, 10284, 61571, 123, 84725, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Here", "##ford", "1", "Don", "##caster", "0" ], "ids": [ 18249, 13387, 122, 11740, 74934, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Lincoln", "1", "Ley", "##ton", "Orient", "1" ], "ids": [ 16944, 122, 34121, 11183, 26743, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Northampton", "3", "Mansfield", "0" ], "ids": [ 79445, 124, 73416, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Roc", "##hda", "##le", "0", "Col", "##chester", "0" ], "ids": [ 90273, 109788, 10284, 121, 24927, 38540, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Sc", "##unt", "##hor", "##pe", "1", "Tor", "##qua", "##y", "0" ], "ids": [ 55260, 20631, 39854, 11355, 122, 24446, 32973, 10157, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Ad", "##d", "Division", "two" ], "ids": [ 25474, 10162, 11987, 10551 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Bristol", "City", "0", "Blackpool", "1" ], "ids": [ 24732, 10773, 121, 102917, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "PA", "##KI", "##ST", "##AN", "318", "-", "2", "V", "EN", "##GL", "##AN", "##D", "-", "-", "L", "##UN", "##CH", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 32349, 59879, 32995, 41275, 30670, 118, 123, 159, 31278, 104780, 41275, 11490, 118, 118, 149, 69849, 86448, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "were", "318", "for", "two", "at", "lu", "##nch", "on", "the", "third", "day", "of", "the", "third", "and", "final", "test", "at", "The", "Oval", "on", "Saturday", "in", "rep", "##ly", "to", "England", "'", "s", "326", "all", "out", "." ], "ids": [ 15437, 10309, 30670, 10142, 10551, 10160, 14657, 31215, 10135, 10105, 12628, 11940, 10108, 10105, 12628, 10111, 11070, 15839, 10160, 10117, 98765, 10135, 24848, 10106, 76456, 10454, 10114, 11701, 112, 187, 32558, 10435, 10950, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", ":", "England", "326", "(", "J", ".", "C", "##ra", "##wley", "106", ",", "G", ".", "Thorpe", "54", "." ], "ids": [ 66875, 131, 11701, 32558, 113, 147, 119, 140, 10288, 62381, 16084, 117, 144, 119, 84855, 11653, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "W", "##aq", "##ar", "You", "##nis", "4", "-", "95", ")", "." ], "ids": [ 160, 49277, 10354, 11065, 12597, 125, 118, 11978, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "318", "-", "2", "(", "Sa", "##eed", "Anwar", "169", "not", "out", ",", "I", "##ja", "##z", "Ahmed", "61", ")", "." ], "ids": [ 15437, 30670, 118, 123, 113, 12404, 40154, 92168, 22083, 10472, 10950, 117, 146, 10320, 10305, 25530, 12314, 114, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "CAN", "##AD", "##IA", "##N", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 98038, 55538, 35976, 11537, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "23" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the", "Canadian", "Open" ], "ids": [ 33036, 10188, 10105, 14023, 11919 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 2, 6 ] }, { "tokens": [ "tennis", "tournament", "on", "Friday", "(", "pre", "##fix", "numbers", "den", "##otes", "seed", "##ings", ")", ":" ], "ids": [ 20944, 17390, 10135, 30767, 113, 12229, 57014, 20953, 10140, 54989, 49282, 18800, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Quarter", "##finals" ], "ids": [ 75820, 47791 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "3", "-", "Wayne", "Ferreira", "(", "South", "Africa", ")", "beat", "5", "-", "Thomas", "En", "##qvist" ], "ids": [ 124, 118, 18547, 39227, 113, 11056, 12880, 114, 27868, 126, 118, 11096, 10243, 47780 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Sweden", ")", "7", "-", "5", "6", "-", "2" ], "ids": [ 113, 20937, 114, 128, 118, 126, 127, 118, 123 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Marcelo", "Rio", "##s", "(", "Chile", ")", "beat", "Patrick", "Ra", "##fter", "(", "Australia", ")", "0", "-", "6" ], "ids": [ 125, 118, 38165, 12109, 10107, 113, 13218, 114, 27868, 13867, 38571, 33163, 113, 11729, 114, 121, 118, 127 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "1" ], "ids": [ 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "Todd", "Martin", "(", "U", ".", "S", ".", ")", "beat", "Alex", "O", "'", "Brien", "(", "U", ".", "S", ".", ")", "6", "-", "4", "6", "-", "4" ], "ids": [ 128, 118, 24708, 11235, 113, 158, 119, 156, 119, 114, 27868, 14728, 152, 112, 33629, 113, 158, 119, 156, 119, 114, 127, 118, 125, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Todd", "Wood", "##bridge", "(", "Australia", ")", "beat", "Mark", "Philipp", "##ous", "##sis" ], "ids": [ 24708, 18315, 29273, 113, 11729, 114, 27868, 11997, 23293, 13499, 13109 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "Australia", ")", "7", "-", "5", "6", "-", "4" ], "ids": [ 113, 11729, 114, 128, 118, 126, 127, 118, 125 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "UN", "##ION", "-", "NE", "##W", "Z", "##EA", "##LA", "##ND", "W", "##IN", "F", "##IR", "##ST", "SE", "##RI", "##ES", "IN", "SO", "##UT", "##H", "AF", "##RI", "##CA", "." ], "ids": [ 155, 12022, 32469, 14703, 26578, 52980, 118, 86607, 13034, 163, 36789, 44376, 58521, 160, 27128, 143, 73522, 32995, 23056, 46876, 25054, 36351, 71020, 65729, 12396, 55640, 46876, 46900, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9 ] }, { "tokens": [ "PR", "##ET", "##OR", "##IA", ",", "South", "Africa", "1996", "-", "08", "-", "24" ], "ids": [ 23837, 52338, 42622, 35976, 117, 11056, 12880, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "Zealand", "made", "history", "on", "Saturday", "when", "they", "completed", "their", "first", "series", "victory", "in", "South", "Africa", "with", "a", "33", "-", "26", "victory", "in", "the", "second", "test", "." ], "ids": [ 10287, 14451, 11019, 11486, 10135, 24848, 10841, 10689, 15782, 10455, 10422, 11366, 19735, 10106, 11056, 12880, 10169, 169, 11000, 118, 10314, 19735, 10106, 10105, 11132, 15839, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "win", "gave", "the", "All", "Blacks", "an", "un", "##beat", "##able", "2", "-", "0", "lead", "in", "the", "three", "-", "test", "series", "." ], "ids": [ 10117, 14125, 15362, 10105, 11101, 107375, 10151, 10119, 68939, 13096, 123, 118, 121, 14107, 10106, 10105, 11003, 118, 15839, 11366, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Each", "side", "scored", "three", "tries", "and", "the", "Spring", "##bok", "##s", "out", "##sco", "##red", "the", "All", "Blacks", "15", "-", "12", "in", "the", "second", "half", "but", "still", "suffered", "a", "fourth", "successive", "defeat", "against", "their", "old", "enemies", "." ], "ids": [ 23223, 12250, 17233, 11003, 38106, 10111, 10105, 18698, 30980, 10107, 10950, 22402, 15711, 10105, 11101, 107375, 10208, 118, 10186, 10106, 10105, 11132, 13877, 10473, 12647, 26090, 169, 16918, 47525, 24800, 11327, 10455, 12898, 63011, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "tries", "from", "wing", "Jeff", "Wilson", "in", "the", "first", "quarter", "gave", "New", "Zealand", "a", "24", "-", "11", "lead", "before", "tries", "from", "fl", "##anke", "##r", "Ruben", "Kruger", "and", "s", "##c", "##rum", "-", "half", "Jo", "##ost", "van", "der", "West", "##huizen", "in", "the", "space", "of", "two", "minutes", "narrow", "##ed", "the", "gap", "to", "a", "single", "point", "at", "23", "-", "24", "." ], "ids": [ 13214, 38106, 10188, 22571, 17218, 13083, 10106, 10105, 10422, 28330, 15362, 10287, 14451, 169, 10233, 118, 10193, 14107, 11360, 38106, 10188, 58768, 62428, 10129, 79665, 96234, 10111, 187, 10350, 12659, 118, 13877, 20977, 18239, 10145, 10118, 11164, 91504, 10106, 10105, 16199, 10108, 10551, 15304, 41444, 10336, 10105, 55995, 10114, 169, 11376, 12331, 10160, 10328, 118, 10233, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Spring", "##bok", "##s", "would", "have", "gone", "ahead", "had", "not", "fly", "-", "half", "Joel", "St", "##rans", "##ky", "'", "s", "conversion", "hit", "an", "up", "##right", "and", "New", "Zealand", "only", "s", "##cra", "##mble", "##d", "to", "safety", "through", "a", "fine", "penalty", "from", "replacement", "fly", "-", "half", "Jon", "Preston", "and", "a", "drop", "goal", "by", "number", "eight", "Zi", "##nza", "##n", "Brooke", "." ], "ids": [ 10117, 18698, 30980, 10107, 10894, 10529, 45041, 35629, 10374, 10472, 26155, 118, 13877, 24468, 10838, 82171, 11445, 112, 187, 45109, 14946, 10151, 10741, 33661, 10111, 10287, 14451, 10893, 187, 40333, 48272, 10162, 10114, 27116, 11222, 169, 13435, 40924, 10188, 41636, 26155, 118, 13877, 17749, 35119, 10111, 169, 36365, 16586, 10155, 11487, 16222, 99890, 13371, 10115, 46456, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "UN", "##ION", "-", "NE", "##W", "Z", "##EA", "##LA", "##ND", "DE", "##F", "##EA", "##T", "SO", "##UT", "##H", "AF", "##RI", "##CA", "33", "-", "26", "." ], "ids": [ 155, 12022, 32469, 14703, 26578, 52980, 118, 86607, 13034, 163, 36789, 44376, 58521, 25067, 11565, 36789, 11090, 71020, 65729, 12396, 55640, 46876, 46900, 11000, 118, 10314, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ET", "##OR", "##IA", ",", "South", "Africa", "1996", "-", "08", "-", "24" ], "ids": [ 23837, 52338, 42622, 35976, 117, 11056, 12880, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "Zealand", "beat", "South", "Africa", "33", "-", "26", "(", "half", "##time", "21", "-", "11", ")", "in", "the", "second", "test", "on", "Saturday", "." ], "ids": [ 10287, 14451, 27868, 11056, 12880, 11000, 118, 10314, 113, 13877, 18086, 10296, 118, 10193, 114, 10106, 10105, 11132, 15839, 10135, 24848, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "South", "Africa", "-", "Tri", "##es", ":", "Hannes", "St", "##ry", "##dom", ",", "Ruben", "Kruger", ",", "Jo", "##ost", "van", "der", "West", "##huizen", "." ], "ids": [ 11056, 12880, 118, 36642, 10171, 131, 90474, 10838, 10908, 15561, 117, 79665, 96234, 117, 20977, 18239, 10145, 10118, 11164, 91504, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Penal", "##ties", ":", "Joel", "St", "##ran", "##ks", "##y", "(", "3", ")", "." ], "ids": [ 104976, 14197, 131, 24468, 10838, 12111, 11676, 10157, 113, 124, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##version", ":", "St", "##ran", "##ks", "##y", "." ], "ids": [ 12845, 44404, 131, 10838, 12111, 11676, 10157, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "New", "Zealand", "-", "Tri", "##es", ":", "Jeff", "Wilson", "(", "2", ")", ",", "Zi", "##nza", "##n", "Brooke", "." ], "ids": [ 10287, 14451, 118, 36642, 10171, 131, 17218, 13083, 113, 123, 114, 117, 99890, 13371, 10115, 46456, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Penal", "##ties", ":", "Simon", "Cu", "##lha", "##ne", ",", "Jon", "Preston", "(", "2", ")", "." ], "ids": [ 104976, 14197, 131, 12237, 34387, 42182, 10238, 117, 17749, 35119, 113, 123, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##version", "##s", ":", "Cu", "##lha", "##ne", "(", "3", ")", "." ], "ids": [ 12845, 44404, 10107, 131, 34387, 42182, 10238, 113, 124, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Drop", "goal", ":", "Zi", "##nza", "##n", "Brooke", "." ], "ids": [ 69661, 16586, 131, 99890, 13371, 10115, 46456, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "New", "Zealand", "lead", "the", "three", "-", "test", "series", "2", "-", "0", "." ], "ids": [ 10287, 14451, 14107, 10105, 11003, 118, 15839, 11366, 123, 118, 121, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "Y", "##U", "##GO", "##SL", "##AV", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 162, 12022, 83821, 51960, 99903, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "24" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Yugoslav", "league" ], "ids": [ 33036, 10108, 93444, 15616 ], "entity": [ "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 2, 9 ] }, { "tokens": [ "soccer", "matches", "played", "on", "Saturday", ":" ], "ids": [ 41356, 18258, 11553, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Division", "A" ], "ids": [ 11987, 138 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Cu", "##kari", "##cki", "0", "Hajdu", "##k", "2" ], "ids": [ 34387, 40028, 18768, 121, 64934, 10174, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Be", "##cej", "2", "Bora", "##c", "0" ], "ids": [ 14321, 35950, 123, 98164, 10350, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "M", "##lados", "##t", "(", "L", ")", "0", "Ze", "##mun", "0" ], "ids": [ 150, 79095, 10123, 113, 149, 114, 121, 15536, 34326, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Rad", "1", "Bud", "##uc", "##nost", "(", "P", ")", "0" ], "ids": [ 71204, 122, 63623, 43805, 14462, 113, 153, 114, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Be", "##cej", "3", "2", "1", "0", "5", "1", "7" ], "ids": [ 14321, 35950, 124, 123, 122, 121, 126, 122, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Partizan", "2", "2", "0", "0", "6", "2", "6" ], "ids": [ 93130, 123, 123, 121, 121, 127, 123, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vo", "##j", "##vodi", "##na", "2", "2", "0", "0", "4", "1", "6" ], "ids": [ 59482, 10418, 45523, 10219, 123, 123, 121, 121, 125, 122, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Red", "Star", "2", "2", "0", "0", "3", "1", "6" ], "ids": [ 11641, 11836, 123, 123, 121, 121, 124, 122, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M", "##lados", "##t", "(", "L", ")", "3", "1", "1", "1", "6", "4", "4" ], "ids": [ 150, 79095, 10123, 113, 149, 114, 124, 122, 122, 122, 127, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rad", "3", "1", "1", "1", "2", "2", "4" ], "ids": [ 71204, 124, 122, 122, 122, 123, 123, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hajdu", "##k", "3", "1", "0", "2", "3", "3", "3" ], "ids": [ 64934, 10174, 124, 122, 121, 123, 124, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cu", "##kari", "##cki", "3", "1", "0", "2", "5", "6", "3" ], "ids": [ 34387, 40028, 18768, 124, 122, 121, 123, 126, 127, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bud", "##uc", "##nost", "3", "1", "0", "2", "3", "5", "3" ], "ids": [ 63623, 43805, 14462, 124, 122, 121, 123, 124, 126, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ze", "##mun", "3", "0", "2", "1", "2", "3", "2" ], "ids": [ 15536, 34326, 124, 121, 123, 122, 123, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "##lete", "##r", "2", "0", "1", "1", "1", "4", "1" ], "ids": [ 14021, 46192, 10129, 123, 121, 122, 122, 122, 125, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bora", "##c", "3", "0", "0", "3", "0", "8", "0" ], "ids": [ 98164, 10350, 124, 121, 121, 124, 121, 129, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Division", "B" ], "ids": [ 11987, 139 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Su", "##tjes", "##ka", "3", "S", "##lob", "##oda", "2" ], "ids": [ 12271, 55119, 10371, 124, 156, 79775, 18220, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Lo", "##zni", "##ca", "0", "Ob", "##ili", "##c", "1" ], "ids": [ 13069, 23613, 10425, 121, 43019, 13784, 10350, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "OF", "##K", "Ki", "##kind", "##a", "1", "Rad", "##nick", "##i", "(", "N", ")", "0" ], "ids": [ 23240, 11733, 28941, 62891, 10113, 122, 71204, 71609, 10116, 113, 151, 114, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Spartak", "1", "Bud", "##uc", "##nost", "(", "V", ")", "2" ], "ids": [ 59281, 122, 63623, 43805, 14462, 113, 159, 114, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "OF", "##K", "Beograd", "2", "M", "##lados", "##t", "(", "B", "##J", ")", "2" ], "ids": [ 23240, 11733, 26620, 123, 150, 79095, 10123, 113, 139, 15417, 114, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", ":" ], "ids": [ 58592, 10107, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Ob", "##ili", "##c", "3", "3", "0", "0", "8", "1", "9" ], "ids": [ 43019, 13784, 10350, 124, 124, 121, 121, 129, 122, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lo", "##zni", "##ca", "3", "2", "0", "1", "7", "3", "6" ], "ids": [ 13069, 23613, 10425, 124, 123, 121, 122, 128, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##tjes", "##ka", "3", "2", "0", "1", "6", "3", "6" ], "ids": [ 12271, 55119, 10371, 124, 123, 121, 122, 127, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OF", "##K", "Ki", "##kind", "##a", "3", "2", "0", "1", "4", "1", "6" ], "ids": [ 23240, 11733, 28941, 62891, 10113, 124, 123, 121, 122, 125, 122, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bud", "##uc", "##nost", "(", "V", ")", "3", "2", "0", "1", "4", "3", "6" ], "ids": [ 63623, 43805, 14462, 113, 159, 114, 124, 123, 121, 122, 125, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spartak", "3", "1", "1", "1", "3", "3", "4" ], "ids": [ 59281, 124, 122, 122, 122, 124, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ze", "##lez", "##nik", "2", "1", "0", "1", "4", "4", "3" ], "ids": [ 15536, 76969, 12027, 123, 122, 121, 122, 125, 125, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OF", "##K", "Beograd", "3", "0", "3", "1", "4", "4", "3" ], "ids": [ 23240, 11733, 26620, 124, 121, 124, 122, 125, 125, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rad", "##nick", "##i", "3", "1", "0", "2", "5", "6", "3" ], "ids": [ 71204, 71609, 10116, 124, 122, 121, 123, 126, 127, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##lob", "##oda", "3", "0", "1", "2", "4", "8", "1" ], "ids": [ 156, 79775, 18220, 124, 121, 122, 123, 125, 129, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M", "##lados", "##t", "(", "B", "##J", ")", "3", "0", "1", "2", "2", "6", "1" ], "ids": [ 150, 79095, 10123, 113, 139, 15417, 114, 124, 121, 122, 123, 123, 127, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##uda", "##r", "2", "0", "0", "2", "0", "6", "0" ], "ids": [ 155, 18497, 10129, 123, 121, 121, 123, 121, 127, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "P", "##OL", "##IS", "##H", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 153, 39272, 19088, 12396, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AR", "##SA", "##W", "1996", "-", "08", "-", "24" ], "ids": [ 160, 52188, 27138, 13034, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Polish", "first", "division" ], "ids": [ 33036, 10108, 19870, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "matches", "on", "Saturday", ":" ], "ids": [ 41356, 18258, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ami", "##ca", "W", "##ron", "##ki", "3", "Hut", "##nik", "Kr", "##ako", "##w", "0" ], "ids": [ 80157, 10425, 160, 11620, 10506, 124, 104185, 12027, 17640, 20293, 10874, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Sokol", "Ty", "##chy", "5", "Lech", "Po", "##zna", "##n", "3" ], "ids": [ 104869, 64515, 27199, 126, 66161, 11255, 24710, 10115, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Ra", "##kow", "C", "##zes", "##to", "##chow", "##a", "1", "St", "##omi", "##l", "Ol", "##szt", "##yn", "4" ], "ids": [ 38571, 72275, 140, 19579, 10340, 105962, 10113, 122, 10838, 32013, 10161, 60160, 57719, 13379, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Wi", "##sla", "Kr", "##ako", "##w", "1", "Go", "##rnik", "Za", "##br", "##ze", "0" ], "ids": [ 52742, 61432, 17640, 20293, 10874, 122, 14439, 83247, 14074, 36867, 10870, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "S", "##las", "##k", "W", "##roc", "##law", "3", "Od", "##ra", "Wo", "##dzi", "##sla", "##w", "1" ], "ids": [ 156, 13983, 10174, 160, 87015, 37811, 124, 11936, 10288, 102204, 45637, 61432, 10874, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "G", "##KS", "Katowice", "1", "Polonia", "Warsaw", "0" ], "ids": [ 144, 62828, 75494, 122, 21915, 43669, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Za", "##gle", "##bie", "Lu", "##bin", "2", "L", "##KS", "Lo", "##dz", "1" ], "ids": [ 14074, 23239, 18545, 23859, 16473, 123, 149, 62828, 13069, 59880, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Le", "##gia", "Warsaw", "3", "G", "##KS", "Bel", "##chat", "##ow", "2" ], "ids": [ 10281, 15414, 43669, 124, 144, 62828, 47197, 73267, 16602, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "BA", "##S", "##K", "##ET", "##BA", "##LL", "-", "P", "##HI", "##L", "##IP", "##P", "##INE", "PR", "##O", "-", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 39999, 10731, 11733, 52338, 35999, 82834, 118, 153, 108880, 11369, 30331, 11127, 83198, 23837, 11403, 118, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##IL", "##A", "1996", "-", "08", "-", "24" ], "ids": [ 73020, 38850, 10738, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "semi", "-", "final", "round", "games", "on", "Friday", "in", "the", "Philippine", "Basketball", "Association", "second", "conference", ",", "which", "includes", "American", "players", ":" ], "ids": [ 33036, 10108, 15900, 118, 11070, 13569, 13332, 10135, 30767, 10106, 10105, 28893, 25693, 11751, 11132, 25029, 117, 10319, 15433, 10536, 16021, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Alaska", "Milk", "beat", "Pure", "##fo", "##ods", "Hot", "##dog", "##s", "103", "-", "95", "(", "34", "-", "48", "half", "-", "time", ")" ], "ids": [ 20588, 61459, 27868, 51611, 21330, 70150, 14091, 62039, 10107, 15553, 118, 11978, 113, 11069, 118, 11300, 13877, 118, 10635, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##ine", "##bra", "San", "Miguel", "beat", "Shell", "120", "-", "103", "(", "65", "-", "56", ")" ], "ids": [ 144, 11088, 13581, 10469, 13905, 27868, 47581, 12048, 118, 15553, 113, 10843, 118, 11628, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "RE", "##SU", "##L", "##TS", "OF", "S", ".", "KO", "##RE", "##AN", "PR", "##O", "-", "BA", "##SE", "##BA", "##LL", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 71033, 88592, 11369, 36545, 23240, 156, 119, 67422, 66014, 41275, 23837, 11403, 118, 39999, 39039, 35999, 82834, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "24" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "South", "Korean" ], "ids": [ 33036, 10108, 11056, 20501 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "pro", "-", "baseball", "games", "played", "on", "Friday", "." ], "ids": [ 11284, 118, 22450, 13332, 11553, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Samsung", "13", "Hyundai", "3" ], "ids": [ 37077, 10249, 72344, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Hai", "##tai", "5", "Han", "##w", "##ha", "4" ], "ids": [ 26329, 26812, 126, 10818, 10874, 10921, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "O", "##B", "4", "Lotte", "2" ], "ids": [ 152, 11274, 125, 102530, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "S", "##sang", "##bang", "##wo", "##ol", "1", "LG", "0" ], "ids": [ 156, 45952, 26337, 16828, 11481, 122, 49780, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Standing", "##s", "after", "games", "played", "on", "Friday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 58592, 10107, 10662, 13332, 11553, 10135, 30767, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "drawn", ",", "lost", ",", "winning", "percentage", ",", "games", "behind", "first", "place", ")" ], "ids": [ 34788, 117, 14172, 117, 16542, 46971, 117, 13332, 17155, 10422, 11192, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "D", "L", "PC", "##T", "GB" ], "ids": [ 160, 141, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hai", "##tai", "62", "2", "40", ".", "606", "-" ], "ids": [ 26329, 26812, 12066, 123, 10533, 119, 56682, 118 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##sang", "##bang", "##wo", "##ol", "56", "2", "47", ".", "543", "6", "1", "/", "2" ], "ids": [ 156, 45952, 26337, 16828, 11481, 11628, 123, 11413, 119, 50268, 127, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Han", "##w", "##ha", "55", "1", "47", ".", "539", "7" ], "ids": [ 10818, 10874, 10921, 11358, 122, 11413, 119, 52194, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hyundai", "54", "5", "47", ".", "533", "7", "1", "/", "2" ], "ids": [ 72344, 11653, 126, 11413, 119, 45524, 128, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Samsung", "47", "5", "53", ".", "471", "14" ], "ids": [ 37077, 11413, 126, 11756, 119, 31614, 10247 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lotte", "43", "5", "52", ".", "455", "15", "1", "/", "2" ], "ids": [ 102530, 11370, 126, 11525, 119, 38767, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LG", "44", "5", "56", ".", "443", "17" ], "ids": [ 49780, 11126, 126, 11628, 119, 42986, 10273 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##B", "40", "5", "59", ".", "407", "20", "1", "/", "2" ], "ids": [ 152, 11274, 10533, 126, 11867, 119, 35907, 10197, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "AF", "##TER", "FR", "##ID", "##A", "##Y", "'", "S", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 55640, 99552, 64655, 28895, 10738, 14703, 112, 156, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "24" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "League", "Baseball" ], "ids": [ 14988, 11074, 27084 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "standing", "##s", "after", "games", "played", "on", "Friday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 32173, 10107, 10662, 13332, 11553, 10135, 30767, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "winning", "percentage", "and", "games", "behind", ")", ":" ], "ids": [ 14172, 117, 16542, 46971, 10111, 13332, 17155, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ER", "##IC", "##AN", "LE", "##AG", "##UE" ], "ids": [ 24339, 24093, 30889, 41275, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "73", "54", ".", "575", "-" ], "ids": [ 86607, 13034, 162, 42622, 11733, 12545, 11653, 119, 42813, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "67", "60", ".", "528", "6" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 12316, 10709, 119, 36711, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "64", "65", ".", "496", "10" ], "ids": [ 139, 21793, 60493, 11537, 11295, 10843, 119, 42498, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "60", "69", ".", "465", "14" ], "ids": [ 58573, 35066, 77261, 11403, 10709, 12573, 119, 36307, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "46", "82", ".", "359", "27", "1", "/", "2" ], "ids": [ 25067, 11090, 35066, 37611, 11528, 12180, 119, 35403, 10365, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "76", "52", ".", "594", "-" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 12428, 11525, 119, 59962, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "69", "61", ".", "531", "8" ], "ids": [ 39774, 30889, 109865, 11403, 12573, 12314, 119, 49041, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "64", "64", ".", "500", "12" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 11295, 11295, 119, 10757, 10186 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "61", "68", ".", "473", "15", "1", "/", "2" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 12314, 12370, 119, 39130, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "58", "72", ".", "446", "19" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 11824, 12120, 119, 40709, 10270 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "74", "55", ".", "574", "-" ], "ids": [ 157, 11259, 12674, 38025, 12535, 11358, 119, 57330, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "66", "61", ".", "520", "7" ], "ids": [ 23056, 32071, 11090, 51036, 12215, 12314, 119, 25676, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "62", "69", ".", "473", "13" ], "ids": [ 152, 10738, 11733, 44376, 58521, 12066, 12573, 119, 39130, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "60", "68", ".", "469", "13", "1", "/", "2" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 10709, 12370, 119, 39731, 10249, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##T", "##UR", "##DA", "##Y", ",", "AU", "##G", "##US", "##T", "24", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 21318, 11090, 98348, 36382, 14703, 117, 29088, 11447, 32612, 11090, 10233, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "AT", "B", "##OS", "##TO", "##N" ], "ids": [ 23056, 32071, 11090, 51036, 30554, 139, 21793, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "AT", "CL", "##E", "##VE", "##LA", "##ND" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 30554, 75151, 11259, 68560, 44376, 58521 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "AT", "BA", "##L", "##TI", "##M", "##OR", "##E" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 30554, 39999, 11369, 72286, 11517, 42622, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "AT", "CH", "##IC", "##AG", "##O" ], "ids": [ 58573, 35066, 77261, 11403, 30554, 39774, 30889, 109865, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "AT", "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 152, 10738, 11733, 44376, 58521, 30554, 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "AT", "KA", "##NS", "##AS", "C", "##IT", "##Y" ], "ids": [ 25067, 11090, 35066, 37611, 30554, 85314, 69196, 38025, 140, 37611, 14703 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "AT", "MI", "##N", "##NE", "##S", "##OT", "##A" ], "ids": [ 157, 11259, 12674, 38025, 30554, 75416, 11537, 93280, 10731, 62146, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "NA", "##TION", "##AL", "LE", "##AG", "##UE" ], "ids": [ 56586, 98207, 32002, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "80", "47", ".", "630", "-" ], "ids": [ 30554, 44376, 77261, 10738, 10832, 11413, 119, 34038, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "69", "58", ".", "543", "11" ], "ids": [ 102059, 77261, 66014, 32002, 12573, 11824, 119, 50268, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "59", "70", ".", "457", "22" ], "ids": [ 86607, 13034, 162, 42622, 11733, 11867, 10923, 119, 42950, 10306 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "59", "70", ".", "457", "22" ], "ids": [ 83243, 42622, 28895, 10738, 11867, 10923, 119, 42950, 10306 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "53", "76", ".", "411", "28" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 11756, 12428, 119, 34386, 10348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "68", "60", ".", "531", "-" ], "ids": [ 53317, 149, 11403, 83259, 10731, 12370, 10709, 119, 49041, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "68", "61", ".", "527", "1", "/", "2" ], "ids": [ 145, 11403, 32612, 60493, 11537, 12370, 12314, 119, 43963, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "64", "63", ".", "504", "3", "1", "/", "2" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 11295, 12256, 119, 43098, 124, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "63", "63", ".", "500", "4" ], "ids": [ 39774, 30889, 109865, 11403, 12256, 12256, 119, 10757, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "55", "73", ".", "430", "13" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 11358, 12545, 119, 26262, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "70", "60", ".", "538", "-" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 10923, 10709, 119, 45677, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "68", "60", ".", "531", "1" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 12370, 10709, 119, 49041, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "66", "63", ".", "512", "3", "1", "/", "2" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 12215, 12256, 119, 29957, 124, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "54", "72", ".", "429", "14" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 11653, 12120, 119, 37624, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##T", "##UR", "##DA", "##Y", ",", "AU", "##G", "##US", "##T", "24", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 21318, 11090, 98348, 36382, 14703, 117, 29088, 11447, 32612, 11090, 10233, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "AT", "AT", "##LA", "##NT", "##A" ], "ids": [ 39774, 30889, 109865, 11403, 30554, 30554, 44376, 77261, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "AT", "H", "##O", "##US", "##TO", "##N" ], "ids": [ 53317, 149, 11403, 83259, 10731, 30554, 145, 11403, 32612, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "AT", "L", "##OS", "AN", "##GE", "##LE", "##S" ], "ids": [ 86607, 13034, 162, 42622, 11733, 30554, 149, 21793, 50972, 58719, 51036, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "AT", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O" ], "ids": [ 102059, 77261, 66014, 32002, 30554, 21318, 11537, 64655, 41275, 89955, 36175, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "AT", "FL", "##OR", "##ID", "##A" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 30554, 83243, 42622, 28895, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "AT", "CO", "##L", "##OR", "##AD", "##O" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 30554, 32992, 11369, 42622, 55538, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "AT", "SA", "##N", "DI", "##EG", "##O" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 30554, 21318, 11537, 110014, 104036, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "FR", "##ID", "##A", "##Y", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 64655, 28895, 10738, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "24" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Major", "League" ], "ids": [ 33036, 10108, 14988, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "Baseball", "games", "played", "on", "Friday", "(", "home", "team", "in", "CA", "##PS", ")", ":" ], "ids": [ 27084, 13332, 11553, 10135, 30767, 113, 11816, 11121, 10106, 24707, 46983, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "League" ], "ids": [ 10536, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "6", "Seattle", "4" ], "ids": [ 139, 21793, 60493, 11537, 127, 20902, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Milwaukee", "6", "CL", "##E", "##VE", "##LA", "##ND", "5", "(", "11", "innings", ")" ], "ids": [ 36413, 127, 75151, 11259, 68560, 44376, 58521, 126, 113, 10193, 48974, 114 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "California", "2", "BA", "##L", "##TI", "##M", "##OR", "##E", "0" ], "ids": [ 11621, 123, 39999, 11369, 72286, 11517, 42622, 11259, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "5", "Oakland", "3" ], "ids": [ 86607, 13034, 162, 42622, 11733, 126, 38340, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Toronto", "4", "CH", "##IC", "##AG", "##O", "2" ], "ids": [ 15256, 125, 39774, 30889, 109865, 11403, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Detroit", "3", "KA", "##NS", "##AS", "C", "##IT", "##Y", "2" ], "ids": [ 19727, 124, 85314, 69196, 38025, 140, 37611, 14703, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "9", "Texas", "2" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 130, 12466, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "National", "League" ], "ids": [ 10655, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "Cincinnati", "6", "FL", "##OR", "##ID", "##A", "5", "(", "1", "##ST", "GM", ")" ], "ids": [ 31257, 127, 83243, 42622, 28895, 10738, 126, 113, 122, 32995, 40121, 114 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "8", "Cincinnati", "3", "(", "2", "##ND", "GM", ")" ], "ids": [ 83243, 42622, 28895, 10738, 129, 31257, 124, 113, 123, 58521, 40121, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "4", "Chicago", "3" ], "ids": [ 30554, 44376, 77261, 10738, 125, 12317, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "St", "Louis", "1", "H", "##O", "##US", "##TO", "##N", "0" ], "ids": [ 10838, 11334, 122, 145, 11403, 32612, 60493, 11537, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Pittsburgh", "5", "CO", "##L", "##OR", "##AD", "##O", "3" ], "ids": [ 23812, 126, 32992, 11369, 42622, 55538, 11403, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "7", "New", "York", "5" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 128, 10287, 10482, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Philadelphia", "7", "SA", "##N", "DI", "##EG", "##O", "4" ], "ids": [ 15979, 128, 21318, 11537, 110014, 104036, 11403, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Montreal", "10", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "8" ], "ids": [ 20990, 10150, 21318, 11537, 64655, 41275, 89955, 36175, 11403, 129 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "P", "##OR", "##T", "##U", "##G", "##UE", "##SE", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##T", "." ], "ids": [ 71020, 65622, 24093, 118, 153, 42622, 11090, 12022, 11447, 62674, 39039, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##B", "##ON", "1996", "-", "08", "-", "24" ], "ids": [ 149, 19088, 11274, 30118, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "Portuguese", "first" ], "ids": [ 32070, 16203, 10108, 169, 25550, 10422 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "match", "on", "Saturday", ":" ], "ids": [ 13751, 41356, 12356, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bel", "##enen", "##ses", "2", "Boa", "##vista", "4" ], "ids": [ 47197, 24580, 13149, 123, 73219, 29106, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "DI", "##SA", "##P", "##PO", "##IN", "##TI", "##NG", "AJ", "##AX", "SL", "##UM", "##P", "2", "-", "0", "AT", "H", "##EE", "##RE", "##NV", "##EE", "##N", "." ], "ids": [ 71020, 65622, 24093, 118, 110014, 27138, 11127, 93520, 27128, 72286, 34065, 41191, 83026, 52671, 72679, 11127, 123, 118, 121, 30554, 145, 95825, 66014, 95011, 95825, 11537, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "24" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "champions", "Ajax", "Amsterdam", "falt", "##ered", "in", "their", "second", "league", "match", "of", "the", "season", "on", "Saturday", "losing", "2", "-", "0", "away", "at", "Heer", "##en", "##veen", "." ], "ids": [ 17693, 27745, 37057, 14017, 100865, 45452, 10106, 10455, 11132, 15616, 12356, 10108, 10105, 11226, 10135, 24848, 27817, 123, 118, 121, 14942, 10160, 49764, 10136, 53467, 119 ], "entity": [ "B-MISC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Ajax", ",", "who", "had", "a", "dis", "##mal", "series", "of", "pre", "-", "season", "results", "before", "beating", "NA", "##C", "of", "Breda", "in", "their", "opening", "game", ",", "had", "the", "best", "of", "an", "enter", "##taining", "first", "half", "but", "failed", "to", "break", "the", "dead", "##lock", "." ], "ids": [ 37057, 117, 10479, 10374, 169, 27920, 16120, 11366, 10108, 12229, 118, 11226, 17466, 11360, 58081, 56586, 10858, 10108, 57883, 10106, 10455, 17975, 11661, 117, 10374, 10105, 12504, 10108, 10151, 31006, 70700, 10422, 13877, 10473, 20775, 10114, 24194, 10105, 23457, 36121, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eight", "minutes", "after", "the", "interval", ",", "Heer", "##en", "##veen", "'", "s", "Romeo", "Wo", "##uden", "broke", "through", "the", "Amsterdam", "defence", ",", "left", "defender", "John", "Ve", "##ld", "##man", "standing", "and", "cu", "##rle", "##d", "the", "ball", "beyond", "goalkeeper", "Edwin", "van", "der", "Sar", "into", "the", "Ajax", "net", "." ], "ids": [ 43788, 15304, 10662, 10105, 72331, 117, 49764, 10136, 53467, 112, 187, 26186, 102204, 23280, 30500, 11222, 10105, 14017, 47245, 117, 12153, 36426, 10421, 19561, 12620, 10589, 32173, 10111, 10854, 43539, 10162, 10105, 20724, 28569, 84159, 26259, 10145, 10118, 64696, 10708, 10105, 37057, 11988, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 4, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 3, 9, 9 ] }, { "tokens": [ "Ajax", ",", "without", "injured", "defender", "##s", "Marc", "##io", "Santos", "and", "Winston", "Boga", "##rde", "and", "striker", "##s", "Jar", "##i", "Li", "##tman", "##en", "and", "Marc", "Over", "##mar", "##s", ",", "then", "stepped", "up", "the", "pace", "and", "looked", "certain", "to", "equal", "##ise", "." ], "ids": [ 37057, 117, 13663, 36081, 36426, 10107, 15254, 10638, 17223, 10111, 33252, 76960, 17229, 10111, 103325, 10107, 91531, 10116, 13258, 65417, 10136, 10111, 15254, 15704, 14678, 10107, 117, 11059, 99116, 10741, 10105, 32547, 10111, 59822, 16620, 10114, 32943, 13041, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "they", "left", "gap", "##s", "at", "the", "back", "and", "on", "73", "minutes", "Danish", "striker", "Jon", "Dahl", "Tomas", "##son", "rus", "##hed", "out", "of", "his", "own", "half", ",", "beat", "the", "Ajax", "defence", "and", "lo", "##bbed", "van", "der", "Sar", "." ], "ids": [ 16976, 10689, 12153, 55995, 10107, 10160, 10105, 12014, 10111, 10135, 12545, 15304, 29876, 103325, 17749, 55809, 41889, 11599, 19867, 16081, 10950, 10108, 10226, 12542, 13877, 117, 27868, 10105, 37057, 47245, 10111, 10406, 98091, 10145, 10118, 64696, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "The", "defeat", "means", "Ajax", "'", "s", "main", "title", "conte", "##nders", "PSV", "Eindhoven", ",", "who", "beat", "the", "champions", "3", "-", "0", "in", "the", "traditional", "league", "curta", "##in", "-", "raise", "##r", ",", "can", "go", "three", "points", "clear", "of", "their", "rivals", "if", "they", "beat", "Groningen", "on", "Sunday", "." ], "ids": [ 10117, 24800, 17574, 37057, 112, 187, 12126, 12887, 26777, 72975, 66922, 55552, 117, 10479, 27868, 10105, 27745, 124, 118, 121, 10106, 10105, 17531, 15616, 51738, 10245, 118, 42439, 10129, 117, 10944, 11783, 11003, 12789, 24866, 10108, 10455, 71908, 12277, 10689, 27868, 36806, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "BE", "##L", "##GI", "##AN", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 46291, 11369, 100075, 41275, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "24" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Belgian", "first" ], "ids": [ 33036, 10108, 36652, 10422 ], "entity": [ "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 2, 9 ] }, { "tokens": [ "division", "matches", "on", "Saturday", ":" ], "ids": [ 13751, 18258, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standard", "Lie", "##ge", "3", "Mol", "##en", "##beek", "0" ], "ids": [ 17861, 39710, 10525, 124, 58895, 10136, 71276, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Anderlecht", "2", "Lok", "##eren", "2" ], "ids": [ 88092, 123, 63998, 13653, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Cercle", "Brugge", "2", "Mo", "##us", "##cro", "##n", "2" ], "ids": [ 75154, 57847, 123, 34987, 10251, 37615, 10115, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Antwerp", "1", "Lo", "##mmel", "4" ], "ids": [ 85332, 122, 13069, 79968, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "G", "##hen", "##t", "3", "Aa", "##lst", "2" ], "ids": [ 144, 14786, 10123, 124, 80131, 55533, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Lie", "##rse", "4", "Charleroi", "0" ], "ids": [ 39710, 16239, 125, 88011, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Sint", "T", "##rui", "##den", "3", "Ek", "##eren", "1" ], "ids": [ 20160, 157, 59559, 10633, 124, 35769, 13653, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "LE", "##AD", "##ING", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "SC", "##OR", "##ER", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 84977, 55538, 50183, 64655, 50655, 86448, 84977, 109865, 62674, 18137, 42622, 24093, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "24" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "goals", "##core", "##rs", "in", "the", "French" ], "ids": [ 100085, 18173, 45811, 10943, 10106, 10105, 11894 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "first", "division", "after", "Saturday", "'", "s", "matches", ":" ], "ids": [ 10422, 13751, 10662, 24848, 112, 187, 18258, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "Ant", "##o", "Dr", "##ob", "##njak", "(", "Bastia", ")", ",", "Xavier", "Grave", "##laine", "(", "Marseille", ")", "." ], "ids": [ 124, 118, 40328, 10133, 11612, 31165, 108805, 113, 107497, 114, 117, 23766, 44430, 67320, 113, 25016, 114, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9 ] }, { "tokens": [ "2", "-", "Mil", "##adi", "##n", "Be", "##cano", "##vic", "(", "Lille", ")", ",", "Enzo", "Sci", "##fo", "(", "Monaco", ")", "," ], "ids": [ 123, 118, 75311, 18974, 10115, 14321, 25498, 48175, 113, 28372, 114, 117, 50734, 23359, 21330, 113, 24661, 114, 117 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9 ] }, { "tokens": [ "Vladimir", "Sm", "##ice", "##r", "(", "Lens", ")", ",", "Christopher", "W", "##re", "##h", "(", "G", "##uing", "##amp", ")", "." ], "ids": [ 18124, 41922, 11918, 10129, 113, 72008, 114, 117, 15244, 160, 10246, 10237, 113, 144, 94213, 53692, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "SU", "##MM", "##AR", "##IE", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 84977, 109865, 62674, 86643, 93252, 52188, 71655, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "24" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##mmar", "##ies", "of", "French", "first", "division" ], "ids": [ 12271, 100620, 11624, 10108, 11894, 10422, 13751 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "on", "Saturday", ":" ], "ids": [ 18258, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Nantes", "0", "Lens", "1", "(", "Sm", "##ice", "##r", "52", "##nd", ")", "." ], "ids": [ 32134, 121, 72008, 122, 113, 41922, 11918, 10129, 11525, 11534, 114, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "0", "." ], "ids": [ 33100, 18086, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "16", ",", "000", "." ], "ids": [ 46080, 10250, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nice", "1", "(", "De", "##bba", "##h", "39", "##th", ")", "Bastia", "1", "(", "Dr", "##ob", "##njak", "82", "##nd", ")", "." ], "ids": [ 26918, 122, 113, 10190, 55350, 10237, 11303, 11143, 114, 107497, 122, 113, 11612, 31165, 108805, 12180, 11534, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 9, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "6", ",", "000", "." ], "ids": [ 127, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Lille", "3", "(", "Bou", "##toi", "##lle", "47", "##th", ",", "Be", "##cano", "##vic", "79", "##th", "pen", ",", "82", "##nd", ")", ")", "Rennes", "1" ], "ids": [ 28372, 124, 113, 62583, 40331, 11270, 11413, 11143, 117, 14321, 25498, 48175, 12791, 11143, 66558, 117, 12180, 11534, 114, 114, 42288, 122 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "(", "G", "##ui", "##var", "##c", "'", "h", "60", "##th", "pen", "." ], "ids": [ 113, 144, 11990, 16648, 10350, 112, 176, 10709, 11143, 66558, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ ")", "0", "-", "0", "." ], "ids": [ 114, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ",", "000", "." ], "ids": [ 127, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Bordeaux", "0", "Auxerre", "0", "." ], "ids": [ 25169, 121, 86186, 121, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 9, 3, 9, 9 ] }, { "tokens": [ "30", ",", "000", "." ], "ids": [ 10244, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Marseille", "1", "(", "Grave", "##laine", "24", "##th", ")", "Metz", "2", "(", "Tra", "##ore", "65", "##th", ",", "Bomb", "##arda" ], "ids": [ 25016, 122, 113, 44430, 67320, 10233, 11143, 114, 32434, 123, 113, 21469, 13024, 10843, 11143, 117, 63141, 44634 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 4, 8 ] }, { "tokens": [ "69", "##th", ")", "." ], "ids": [ 12573, 11143, 114, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "20", ",", "000", "." ], "ids": [ 10197, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Strasbourg", "1", "(", "Zi", "##telli", "80", "##th", ")", "Le", "Havre", "0", "." ], "ids": [ 30300, 122, 113, 99890, 82127, 10832, 11143, 114, 10281, 59887, 121, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "0", "-", "0", "." ], "ids": [ 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "15", ",", "000" ], "ids": [ 10208, 117, 10259 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Caen", "1", "(", "Banca", "##rel", "70", "##th", ")", "Lyon", "1", "(", "Cave", "##glia", "89", "##th", ")", "." ], "ids": [ 51011, 122, 113, 74316, 19362, 10923, 11143, 114, 17980, 122, 113, 43502, 27965, 12642, 11143, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "0", "." ], "ids": [ 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "9", ",", "000", "." ], "ids": [ 130, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "G", "##uing", "##amp", "2", "(", "W", "##re", "##h", "15th", ",", "42", "##nd", ")", "Monaco", "1", "(", "Sci", "##fo", "35", "##th", ")", "." ], "ids": [ 144, 94213, 53692, 123, 113, 160, 10246, 10237, 36293, 117, 11276, 11534, 114, 24661, 122, 113, 23359, 21330, 10803, 11143, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "1", "." ], "ids": [ 123, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "7", ",", "000", "." ], "ids": [ 128, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Montpellier", "0", "Cannes", "1", "(", "Cha", "##rve", "##t", "8th", ")", "." ], "ids": [ 38069, 121, 27615, 122, 113, 53453, 40252, 10123, 32074, 114, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "0", "-", "1", "." ], "ids": [ 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "10", ",", "000", "." ], "ids": [ 10150, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "on", "Friday", ":" ], "ids": [ 17712, 10336, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nancy", "0", "Paris", "St", "Germain", "0", "." ], "ids": [ 20073, 121, 10728, 10838, 26289, 121, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "15", ",", "000", "." ], "ids": [ 10208, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "24" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "in", "the", "French", "soccer" ], "ids": [ 58592, 10107, 10106, 10105, 11894, 41356 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "league", "after", "Saturday", "'", "s", "matches", "(", "tab", "##ulate", "under", "played", ",", "won", "," ], "ids": [ 15616, 10662, 24848, 112, 187, 18258, 113, 100781, 70863, 10571, 11553, 117, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "drawn", ",", "lost", ",", "goals", "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 34788, 117, 14172, 117, 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lens", "3", "3", "0", "0", "6", "1", "9" ], "ids": [ 72008, 124, 124, 121, 121, 127, 122, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bastia", "3", "2", "1", "0", "4", "1", "7" ], "ids": [ 107497, 124, 123, 122, 121, 125, 122, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "Saint", "-", "Germain", "3", "2", "1", "0", "3", "0", "7" ], "ids": [ 10728, 10602, 118, 26289, 124, 123, 122, 121, 124, 121, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Auxerre", "3", "2", "1", "0", "3", "0", "7" ], "ids": [ 86186, 124, 123, 122, 121, 124, 121, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cannes", "3", "2", "1", "0", "4", "2", "7" ], "ids": [ 27615, 124, 123, 122, 121, 125, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lille", "3", "2", "0", "1", "4", "3", "6" ], "ids": [ 28372, 124, 123, 121, 122, 125, 124, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bordeaux", "3", "1", "2", "0", "2", "1", "5" ], "ids": [ 25169, 124, 122, 123, 121, 123, 122, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Monaco", "3", "1", "1", "1", "5", "3", "4" ], "ids": [ 24661, 124, 122, 122, 122, 126, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Marseille", "3", "1", "1", "1", "5", "4", "4" ], "ids": [ 25016, 124, 122, 122, 122, 126, 125, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Metz", "3", "1", "1", "1", "3", "3", "4" ], "ids": [ 32434, 124, 122, 122, 122, 124, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lyon", "3", "1", "1", "1", "4", "4", "4" ], "ids": [ 17980, 124, 122, 122, 122, 125, 125, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##uing", "##amp", "3", "1", "1", "1", "2", "2", "4" ], "ids": [ 144, 94213, 53692, 124, 122, 122, 122, 123, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rennes", "3", "1", "0", "2", "4", "6", "3" ], "ids": [ 42288, 124, 122, 121, 123, 125, 127, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Strasbourg", "3", "1", "0", "2", "1", "3", "3" ], "ids": [ 30300, 124, 122, 121, 123, 122, 124, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Montpellier", "3", "0", "2", "1", "1", "2", "2" ], "ids": [ 38069, 124, 121, 123, 122, 122, 123, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nantes", "3", "0", "1", "2", "2", "5", "1" ], "ids": [ 32134, 124, 121, 122, 123, 123, 126, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nancy", "3", "0", "1", "2", "2", "5", "1" ], "ids": [ 20073, 124, 121, 122, 123, 123, 126, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nice", "3", "0", "1", "2", "2", "5", "1" ], "ids": [ 26918, 124, 121, 122, 123, 123, 126, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Le", "Havre", "3", "0", "1", "1", "1", "3", "1" ], "ids": [ 10281, 59887, 124, 121, 122, 122, 122, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Caen", "3", "0", "1", "2", "1", "5", "1" ], "ids": [ 51011, 124, 121, 122, 123, 122, 126, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "24" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "French", "first", "division" ], "ids": [ 33036, 10108, 11894, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "on", "Saturday", ":" ], "ids": [ 18258, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Nantes", "0", "Lens", "1" ], "ids": [ 32134, 121, 72008, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Nice", "1", "Bastia", "1" ], "ids": [ 26918, 122, 107497, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Lille", "3", "Rennes", "1" ], "ids": [ 28372, 124, 42288, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Bordeaux", "0", "Auxerre", "0" ], "ids": [ 25169, 121, 86186, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Marseille", "1", "Metz", "2" ], "ids": [ 25016, 122, 32434, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Strasbourg", "1", "Le", "Havre", "0" ], "ids": [ 30300, 122, 10281, 59887, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Caen", "1", "Lyon", "1" ], "ids": [ 51011, 122, 17980, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "G", "##uing", "##amp", "2", "Monaco", "1" ], "ids": [ 144, 94213, 53692, 123, 24661, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Montpellier", "0", "Cannes", "1" ], "ids": [ 38069, 121, 27615, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Play", "##ed", "on", "Friday", ":" ], "ids": [ 17712, 10336, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nancy", "0", "Paris", "St", "Germain", "0" ], "ids": [ 20073, 121, 10728, 10838, 26289, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "24" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "Dutch", "first", "division" ], "ids": [ 32070, 16203, 10108, 17693, 10422, 13751 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "match", "played", "on", "Saturday", ":" ], "ids": [ 41356, 12356, 11553, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##raaf", "##schap", "Doe", "##tin", "##chem", "3", "RK", "##C", "W", "##aal", "##wijk", "2" ], "ids": [ 144, 71647, 21289, 71335, 15364, 34884, 124, 105546, 10858, 160, 19641, 42727, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Willem", "II", "Til", "##burg", "0", "Fortuna", "Sitt", "##ard", "1" ], "ids": [ 20903, 10335, 27853, 12248, 121, 59890, 105987, 13167, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "NA", "##C", "Breda", "1", "Sparta", "Rotterdam", "0" ], "ids": [ 56586, 10858, 57883, 122, 36354, 25136, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Heer", "##en", "##veen", "2", "Ajax", "Amsterdam", "0" ], "ids": [ 49764, 10136, 53467, 123, 37057, 14017, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##raaf", "##schap", "Doe", "##tin", "##chem", "2", "1", "1", "0", "4", "3", "4" ], "ids": [ 144, 71647, 21289, 71335, 15364, 34884, 123, 122, 122, 121, 125, 124, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Sitt", "##ard", "2", "1", "1", "0", "1", "0", "4" ], "ids": [ 59890, 105987, 13167, 123, 122, 122, 121, 122, 121, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PSV", "Eindhoven", "1", "1", "0", "0", "4", "1", "3" ], "ids": [ 66922, 55552, 122, 122, 121, 121, 125, 122, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Twente", "En", "##sche", "##de", "1", "1", "0", "0", "3", "1", "3" ], "ids": [ 104879, 10243, 12279, 10253, 122, 122, 121, 121, 124, 122, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vi", "##tesse", "Arnhem", "1", "1", "0", "0", "2", "0", "3" ], "ids": [ 31826, 100319, 76323, 122, 122, 121, 121, 123, 121, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Heer", "##en", "##veen", "2", "1", "0", "1", "3", "3", "3" ], "ids": [ 49764, 10136, 53467, 123, 122, 121, 122, 124, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##C", "Breda", "2", "1", "0", "1", "1", "1", "3" ], "ids": [ 56586, 10858, 57883, 123, 122, 121, 122, 122, 122, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ajax", "Amsterdam", "2", "1", "0", "1", "1", "2", "3" ], "ids": [ 37057, 14017, 123, 122, 121, 122, 122, 123, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Utrecht", "1", "0", "1", "0", "2", "2", "1" ], "ids": [ 24890, 122, 121, 122, 121, 123, 123, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Feyenoord", "Rotterdam", "1", "0", "1", "0", "1", "1", "1" ], "ids": [ 103340, 25136, 122, 121, 122, 121, 122, 122, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Roda", "JC", "Kerk", "##rade", "1", "0", "1", "0", "1", "1", "1" ], "ids": [ 97751, 76199, 36156, 18752, 122, 121, 122, 121, 122, 122, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vol", "##enda", "##m", "1", "0", "1", "0", "1", "1", "1" ], "ids": [ 12546, 27808, 10147, 122, 121, 122, 121, 122, 122, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Groningen", "1", "0", "1", "0", "0", "0", "1" ], "ids": [ 36806, 122, 121, 122, 121, 121, 121, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RK", "##C", "W", "##aal", "##wijk", "2", "0", "1", "1", "4", "5", "1" ], "ids": [ 105546, 10858, 160, 19641, 42727, 123, 121, 122, 122, 125, 126, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sparta", "Rotterdam", "2", "0", "1", "1", "0", "1", "1" ], "ids": [ 36354, 25136, 123, 121, 122, 122, 121, 122, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Willem", "II", "Til", "##burg", "2", "0", "1", "1", "0", "1", "1" ], "ids": [ 20903, 10335, 27853, 12248, 123, 121, 122, 122, 121, 122, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AZ", "Al", "##km", "##aar", "1", "0", "0", "1", "0", "2", "0" ], "ids": [ 81705, 10883, 23440, 21960, 122, 121, 121, 122, 121, 123, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NEC", "Nijmegen", "1", "0", "0", "1", "1", "4", "0" ], "ids": [ 97104, 81444, 122, 121, 121, 122, 122, 125, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SU", "##MM", "##AR", "##IE", "##S", "OF", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "MA", "##TC", "##H", "##ES", "." ], "ids": [ 71020, 65622, 24093, 118, 86643, 93252, 52188, 71655, 10731, 23240, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 27277, 55671, 12396, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##mmar", "##ies", "of", "German", "first", "division" ], "ids": [ 12271, 100620, 11624, 10108, 12026, 10422, 13751 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "played", "on", "Saturday", ":" ], "ids": [ 18258, 11553, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bochum", "1", "(", "Jack", "66", "##th", "minute", ")", "Armin", "##ia", "Bielefeld", "1", "(", "Mol", "##ata", "59", "##th", ")", "." ], "ids": [ 63359, 122, 113, 12342, 12215, 11143, 21760, 114, 78283, 10280, 67943, 122, 113, 58895, 11952, 11867, 11143, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 9, 9, 9, 9, 3, 7, 7, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "0", "." ], "ids": [ 33100, 18086, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "25", ",", "000" ], "ids": [ 46080, 10258, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Moe", "##nche", "##ng", "##lad", "##bach", "1", "(", "Andersson", "22", "##nd", ")", "Karlsruhe", "3" ], "ids": [ 48007, 80790, 49457, 10376, 19505, 14135, 122, 113, 36303, 10306, 11534, 114, 36954, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 4, 9, 9, 9, 3, 9 ] }, { "tokens": [ "(", "Ha", "##ess", "##ler", "33", "##rd", ",", "Dundee", "45", "##th", ",", "Keller", "90", "##th", ")", "." ], "ids": [ 113, 13740, 22094, 10815, 11000, 12023, 117, 60426, 10827, 11143, 117, 38294, 10919, 11143, 114, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 4, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "2", "." ], "ids": [ 122, 118, 123, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "20", ",", "000" ], "ids": [ 10197, 117, 10259 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Stuttgart", "2", "(", "Bala", "##kow", "50th", ",", "Bob", "##ic", "61", "##st", ")", "Werder", "Bremen", "1", "(", "Vo", "##tava" ], "ids": [ 16048, 123, 113, 101370, 72275, 98105, 117, 13583, 11130, 12314, 10562, 114, 89919, 21360, 122, 113, 59482, 29102 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 4, 8, 9, 9, 9, 3, 7, 9, 9, 4, 8 ] }, { "tokens": [ "68", "##th", ")", "." ], "ids": [ 12370, 11143, 114, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "0", "." ], "ids": [ 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "32", ",", "000" ], "ids": [ 10842, 117, 10259 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "1860", "Munich", "1", "(", "Sc", "##hwa", "##bl", "38", "##th", ")", "Borussia", "Dortmund", "3", "(", "Zo", "##rc" ], "ids": [ 13336, 27349, 122, 113, 55260, 77155, 31766, 11171, 11143, 114, 48007, 33962, 124, 113, 31494, 46382 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 3, 7, 9, 9, 4, 8 ] }, { "tokens": [ "59", "##th", "-", "pen", ",", "Moe", "##ller", "73", "##rd", ",", "Heinrich", "90", "##th", ")", "." ], "ids": [ 11867, 11143, 118, 66558, 117, 80790, 18289, 12545, 12023, 117, 13373, 10919, 11143, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "50", ",", "000" ], "ids": [ 10462, 117, 10259 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Bayer", "Leverkusen", "0", "Fortuna", "Due", "##ssel", "##dorf", "1", "(", "See", "##lige", "##r", "47", "##th", ")", "." ], "ids": [ 42806, 84961, 121, 59890, 20896, 49235, 16631, 122, 113, 13924, 14425, 10129, 11413, 11143, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "0", "." ], "ids": [ 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "18", ",", "000" ], "ids": [ 10218, 117, 10259 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Freiburg", "1", "(", "Ze", "##yer", "52", "##nd", ")", "Cologne", "3", "(", "Ga", "##iss", "##may", "##er", "9th", ",", "Pol", "##ster" ], "ids": [ 29283, 122, 113, 15536, 17750, 11525, 11534, 114, 52577, 124, 113, 69699, 47097, 77913, 10165, 35065, 117, 38432, 12765 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8 ] }, { "tokens": [ "86", "##th", ",", "90", "##th", ")", "." ], "ids": [ 12224, 11143, 117, 10919, 11143, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "1", "." ], "ids": [ 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "22", ",", "500" ], "ids": [ 10306, 117, 10757 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "RE", "##SU", "##L", "##TS", "OF", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "MA", "##TC", "##H", "##ES", "." ], "ids": [ 71020, 65622, 24093, 118, 71033, 88592, 11369, 36545, 23240, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 27277, 55671, 12396, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "German", "first", "division" ], "ids": [ 33036, 10108, 12026, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "matches", "played", "on", "Saturday", ":" ], "ids": [ 41356, 18258, 11553, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bochum", "1", "Armin", "##ia", "Bielefeld", "1" ], "ids": [ 63359, 122, 78283, 10280, 67943, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Borussia", "Moe", "##nche", "##ng", "##lad", "##bach", "1", "Karlsruhe", "3" ], "ids": [ 48007, 80790, 49457, 10376, 19505, 14135, 122, 36954, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Stuttgart", "2", "Werder", "Bremen", "1" ], "ids": [ 16048, 123, 89919, 21360, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "1860", "Munich", "1", "Borussia", "Dortmund", "3" ], "ids": [ 13336, 27349, 122, 48007, 33962, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Bayer", "Leverkusen", "0", "Fortuna", "Due", "##ssel", "##dorf", "1" ], "ids": [ 42806, 84961, 121, 59890, 20896, 49235, 16631, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Freiburg", "1", "Cologne", "3" ], "ids": [ 29283, 122, 52577, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Play", "##ed", "on", "Saturday", ":" ], "ids": [ 17712, 10336, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "4", "Schalke", "4" ], "ids": [ 10838, 54583, 125, 87909, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Hansa", "Rostock", "0", "Hamburg", "1" ], "ids": [ 77740, 47090, 121, 15021, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Bundesliga", "standing", "##s", "after", "Saturday", "'", "s", "games", "(", "tab", "##ulate", "under" ], "ids": [ 21436, 32173, 10107, 10662, 24848, 112, 187, 13332, 113, 100781, 70863, 10571 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals", "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cologne", "3", "3", "0", "0", "7", "1", "9" ], "ids": [ 52577, 124, 124, 121, 121, 128, 122, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VfB", "Stuttgart", "2", "2", "0", "0", "6", "1", "6" ], "ids": [ 76227, 16048, 123, 123, 121, 121, 127, 122, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Dortmund", "3", "2", "0", "1", "9", "5", "6" ], "ids": [ 48007, 33962, 124, 123, 121, 122, 130, 126, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hamburg", "3", "2", "0", "1", "7", "3", "6" ], "ids": [ 15021, 124, 123, 121, 122, 128, 124, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayer", "Leverkusen", "3", "2", "0", "1", "7", "4", "6" ], "ids": [ 42806, 84961, 124, 123, 121, 122, 128, 125, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VfL", "Bochum", "3", "1", "2", "0", "3", "2", "5" ], "ids": [ 77307, 63359, 124, 122, 123, 121, 124, 123, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karlsruhe", "2", "1", "1", "0", "5", "3", "4" ], "ids": [ 36954, 123, 122, 122, 121, 126, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayern", "Munich", "2", "1", "1", "0", "3", "2", "4" ], "ids": [ 17200, 27349, 123, 122, 122, 121, 124, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "3", "1", "1", "1", "7", "7", "4" ], "ids": [ 10838, 54583, 124, 122, 122, 122, 128, 128, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1860", "Munich", "3", "1", "0", "2", "3", "5", "3" ], "ids": [ 13336, 27349, 124, 122, 121, 123, 124, 126, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Freiburg", "3", "1", "0", "2", "5", "10", "3" ], "ids": [ 29283, 124, 122, 121, 123, 126, 10150, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Due", "##ssel", "##dorf", "3", "1", "0", "2", "1", "7", "3" ], "ids": [ 59890, 20896, 49235, 16631, 124, 122, 121, 123, 122, 128, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hansa", "Rostock", "3", "0", "2", "1", "3", "4", "2" ], "ids": [ 77740, 47090, 124, 121, 123, 122, 124, 125, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Armin", "##ia", "Bielefeld", "3", "0", "2", "1", "2", "3", "2" ], "ids": [ 78283, 10280, 67943, 124, 121, 123, 122, 123, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Moe", "##nche", "##ng", "##lad", "##bach", "3", "0", "2", "1", "1", "3", "2" ], "ids": [ 48007, 80790, 49457, 10376, 19505, 14135, 124, 121, 123, 122, 122, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Schalke", "3", "0", "2", "1", "4", "8", "2" ], "ids": [ 87909, 124, 121, 123, 122, 125, 129, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Werder", "Bremen", "3", "0", "1", "2", "4", "6", "1" ], "ids": [ 89919, 21360, 124, 121, 122, 123, 125, 127, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MS", "##V", "Duisburg", "2", "0", "0", "2", "1", "4", "0" ], "ids": [ 21018, 11779, 65064, 123, 121, 121, 123, 122, 125, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "AU", "##ST", "##RI", "##A", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 29088, 32995, 46876, 10738, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VI", "##EN", "##NA", "1996", "-", "08", "-", "24" ], "ids": [ 12262, 50655, 36742, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Austria", "first", "division" ], "ids": [ 33036, 10108, 14479, 10422, 13751 ], "entity": [ "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9 ] }, { "tokens": [ "soccer", "matches", "played", "on", "Saturday", ":" ], "ids": [ 41356, 18258, 11553, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rapid", "Vienna", "0", "FC", "Linz", "0" ], "ids": [ 41047, 20590, 121, 11529, 45064, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "GA", "##K", "2", "Austria", "Vienna", "2" ], "ids": [ 74212, 11733, 123, 14479, 20590, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Ad", "##mira", "/", "W", "##acker", "0", "Sturm", "Graz", "3" ], "ids": [ 25474, 66807, 120, 160, 108372, 121, 53079, 34288, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Linz", "##er", "AS", "##K", "1", "FC", "Tirol", "Innsbruck", "3" ], "ids": [ 45064, 10165, 17421, 11733, 122, 11529, 44104, 36184, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Tirol", "Innsbruck", "6", "4", "2", "0", "13", "5", "14" ], "ids": [ 11529, 44104, 36184, 127, 125, 123, 121, 10249, 126, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Austria", "Vienna", "6", "4", "2", "0", "9", "5", "14" ], "ids": [ 14479, 20590, 127, 125, 123, 121, 130, 126, 10247 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SV", "Salzburg", "5", "3", "2", "0", "4", "1", "11" ], "ids": [ 25452, 29024, 126, 124, 123, 121, 125, 122, 10193 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sturm", "Graz", "6", "2", "3", "1", "8", "5", "9" ], "ids": [ 53079, 34288, 127, 123, 124, 122, 129, 126, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GA", "##K", "6", "1", "3", "2", "8", "10", "6" ], "ids": [ 74212, 11733, 127, 122, 124, 123, 129, 10150, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rapid", "Wien", "5", "0", "5", "0", "3", "3", "5" ], "ids": [ 41047, 13659, 126, 121, 126, 121, 124, 124, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SV", "R", "##ied", "5", "1", "1", "3", "6", "5", "4" ], "ids": [ 25452, 155, 24140, 126, 122, 122, 124, 127, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Linz", "##er", "AS", "##K", "5", "0", "3", "2", "4", "8", "3" ], "ids": [ 45064, 10165, 17421, 11733, 126, 121, 124, 123, 125, 129, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ad", "##mira", "/", "W", "##acker", "6", "0", "3", "3", "5", "10", "3" ], "ids": [ 25474, 66807, 120, 160, 108372, 127, 121, 124, 124, 126, 10150, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Linz", "6", "0", "2", "4", "1", "9", "2" ], "ids": [ 11529, 45064, 127, 121, 123, 125, 122, 130, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "RAI", "##N", "BR", "##ING", "##S", "PR", "##EM", "##AT", "##UR", "##E", "EN", "##D", "TO", "SR", "##I", "LAN", "##KA", "MA", "##TC", "##H", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 91194, 11537, 49351, 50183, 10731, 23837, 67753, 32071, 98348, 11259, 31278, 11490, 58573, 23032, 11281, 94057, 67813, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "24" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "one", "-", "day", "match", "between", "Sri", "Lanka", "and", "a", "World", "XI", "was", "abandoned", "on", "Saturday", "because", "of", "rain", "." ], "ids": [ 10117, 10464, 118, 11940, 12356, 10948, 16098, 20828, 10111, 169, 10315, 14627, 10134, 32296, 10135, 24848, 12373, 10108, 50939, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", ":", "World", "XI", "102", "-", "0", "(", "M", ".", "W", "##au", "##gh", "39", "not", "out", ",", "S", ".", "Ten", "##dul", "##kar", "56", "not", "out", ")", "off", "21", ".", "4", "over", "##s", "v", "Sri", "Lanka", "." ], "ids": [ 66875, 10107, 131, 10315, 14627, 14818, 118, 121, 113, 150, 119, 160, 11705, 15774, 11303, 10472, 10950, 117, 156, 119, 16411, 42918, 15190, 11628, 10472, 10950, 114, 11898, 10296, 119, 125, 10491, 10107, 190, 16098, 20828, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "British", "host", "##age", "in", "Che", "##chny", "##a", "describes", "orde", "##al", "." ], "ids": [ 11160, 19317, 12276, 10106, 44131, 95063, 10113, 34797, 19872, 10415, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "British", "aid", "worker", ",", "held", "host", "##age", "in", "Che", "##chny", "##a", "for", "nearly", "four", "weeks", ",", "said", "on", "Saturday", "a", "co", "##cked", "Ka", "##lash", "##nikov", "had", "been", "th", "##rust", "into", "his", "mouth", "at", "one", "point", "during", "his", "orde", "##al", "." ], "ids": [ 138, 11160, 19778, 64840, 117, 11991, 19317, 12276, 10106, 44131, 95063, 10113, 10142, 21377, 11598, 20750, 117, 12415, 10135, 24848, 169, 11170, 72333, 25444, 25297, 52574, 10374, 10590, 77586, 56657, 10708, 10226, 42213, 10160, 10464, 12331, 10939, 10226, 19872, 10415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "Pen", "##rose", ",", "a", "23", "-", "year", "-", "old", "worker", "with", "the", "group", "Action", "Against", "Hunger", ",", "described", "his", "orde", "##al", "to", "a", "news", "conference", "when", "he", "arrived", "back", "in", "Britain", "from", "Moscow", "." ], "ids": [ 10631, 52559, 35329, 117, 169, 10328, 118, 10924, 118, 12898, 64840, 10169, 10105, 11795, 21208, 29809, 78777, 117, 13010, 10226, 19872, 10415, 10114, 169, 14424, 25029, 10841, 10261, 22584, 12014, 10106, 16032, 10188, 18744, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "\"", "The", "worst", "period", "of", "physical", "man", "##handling", "was", "during", "that", "time", "when", "we", "were", "beaten", "with", "Ka", "##lash", "##nikov", "##s", "and", "at", "one", "point", "I", "had", "a", "Ka", "##lash", "##nikov", "held", "to", "the", "back", "of", "my", "th", "##roat", "-", "-", "co", "##cked", ",", "\"", "he", "said", "." ], "ids": [ 107, 10117, 62006, 13127, 10108, 22899, 10817, 95188, 10134, 10939, 10189, 10635, 10841, 11951, 10309, 74075, 10169, 25444, 25297, 52574, 10107, 10111, 10160, 10464, 12331, 146, 10374, 169, 25444, 25297, 52574, 11991, 10114, 10105, 12014, 10108, 15127, 77586, 64825, 118, 118, 11170, 72333, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "For", "the", "first", "period", "we", "were", "held", "in", "a", "small", "room", "with", "no", "bed", "or", "anything", "." ], "ids": [ 107, 11399, 10105, 10422, 13127, 11951, 10309, 11991, 10106, 169, 12474, 19555, 10169, 10192, 30113, 10345, 42819, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "had", "very", "little", "food", "and", "sometimes", "went", "two", "or", "three", "days", "without", "eating", ".", "\"" ], "ids": [ 12865, 10374, 12558, 16745, 18301, 10111, 17611, 13446, 10551, 10345, 11003, 13990, 13663, 77596, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gun", "##men", "seized", "Pen", "##rose", ",", "who", "comes", "from", "S", "##werf", "##ord", "in", "southern", "England", ",", "French", "##man", "Frederic", "Mala", "##rde", "##au", "and", "six", "other", "host", "##ages", "from", "their", "car", "in", "G", "##ro", "##zny", ",", "the", "capital", "of", "Che", "##chny", "##a", ",", "on", "July", "27", "." ], "ids": [ 31328, 11418, 80176, 52559, 35329, 117, 10479, 21405, 10188, 156, 83332, 17392, 10106, 17156, 11701, 117, 11894, 10589, 43120, 58335, 17229, 11705, 10111, 12449, 10684, 19317, 24115, 10188, 10455, 13000, 10106, 144, 10567, 25424, 117, 10105, 12185, 10108, 44131, 95063, 10113, 117, 10135, 11112, 10365, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 9, 2, 6, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "assai", "##lant", "##s", "had", "demanded", "a", "ran", "##som", "of", "300", ",", "000", "pounds", "(", "$", "465", ",", "000", ")", "but", "no", "money", "was", "paid", "by", "the", "charity", "when", "they", "were", "released", "on", "Wednesday", "." ], "ids": [ 10117, 58014, 29329, 10107, 10374, 78164, 169, 17044, 32081, 10108, 11093, 117, 10259, 61982, 113, 109, 36307, 117, 10259, 114, 10473, 10192, 17920, 10134, 25938, 10155, 10105, 53069, 10841, 10689, 10309, 11539, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "host", "##ages", "were", "held", "in", "a", "house", "in", "or", "near", "G", "##ro", "##zny", "which", "was", "bomba", "##rde", "##d", "regularly", "." ], "ids": [ 10117, 19317, 24115, 10309, 11991, 10106, 169, 13215, 10106, 10345, 12883, 144, 10567, 25424, 10319, 10134, 39889, 17229, 10162, 36942, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "During", "the", "last", "15", "days", "of", "being", "held", ",", "the", "fighting", "in", "G", "##ro", "##zny", "was", "very", "close", "." ], "ids": [ 107, 12550, 10105, 12469, 10208, 13990, 10108, 11223, 11991, 117, 10105, 27535, 10106, 144, 10567, 25424, 10134, 12558, 16065, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "At", "first", "it", "was", "street", "fighting", "outside", "the", "house", "and", "then", "we", "came", "under", "very", "heavy", "shell", "##ing", "and", "bomba", "##rd", "##ment", "from", "conventional", "weapons", "like", "tanks", ",", "artillery", "and", "gr", "##ena", "##de", "launch", "##ers", ",", "\"", "he", "said", "." ], "ids": [ 11699, 10422, 10271, 10134, 23840, 27535, 17555, 10105, 13215, 10111, 11059, 11951, 13383, 10571, 12558, 18296, 43332, 10230, 10111, 39889, 12023, 10426, 10188, 56252, 31881, 11850, 46731, 117, 46524, 10111, 30518, 13032, 10253, 29227, 10901, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pen", "##rose", "had", "been", "working", "for", "the", "charity", "which", "provides", "food", "to", "civilians", "for", "only", "a", "few", "weeks", "before", "he", "was", "captured", "." ], "ids": [ 52559, 35329, 10374, 10590, 14616, 10142, 10105, 53069, 10319, 20245, 18301, 10114, 77485, 10142, 10893, 169, 13824, 20750, 11360, 10261, 10134, 25030, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "asked", "if", "he", "would", "return", "to", "the", "mountain", "##ous", "region", "where", "rebels", "have", "been", "fighting", "Russian", "troops", "for", "full", "independence", ",", "Pen", "##rose", "said", ":", "\"", "Not", "for", "the", "time", "being", "." ], "ids": [ 12242, 22151, 12277, 10261, 10894, 15079, 10114, 10105, 25233, 13499, 12220, 10940, 57545, 10529, 10590, 27535, 13463, 20836, 10142, 13375, 31412, 117, 52559, 35329, 12415, 131, 107, 16040, 10142, 10105, 10635, 11223, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "do", "n", "'", "t", "think", "it", "'", "s", "safe", "for", "me", "." ], "ids": [ 146, 10149, 182, 112, 188, 27874, 10271, 112, 187, 43966, 10142, 10911, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "may", "##be", "in", "the", "future", ",", "depending", "on", "the", "circumstances", ".", "\"" ], "ids": [ 16976, 11387, 11044, 10106, 10105, 16711, 117, 45812, 10135, 10105, 54186, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Princess", "Diana", "send", "message", "to", "Mother", "Teresa", "." ], "ids": [ 22292, 22365, 45567, 30514, 10114, 23625, 21218, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "'", "s", "Princess", "Diana", "has", "sent", "a", "message", "to", "seriously", "ill", "Mother", "Teresa", ",", "the", "nun", "to", "whom", "she", "has", "turned", "several", "times", "for", "spiritual", "guidance", "." ], "ids": [ 16032, 112, 187, 22292, 22365, 10393, 14541, 169, 30514, 10114, 75543, 32941, 23625, 21218, 117, 10105, 11715, 10114, 18104, 10833, 10393, 21031, 11736, 13465, 10142, 42422, 78112, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Diana", "'", "s", "office", "said", "on", "Saturday", "the", "princes", "##s", "had", "sent", "a", "message", "to", "the", "Nobel", "Peace", "Prize", "-", "winning", "missionary", "as", "news", "broke", "this", "week", "of", "her", "battle", "against", "heart", "problems", "and", "malaria", "." ], "ids": [ 22365, 112, 187, 14301, 12415, 10135, 24848, 10105, 87641, 10107, 10374, 14541, 169, 30514, 10114, 10105, 16280, 20705, 17017, 118, 16542, 89063, 10146, 14424, 30500, 10531, 16118, 10108, 10485, 18758, 11327, 21736, 20390, 10111, 88086, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "spoke", "##s", "##woman", "declined", "to", "release", "details", "of", "the", "message", "." ], "ids": [ 138, 50005, 10107, 79999, 44948, 10114, 14072, 29500, 10108, 10105, 30514, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Diana", "first", "met", "the", "Albanian", "-", "born", "missionary", "in", "Rome", "in", "1992", "." ], "ids": [ 22365, 10422, 10428, 10105, 54257, 118, 11175, 89063, 10106, 14592, 10106, 10450, 119 ], "entity": [ "B-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 2, 6, 6, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "She", "said", "afterwards", "that", "the", "meeting", "had", "fu", "##lf", "##ille", "##d", "her", "\"", "dea", "##rest", "wish", "\"", "and", "the", "two", "women", "have", "met", "several", "times", "since", "." ], "ids": [ 11149, 12415, 49827, 10189, 10105, 19822, 10374, 11005, 35173, 14420, 10162, 10485, 107, 42492, 34189, 66069, 107, 10111, 10105, 10551, 13190, 10529, 10428, 11736, 13465, 11764, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "princes", "##s", ",", "who", "has", "carved", "out", "a", "major", "role", "for", "herself", "as", "a", "help", "##er", "of", "the", "sick", "and", "need", "##y", ",", "is", "said", "to", "have", "turned", "to", "Mother", "Teresa", "for", "guidance", "as", "her", "marriage", "c", "##rum", "##ble", "##d", "to", "heir", "to", "the", "British", "throne", "Prince", "Charles", "." ], "ids": [ 10117, 87641, 10107, 117, 10479, 10393, 84860, 10950, 169, 11922, 12971, 10142, 32262, 10146, 169, 15217, 10165, 10108, 10105, 101003, 10111, 17367, 10157, 117, 10124, 12415, 10114, 10529, 21031, 10114, 23625, 21218, 10142, 78112, 10146, 10485, 21288, 171, 12659, 11203, 10162, 10114, 72143, 10114, 10105, 11160, 53409, 14185, 10925, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 9 ] }, { "tokens": [ "The", "85", "-", "year", "-", "old", "nun", "said", "in", "the", "past", "that", "she", "was", "pra", "##ying", "for", "the", "couple", ",", "whose", "divorce", "is", "expected", "to", "become", "final", "next", "week", "." ], "ids": [ 10117, 12017, 118, 10924, 118, 12898, 11715, 12415, 10106, 10105, 17781, 10189, 10833, 10134, 69857, 40018, 10142, 10105, 20969, 117, 16879, 58277, 10124, 25973, 10114, 13461, 11070, 13451, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Doctor", "##s", "car", "##ing", "for", "Mother", "Teresa", "in", "a", "Calcutta", "hospital", "said", "on", "Saturday", "that", "her", "fever", "had", "fallen", "and", "her", "malaria", "was", "under", "control", "but", "she", "remained", "on", "a", "resp", "##irat", "##or", "in", "intensive", "care", "." ], "ids": [ 17376, 10107, 13000, 10230, 10142, 23625, 21218, 10106, 169, 54383, 18141, 12415, 10135, 24848, 10189, 10485, 105142, 10374, 40055, 10111, 10485, 88086, 10134, 10571, 12608, 10473, 10833, 15980, 10135, 169, 52812, 56610, 10667, 10106, 73636, 11131, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "PA", "##KI", "##ST", "##AN", "339", "-", "4", "V", "EN", "##GL", "##AN", "##D", "-", "close", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 32349, 59879, 32995, 41275, 34753, 118, 125, 159, 31278, 104780, 41275, 11490, 118, 16065, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "Sa", "##eed", "Anwar", "c", "C", "##roft", "b", "Cork", "176" ], "ids": [ 12404, 40154, 92168, 171, 140, 101860, 170, 42049, 21613 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 9, 4, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "c", "Cork", "b", "C", "##roft", "46" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 171, 42049, 170, 140, 101860, 11528 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 9, 4, 8, 9 ] }, { "tokens": [ "I", "##ja", "##z", "Ahmed", "c", "Stewart", "b", "Mu", "##lla", "##lly", "61" ], "ids": [ 146, 10320, 10305, 25530, 171, 17493, 170, 49056, 11083, 17903, 12314 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 9, 4, 8, 8, 9 ] }, { "tokens": [ "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", "c", "Hus", "##sain", "b", "Mu", "##lla", "##lly", "35" ], "ids": [ 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 171, 109022, 82083, 170, 49056, 11083, 17903, 10803 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Salim", "Malik", "not", "out", "2" ], "ids": [ 98284, 45783, 10472, 10950, 123 ], "entity": [ "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9 ] }, { "tokens": [ "As", "##if", "Mu", "##jta", "##ba", "not", "out", "1" ], "ids": [ 10882, 13918, 49056, 51465, 10537, 10472, 10950, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "18" ], "ids": [ 50821, 10107, 10218 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wi", "##cket", "-", "1", "-", "106", "2", "-", "239", "3", "-", "334", "4", "-", "334" ], "ids": [ 15750, 10108, 23040, 28721, 118, 122, 118, 16084, 123, 118, 25338, 124, 118, 33956, 125, 118, 33956 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "bat", "-", "Was", "##im", "Ak", "##ram", ",", "Moi", "##n", "Khan", ",", "Mus", "##hta", "##q", "Ahmed", ",", "W", "##aq", "##ar", "You", "##nis", ",", "Mohammad", "Ak", "##am" ], "ids": [ 11469, 11519, 118, 22034, 11759, 71275, 13845, 117, 82447, 10115, 16324, 117, 31013, 32493, 11703, 25530, 117, 160, 49277, 10354, 11065, 12597, 117, 40036, 71275, 11008 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8 ] }, { "tokens": [ "England", "326", "all", "out" ], "ids": [ 11701, 32558, 10435, 10950 ], "entity": [ "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9 ] }, { "tokens": [ "Soccer", "-", "Ni", "##j", "##me", "##h", "beat", "Nas", "##r", "1", "-", "0", "." ], "ids": [ 25914, 118, 30409, 10418, 10627, 10237, 27868, 40751, 10129, 122, 118, 121, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "TR", "##IP", "##OL", "##I", ",", "Lebanon", "1996", "-", "08", "-", "24" ], "ids": [ 80047, 30331, 39272, 11281, 117, 40037, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ni", "##j", "##me", "##h", "of", "Lebanon", "beat", "Nas", "##r", "of", "Saudi", "Arabia", "1", "-", "0", "(", "half", "##time", "1", "-", "0", ")", "in", "their", "Asian", "club", "championship", "second", "round", "first", "leg", "tie", "on", "Saturday", "." ], "ids": [ 30409, 10418, 10627, 10237, 10108, 40037, 27868, 40751, 10129, 10108, 26598, 27860, 122, 118, 121, 113, 13877, 18086, 122, 118, 121, 114, 10106, 10455, 16900, 11111, 20755, 11132, 13569, 10422, 33810, 27916, 10135, 24848, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 9, 3, 7, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##r", ":", "Is", "##sa", "All", "##ous", "##h", "(", "45", "##th", "minute", ")", "." ], "ids": [ 66875, 10129, 131, 12034, 10466, 11101, 13499, 10237, 113, 10827, 11143, 21760, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "10", ",", "000", "." ], "ids": [ 46080, 131, 10150, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Adventure", "##rs", "start", "Canadian", "wilde", "##rness", "race", "." ], "ids": [ 29525, 10943, 15148, 14023, 39351, 110208, 14025, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "PE", "##M", "##B", "##ER", "##TO", "##N", ",", "British", "Columbia", "1996", "-", "08", "-", "24" ], "ids": [ 80468, 11517, 11274, 24093, 60493, 11537, 117, 11160, 13469, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "About", "350", "adventure", "##rs", "from", "nine", "countries", "set", "out", "on", "Saturday", "to", "climb", ",", "ra", "##ft", ",", "bike", "and", "run", "in", "a", "323", "-", "mile", "(", "517", "-", "km", ")", "end", "##urance", "race", "through", "the", "Canadian", "wilde", "##rness", "." ], "ids": [ 16260, 14992, 67865, 10943, 10188, 19964, 15911, 11847, 10950, 10135, 24848, 10114, 93274, 117, 11859, 12961, 117, 99345, 10111, 14095, 10106, 169, 28550, 118, 21128, 113, 49494, 118, 10204, 114, 11572, 41078, 14025, 11222, 10105, 14023, 39351, 110208, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "The", "event", ",", "called", "the", "Eco", "-", "Challenge", ",", "is", "part", "of", "a", "growing", "sport", "known", "as", "adventure", "racing", "in", "which", "competitors", "test", "their", "limits", "for", "days", "over", "a", "per", "##ilo", "##us", "wilde", "##rness", "course", "." ], "ids": [ 10117, 14416, 117, 11552, 10105, 85526, 118, 22193, 117, 10124, 10668, 10108, 169, 25566, 17925, 11053, 10146, 67865, 31008, 10106, 10319, 92093, 15839, 10455, 47418, 10142, 13990, 10491, 169, 10178, 21785, 10251, 39351, 110208, 15348, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "'", "m", "looking", "forward", "to", "this", "race", "." ], "ids": [ 107, 146, 112, 181, 34279, 23307, 10114, 10531, 14025, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "think", "it", "will", "be", "more", "physically", "challenging", "and", "we", "'", "ll", "have", "to", "go", "up", "against", "more", "diverse", "situations", "due", "to", "the", "terrain", ",", "\"", "said", "Dr", ".", "Michael", "St", "##roud", ",", "a", "veteran", "Eco", "-", "Challenge", "participant", "." ], "ids": [ 146, 27874, 10271, 11337, 10347, 10798, 94274, 109024, 10111, 11951, 112, 22469, 10529, 10114, 11783, 10741, 11327, 10798, 15082, 52844, 10850, 10114, 10105, 26555, 117, 107, 12415, 11612, 119, 10631, 10838, 99788, 117, 169, 55669, 85526, 118, 22193, 61986, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "The", "Eco", "-", "Challenge", "has", "been", "staged", "twice", "before", "-", "-", "in", "Utah", "and", "Maine", "last", "year", "-", "-", "and", "is", "modell", "##ed", "on", "similar", "races", "overseas", "." ], "ids": [ 10117, 85526, 118, 22193, 10393, 10590, 84310, 26261, 11360, 118, 118, 10106, 22418, 10111, 20614, 12469, 10924, 118, 118, 10111, 10124, 71703, 10336, 10135, 13213, 20624, 59391, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "70", "teams", "in", "this", "year", "'", "s", "race", "will", "will", "tre", "##k", "g", "##lac", "##iers", ",", "climb", "mountains", ",", "white", "##water", "ra", "##ft", ",", "horse", "##back", "ride", ",", "can", "##oe", "and", "mountain", "bike", "along", "the", "gr", "##uel", "##ing", "course", "." ], "ids": [ 10117, 10923, 14404, 10106, 10531, 10924, 112, 187, 14025, 11337, 11337, 11617, 10174, 175, 63279, 20297, 117, 93274, 44623, 117, 15263, 21099, 11859, 12961, 117, 30491, 18666, 48543, 117, 10944, 20085, 10111, 25233, 99345, 12400, 10105, 30518, 27043, 10230, 15348, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "year", "'", "s", "race", ",", "the", "route", "of", "which", "was", "keep", "a", "secret", "until", "Friday", "evening", ",", "is", "being", "held", "near", "Pe", "##mber", "##ton", ",", "British", "Columbia", ",", "about", "100", "miles", "(", "160", "km", ")", "northeast", "of", "Vancouver", "." ], "ids": [ 10747, 10924, 112, 187, 14025, 117, 10105, 13933, 10108, 10319, 10134, 23819, 169, 23658, 11444, 30767, 42135, 117, 10124, 11223, 11991, 12883, 29005, 33567, 11183, 117, 11160, 13469, 117, 10978, 10407, 14148, 113, 13849, 10204, 114, 33002, 10108, 21541, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "area", "is", "filled", "with", "tre", "##acher", "##ous", "mountain", "peaks", ",", "ice", "fields", "and", "fri", "##gid", "waters", "." ], "ids": [ 10117, 11168, 10124, 39287, 10169, 11617, 58093, 13499, 25233, 86666, 117, 24642, 28455, 10111, 35350, 77044, 42646, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Organ", "##iser", "##s", "ex", "##pect", "about", "two", "-", "third", "##s", "of", "the", "participants", "to", "drop", "out", "or", "be", "dis", "##qual", "##ified", "before", "the", "finish", "." ], "ids": [ 72154, 25004, 10107, 11419, 51511, 10978, 10551, 118, 12628, 10107, 10108, 10105, 35675, 10114, 36365, 10950, 10345, 10347, 27920, 102260, 31825, 11360, 10105, 26282, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "hard", "##y", "ones", "are", "expected", "to", "complete", "the", "course", "in", "about", "six", "days", ",", "with", "first", "-", "place", "finish", "##ers", "receiving", "$", "10", ",", "000", "in", "prize", "money", "." ], "ids": [ 10117, 19118, 10157, 35688, 10301, 25973, 10114, 17876, 10105, 15348, 10106, 10978, 12449, 13990, 117, 10169, 10422, 118, 11192, 26282, 10901, 31391, 109, 10150, 117, 10259, 10106, 32929, 17920, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "Eco", "-", "Challenge", ",", "competitors", "race", "in", "teams", "of", "five", "which", "must", "include", "both", "men", "and", "women", "." ], "ids": [ 10167, 10105, 85526, 118, 22193, 117, 92093, 14025, 10106, 14404, 10108, 12403, 10319, 14982, 12363, 11408, 10588, 10111, 13190, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Team", "members", "must", "remain", "within", "100", "yards", "(", "metres", ")", "of", "each", "other", "at", "all", "times", "and", "finish", "together", "." ], "ids": [ 12140, 12464, 14982, 25430, 12381, 10407, 25537, 113, 16393, 114, 10108, 11948, 10684, 10160, 10435, 13465, 10111, 26282, 14229, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "race", "##rs", "carrying", "about", "40", "pounds", "(", "18", "kg", ")", "of", "gear", "on", "their", "back", "##s", ",", "broken", "bones", ",", "sun", "##stro", "##ke", ",", "de", "##hy", "##drat", "##ion", "and", "ex", "##haus", "##tion", "are", "common", "." ], "ids": [ 12613, 14025, 10943, 39157, 10978, 10533, 61982, 113, 10218, 11895, 114, 10108, 62559, 10135, 10455, 12014, 10107, 117, 36197, 48222, 117, 42230, 34582, 10550, 117, 10104, 19275, 92659, 11046, 10111, 11419, 14465, 10822, 10301, 14624, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##lera", "kills", "21", "in", "southern", "Nigeria", "." ], "ids": [ 50690, 37684, 69179, 10296, 10106, 17156, 22045, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "LA", "##GO", "##S", "1996", "-", "05", "-", "28" ], "ids": [ 29079, 83821, 10731, 10389, 118, 10831, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "outbreak", "of", "cho", "##lera", "has", "killed", "21", "people", "in", "a", "week", "at", "U", "##bi", "##mini", "in", "oil", "-", "rich", "southern", "Nigeria", ",", "the", "News", "Agency", "of", "Nigeria", "reported", "on", "Saturday", "." ], "ids": [ 10313, 63831, 10108, 11257, 37684, 10393, 15875, 10296, 11426, 10106, 169, 16118, 10160, 158, 11645, 37249, 10106, 21073, 118, 33250, 17156, 22045, 117, 10105, 12219, 21887, 10108, 22045, 15943, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "chairman", "of", "the", "local", "council", ",", "Damian", "E", "##jio", "##hu", "##o", ",", "said", "drugs", "had", "been", "rus", "##hed", "to", "the", "area", "to", "quell", "the", "disease", "and", "the", "community", "needed", "a", "safe", "##r", "source", "of", "drinking", "water", "to", "prevent", "future", "outbreak", "##s", "." ], "ids": [ 10117, 27627, 10108, 10105, 11436, 23503, 117, 80820, 142, 97719, 13723, 10133, 117, 12415, 40421, 10374, 10590, 19867, 16081, 10114, 10105, 11168, 10114, 44183, 10105, 21911, 10111, 10105, 13354, 23794, 169, 43966, 10129, 15247, 10108, 68351, 12286, 10114, 29320, 16711, 63831, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "E", "##pide", "##mics", "are", "common", "in", "rural", "areas", "of", "Nigeria", "where", "pipe", "##d", "water", "is", "not", "usually", "available", "." ], "ids": [ 142, 77677, 58622, 10301, 14624, 10106, 18380, 14544, 10108, 22045, 10940, 82153, 10162, 12286, 10124, 10472, 15910, 14579, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Malawi", "'", "s", "ex", "-", "president", "Banda", "says", "he", "'", "s", "feeling", "well", "." ], "ids": [ 51020, 112, 187, 11419, 118, 12931, 37963, 22153, 10261, 112, 187, 61362, 11206, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BL", "##AN", "##T", "##Y", "##RE", "1996", "-", "08", "-", "24" ], "ids": [ 102549, 41275, 11090, 14703, 66014, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Malawi", "'", "s", "fra", "##il", "former", "president", ",", "Ka", "##mu", "##zu", "Banda", ",", "said", "on", "Saturday", "in", "a", "rare", "public", "interview", "that", "he", "was", "feeling", "well", "despite", "his", "advanced", "years", "." ], "ids": [ 51020, 112, 187, 10628, 11030, 11775, 12931, 117, 25444, 11717, 13078, 37963, 117, 12415, 10135, 24848, 10106, 169, 23902, 11683, 21213, 10189, 10261, 10134, 61362, 11206, 22087, 10226, 27072, 10855, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "feel", "all", "right", "and", "I", "eat", "everything", "that", "is", "put", "on", "the", "table", "." ], "ids": [ 107, 146, 38008, 10435, 13448, 10111, 146, 69110, 42536, 10189, 10124, 14499, 10135, 10105, 21783, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "that", "means", "I", "am", "all", "right", ",", "\"", "he", "told", "reporter", "##s", "invited", "to", "his", "home", "." ], "ids": [ 12689, 10189, 17574, 146, 10392, 10435, 13448, 117, 107, 10261, 21937, 41408, 10107, 33392, 10114, 10226, 11816, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Banda", ",", "a", "veg", "##etaria", "##n", "tee", "##tot", "##alle", "##r", "believed", "to", "be", "97", ",", "walk", "##ed", "una", "##ide", "##d", "but", "supporting", "himself", "on", "a", "walking", "stick", "." ], "ids": [ 37963, 117, 169, 108193, 95002, 10115, 77711, 40530, 31080, 10129, 20718, 10114, 10347, 12328, 117, 33734, 10336, 10153, 13315, 10162, 10473, 32403, 14764, 10135, 169, 59381, 84081, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "c", "##lut", "##ched", "a", "fly", "w", "##his", "##k", "which", "for", "a", "long", "time", "symbol", "##ised", "his", "ob", "##session", "with", "power", "." ], "ids": [ 10357, 171, 40846, 35456, 169, 26155, 191, 49311, 10174, 10319, 10142, 169, 11695, 10635, 29725, 20666, 10226, 17339, 88080, 10169, 13183, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "health", "was", "the", "subject", "of", "much", "recent", "sp", "##ecu", "##lation", "." ], "ids": [ 11597, 17004, 10134, 10105, 20036, 10108, 13172, 19037, 32650, 97038, 19718, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Malawi", "'", "s", "und", "##is", "##put", "##ed", "ruler", "for", "three", "decades", ",", "he", "lost", "power", "in", "the", "first", "all", "-", "party", "elections", "in", "1994", "." ], "ids": [ 51020, 112, 187, 10130, 10291, 27876, 10336, 64192, 10142, 11003, 33256, 117, 10261, 14172, 13183, 10106, 10105, 10422, 10435, 118, 14039, 22054, 10106, 10444, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "spent", "a", "year", "under", "house", "arrest", "and", "was", "tried", "but", "ac", "##qui", "##tted", "last", "year", "on", "charges", "of", "order", "##ing", "the", "murder", "of", "four", "opponents", "in", "1983", "." ], "ids": [ 10357, 18571, 169, 10924, 10571, 13215, 45165, 10111, 10134, 27156, 10473, 13621, 39639, 95408, 12469, 10924, 10135, 31128, 10108, 12990, 10230, 10105, 29448, 10108, 11598, 63568, 10106, 10643, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zimbabwe", "fires", "striking", "civil", "servant", "##s", "." ], "ids": [ 34577, 90350, 87894, 14161, 53211, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Em", "##elia", "Sit", "##hole" ], "ids": [ 11289, 44552, 43690, 84569 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "H", "##AR", "##AR", "##E", "1996", "-", "08", "-", "24" ], "ids": [ 145, 52188, 52188, 11259, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Zimbabwe", "##an", "government", "fired", "thousands", "of", "workers", "on", "Saturday", "for", "def", "##ying", "an", "order", "to", "end", "a", "strike", "which", "has", "c", "##rip", "##ple", "##d", "essential", "services", "and", "dis", "##rupted", "international", "and", "domestic", "flights", "." ], "ids": [ 10117, 34577, 10206, 12047, 38903, 39966, 10108, 23829, 10135, 24848, 10142, 100745, 40018, 10151, 12990, 10114, 11572, 169, 37456, 10319, 10393, 171, 68228, 22238, 10162, 50399, 12639, 10111, 27920, 63133, 12533, 10111, 31084, 55650, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Public", "Service", "Commission", "(", "PS", "##C", ")", "said", "in", "a", "statement", "that", "the", "workers", "-", "-", "including", "nurse", "##s", ",", "junior", "doctors", ",", "mort", "##uary", "attend", "##ants", ",", "customs", "officers", "and", "fire", "##fig", "##hter", "##s", "-", "-", "would", "be", "barre", "##d", "from", "entering", "their", "work", "##place", "##s", "on", "Monday", "." ], "ids": [ 10117, 14647, 13489, 14941, 113, 21290, 10858, 114, 12415, 10106, 169, 33311, 10189, 10105, 23829, 118, 118, 11198, 108470, 10107, 117, 21854, 82782, 117, 12338, 68736, 34465, 22595, 117, 89907, 23579, 10111, 13559, 74115, 70445, 10107, 118, 118, 10894, 10347, 107553, 10162, 10188, 44824, 10455, 11424, 30236, 10107, 10135, 40714, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "All", "civil", "servant", "##s", "who", "did", "not", "return", "to", "work", "at", "their", "normal", "working", "hours", ",", "and", "remained", "working", "for", "the", "full", "working", "day", "on", "23", "August", "1996", ",", "have", "been", "sum", "##mari", "##ly", "dismissed", ".", ".", "." ], "ids": [ 107, 11101, 14161, 53211, 10107, 10479, 12172, 10472, 15079, 10114, 11424, 10160, 10455, 16626, 14616, 19573, 117, 10111, 15980, 14616, 10142, 10105, 13375, 14616, 11940, 10135, 10328, 10735, 10389, 117, 10529, 10590, 28439, 65899, 10454, 59379, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "with", "immediate", "effect", ",", "\"", "it", "said", "in", "a", "statement", "." ], "ids": [ 10169, 46938, 18514, 117, 107, 10271, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Union", "officials", "from", "the", "Public", "Service", "Association", "(", "PSA", ")", "were", "una", "##vai", "##lab", "##le", "for", "comment", "." ], "ids": [ 11457, 27730, 10188, 10105, 14647, 13489, 11751, 113, 99575, 114, 10309, 10153, 37557, 41284, 10284, 10142, 49641, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Public", "Service", ",", "Labour", "and", "Social", "Welfare", "Minister", "Florence", "Chi", "##tau", "##ro", "told", "state", "radio", "her", "ministry", "had", "already", "begun", "re", "##c", "##ruit", "##ing", "other", "people", "to", "replace", "the", "striker", "##s", ",", "sub", "-", "contract", "##ing", "some", "of", "the", "work", "to", "private", "firms", "." ], "ids": [ 14647, 13489, 117, 25606, 10111, 12824, 98860, 14355, 23283, 21946, 68330, 10567, 21937, 11388, 12429, 10485, 65338, 10374, 19034, 49510, 11639, 10350, 91788, 10230, 10684, 11426, 10114, 37156, 10105, 103325, 10107, 117, 13987, 118, 16108, 10230, 11152, 10108, 10105, 11424, 10114, 14591, 84459, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "had", "been", "threat", "##ening", "to", "fire", "the", "workers", "since", "the", "strike", "began", "on", "Tuesday", ",", "saying", "it", "was", "illegal", "." ], "ids": [ 10117, 12047, 10374, 10590, 41256, 24428, 10114, 13559, 10105, 23829, 11764, 10105, 37456, 11941, 10135, 70245, 117, 22807, 10271, 10134, 39806, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "striker", "##s", "ig", "##nore", "##d", "the", "threat", "and", "vo", "##wed", "to", "stay", "on", "the", "streets", "until", "their", "demands", "for", "wa", "##ge", "rises", "of", "30", "to", "60", "percent", "were", "met", "." ], "ids": [ 16976, 10105, 103325, 10107, 23602, 99772, 10162, 10105, 41256, 10111, 12556, 48854, 10114, 29597, 10135, 10105, 41969, 11444, 10455, 64886, 10142, 11471, 10525, 91144, 10108, 10244, 10114, 10709, 22362, 10309, 10428, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "stop", "##page", "has", "left", "essential", "services", "stretch", "##ed", "with", "many", "hospitals", "handling", "only", "emergency", "cases", "under", "senior", "doctors", "with", "the", "help", "of", "army", "medical", "personnel", "and", "the", "Red", "Cross", "." ], "ids": [ 10117, 20517, 36795, 10393, 12153, 50399, 12639, 85690, 10336, 10169, 11299, 70105, 52703, 10893, 44461, 16480, 10571, 17843, 82782, 10169, 10105, 15217, 10108, 17977, 19436, 23889, 10111, 10105, 11641, 15666, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "It", "has", "also", "dis", "##rupted", "flights", "." ], "ids": [ 10377, 10393, 10379, 27920, 63133, 55650, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "internal", "services", "were", "cancelled", ",", "leaving", "tourists", "at", "the", "Victoria", "Falls", "resort", "strand", "##ed", ",", "and", "flights", "abroad", "were", "delayed", "." ], "ids": [ 13885, 29868, 12639, 10309, 60557, 117, 21005, 85709, 10160, 10105, 13661, 23118, 60637, 65803, 10336, 117, 10111, 55650, 50901, 10309, 67058, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "PSA", "said", "80", "percent", "of", "the", "country", "'", "s", "180", ",", "000", "civil", "servant", "##s", "took", "part", "in", "the", "strike", "which", "is", "a", "rare", "challenge", "to", "President", "Robert", "Mu", "##gabe", ",", "who", "has", "been", "in", "power", "since", "independence", "from", "Britain", "in", "1980", "." ], "ids": [ 10117, 99575, 12415, 10832, 22362, 10108, 10105, 12723, 112, 187, 13912, 117, 10259, 14161, 53211, 10107, 12149, 10668, 10106, 10105, 37456, 10319, 10124, 169, 23902, 36040, 10114, 12811, 10820, 49056, 30337, 117, 10479, 10393, 10590, 10106, 13183, 11764, 31412, 10188, 16032, 10106, 10538, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Opposition", "parties", ",", "ci", "##vic", "organisations", "and", "private", "-", "sector", "unions", "have", "expressed", "support", "for", "the", "action", "and", "den", "##oun", "##ced", "the", "government", "'", "s", "pay", "rises", "of", "up", "to", "eight", "percent", "for", "its", "workers", "." ], "ids": [ 69053, 18708, 117, 11322, 48175, 41536, 10111, 14591, 118, 17417, 76841, 10529, 31685, 13145, 10142, 10105, 14204, 10111, 10140, 43971, 38039, 10105, 12047, 112, 187, 16868, 91144, 10108, 10741, 10114, 16222, 22362, 10142, 10474, 23829, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Civil", "servant", "##s", "earn", "on", "average", "Z", "$", "1", ",", "000", "(", "$", "100", ")", "a", "month", "." ], "ids": [ 14906, 53211, 10107, 65065, 10135, 13551, 163, 109, 122, 117, 10259, 113, 109, 10407, 114, 169, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "say", "their", "pay", "has", "not", "kept", "up", "at", "all", "with", "inflation", ",", "currently", "running", "at", "22", "percent", "." ], "ids": [ 11696, 23763, 10455, 16868, 10393, 10472, 26546, 10741, 10160, 10435, 10169, 105888, 117, 15313, 18020, 10160, 10306, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rwanda", "says", "Za", "##ire", "ex", "##pel", "##s", "28", "Rwanda", "##n", "refugees", "." ], "ids": [ 57557, 22153, 14074, 11627, 11419, 17703, 10107, 10348, 57557, 10115, 71797, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "K", "##IG", "##AL", "##I", "1996", "-", "08", "-", "24" ], "ids": [ 148, 89696, 32002, 11281, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rwanda", "said", "on", "Saturday", "that", "Za", "##ire", "had", "expelled", "28", "Rwanda", "##n", "Hut", "##u", "refugees", "accused", "of", "being", "\"", "trouble", "-", "makers", "\"", "in", "camps", "in", "eastern", "Za", "##ire", "." ], "ids": [ 57557, 12415, 10135, 24848, 10189, 14074, 11627, 10374, 90811, 10348, 57557, 10115, 104185, 10138, 71797, 37303, 10108, 11223, 107, 58285, 118, 104213, 107, 10106, 33978, 10106, 18677, 14074, 11627, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 5, 9, 9, 9, 2, 6, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Captain", "Fi", "##rmin", "Gate", "##ra", ",", "spoke", "##sman", "for", "the", "Tu", "##tsi", "-", "dominated", "Rwanda", "##n", "army", ",", "told", "Reuters", "in", "Ki", "##gali", "that", "17", "of", "the", "28", "refugees", "handed", "over", "on", "Friday", "from", "the", "Za", "##irea", "##n", "town", "of", "Go", "##ma", "had", "been", "soldiers", "in", "the", "former", "Hut", "##u", "army", "which", "fled", "to", "Za", "##ire", "in", "1994", "after", "being", "defeated", "by", "Tu", "##tsi", "forces", "in", "Rwanda", "'", "s", "civil", "war", "." ], "ids": [ 17448, 36448, 75508, 30716, 10288, 117, 50005, 24305, 10142, 10105, 20108, 27856, 118, 49365, 57557, 10115, 17977, 117, 21937, 46617, 10106, 28941, 53740, 10189, 10273, 10108, 10105, 10348, 71797, 44040, 10491, 10135, 30767, 10188, 10105, 14074, 60330, 10115, 12221, 10108, 14439, 10369, 10374, 10590, 23324, 10106, 10105, 11775, 104185, 10138, 17977, 10319, 56598, 10114, 14074, 11627, 10106, 10444, 10662, 11223, 18058, 10155, 20108, 27856, 13729, 10106, 57557, 112, 187, 14161, 10338, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 2, 6, 6, 6, 2, 6, 9, 9, 9, 3, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Za", "##irea", "##n", "Prime", "Minister", "Ken", "##go", "wa", "Don", "##do", "said", "on", "Thursday", "in", "a", "visit", "to", "Rwanda", "that", "his", "country", "would", "ex", "##pel", "##l", "all", "the", "refugees", "back", "to", "Rwanda", "but", "he", "gave", "no", "time", "##fram", "##e", "." ], "ids": [ 14074, 60330, 10115, 19924, 14355, 19355, 10797, 11471, 11740, 10317, 12415, 10135, 67067, 10106, 169, 27541, 10114, 57557, 10189, 10226, 12723, 10894, 11419, 17703, 10161, 10435, 10105, 71797, 12014, 10114, 57557, 10473, 10261, 15362, 10192, 10635, 110123, 10112, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Za", "##ire", "is", "home", "to", "1", ".", "1", "million", "Rwanda", "##n", "Hut", "##u", "refugees", "who", "fled", "three", "months", "of", "civil", "war", "in", "1994", "." ], "ids": [ 14074, 11627, 10124, 11816, 10114, 122, 119, 122, 12473, 57557, 10115, 104185, 10138, 71797, 10479, 56598, 11003, 15555, 10108, 14161, 10338, 10106, 10444, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 2, 6, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Many", "had", "taken", "part", "in", "the", "gen", "##ocide", "that", "year", "of", "one", "million", "people", ",", "mostly", "Tu", "##tsi", "##s", ",", "and", "refuse", "to", "go", "home", "for", "fear", "of", "repris", "##al", "at", "the", "hands", "of", "the", "new", "Tu", "##tsi", "-", "dominated", "government", "in", "Ki", "##gali", "." ], "ids": [ 17244, 10374, 15109, 10668, 10106, 10105, 15331, 98808, 10189, 10924, 10108, 10464, 12473, 11426, 117, 19774, 20108, 27856, 10107, 117, 10111, 48787, 10114, 11783, 11816, 10142, 44929, 10108, 62907, 10415, 10160, 10105, 27925, 10108, 10105, 10751, 20108, 27856, 118, 49365, 12047, 10106, 28941, 53740, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Gate", "##ra", "said", "the", "refugees", "were", "handed", "over", "following", "a", "deal", "made", "at", "a", "meeting", "between", "the", "governor", "of", "Za", "##ire", "'", "s", "north", "Ki", "##vu", "region", "and", "his", "counter", "##part", "in", "the", "Rwanda", "##n", "border", "town", "of", "G", "##isen", "##yi", "." ], "ids": [ 30716, 10288, 12415, 10105, 71797, 10309, 44040, 10491, 11901, 169, 19918, 11019, 10160, 169, 19822, 10948, 10105, 28795, 10108, 14074, 11627, 112, 187, 12756, 28941, 13048, 12220, 10111, 10226, 46298, 48433, 10106, 10105, 57557, 10115, 20949, 12221, 10108, 144, 14838, 13641, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "\"", "After", "a", "meeting", "between", "the", "governor", "of", "north", "Ki", "##vu", "and", "the", "pre", "##fect", "of", "G", "##isen", "##yi", ",", "28", "prisoners", "(", "refugees", ")", "were", "handed", "over", "to", "Rwanda", "##n", "authorities", "on", "Friday", ",", "\"", "Gate", "##ra", "said", ".", "\"" ], "ids": [ 107, 11301, 169, 19822, 10948, 10105, 28795, 10108, 12756, 28941, 13048, 10111, 10105, 12229, 84732, 10108, 144, 14838, 13641, 117, 10348, 44094, 113, 71797, 114, 10309, 44040, 10491, 10114, 57557, 10115, 28308, 10135, 30767, 117, 107, 30716, 10288, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Out", "of", "these", "17", "were", "former", "soldiers", "." ], "ids": [ 14504, 10108, 11762, 10273, 10309, 11775, 23324, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "people", "are", "now", "in", "G", "##isen", "##yi", "prison", ",", "\"", "Gate", "##ra", "added", "." ], "ids": [ 13252, 11426, 10301, 11858, 10106, 144, 14838, 13641, 20538, 117, 107, 30716, 10288, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Rev", "##ered", "skull", "of", "S", ".", "Africa", "king", "is", "Scottish", "woman", "'", "s", "." ], "ids": [ 24774, 45452, 94671, 10108, 156, 119, 12880, 20636, 10124, 18879, 18299, 112, 187, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "24" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "li", "##mel", "##ight", "-", "lov", "##ing", "South", "African", "chief", "was", "in", "dis", "##gra", "##ce", "on", "Saturday", "after", "a", "prize", "##d", "skull", "he", "brought", "home", "from", "Scotland", "was", "identified", "as", "belonging", "not", "to", "his", "sacred", "tribal", "an", "##ces", "##tor", ",", "but", "to", "a", "middle", "-", "aged", "white", "woman", "." ], "ids": [ 138, 11614, 19390, 27521, 118, 49950, 10230, 11056, 13839, 19421, 10134, 10106, 27920, 25635, 10419, 10135, 24848, 10662, 169, 32929, 10162, 94671, 10261, 17327, 11816, 10188, 16901, 10134, 26121, 10146, 54188, 10472, 10114, 10226, 79038, 65227, 10151, 14585, 11813, 117, 10473, 10114, 169, 20181, 118, 30262, 15263, 18299, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "foren", "##sic", "scientist", "who", "examined", "the", "supposed", "skull", "of", "19th", "century", "King", "Hi", "##nts", "##a", ",", "a", "chief", "of", "President", "Nelson", "Mandela", "'", "s", "X", "##hosa", "tribe", "killed", "in", "battle", "by", "the", "British", ",", "said", "it", "was", "in", "fact", "the", "c", "##rani", "##um", "of", "a", "European", "woman", "." ], "ids": [ 138, 33613, 90439, 59248, 10479, 101657, 10105, 59516, 94671, 10108, 19794, 11943, 11515, 20065, 14073, 10113, 117, 169, 19421, 10108, 12811, 15962, 63881, 112, 187, 161, 107164, 40964, 15875, 10106, 18758, 10155, 10105, 11160, 117, 12415, 10271, 10134, 10106, 18638, 10105, 171, 31110, 10465, 10108, 169, 11914, 18299, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Chief", "Nicholas", "G", "##cale", "##ka", ",", "dressed", "in", "animal", "skin", "##s", "and", "full", "tribal", "re", "##gali", "##a", ",", "journey", "##ed", "to", "a", "win", "##try", "Scotland", "in", "February", "on", "a", "huge", "##ly", "public", "##ised", "quest", "to", "find", "Hi", "##nts", "##a", "'", "s", "skull", "." ], "ids": [ 16730, 19289, 144, 45330, 10371, 117, 94092, 10106, 18882, 40564, 10107, 10111, 13375, 65227, 11639, 53740, 10113, 117, 43610, 10336, 10114, 169, 14125, 30449, 16901, 10106, 11508, 10135, 169, 42126, 10454, 11683, 20666, 21974, 10114, 17860, 20065, 14073, 10113, 112, 187, 94671, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "The", "wit", "##ch", "##do", "##ctor", "said", "an", "##cestors", "had", "appeared", "to", "him", "in", "a", "dream", "and", "ordered", "him", "to", "return", "the", "head", ",", "said", "to", "have", "been", "carried", "off", "as", "a", "colonial", "trophy", "by", "the", "officer", "who", "shot", "and", "allegedly", "be", "##head", "##ed", "Hi", "##nts", "##a", "after", "a", "battle", "in", "1835", "." ], "ids": [ 10117, 43612, 10269, 10317, 21038, 12415, 10151, 105144, 10374, 14565, 10114, 10957, 10106, 169, 51442, 10111, 23782, 10957, 10114, 15079, 10105, 13578, 117, 12415, 10114, 10529, 10590, 21086, 11898, 10146, 169, 26098, 103045, 10155, 10105, 19288, 10479, 19508, 10111, 78210, 10347, 20391, 10336, 20065, 14073, 10113, 10662, 169, 18758, 10106, 16270, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "G", "##cale", "##ka", "ran", "into", "trouble", "as", "soon", "as", "he", "returned", "to", "South", "Africa", "with", "a", "skull", "he", "found", "in", "a", "co", "##ttage", "in", "a", "lo", "##nel", "##y", "Highland", "forest", "near", "In", "##vern", "##ess", "." ], "ids": [ 16976, 144, 45330, 10371, 17044, 10708, 58285, 10146, 17864, 10146, 10261, 14030, 10114, 11056, 12880, 10169, 169, 94671, 10261, 11823, 10106, 169, 11170, 69255, 10106, 169, 10406, 17608, 10157, 52115, 27736, 12883, 10167, 38937, 22094, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "He", "said", "the", "spirit", "of", "a", "hurricane", "had", "guided", "him", "there", "." ], "ids": [ 10357, 12415, 10105, 41576, 10108, 169, 98285, 10374, 92486, 10957, 11155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Members", "of", "the", "X", "##hosa", "royal", "family", ",", "brand", "##ing", "G", "##cale", "##ka", "a", "char", "##latan", ",", "con", "##fis", "##cated", "the", "head", "and", "sent", "it", "for", "tests", "to", "a", "foren", "##sic", "scientist", ",", "who", "examined", "the", "shape", "of", "the", "skull", "and", "the", "hole", "that", "he", "determined", "had", "not", "come", ",", "as", "supposed", ",", "from", "a", "bu", "##llet", "." ], "ids": [ 44659, 10108, 10105, 161, 107164, 23954, 11365, 117, 23467, 10230, 144, 45330, 10371, 169, 101328, 73728, 117, 10173, 65702, 57736, 10105, 13578, 10111, 14541, 10271, 10142, 34926, 10114, 169, 33613, 90439, 59248, 117, 10479, 101657, 10105, 31260, 10108, 10105, 94671, 10111, 10105, 51604, 10189, 10261, 30706, 10374, 10472, 10678, 117, 10146, 59516, 117, 10188, 169, 11499, 47803, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "can", "be", "stated", "beyond", "reason", "##able", "doubt", "that", "this", "skull", "is", "not", "that", "of", "the", "late", "king", ",", "\"", "the", "scientist", "said", "in", "a", "statement", "." ], "ids": [ 107, 10377, 10944, 10347, 17067, 28569, 27949, 13096, 86697, 10189, 10531, 94671, 10124, 10472, 10189, 10108, 10105, 13002, 20636, 117, 107, 10105, 59248, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sudan", "arrest", "##s", "opposition", "se", "##wing", "machine", "sm", "##ug", "##gler", "##s", "." ], "ids": [ 28407, 45165, 10107, 21227, 10126, 25649, 21432, 39709, 19951, 32617, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##HA", "##RT", "##O", "##UM", "1996", "-", "08", "-", "24" ], "ids": [ 148, 58132, 46935, 11403, 72679, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sudan", "##ese", "police", "have", "arrested", "three", "people", "trying", "to", "sm", "##ug", "##gle", "se", "##wing", "machines", "and", "army", "clothing", "to", "Sudan", "##ese", "opposition", "groups", "in", "Eritrea", ",", "an", "official", "newspaper", "reported", "on", "Saturday", "." ], "ids": [ 28407, 13565, 15034, 10529, 29479, 11003, 11426, 32862, 10114, 39709, 19951, 23239, 10126, 25649, 34191, 10111, 17977, 58799, 10114, 28407, 13565, 21227, 15647, 10106, 60004, 117, 10151, 14731, 22047, 15943, 10135, 24848, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "-", "owned", "al", "-", "Inga", "##z", "al", "-", "Wat", "##ani", "said", "the", "sm", "##ug", "##gler", "##s", "were", "caught", "in", "Ban", "##at", "in", "the", "eastern", "state", "of", "Ka", "##ssa", "##la", ",", "on", "the", "border", "with", "Eritrea", ",", "and", "had", "con", "##fes", "##sed", "they", "were", "on", "their", "way", "to", "\"", "the", "so", "-", "called", "alliance", "forces", "which", "have", "been", "under", "##tak", "##ing", "sub", "##versi", "##ve", "operations", "on", "the", "eastern", "border", "\"", "." ], "ids": [ 10117, 12047, 118, 17012, 10164, 118, 10958, 10305, 10164, 118, 51082, 14013, 12415, 10105, 39709, 19951, 32617, 10107, 10309, 39797, 10106, 21631, 10526, 10106, 10105, 18677, 11388, 10108, 25444, 11253, 10330, 117, 10135, 10105, 20949, 10169, 60004, 117, 10111, 10374, 10173, 58058, 16219, 10689, 10309, 10135, 10455, 13170, 10114, 107, 10105, 10380, 118, 11552, 36758, 13729, 10319, 10529, 10590, 10571, 19049, 10230, 13987, 97209, 10612, 18356, 10135, 10105, 18677, 20949, 107, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Author", "##ities", "in", "Ka", "##ssa", "##la", "said", "opposition", "forces", "based", "in", "Eritrea", "have", "been", "lay", "##ing", "land", "##mines", "and", "st", "##eal", "##ing", "vehicles", "and", "other", "goods", "to", "sm", "##ug", "##gle", "them", "across", "the", "border", "into", "Eritrea", "." ], "ids": [ 57043, 17285, 10106, 25444, 11253, 10330, 12415, 21227, 13729, 11610, 10106, 60004, 10529, 10590, 47413, 10230, 11773, 91256, 10111, 28780, 30759, 10230, 27237, 10111, 10684, 36931, 10114, 39709, 19951, 23239, 11345, 15130, 10105, 20949, 10708, 60004, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Sudan", "accuse", "##s", "the", "Eritrea", "##n", "authorities", "of", "providing", "support", "to", "Sudan", "##ese", "opposition", "elements", "based", "in", "Eritrea", "." ], "ids": [ 28407, 93413, 10107, 10105, 60004, 10115, 28308, 10108, 26099, 13145, 10114, 28407, 13565, 21227, 17464, 11610, 10106, 60004, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Eritrea", "cut", "diplomatic", "ties", "with", "Sudan", "in", "1994", ",", "ac", "##cus", "##ing", "it", "of", "training", "rebels", "to", "make", "raids", "into", "Eritrea", "." ], "ids": [ 60004, 21610, 64838, 45169, 10169, 28407, 10106, 10444, 117, 13621, 14319, 10230, 10271, 10108, 15722, 57545, 10114, 13086, 77939, 10708, 60004, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "exile", "##d", "National", "Democratic", "Alliance", ",", "a", "Sudan", "##ese", "um", "##brella", "opposition", "group", ",", "has", "its", "headquarters", "in", "the", "Eritrea", "##n", "capital", "As", "##mara", "." ], "ids": [ 10117, 67696, 10162, 10655, 19281, 21892, 117, 169, 28407, 13565, 10293, 88807, 21227, 11795, 117, 10393, 10474, 28245, 10106, 10105, 60004, 10115, 12185, 10882, 41244, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 9 ] }, { "tokens": [ "It", "uses", "the", "former", "Sudan", "##ese", "em", "##bas", "##sy", "." ], "ids": [ 10377, 19873, 10105, 11775, 28407, 13565, 10266, 21322, 16105, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Albanian", "Socialist", "##s", "start", "landmark", "reform", "con", "##gres", "##s", "." ], "ids": [ 54257, 42637, 10107, 15148, 91993, 34800, 10173, 68094, 10107, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##IR", "##AN", "##A", "1996", "-", "08", "-", "24" ], "ids": [ 157, 73522, 41275, 10738, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Albania", "'", "s", "opposition", "Socialist", "Party", "began", "a", "two", "-", "day", "con", "##gres", "##s", "on", "Saturday", "to", "discuss", "major", "jet", "##tis", "##oning", "its", "links", "with", "almost", "half", "a", "century", "of", "Stalin", "##ist", "di", "##ctat", "##ors", "##hip", "in", "the", "Balkan", "country", "." ], "ids": [ 28931, 112, 187, 21227, 42637, 12529, 11941, 169, 10551, 118, 11940, 10173, 68094, 10107, 10135, 24848, 10114, 71695, 11922, 48504, 13434, 61499, 10474, 23608, 10169, 17122, 13877, 169, 11943, 10108, 26059, 11293, 10120, 95400, 16379, 17883, 10106, 10105, 31442, 12723, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "\"", "The", "con", "##gres", "##s", "will", "app", "##rove", "new", "concepts", "that", "will", "turn", "the", "party", "into", "a", "Social", "-", "Democratic", "and", "electoral", "party", ",", "not", "a", "class", "and", "ide", "##ological", "one", ",", "\"", "the", "Socialist", "Ze", "##ri", "i", "Pop", "##ullit", "daily", "said", "in", "an", "editorial", "." ], "ids": [ 107, 10117, 10173, 68094, 10107, 11337, 72894, 75662, 10751, 51074, 10189, 11337, 18923, 10105, 14039, 10708, 169, 12824, 118, 19281, 10111, 29125, 14039, 117, 10472, 169, 13596, 10111, 38938, 30975, 10464, 117, 107, 10105, 42637, 15536, 10401, 177, 17565, 60219, 27636, 12415, 10106, 10151, 30202, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ja", "##iled", "Socialist", "leader", "Fat", "##os", "Nan", "##o", "made", "the", "first", "call", "for", "change", "in", "July", ",", "a", "month", "after", "the", "party", "'", "s", "chief", "opponents", ",", "the", "conservative", "Democrats", "of", "President", "Sal", "##i", "Be", "##rish", "##a", ",", "almost", "s", "##we", "##pt", "the", "board", "in", "a", "disputed", "general", "election", "." ], "ids": [ 28248, 79257, 42637, 15014, 48803, 10310, 44286, 10133, 11019, 10105, 10422, 20575, 10142, 15453, 10106, 11112, 117, 169, 14064, 10662, 10105, 14039, 112, 187, 19421, 63568, 117, 10105, 50202, 56282, 10108, 12811, 64831, 10116, 14321, 41835, 10113, 117, 17122, 187, 12577, 14971, 10105, 17936, 10106, 169, 106989, 11389, 13685, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Socialist", "##s", ",", "reform", "##ed", "heir", "##s", "to", "the", "communist", "##s", ",", "pulled", "out", "of", "the", "poll", "saying", "it", "was", "a", "sh", "##am", "." ], "ids": [ 10117, 42637, 10107, 117, 34800, 10336, 72143, 10107, 10114, 10105, 64574, 10107, 117, 65884, 10950, 10108, 10105, 70156, 22807, 10271, 10134, 169, 48201, 11008, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Acting", "Socialist", "leader", "Ser", "##vet", "Pel", "##lum", "##bi", "has", "said", "he", "too", "will", "ur", "##ge", "the", "party", "to", "s", "##cra", "##p", "the", "ideas", "of", "Karl", "Marx", "at", "the", "con", "##gres", "##s", "." ], "ids": [ 84489, 42637, 15014, 39759, 15028, 75056, 20571, 11645, 10393, 12415, 10261, 16683, 11337, 10399, 10525, 10105, 14039, 10114, 187, 40333, 10410, 10105, 23802, 10108, 11862, 22919, 10160, 10105, 10173, 68094, 10107, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "pro", "-", "reform", "stan", "##ce", "of", "some", "of", "the", "party", "leadership", "initially", "caused", "a", "storm", "and", "tri", "##ggere", "##d", "the", "resignation", "last", "month", "of", "the", "party", "'", "s", "Secretary", "-", "General", "Gram", "##oz", "R", "##uc", "##i", "." ], "ids": [ 10117, 11284, 118, 34800, 45244, 10419, 10108, 11152, 10108, 10105, 14039, 25121, 20465, 19513, 169, 31642, 10111, 15633, 79581, 10162, 10105, 66129, 12469, 14064, 10108, 10105, 14039, 112, 187, 19382, 118, 11220, 42269, 20129, 155, 43805, 10116, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "More", "recently", "political", "comment", "##ators", "have", "reported", "a", "growing", "consensus", ",", "however", ",", "and", "a", "ri", "##ft", "at", "the", "meeting", "looks", "increasingly", "unlikely", "." ], "ids": [ 15946, 23746, 13736, 49641, 56602, 10529, 15943, 169, 25566, 72049, 117, 13800, 117, 10111, 169, 29956, 12961, 10160, 10105, 19822, 59148, 45015, 107914, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nicaragua", "##n", "president", "to", "go", "to", "U", ".", "S", ".", "for", "medical", "care", "." ], "ids": [ 32337, 10115, 12931, 10114, 11783, 10114, 158, 119, 156, 119, 10142, 19436, 11131, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##AG", "##U", "##A", ",", "Nicaragua", "1996", "-", "08", "-", "23" ], "ids": [ 73020, 109865, 12022, 10738, 117, 32337, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nicaragua", "##n", "President", "Violet", "##a", "Cham", "##or", "##ro", "was", "due", "to", "fly", "to", "the", "United", "States", "on", "Saturday", "for", "a", "medical", "check", "-", "up", "to", "determine", "if", "surgery", "was", "needed", "on", "the", "lower", "part", "of", "her", "spin", "##al", "column", ",", "the", "government", "said", "on", "Friday", "." ], "ids": [ 32337, 10115, 12811, 74301, 10113, 96727, 10667, 10567, 10134, 10850, 10114, 26155, 10114, 10105, 10609, 10859, 10135, 24848, 10142, 169, 19436, 43662, 118, 10741, 10114, 37284, 12277, 44811, 10134, 23794, 10135, 10105, 18165, 10668, 10108, 10485, 30428, 10415, 41278, 117, 10105, 12047, 12415, 10135, 30767, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cham", "##or", "##ro", "has", "com", "##plained", "of", "lower", "back", "pain", "since", "her", "trip", "to", "Taiwan", "in", "May", ",", "when", "the", "pain", "forced", "her", "to", "go", "to", "Taipei", "University", "Hospital", "for", "an", "examination", "." ], "ids": [ 96727, 10667, 10567, 10393, 10212, 103154, 10108, 18165, 12014, 38576, 11764, 10485, 37307, 10114, 19449, 10106, 10725, 117, 10841, 10105, 38576, 20054, 10485, 10114, 11783, 10114, 50291, 10404, 16025, 10142, 10151, 65548, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Cham", "##or", "##ro", ",", "66", ",", "su", "##ffers", "from", "os", "##te", "##op", "##oros", "##is", ",", "a", "disease", "that", "weak", "##ens", "the", "bones", ",", "and", "has", "repeatedly", "flow", "##n", "to", "Washington", "for", "treatment", "by", "her", "longtime", "doctor", ",", "Sam", "Wilson", "." ], "ids": [ 96727, 10667, 10567, 117, 12215, 117, 10198, 85779, 10188, 10427, 10216, 13362, 83845, 10291, 117, 169, 21911, 10189, 61285, 12457, 10105, 48222, 117, 10111, 10393, 77998, 30676, 10115, 10114, 11586, 10142, 21379, 10155, 10485, 106068, 26937, 117, 14268, 13083, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Nepal", "wo", "n", "'", "t", "help", "split", "Tibet", ",", "king", "tells", "China", "." ], "ids": [ 22276, 12796, 182, 112, 188, 15217, 24137, 26392, 117, 20636, 27024, 11593, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "24" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "King", "Bir", "##endra", "of", "Nepal", "has", "told", "China", "his", "nation", "will", "not", "become", "the", "tool", "of", "people", "who", "want", "Tibetan", "independence", "from", "Beijing", ",", "the", "official", "China", "Daily", "newspaper", "said", "on", "Saturday", "." ], "ids": [ 11515, 19319, 96086, 10108, 22276, 10393, 21937, 11593, 10226, 22274, 11337, 10472, 13461, 10105, 53276, 10108, 11426, 10479, 21528, 65488, 31412, 10188, 23824, 117, 10105, 14731, 11593, 17252, 22047, 12415, 10135, 24848, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "King", "Bir", "##endra", ",", "in", "Tibet", "at", "the", "start", "of", "a", "one", "-", "week", "uno", "##fficial", "visit", "to", "China", ",", "said", "the", "Nepal", "##ese", "government", "had", "\"", "maintained", "a", "sharp", "vi", "##gil", "##ance", "against", "such", "intentions", "\"", ",", "the", "newspaper", "said", "." ], "ids": [ 11515, 19319, 96086, 117, 10106, 26392, 10160, 10105, 15148, 10108, 169, 10464, 118, 16118, 11381, 101272, 27541, 10114, 11593, 117, 12415, 10105, 22276, 13565, 12047, 10374, 107, 32974, 169, 77348, 13956, 32837, 16460, 11327, 11049, 18151, 107, 117, 10105, 22047, 12415, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nepal", "shares", "a", "long", "mountain", "border", "with", "the", "resti", "##ve", "Himalaya", "##n", "region", ",", "where", "opposition", "to", "Beijing", "'", "s", "four", "-", "decade", "rule", "is", "widespread", "." ], "ids": [ 22276, 45751, 169, 11695, 25233, 20949, 10169, 10105, 57676, 10612, 62824, 10115, 12220, 117, 10940, 21227, 10114, 23824, 112, 187, 11598, 118, 35858, 21983, 10124, 48675, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chinese", "official", "media", "has", "often", "accused", "foreign", "forces", ",", "notably", "the", "United", "States", ",", "of", "seeking", "to", "support", "Tibetan", "independence", "activists", "." ], "ids": [ 13299, 14731, 12518, 10393, 12899, 37303, 20796, 13729, 117, 36900, 10105, 10609, 10859, 117, 10108, 51285, 10114, 13145, 65488, 31412, 84024, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "King", "Bir", "##enda", "told", "G", "##yai", "##ca", "##in", "Nor", "##bu", ",", "chairman", "of", "the", "Tibetan", "government", ",", "that", "Nepal", "would", "not", "\"", "become", "a", "tool", "for", "others", "to", "split", "Tibet", "\"", ",", "the", "newspaper", "said", "." ], "ids": [ 11515, 19319, 27808, 21937, 144, 66988, 10425, 10245, 98837, 12177, 117, 27627, 10108, 10105, 65488, 12047, 117, 10189, 22276, 10894, 10472, 107, 13461, 169, 53276, 10142, 14633, 10114, 24137, 26392, 107, 117, 10105, 22047, 12415, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##yai", "##ca", "##in", "told", "the", "royal", "visit", "##or", "increased", "cooperation", "between", "Nepal", "and", "Tibet", "was", "possible", "in", "the", "fields", "of", "trade", ",", "tourism", ",", "communications", "and", "sports", ",", "it", "said", "." ], "ids": [ 144, 66988, 10425, 10245, 21937, 10105, 23954, 27541, 10667, 19299, 56547, 10948, 22276, 10111, 26392, 10134, 14128, 10106, 10105, 28455, 10108, 18908, 117, 60013, 117, 42919, 10111, 18204, 117, 10271, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "gave", "no", "details", "." ], "ids": [ 10377, 15362, 10192, 29500, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "hang", "##s", "two", "men", "for", "drug", "traffic", "##king", "." ], "ids": [ 12901, 60083, 10107, 10551, 10588, 10142, 20998, 26482, 15629, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##E", "##H", "##RA", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 157, 11259, 12396, 29990, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "has", "hang", "##ed", "two", "drug", "traffic", "##kers", "in", "the", "southern", "city", "of", "Shi", "##raz", ",", "the", "evening", "newspaper", "Res", "##ala", "##t", "reported", "on", "Saturday", "." ], "ids": [ 12901, 10393, 60083, 10336, 10551, 20998, 26482, 25739, 10106, 10105, 17156, 11584, 10108, 44795, 29948, 117, 10105, 42135, 22047, 32070, 13322, 10123, 15943, 10135, 24848, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "two", "Iranian", "men", "were", "arrested", "in", "July", "with", "419", "kilo", "##gram", "##s", "(", "924", "lb", "##s", ")", "of", "op", "##ium", "after", "they", "opened", "fire", "on", "police", "and", "killed", "a", "pe", "##dest", "##rain", "and", "wounded", "four", ",", "the", "newspaper", "quoted", "a", "police", "commander", "as", "saying", "." ], "ids": [ 10117, 10551, 41768, 10588, 10309, 29479, 10106, 11112, 10169, 42369, 86754, 31253, 10107, 113, 70289, 23989, 10107, 114, 10108, 10303, 12454, 10662, 10689, 14377, 13559, 10135, 15034, 10111, 15875, 169, 11161, 66804, 32782, 10111, 39127, 11598, 117, 10105, 22047, 70676, 169, 15034, 27703, 10146, 22807, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ala", "##t", "said", "the", "execution", "##s", "were", "ordered", "by", "the", "Islamic", "Revolutionary", "Court", "." ], "ids": [ 32070, 13322, 10123, 12415, 10105, 62341, 10107, 10309, 23782, 10155, 10105, 22150, 52514, 14100, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "It", "did", "not", "say", "when", "they", "took", "place", "." ], "ids": [ 10377, 12172, 10472, 23763, 10841, 10689, 12149, 11192, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "of", "the", "men", ",", "who", "killed", "the", "pe", "##dest", "##rian", ",", "was", "hang", "##ed", "at", "the", "site", "of", "the", "crime", "and", "the", "other", "was", "executed", "in", "Adel", "prison", "in", "Shi", "##raz", ",", "the", "newspaper", "said", "." ], "ids": [ 11340, 10108, 10105, 10588, 117, 10479, 15875, 10105, 11161, 66804, 20764, 117, 10134, 60083, 10336, 10160, 10105, 11920, 10108, 10105, 22564, 10111, 10105, 10684, 10134, 45955, 10106, 80444, 20538, 10106, 44795, 29948, 117, 10105, 22047, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pos", "##session", "of", "30", "gram", "##mes", "(", "just", "over", "an", "ou", "##nce", ")", "of", "hero", "##in", "or", "five", "kg", "(", "11", "lb", ")", "of", "op", "##ium", "is", "pun", "##isha", "##ble", "by", "death", "in", "Iran", "." ], "ids": [ 94071, 88080, 10108, 10244, 49209, 13546, 113, 12820, 10491, 10151, 10431, 12150, 114, 10108, 51670, 10245, 10345, 12403, 11895, 113, 10193, 23989, 114, 10108, 10303, 12454, 10124, 32310, 54112, 11203, 10155, 12557, 10106, 12901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "More", "than", "1", ",", "000", "people", "have", "been", "executed", "in", "drug", "-", "related", "cases", "since", "the", "law", "took", "effect", "in", "1989", "." ], "ids": [ 15946, 11084, 122, 117, 10259, 11426, 10529, 10590, 45955, 10106, 20998, 118, 16382, 16480, 11764, 10105, 13255, 12149, 18514, 10106, 10524, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "has", "an", "estimated", "one", "million", "drug", "add", "##ict", "##s", "and", "is", "a", "key", "transit", "route", "for", "drugs", ",", "mostly", "op", "##ium", ",", "sm", "##ug", "##gled", "to", "Europe", "through", "Afghanistan", "and", "Pakistan", "-", "-", "the", "so", "called", "\"", "Golden", "Crescent", ".", "\"" ], "ids": [ 12901, 10393, 10151, 25267, 10464, 12473, 20998, 42852, 106788, 10107, 10111, 10124, 169, 18444, 60486, 13933, 10142, 40421, 117, 19774, 10303, 12454, 117, 39709, 19951, 38239, 10114, 11767, 11222, 18776, 10111, 15437, 118, 118, 10105, 10380, 11552, 107, 14428, 100864, 119, 107 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Main", "Tunisia", "##n", "opposition", "party", "ou", "##sted", "from", "HQ", "." ], "ids": [ 14883, 51173, 10115, 21227, 14039, 10431, 36018, 10188, 106368, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##NI", "##S", "1996", "-", "08", "-", "24" ], "ids": [ 94747, 52898, 10731, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tunisia", "'", "s", "main", "opposition", "party", "on", "Saturday", "announced", "that", "it", "had", "been", "ou", "##sted", "from", "its", "headquarters", "building", "by", "a", "court", "decision", "for", "failing", "to", "pay", "the", "rent", "." ], "ids": [ 51173, 112, 187, 12126, 21227, 14039, 10135, 24848, 13854, 10189, 10271, 10374, 10590, 10431, 36018, 10188, 10474, 28245, 12585, 10155, 169, 14866, 19231, 10142, 72103, 10114, 16868, 10105, 60727, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mohamed", "Ali", "K", "##hal", "##fall", "##ah", ",", "spoke", "##sman", "for", "the", "Movement", "of", "Socialist", "Democrats", "(", "MD", "##S", ")", "said", "that", "a", "bai", "##liff", "who", "was", "ac", "##com", "##pa", "##gni", "##ed", "by", "police", "##men", ",", "on", "Saturday", "ordered", "the", "party", "to", "leave", "the", "building", "." ], "ids": [ 31790, 13518, 148, 18453, 16220, 12257, 117, 50005, 24305, 10142, 10105, 28516, 10108, 42637, 56282, 113, 32112, 10731, 114, 12415, 10189, 169, 48775, 110320, 10479, 10134, 13621, 22530, 11359, 27170, 10336, 10155, 15034, 11418, 117, 10135, 24848, 23782, 10105, 14039, 10114, 21964, 10105, 12585, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "were", "not", "allowed", "a", "delay", "to", "enable", "us", "to", "transfer", "the", "movement", "'", "s", "goods", "and", "documents", ",", "\"", "K", "##hal", "##fall", "##ah", "added", "in", "a", "statement", "." ], "ids": [ 107, 12865, 10309, 10472, 18162, 169, 76497, 10114, 79326, 19626, 10114, 21110, 10105, 17123, 112, 187, 36931, 10111, 21784, 117, 107, 148, 18453, 16220, 12257, 16288, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "building", "is", "state", "property", "." ], "ids": [ 10117, 12585, 10124, 11388, 18381, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "MD", "##S", "was", "represented", "in", "court", "and", "admitted", "o", "##wing", "money", "for", "rent", "but", "did", "not", "give", "details", "." ], "ids": [ 10117, 32112, 10731, 10134, 18839, 10106, 14866, 10111, 40345, 183, 25649, 17920, 10142, 60727, 10473, 12172, 10472, 18090, 29500, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MD", "##S", "this", "year", "lost", "its", "president", "and", "vice", "-", "president", ",", "both", "of", "whom", "were", "tried", "and", "given", "jail", "sentence", "##s", "." ], "ids": [ 32112, 10731, 10531, 10924, 14172, 10474, 12931, 10111, 16543, 118, 12931, 117, 11408, 10108, 18104, 10309, 27156, 10111, 13507, 75934, 49219, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MD", "##S", "president", "Mohamed", "Mo", "##ada", "was", "sentenced", "last", "February", "to", "11", "years", "in", "jail", "on", "charges", "of", "having", "secret", "contacts", "with", "Libya", "##n", "agents", "and", "receiving", "money", "from", "Tripoli", "." ], "ids": [ 32112, 10731, 12931, 31790, 34987, 11153, 10134, 53365, 12469, 11508, 10114, 10193, 10855, 10106, 75934, 10135, 31128, 10108, 13677, 23658, 75091, 10169, 50720, 10115, 32124, 10111, 31391, 17920, 10188, 60946, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Vice", "-", "president", "K", "##hem", "##ais", "Cham", "##mari", "last", "July", "was", "sentenced", "to", "five", "years", "in", "prison", "on", "a", "charge", "of", "disc", "##los", "##ing", "secrets", "of", "judicial", "proceedings", "in", "Mo", "##ada", "'", "s", "affair", "." ], "ids": [ 19214, 118, 12931, 148, 25947, 12985, 96727, 65899, 12469, 11112, 10134, 53365, 10114, 12403, 10855, 10106, 20538, 10135, 169, 18163, 10108, 27224, 13788, 10230, 76101, 10108, 41809, 93399, 10106, 34987, 11153, 112, 187, 63879, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "To", "replace", "Mo", "##ada", ",", "the", "MD", "##S", "after", "the", "trial", "named", "K", "##hal", "##fall", "##ah", "as", "\"", "co", "##ordinator", "\"", "but", "Ismail", "Bou", "##lah", "##ya", ",", "the", "last", "of", "the", "MD", "##S", "founding", "members", "still", "politically", "active", ",", "claimed", "the", "title", "of", "president", ",", "causing", "a", "new", "split", "within", "the", "movement", "." ], "ids": [ 11469, 37156, 34987, 11153, 117, 10105, 32112, 10731, 10662, 10105, 23626, 12038, 148, 18453, 16220, 12257, 10146, 107, 11170, 72397, 107, 10473, 43441, 62583, 16254, 10679, 117, 10105, 12469, 10108, 10105, 32112, 10731, 30704, 12464, 12647, 99972, 14459, 117, 20737, 10105, 12887, 10108, 12931, 117, 34705, 169, 10751, 24137, 12381, 10105, 17123, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MD", "##S", "was", "founded", "in", "1978", "by", "a", "group", "led", "by", "Ahmed", "Me", "##stir", "##i", ",", "who", "withdrew", "from", "politics", "in", "1992", "." ], "ids": [ 32112, 10731, 10134, 14078, 10106, 10693, 10155, 169, 11795, 12857, 10155, 25530, 11589, 64345, 10116, 117, 10479, 56226, 10188, 25674, 10106, 10450, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##cce", "##eding", "him", "as", "head", "of", "the", "movement", ",", "Mo", "##ada", ",", "an", "Arab", "nationalist", ",", "ou", "##sted", "liberal", "##s", "led", "by", "MD", "##S", "secretary", "-", "general", "Must", "##ap", "##ha", "Ben", "Ja", "##afa", "##r", "in", "1993", "." ], "ids": [ 12271, 48798, 56520, 10957, 10146, 13578, 10108, 10105, 17123, 117, 34987, 11153, 117, 10151, 17365, 99451, 117, 10431, 36018, 28950, 10107, 12857, 10155, 32112, 10731, 37664, 118, 11389, 54690, 16070, 10921, 13304, 28248, 90804, 10129, 10106, 10463, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Kur", "##dish", "group", "says", "two", "killed", "in", "Iraqi", "shell", "##ing", "." ], "ids": [ 61912, 67522, 11795, 22153, 10551, 15875, 10106, 57806, 43332, 10230, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "N", "##IC", "##OS", "##IA", "1996", "-", "08", "-", "24" ], "ids": [ 151, 30889, 21793, 35976, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Iraqi", "Kur", "##dish", "guerrilla", "group", "on", "Saturday", "accused", "Iraqi", "government", "forces", "of", "killing", "two", "civilians", "in", "shell", "##ing", "in", "northern", "Iraq", ",", "the", "Iranian", "news", "agency", "IR", "##NA", "reported", "." ], "ids": [ 10313, 57806, 61912, 67522, 106552, 11795, 10135, 24848, 37303, 57806, 12047, 13729, 10108, 34248, 10551, 77485, 10106, 43332, 10230, 10106, 17335, 21455, 117, 10105, 41768, 14424, 34649, 86851, 36742, 15943, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "IR", "##NA", "said", "it", "was", "monitoring", "a", "report", "from", "a", "radio", "station", "affiliated", "to", "the", "Patriot", "##ic", "Union", "of", "Kurdistan", "(", "P", "##U", "##K", ")", "." ], "ids": [ 86851, 36742, 12415, 10271, 10134, 74265, 169, 17553, 10188, 169, 12429, 11825, 50322, 10114, 10105, 107222, 11130, 11457, 10108, 86246, 113, 153, 12022, 11733, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "\"", "Iraqi", "army", "heavily", "shell", "##ed", "the", "Kan", "##ie", "Kar", "##zh", "##ala", "camp", ",", "west", "of", "Ar", "##bil", ",", "on", "Friday", ".", ".", "." ], "ids": [ 107, 57806, 17977, 33556, 43332, 10336, 10105, 57528, 10400, 90233, 15104, 13322, 16700, 117, 13735, 10108, 18484, 17513, 117, 10135, 30767, 119, 119, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "civilians", "were", "killed", "in", "the", "Iraqi", "bombing", ",", "\"", "IR", "##NA", "quoted", "the", "radio", "report", "as", "saying", "." ], "ids": [ 13214, 77485, 10309, 15875, 10106, 10105, 57806, 67011, 117, 107, 86851, 36742, 70676, 10105, 12429, 17553, 10146, 22807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "P", "##U", "##K", "-", "run", "radio", "on", "Friday", "said", "Iraqi", "heavy", "artillery", "was", "pound", "##ing", "its", "positions", "in", "Kur", "##dish", "-", "controlled", "northern", "Iraq", "but", "it", "gave", "no", "details", "of", "casualties", "." ], "ids": [ 10117, 153, 12022, 11733, 118, 14095, 12429, 10135, 30767, 12415, 57806, 18296, 46524, 10134, 99233, 10230, 10474, 23188, 10106, 61912, 67522, 118, 29050, 17335, 21455, 10473, 10271, 15362, 10192, 29500, 10108, 69297, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "no", "independent", "con", "##firmation", "of", "the", "reports", "." ], "ids": [ 11723, 10134, 10192, 16584, 10173, 80735, 10108, 10105, 26610, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rival", "Kurdistan", "Democratic", "Party", "(", "K", "##DP", ")", ",", "which", "accuse", "##s", "Iran", "of", "supporting", "the", "P", "##U", "##K", ",", "said", "on", "Thursday", "that", "its", "forces", "had", "halt", "##ed", "an", "Iranian", "-", "backed", "attack", "by", "thousands", "of", "P", "##U", "##K", "fighters", "." ], "ids": [ 10117, 24792, 86246, 19281, 12529, 113, 148, 54714, 114, 117, 10319, 93413, 10107, 12901, 10108, 32403, 10105, 153, 12022, 11733, 117, 12415, 10135, 67067, 10189, 10474, 13729, 10374, 59334, 10336, 10151, 41768, 118, 61010, 16342, 10155, 39966, 10108, 153, 12022, 11733, 62450, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "The", "United", "States", "said", "in", "Washington", "on", "Friday", "that", "it", "had", "broke", "##red", "a", "cea", "##sef", "##ire", "to", "end", "six", "days", "of", "fighting", "between", "the", "two", "main", "Kur", "##dish", "faction", "##s", "and", "pers", "##ua", "##ded", "them", "to", "attend", "U", ".", "S", ".", "-", "media", "##ted", "peace", "talks", "next", "month", "." ], "ids": [ 10117, 10609, 10859, 12415, 10106, 11586, 10135, 30767, 10189, 10271, 10374, 30500, 15711, 169, 25578, 107749, 11627, 10114, 11572, 12449, 13990, 10108, 27535, 10948, 10105, 10551, 12126, 61912, 67522, 84395, 10107, 10111, 108839, 11908, 21597, 11345, 10114, 34465, 158, 119, 156, 119, 118, 12518, 11912, 28101, 56672, 13451, 14064, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "c", "##lash", "##es", ",", "sh", "##atte", "##ring", "a", "cea", "##sef", "##ire", "nego", "##tia", "##ted", "last", "year", "by", "Washington", ",", "had", "threatened", "a", "U", ".", "S", ".", "-", "led", "peace", "plan", "to", "unit", "##e", "the", "Kur", "##dish", "region", "against", "Iraqi", "President", "Saddam", "Hussein", "." ], "ids": [ 10117, 171, 25297, 10171, 117, 48201, 43961, 13135, 169, 25578, 107749, 11627, 21134, 16180, 11912, 12469, 10924, 10155, 11586, 117, 10374, 44593, 169, 158, 119, 156, 119, 118, 12857, 28101, 13065, 10114, 16511, 10112, 10105, 61912, 67522, 12220, 11327, 57806, 12811, 85431, 49053, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 2, 9, 4, 8, 9 ] }, { "tokens": [ "U", ".", "S", ".", ",", "British", "and", "French", "planes", "have", "been", "patrol", "##ling", "the", "ski", "##es", "of", "northern", "Iraq", "since", "shortly", "after", "the", "1991", "Gulf", "War", "to", "shield", "Iraq", "'", "s", "Kur", "##ds", "from", "any", "attack", "by", "Iraqi", "troops", "." ], "ids": [ 158, 119, 156, 119, 117, 11160, 10111, 11894, 39972, 10529, 10590, 62976, 11945, 10105, 40122, 10171, 10108, 17335, 21455, 11764, 31555, 10662, 10105, 10442, 28239, 11277, 10114, 88939, 21455, 112, 187, 61912, 13268, 10188, 11178, 16342, 10155, 57806, 20836, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 2, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Iran", "accuse", "##s", "Iraq", "of", "cea", "##sef", "##ire", "violation", "##s", "." ], "ids": [ 12901, 93413, 10107, 21455, 10108, 25578, 107749, 11627, 88993, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "N", "##IC", "##OS", "##IA", "1996", "-", "08", "-", "24" ], "ids": [ 151, 30889, 21793, 35976, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "has", "accused", "Iraq", "of", "viola", "##ting", "the", "cea", "##sef", "##ire", "ending", "their", "1980", "-", "88", "war", "some", "32", "times", "between", "the", "end", "of", "March", "and", "May", "31", "this", "year", ",", "the", "Iranian", "news", "agency", "IR", "##NA", "reported", "on", "Saturday", "." ], "ids": [ 12901, 10393, 37303, 21455, 10108, 49698, 12141, 10105, 25578, 107749, 11627, 29077, 10455, 10538, 118, 12074, 10338, 11152, 10842, 13465, 10948, 10105, 11572, 10108, 11144, 10111, 10725, 10413, 10531, 10924, 117, 10105, 41768, 14424, 34649, 86851, 36742, 15943, 10135, 24848, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "'", "s", "deputy", "representative", "to", "the", "United", "Nations", ",", "Maji", "##d", "Tak", "##ht", "Ra", "##van", "##chi", ",", "made", "the", "allegations", "in", "a", "letter", "to", "U", ".", "N", ".", "Secretary", "-", "General", "Bou", "##tros", "Bou", "##tros", "-", "G", "##hali", "on", "Friday", ",", "the", "agency", "said", "." ], "ids": [ 12901, 112, 187, 45404, 33786, 10114, 10105, 10609, 15145, 117, 103022, 10162, 38217, 13599, 38571, 12955, 12806, 117, 11019, 10105, 85190, 10106, 169, 19310, 10114, 158, 119, 151, 119, 19382, 118, 11220, 62583, 34715, 62583, 34715, 118, 144, 63889, 10135, 30767, 117, 10105, 34649, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Islamic", "Republic", "of", "Iran", "has", "reported", "some", "32", "new", "cases", "of", "cea", "##sef", "##ire", "violation", "##s", "by", "the", "Iraqi", "regime", "between", "March", "31", "and", "May", "31", ",", "1996", ",", "\"", "it", "reported", "from", "New", "York", "." ], "ids": [ 107, 10117, 22150, 13681, 10108, 12901, 10393, 15943, 11152, 10842, 10751, 16480, 10108, 25578, 107749, 11627, 88993, 10107, 10155, 10105, 57806, 24807, 10948, 11144, 10413, 10111, 10725, 10413, 117, 10389, 117, 107, 10271, 15943, 10188, 10287, 10482, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "It", "said", "violation", "##s", "included", "construct", "##ing", "observation", "posts", ",", "instal", "##ling", "morta", "##rs", "and", "anti", "-", "aircraft", "can", "##non", "##s", ",", "setting", "up", "ten", "##ts", ",", "pen", "##et", "##rating", "Iranian", "territory", ",", "and", "firing", "rifle", "gr", "##ena", "##des", "towards", "Iranian", "territory", "." ], "ids": [ 10377, 12415, 88993, 10107, 12742, 80392, 10230, 45856, 68699, 117, 50562, 11945, 69908, 10943, 10111, 14249, 118, 16167, 10944, 17518, 10107, 117, 29421, 10741, 11769, 10806, 117, 66558, 10308, 45527, 41768, 24399, 117, 10111, 68573, 59116, 30518, 13032, 10920, 18095, 41768, 24399, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "eight", "-", "year", "war", "between", "the", "two", "countries", "ended", "with", "a", "U", ".", "N", ".", "-", "sponsored", "cea", "##sef", "##ire", "." ], "ids": [ 10117, 16222, 118, 10924, 10338, 10948, 10105, 10551, 15911, 18428, 10169, 169, 158, 119, 151, 119, 118, 44747, 25578, 107749, 11627, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Iraq", "-", "Aug", "24", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 21455, 118, 53012, 10233, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##G", "##HD", "##AD", "1996", "-", "08", "-", "24" ], "ids": [ 39999, 11447, 99997, 55538, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "some", "of", "the", "leading", "stories", "in", "the", "official", "Iraqi", "press", "on", "Saturday", "." ], "ids": [ 13252, 10301, 11152, 10108, 10105, 16018, 21158, 10106, 10105, 14731, 57806, 21040, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##UM", "##H", "##O", "##UR", "##I", "##Y", "##A" ], "ids": [ 147, 72679, 12396, 11403, 98348, 11281, 14703, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Istanbul", "chamber", "of", "commerce", "ur", "##ges", "Ankara", "to", "res", "##ume", "trade", "with", "Iraq", "." ], "ids": [ 118, 25218, 51773, 10108, 22636, 10399, 13156, 23883, 10114, 39429, 20467, 18908, 10169, 21455, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "-", "Off", "##ers", "from", "Arab", "and", "foreign", "companies", "to", "supply", "Iraq", "with", "goods", "." ], "ids": [ 118, 23490, 10901, 10188, 17365, 10111, 20796, 18866, 10114, 28914, 21455, 10169, 36931, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "-", "Four", "ships", "un", "##load", "tonnes", "of", "Iraq", "-", "bound", "sugar", "at", "Jordan", "'", "s", "A", "##qa", "##ba", "." ], "ids": [ 118, 16773, 22513, 10119, 64312, 39435, 10108, 21455, 118, 46538, 60390, 10160, 16366, 112, 187, 138, 35102, 10537, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 1, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "-", "Editorial", "bl", "##ames", "U", ".", "S", ".", "for", "latest", "fl", "##are", "-", "up", "of", "fighting", "between", "Kur", "##dish", "rebels", "in", "northern", "Iraq", "." ], "ids": [ 118, 21507, 21484, 55497, 158, 119, 156, 119, 10142, 50908, 58768, 11591, 118, 10741, 10108, 27535, 10948, 61912, 67522, 57545, 10106, 17335, 21455, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 9 ] }, { "tokens": [ "-", "Black", "market", "boom", "##s", "in", "the", "sh", "##adow", "of", "state", "-", "run", "super", "##market", "##s", "." ], "ids": [ 118, 11750, 17313, 49704, 10107, 10106, 10105, 48201, 96580, 10108, 11388, 118, 14095, 25212, 60336, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Parliament", "complete", "##s", "draft", "law", "on", "protection", "of", "river", "waters", "in", "Iraq", "." ], "ids": [ 118, 19173, 17876, 10107, 28447, 13255, 10135, 20344, 10108, 16965, 42646, 10106, 21455, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Q", "##AD", "##IS", "##SI", "##Y", "##A" ], "ids": [ 154, 55538, 19088, 44802, 14703, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Iraq", "den", "##oun", "##ces", "violation", "of", "airs", "##pace", "by", "U", ".", "S", ".", "war", "##plane", "##s", "." ], "ids": [ 118, 21455, 10140, 43971, 14585, 88993, 10108, 104816, 50957, 10155, 158, 119, 156, 119, 10338, 47828, 10107, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "IRA", "##Q" ], "ids": [ 64107, 19282 ], "entity": [ "B-LOC", "I-LOC" ], "entity_ids": [ 1, 5 ] }, { "tokens": [ "-", "Editorial", "la", "##mba", "##sts", "Ja", "##lal", "Tala", "##bani", ",", "leader", "of", "a", "Kur", "##dish", "rebel", "faction", "in", "the", "north", ",", "for", "li", "##ais", "##ing", "with", "Iran", "in", "its", "fight", "against", "rivals", "." ], "ids": [ 118, 21507, 10109, 17714, 28036, 28248, 29267, 110135, 107081, 117, 15014, 10108, 169, 61912, 67522, 56696, 84395, 10106, 10105, 12756, 117, 10142, 11614, 12985, 10230, 10169, 12901, 10106, 10474, 20780, 11327, 71908, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##B", "##EL" ], "ids": [ 39999, 11274, 68999 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "-", "B", "##lami", "##ng", "Iraq", "for", "rio", "##ts", "in", "Jordan", "is", "a", "dir", "##ty", "game", "." ], "ids": [ 118, 139, 80761, 10376, 21455, 10142, 27244, 10806, 10106, 16366, 10124, 169, 15895, 11195, 11661, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "campaign", "bus", "##y", "making", "\"", "news", "\"", "." ], "ids": [ 24139, 17323, 19369, 10157, 14293, 107, 14424, 107, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Laurence", "M", "##c", "##Q", "##uilla", "##n" ], "ids": [ 34946, 150, 10350, 19282, 89659, 10115 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Bill", "Clinton", "has", "served", "notice", "he", "inte", "##nds", "to", "be", "bus", "##y", "\"", "making", "news", "\"", "-", "-", "or", "at", "least", "doing", "things", "that", "look", "and", "sound", "like", "it", "in", "a", "campaign", "year", "." ], "ids": [ 12811, 13160, 24139, 10393, 12325, 48323, 10261, 14168, 27090, 10114, 10347, 19369, 10157, 107, 14293, 14424, 107, 118, 118, 10345, 10160, 16298, 30918, 24682, 10189, 25157, 10111, 19302, 11850, 10271, 10106, 169, 17323, 10924, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "Democrats", "gathering", "in", "Chicago", "to", "start", "a", "convention", "on", "Monday", "to", "nomina", "##te", "him", "for", "a", "second", "term", "as", "president", ",", "Clinton", "plans", "a", "st", "##eady", "parade", "of", "events", "designed", "to", "high", "##light", "his", "leadership", "and", "di", "##m", "the", "g", "##low", "of", "the", "just", "-", "concluded", "Republican", "con", "##clave", "that", "gave", "a", "bo", "##ost", "to", "rival", "Bob", "Dol", "##e", "." ], "ids": [ 12613, 56282, 88666, 10106, 12317, 10114, 15148, 169, 37812, 10135, 40714, 10114, 38316, 10216, 10957, 10142, 169, 11132, 13719, 10146, 12931, 117, 24139, 18195, 169, 28780, 61973, 71115, 10108, 15284, 15513, 10114, 11846, 24310, 10226, 25121, 10111, 10120, 10147, 10105, 175, 27863, 10108, 10105, 12820, 118, 37074, 21776, 10173, 48965, 10189, 15362, 169, 20506, 18239, 10114, 24792, 13583, 100035, 10112, 119 ], "entity": [ "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "After", "a", "week", "of", "care", "##fully", "orchestra", "##ted", "events", "signing", "into", "law", "bill", "##s", "passed", "by", "the", "Republican", "-", "controlled", "Congress", ",", "Clinton", "used", "his", "Saturday", "radio", "address", "to", "the", "nation", "to", "proud", "##ly", "\"", "anno", "##unce", "\"", "a", "development", "in", "the", "war", "on", "crime", "." ], "ids": [ 11301, 169, 16118, 10108, 11131, 42920, 26816, 11912, 15284, 46529, 10708, 13255, 34497, 10107, 20006, 10155, 10105, 21776, 118, 29050, 15984, 117, 24139, 11031, 10226, 24848, 12429, 32198, 10114, 10105, 22274, 10114, 97801, 10454, 107, 11671, 93050, 107, 169, 13405, 10106, 10105, 10338, 10135, 22564, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-ORG", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 3, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Six", "##ty", "days", "ago", "I", "directed", "the", "attorney", "general", "to", "draw", "up", "a", "plan", "for", "a", "national", "regi", "##str", "##y", "of", "sex", "offen", "##ders", ",", "\"", "Clinton", "said", ".", "\"" ], "ids": [ 107, 20615, 11195, 13990, 36390, 146, 15446, 10105, 54131, 11389, 10114, 25974, 10741, 169, 13065, 10142, 169, 11844, 55483, 53142, 10157, 10108, 18549, 84646, 25779, 117, 107, 24139, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "That", "plan", "has", "now", "reached", "my", "des", "##k", ".", "\"" ], "ids": [ 13646, 13065, 10393, 11858, 17087, 15127, 10139, 10174, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Today", "I", "am", "pl", "##eas", "##ed", "to", "anno", "##unce", "that", "we", "are", "following", "through", "on", "our", "commitment", "to", "keep", "track", "of", "these", "criminal", "##s", ",", "not", "just", "in", "a", "single", "state", "but", "where", "##ver", "they", "go", ",", "\"", "he", "said", "." ], "ids": [ 107, 17160, 146, 10392, 20648, 42658, 10336, 10114, 11671, 93050, 10189, 11951, 10301, 11901, 11222, 10135, 17446, 75010, 10114, 23819, 14310, 10108, 11762, 30931, 10107, 117, 10472, 12820, 10106, 169, 11376, 11388, 10473, 10940, 12563, 10689, 11783, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Act", "##ually", ",", "creation", "of", "such", "a", "regi", "##str", "##y", "was", "under", "##way", "without", "Clinton", "lift", "##ing", "a", "finger", "." ], "ids": [ 13968, 79090, 117, 26545, 10108, 11049, 169, 55483, 53142, 10157, 10134, 10571, 14132, 13663, 24139, 63376, 10230, 169, 88519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attorney", "General", "Janet", "Reno", "'", "s", "report", "-", "-", "all", "nine", "pages", "of", "it", ",", "including", "foot", "##note", "##s", "-", "-", "offers", "only", "the", "interim", "services", "of", "the", "FBI", "until", "a", "formal", "regi", "##str", "##y", "on", "sex", "offen", "##ders", "has", "been", "established", "." ], "ids": [ 45551, 11220, 32575, 46965, 112, 187, 17553, 118, 118, 10435, 19964, 20255, 10108, 10271, 117, 11198, 24963, 72440, 10107, 118, 118, 23818, 10893, 10105, 63313, 12639, 10108, 10105, 27254, 11444, 169, 23129, 55483, 53142, 10157, 10135, 18549, 84646, 25779, 10393, 10590, 13245, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "months", "ago", ",", "Clinton", "announced", "he", "wanted", "an", "interim", "effort", "established", "." ], "ids": [ 13214, 15555, 36390, 117, 24139, 13854, 10261, 22591, 10151, 63313, 24912, 13245, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Now", ",", "60", "days", "later", ",", "he", "had", "a", "chance", "to", "talk", "about", "it", "again", "." ], "ids": [ 17121, 117, 10709, 13990, 10873, 117, 10261, 10374, 169, 27893, 10114, 31311, 10978, 10271, 13123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "an", "example", "of", "Clinton", "'", "s", "strategic", "planning", "as", "he", "heads", "into", "the", "stretch", "drive", "for", "the", "Nov", ".", "5", "presidential", "election", "." ], "ids": [ 10377, 10124, 10151, 14351, 10108, 24139, 112, 187, 52009, 30240, 10146, 10261, 42399, 10708, 10105, 85690, 23806, 10142, 10105, 36779, 119, 126, 36476, 13685, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Such", "things", "do", "not", "happen", "by", "chance", "in", "the", "Clinton", "White", "House", ",", "they", "are", "part", "of", "his", "political", "chess", "game", "." ], "ids": [ 43958, 24682, 10149, 10472, 84630, 10155, 27893, 10106, 10105, 24139, 12136, 11545, 117, 10689, 10301, 10668, 10108, 10226, 13736, 88716, 11661, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "past", "week", "Clinton", "signed", "into", "law", "an", "increase", "in", "the", "mini", "##mium", "wa", "##ge", ",", "a", "bill", "that", "makes", "it", "easier", "for", "someone", "with", "a", "pre", "-", "existing", "health", "problem", "to", "change", "jobs", ",", "and", "s", "##we", "##eping", "changes", "over", "##hau", "##ling", "the", "nation", "'", "s", "welfare", "system", "." ], "ids": [ 10167, 10105, 17781, 16118, 24139, 14775, 10708, 13255, 10151, 20299, 10106, 10105, 25103, 41514, 11471, 10525, 117, 169, 34497, 10189, 20562, 10271, 81853, 10142, 30455, 10169, 169, 12229, 118, 26636, 17004, 18077, 10114, 15453, 45083, 117, 10111, 187, 12577, 79654, 19010, 10491, 52332, 11945, 10105, 22274, 112, 187, 78366, 11787, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "America", "can", "look", "back", "on", "a", "week", "of", "remarkable", "achievement", ",", "\"", "Clinton", "said", ",", "without", "even", "a", "passing", "reference", "to", "the", "Republican", "majority", "in", "the", "House", "and", "Senate", "." ], "ids": [ 107, 11440, 10944, 25157, 12014, 10135, 169, 16118, 10108, 88916, 66089, 117, 107, 24139, 12415, 117, 13663, 13246, 169, 33389, 21457, 10114, 10105, 21776, 19471, 10106, 10105, 11545, 10111, 22294, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 9, 3, 9 ] }, { "tokens": [ "\"", "America", "is", "on", "the", "right", "track", "offering", "more", "opportunity", ",", "demand", "##ing", "more", "responsibility", ",", "building", "a", "stronger", "community", ",", "the", "sense", "of", "shared", "values", "and", "stronger", "families", ",", "\"", "he", "said", "in", "striking", "the", "theme", "of", "his", "coming", "week", "." ], "ids": [ 107, 11440, 10124, 10135, 10105, 13448, 14310, 42281, 10798, 34468, 117, 34394, 10230, 10798, 39450, 117, 12585, 169, 85688, 13354, 117, 10105, 15495, 10108, 29054, 31313, 10111, 85688, 15300, 117, 107, 10261, 12415, 10106, 87894, 10105, 26648, 10108, 10226, 23959, 16118, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "According", "to", "a", "senior", "campaign", "official", ",", "Clinton", "\"", "will", "be", "making", "a", "lot", "of", "news", "in", "the", "coming", "week", "-", "-", "something", "different", "each", "day", ".", "\"" ], "ids": [ 14156, 10114, 169, 17843, 17323, 14731, 117, 24139, 107, 11337, 10347, 14293, 169, 19826, 10108, 14424, 10106, 10105, 23959, 16118, 118, 118, 26133, 12902, 11948, 11940, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "de", "##parts", "on", "Sunday", "on", "a", "four", "-", "day", "train", "trip", "through", "West", "Virginia", ",", "Kentucky", ",", "Ohio", ",", "Michigan", "and", "Indiana", "while", "fellow", "Democrats", "are", "gathered", "in", "Chicago", "." ], "ids": [ 24139, 10104, 86197, 10135, 19731, 10135, 169, 11598, 118, 11940, 17767, 37307, 11222, 11164, 13634, 117, 19627, 117, 13608, 117, 15476, 10111, 16564, 11371, 24619, 56282, 10301, 69918, 10106, 12317, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 1, 9, 1, 9, 1, 9, 9, 2, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "He", "'", "ll", "make", "news", "during", "the", "day", ".", ".", ".", "and", "then", "at", "night", "the", "attention", "will", "go", "to", "the", "convention", ",", "\"", "said", "the", "campaign", "official", ".", "\"" ], "ids": [ 107, 10357, 112, 22469, 13086, 14424, 10939, 10105, 11940, 119, 119, 119, 10111, 11059, 10160, 16903, 10105, 21341, 11337, 11783, 10114, 10105, 37812, 117, 107, 12415, 10105, 17323, 14731, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "think", "it", "'", "ll", "work", "really", "well", ".", "\"" ], "ids": [ 12865, 27874, 10271, 112, 22469, 11424, 30181, 11206, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Although", "officials", "decline", "to", "say", "just", "what", "each", "day", "'", "s", "\"", "news", "\"", "will", "be", ",", "the", "intent", "is", "to", "put", "a", "focus", "on", "Clinton", "himself", "and", "not", "just", "those", "attending", "the", "party", "'", "s", "convention", "." ], "ids": [ 15785, 27730, 46695, 10114, 23763, 12820, 12976, 11948, 11940, 112, 187, 107, 14424, 107, 11337, 10347, 117, 10105, 58692, 10124, 10114, 14499, 169, 23195, 10135, 24139, 14764, 10111, 10472, 12820, 12676, 54234, 10105, 14039, 112, 187, 37812, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Each", "day", "of", "the", "trip", "will", "have", "a", "late", "start", ",", "so", "that", "network", "television", "correspondent", "##s", "will", "be", "able", "to", "do", "live", "reports", "for", "morning", "programmes", "." ], "ids": [ 23223, 11940, 10108, 10105, 37307, 11337, 10529, 169, 13002, 15148, 117, 10380, 10189, 17175, 14162, 70503, 10107, 11337, 10347, 16197, 10114, 10149, 12962, 26610, 10142, 28757, 37364, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Campaign", "officials", "then", "hope", "the", "day", "'", "s", "\"", "news", "\"", "event", "will", "be", "show", "##case", "##d", "on", "evening", "television", "news", "shows", "as", "a", "lead", "-", "in", "for", "that", "night", "'", "s", "convention", "programme", "." ], "ids": [ 39752, 27730, 11059, 50725, 10105, 11940, 112, 187, 107, 14424, 107, 14416, 11337, 10347, 11897, 41621, 10162, 10135, 42135, 14162, 14424, 15573, 10146, 169, 14107, 118, 10106, 10142, 10189, 16903, 112, 187, 37812, 19611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "'", "ll", "be", "con", "##centra", "##ting", ".", ".", ".", "on", "supporting", "the", "president", "as", "he", "is", "on", "the", "trip", "and", "making", "significant", "public", "policy", "statements", "related", "to", "some", "of", "his", "plans", "for", "the", "future", ",", "\"", "said", "White", "House", "Press", "Secretary", "Mike", "M", "##c", "##C", "##ur", "##ry", "." ], "ids": [ 107, 12865, 112, 22469, 10347, 10173, 97368, 12141, 119, 119, 119, 10135, 32403, 10105, 12931, 10146, 10261, 10124, 10135, 10105, 37307, 10111, 14293, 17912, 11683, 14368, 70808, 16382, 10114, 11152, 10108, 10226, 18195, 10142, 10105, 16711, 117, 107, 12415, 12136, 11545, 10568, 19382, 13270, 150, 10350, 10858, 10546, 10908, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 4, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "M", "##c", "##C", "##ur", "##ry", "said", "that", "when", "Clinton", "deliver", "##s", "his", "acceptance", "address", "on", "Thursday", "night", "to", "fellow", "Democrats", "and", "a", "national", "television", "audience", ",", "he", "will", "\"", "set", "out", "a", "road", "map", "\"", "for", "the", "nation", "'", "s", "future", "-", "-", "one", "the", "president", "hopes", "guides", "him", "back", "to", "the", "White", "House", "for", "four", "more", "years", "." ], "ids": [ 150, 10350, 10858, 10546, 10908, 12415, 10189, 10841, 24139, 80498, 10107, 10226, 103024, 32198, 10135, 67067, 16903, 10114, 24619, 56282, 10111, 169, 11844, 14162, 26070, 117, 10261, 11337, 107, 11847, 10950, 169, 15485, 14876, 107, 10142, 10105, 22274, 112, 187, 16711, 118, 118, 10464, 10105, 12931, 82467, 78081, 10957, 12014, 10114, 10105, 12136, 11545, 10142, 11598, 10798, 10855, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hurricane", "expected", "to", "ve", "##er", "north", "of", "Caribbean", "." ], "ids": [ 44871, 25973, 10114, 10323, 10165, 12756, 10108, 31778, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "MI", "##AM", "##I", "1996", "-", "08", "-", "24" ], "ids": [ 75416, 36535, 11281, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hurricane", "Edouard", "grew", "stronger", "on", "Saturday", "as", "it", "s", "##wir", "##led", "across", "the", "Atlantic", "Ocean", ",", "but", "for", "##eca", "##sters", "at", "the", "National", "Hurricane", "Center", "said", "the", "storm", "would", "likely", "swing", "north", "and", "miss", "the", "Caribbean", "." ], "ids": [ 44871, 74362, 23616, 85688, 10135, 24848, 10146, 10271, 187, 86764, 16376, 15130, 10105, 16739, 20500, 117, 10473, 10142, 33588, 47035, 10160, 10105, 10655, 44871, 11719, 12415, 10105, 31642, 10894, 22497, 74772, 12756, 10111, 88237, 10105, 31778, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "Edouard", "is", "getting", "stronger", "and", "stronger", ",", "and", "it", "already", "has", "winds", "of", "105", "mph", "(", "185", "k", "##ph", ")", ",", "\"", "said", "hurricane", "for", "##eca", "##ster", "Li", "##xion", "Av", "##ila", "." ], "ids": [ 107, 74362, 10124, 34875, 85688, 10111, 85688, 117, 10111, 10271, 19034, 10393, 63782, 10108, 14519, 25992, 113, 19859, 179, 28088, 114, 117, 107, 12415, 98285, 10142, 33588, 12765, 13258, 97470, 33799, 13799, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "\"", "But", "the", "good", "news", "is", "that", "all", "our", "computer", "models", "indicate", "Edouard", "is", "going", "to", "turn", "to", "the", "west", "-", "northwest", "on", "Sunday", "and", "miss", "the", "islands", ",", "\"", "he", "added", "." ], "ids": [ 107, 16976, 10105, 15198, 14424, 10124, 10189, 10435, 17446, 18765, 22441, 35802, 74362, 10124, 19090, 10114, 18923, 10114, 10105, 13735, 118, 35078, 10135, 19731, 10111, 88237, 10105, 33294, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "11", "a", ".", "m", ".", "ED", "##T", "(", "1500", "GMT", ")", ",", "Edouard", "was", "1", ",", "130", "miles", "east", "of", "the", "Lesser", "Antilles", "and", "moving", "west", "at", "14", "mph", "(", "25", "k", "##ph", ")", "." ], "ids": [ 11699, 10193, 169, 119, 181, 119, 74053, 11090, 113, 13922, 20362, 114, 117, 74362, 10134, 122, 117, 13389, 14148, 13827, 10108, 10105, 91642, 98203, 10111, 23557, 13735, 10160, 10247, 25992, 113, 10258, 179, 28088, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Its", "exact", "position", "was", "latitude", "14", ".", "5", "north", ",", "longitud", "##e", "44", ".", "2", "west", "." ], "ids": [ 14864, 45809, 12956, 10134, 58484, 10247, 119, 126, 12756, 117, 23230, 10112, 11126, 119, 123, 13735, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "France", "hands", "suspected", "ETA", "member", "to", "Spain", "." ], "ids": [ 10688, 27925, 80337, 80559, 12008, 10114, 16149, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 3, 9, 9, 1, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "24" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "France", "on", "Saturday", "handed", "a", "suspected", "member", "of", "the", "Basque", "separat", "##ist", "group", "ETA", "to", "Spanish", "authorities", ",", "French", "Interior", "Ministry", "officials", "said", "." ], "ids": [ 10688, 10135, 24848, 44040, 169, 80337, 12008, 10108, 10105, 74950, 81806, 11293, 11795, 80559, 10114, 14661, 28308, 117, 11894, 33667, 19170, 27730, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "O", "B-MISC", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 9, 2, 9, 9, 2, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Ignacio", "Ola", "##sco", "##aga", "Mu", "##gica", ",", "who", "had", "just", "ended", "a", "prison", "sentence", "in", "France", ",", "is", "suspected", "of", "having", "taken", "part", "in", "several", "guerrilla", "attacks", "in", "Spain", "." ], "ids": [ 30930, 66039, 22402, 19357, 49056, 31875, 117, 10479, 10374, 12820, 18428, 169, 20538, 49219, 10106, 10688, 117, 10124, 80337, 10108, 13677, 15109, 10668, 10106, 11736, 106552, 26483, 10106, 16149, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "ETA", "(", "Basque", "Home", "##land", "and", "Freedom", ")", "has", "killed", "about", "800", "people", "in", "its", "campaign", "for", "an", "independent", "Basque", "state", "since", "the", "1960s", "." ], "ids": [ 80559, 113, 74950, 13898, 11080, 10111, 22326, 114, 10393, 15875, 10978, 11900, 11426, 10106, 10474, 17323, 10142, 10151, 16584, 74950, 11388, 11764, 10105, 22818, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "troops", "to", "remain", "in", "Bosnia", "for", "1997", "-", "-", "Rue", "##he", "." ], "ids": [ 12026, 20836, 10114, 25430, 10106, 29634, 10142, 10391, 118, 118, 33553, 11643, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 1, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "24" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Defence", "Minister", "Volker", "Rue", "##he", "said", "that", "German", "troops", "would", "stay", "on", "in", "Bosnia", "next", "year", "as", "part", "of", "an", "international", "force", "to", "ensure", "the", "establishment", "of", "peace", ",", "a", "newspaper", "reported", "on", "Saturday", "." ], "ids": [ 31621, 14355, 77042, 33553, 11643, 12415, 10189, 12026, 20836, 10894, 29597, 10135, 10106, 29634, 13451, 10924, 10146, 10668, 10108, 10151, 12533, 15031, 10114, 40781, 10105, 31989, 10108, 28101, 117, 169, 22047, 15943, 10135, 24848, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "current", "NATO", "-", "led", "peace", "force", "(", "IF", "##OR", ")", "in", "Bosnia", "is", "due", "to", "return", "home", "at", "the", "end", "of", "the", "year", "." ], "ids": [ 10117, 14978, 21662, 118, 12857, 28101, 15031, 113, 25000, 42622, 114, 10106, 29634, 10124, 10850, 10114, 15079, 11816, 10160, 10105, 11572, 10108, 10105, 10924, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Rue", "##he", "told", "Bild", "am", "Sonntag", "in", "an", "interview", "that", "a", "\"", "new", "and", "different", "mandate", "\"", "for", "the", "troops", "would", "be", "agreed", "on", "for", "next", "year", "after", "the", "current", "mandate", "ex", "##pire", "##s", "in", "December", "." ], "ids": [ 16976, 33553, 11643, 21937, 30001, 10392, 103794, 10106, 10151, 21213, 10189, 169, 107, 10751, 10111, 12902, 106424, 107, 10142, 10105, 20836, 10894, 10347, 25577, 10135, 10142, 13451, 10924, 10662, 10105, 14978, 106424, 11419, 72079, 10107, 10106, 11288, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "After", "the", "(", "Bosnia", "##n", ")", "elections", "(", "on", "September", "14", ")", "the", "troops", "will", "start", "being", "reduced", "from", "the", "beginning", "of", "October", "from", "60", ",", "000", "to", "about", "20", ",", "000", "." ], "ids": [ 107, 11301, 10105, 113, 29634, 10115, 114, 22054, 113, 10135, 10596, 10247, 114, 10105, 20836, 11337, 15148, 11223, 25724, 10188, 10105, 17967, 10108, 11212, 10188, 10709, 117, 10259, 10114, 10978, 10197, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "completely", "new", "and", "different", "mandate", "will", "be", "agreed", "for", "next", "year", ",", "\"", "Rue", "##he", "said", "." ], "ids": [ 138, 27185, 10751, 10111, 12902, 106424, 11337, 10347, 25577, 10142, 13451, 10924, 117, 107, 33553, 11643, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "The", "defence", "ministers", "will", "begin", "negotiations", "for", "this", "at", "the", "beginning", "of", "September", "at", "a", "NATO", "meeting", ",", "\"", "he", "told", "the", "newspaper", "in", "an", "interview", ",", "ex", "##cer", "##pts", "of", "which", "were", "released", "ahead", "of", "publication", "on", "Sunday", "." ], "ids": [ 107, 10117, 47245, 66281, 11337, 16135, 61946, 10142, 10531, 10160, 10105, 17967, 10108, 10596, 10160, 169, 21662, 19822, 117, 107, 10261, 21937, 10105, 22047, 10106, 10151, 21213, 117, 11419, 17505, 83609, 10108, 10319, 10309, 11539, 35629, 10108, 16877, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "But", "we", "must", "avoid", "giving", "the", "impression", "this", "peace", "deployment", "in", "former", "Yugoslavia", "is", "being", "perceived", "in", "the", "long", "run", "as", "an", "occupation", "." ], "ids": [ 107, 16976, 11951, 14982, 33253, 24426, 10105, 59513, 10531, 28101, 101194, 10106, 11775, 38168, 10124, 11223, 72077, 10106, 10105, 11695, 14095, 10146, 10151, 28929, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "the", "other", "hand", "we", "must", "prevent", "any", "return", "of", "war", "and", "massacre", "##s", "\"", "he", "said", "." ], "ids": [ 10576, 10105, 10684, 15230, 11951, 14982, 29320, 11178, 15079, 10108, 10338, 10111, 53810, 10107, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "comics", "hope", "independence", "-", "jo", "##ke", "'", "s", "on", "Boss", "##i", "." ], "ids": [ 11667, 60379, 50725, 31412, 118, 12541, 10550, 112, 187, 10135, 43860, 10116, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "OR", "##VI", "##ET", "##O", ",", "Italy", "1996", "-", "08", "-", "24" ], "ids": [ 69308, 90939, 52338, 11403, 117, 11619, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "group", "of", "Italian", "comics", "hope", "the", "jo", "##ke", "will", "be", "on", "separat", "##ist", "leader", "Umberto", "Boss", "##i", "next", "month", "when", "they", "lead", "the", "ancient", "Et", "##rus", "##can", "town", "of", "Or", "##viet", "##o", "in", "a", "moc", "##k", "split", "from", "Rome", "." ], "ids": [ 138, 11795, 10108, 11667, 60379, 50725, 10105, 12541, 10550, 11337, 10347, 10135, 81806, 11293, 15014, 46980, 43860, 10116, 13451, 14064, 10841, 10689, 14107, 10105, 21226, 16232, 13923, 24154, 12221, 10108, 19372, 88445, 10133, 10106, 169, 60914, 10174, 24137, 10188, 14592, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Or", "##viet", "##o", "mayor", "Stefano", "Ci", "##mic", "##chi", "said", "the", "comics", ",", "including", "popular", "actor", "Roberto", "Beni", "##gni", ",", "would", "de", "##cla", "##re", "Or", "##viet", "##o", "\"", "capital", "of", "Et", "##ru", "##ria", "\"", "on", "September", "15", "-", "-", "the", "day", "Boss", "##i", "plans", "a", "march", "across", "the", "north", "in", "favour", "of", "independence", "from", "Rome", "." ], "ids": [ 19372, 88445, 10133, 12747, 26381, 51457, 27057, 12806, 12415, 10105, 60379, 117, 11198, 12600, 14066, 14948, 70552, 27170, 117, 10894, 10104, 60582, 10246, 19372, 88445, 10133, 107, 12185, 10108, 16232, 11680, 11021, 107, 10135, 10596, 10208, 118, 118, 10105, 11940, 43860, 10116, 18195, 169, 78466, 15130, 10105, 12756, 10106, 61264, 10108, 31412, 10188, 14592, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "We", "will", "then", "pro", "##ceed", "with", "the", "ann", "##ex", "##ation", "of", "Sardinia", ",", "Corsica", "and", "Cyprus", ",", "\"", "Ci", "##mic", "##chi", "told", "reporter", "##s", "on", "Saturday", "." ], "ids": [ 107, 12865, 11337, 11059, 11284, 66390, 10169, 10105, 28481, 28580, 11809, 10108, 94413, 117, 101208, 10111, 45639, 117, 107, 51457, 27057, 12806, 21937, 41408, 10107, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "city", "council", "would", "be", "\"", "iron", "##ically", "present", "\"", "when", "the", "comics", "made", "their", "pro", "##clamation", "on", "the", "same", "day", "Boss", "##i", "has", "threatened", "to", "de", "##cla", "##re", "the", "birth", "of", "Pada", "##nia", ",", "the", "name", "he", "has", "given", "to", "northern", "Italy", "." ], "ids": [ 10357, 12415, 10105, 11584, 23503, 10894, 10347, 107, 32374, 52917, 12254, 107, 10841, 10105, 60379, 11019, 10455, 11284, 106026, 10135, 10105, 11561, 11940, 43860, 10116, 10393, 44593, 10114, 10104, 60582, 10246, 10105, 24711, 10108, 12270, 11335, 117, 10105, 11324, 10261, 10393, 13507, 10114, 17335, 11619, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Or", "##viet", "##o", ",", "located", "in", "Um", "##bria", "between", "Rome", "and", "Florence", ",", "was", "once", "the", "capital", "of", "Et", "##ru", "##ria", ",", "an", "ancient", "fede", "##ration", "of", "12", "Et", "##rus", "##can", "towns", "." ], "ids": [ 19372, 88445, 10133, 117, 11954, 10106, 14518, 32152, 10948, 14592, 10111, 23283, 117, 10134, 14907, 10105, 12185, 10108, 16232, 11680, 11021, 117, 10151, 21226, 83482, 19466, 10108, 10186, 16232, 13923, 24154, 26656, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 1, 5, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "\"", "We", "want", "to", "pop", "some", "air", "out", "of", "this", "ball", "##oon", "of", "tension", "that", "has", "been", "blow", "##n", "up", "around", "September", "15", ",", "\"", "Ci", "##mic", "##chi", "said", "." ], "ids": [ 107, 12865, 21528, 10114, 13717, 11152, 12566, 10950, 10108, 10531, 20724, 15938, 10108, 55027, 10189, 10393, 10590, 106194, 10115, 10741, 12166, 10596, 10208, 117, 107, 51457, 27057, 12806, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "We", "want", "to", "help", "turn", "down", "the", "r", "##het", "##ori", "##c", "in", "a", "country", "that", "borders", "former", "Yugoslavia", "yet", "in", "which", "people", "are", "still", "talking", "about", "sec", "##ession", ",", "\"", "he", "added", "." ], "ids": [ 107, 12865, 21528, 10114, 15217, 18923, 12935, 10105, 186, 13358, 14336, 10350, 10106, 169, 12723, 10189, 47360, 11775, 38168, 21833, 10106, 10319, 11426, 10301, 12647, 78254, 10978, 37913, 78843, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Boss", "##i", "has", "inte", "##nsi", "##fied", "his", "separat", "##ist", "r", "##het", "##ori", "##c", "since", "his", "Northern", "League", "party", "'", "s", "good", "showing", "in", "last", "April", "'", "s", "general", "election", ",", "when", "it", "took", "10", "percent", "of", "the", "vote", "nationally", "." ], "ids": [ 43860, 10116, 10393, 14168, 22726, 19907, 10226, 81806, 11293, 186, 13358, 14336, 10350, 11764, 10226, 15352, 11074, 14039, 112, 187, 15198, 37501, 10106, 12469, 10780, 112, 187, 11389, 13685, 117, 10841, 10271, 12149, 10150, 22362, 10108, 10105, 18926, 82196, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "has", "recently", "dropped", "a", "drive", "for", "federal", "##ism", ",", "saying", "sec", "##ession", "from", "Rome", "'", "s", "waste", "##ful", "and", "central", "##ised", "bureau", "##cra", "##cy", "is", "the", "only", "solution", "for", "northern", "##ers", "." ], "ids": [ 10357, 10393, 23746, 30241, 169, 23806, 10142, 16293, 13397, 117, 22807, 37913, 78843, 10188, 14592, 112, 187, 59158, 14446, 10111, 12397, 20666, 32340, 40333, 11710, 10124, 10105, 10893, 28502, 10142, 17335, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "farmer", "says", "he", "mu", "##tila", "##ted", "four", "women", "." ], "ids": [ 11667, 83540, 22153, 10261, 12361, 49999, 11912, 11598, 13190, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "V", "##ERO", "##NA", ",", "Italy", "1996", "-", "08", "-", "24" ], "ids": [ 159, 104737, 36742, 117, 11619, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Italian", "farmer", "accused", "of", "multiple", "homo", "##cide", "has", "con", "##fes", "##sed", "to", "mu", "##tila", "##ting", "the", "bodies", "of", "four", "women", "after", "having", "sex", "with", "them", ",", "the", "Italian", "news", "agency", "AN", "##SA", "reported", "on", "Saturday", "." ], "ids": [ 10313, 11667, 83540, 37303, 10108, 19865, 96177, 65074, 10393, 10173, 58058, 16219, 10114, 12361, 49999, 12141, 10105, 34106, 10108, 11598, 13190, 10662, 13677, 18549, 10169, 11345, 117, 10105, 11667, 14424, 34649, 50972, 27138, 15943, 10135, 24848, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "It", "quoted", "the", "lawyer", "of", "Gian", "##franco", "St", "##evan", "##in", "as", "saying", "the", "35", "-", "year", "-", "old", "farmer", "con", "##fes", "##sed", "on", "Friday", "to", "a", "Verona", "mag", "##istrat", "##e", "that", "he", "had", "killed", "and", "mu", "##tila", "##ted", "the", "women", "." ], "ids": [ 10377, 70676, 10105, 38055, 10108, 57243, 83792, 10838, 59427, 10245, 10146, 22807, 10105, 10803, 118, 10924, 118, 12898, 83540, 10173, 58058, 16219, 10135, 30767, 10114, 169, 31755, 20722, 65293, 10112, 10189, 10261, 10374, 15875, 10111, 12361, 49999, 11912, 10105, 13190, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##SA", "said", "St", "##evan", "##in", "was", "unable", "to", "reca", "##ll", "how", "he", "had", "killed", "the", "women", ",", "remember", "##ing", "only", "that", "he", "had", "found", "them", "\"", "life", "##less", "in", "his", "arms", "\"", "after", "having", "sad", "##mas", "##och", "##istic", "sex", "with", "them", "." ], "ids": [ 50972, 27138, 12415, 10838, 59427, 10245, 10134, 30553, 10114, 103778, 11231, 14796, 10261, 10374, 15875, 10105, 13190, 117, 93161, 10230, 10893, 10189, 10261, 10374, 11823, 11345, 107, 12103, 14985, 10106, 10226, 28150, 107, 10662, 13677, 81708, 12922, 16908, 29025, 18549, 10169, 11345, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "##evan", "##in", ",", "arrested", "in", "1994", "and", "jail", "##ed", "for", "three", "years", "for", "assault", "##ing", "an", "Austrian", "pro", "##stitute", ",", "is", "accused", "of", "murder", "##ing", "five", "women", ",", "three", "of", "whose", "bodies", "were", "found", "near", "his", "villa", "outside", "Verona", "between", "July", "and", "December", "1995", "." ], "ids": [ 10838, 59427, 10245, 117, 29479, 10106, 10444, 10111, 75934, 10336, 10142, 11003, 10855, 10142, 50150, 10230, 10151, 32201, 11284, 69442, 117, 10124, 37303, 10108, 29448, 10230, 12403, 13190, 117, 11003, 10108, 16879, 34106, 10309, 11823, 12883, 10226, 19863, 17555, 31755, 10948, 11112, 10111, 11288, 10436, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "of", "the", "corps", "##es", "were", "identified", "but", "not", "the", "third", ",", "found", "head", "##less", "and", "de", "##com", "##posed", "in", "a", "sac", "##k", "in", "a", "nearby", "canal", "." ], "ids": [ 13214, 10108, 10105, 17593, 10171, 10309, 26121, 10473, 10472, 10105, 12628, 117, 11823, 13578, 14985, 10111, 10104, 22530, 76996, 10106, 169, 109436, 10174, 10106, 169, 22301, 16910, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Law", "##yer", "Cesare", "dal", "Mas", "##o", "told", "AN", "##SA", "that", "St", "##evan", "##in", "con", "##fes", "##sed", "to", "be", "##head", "##ing", "and", "dum", "##ping", "the", "body", "of", "a", "fourth", "woman", "in", "the", "nearby", "Adige", "river", "." ], "ids": [ 13216, 17750, 35457, 10740, 16423, 10133, 21937, 50972, 27138, 10189, 10838, 59427, 10245, 10173, 58058, 16219, 10114, 10347, 20391, 10230, 10111, 54892, 15398, 10105, 14333, 10108, 169, 16918, 18299, 10106, 10105, 22301, 75970, 16965, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Dal", "Mas", "##o", "declined", "to", "comment", "on", "the", "alleged", "fifth", "murder", ",", "saying", "only", "that", "\"", "the", "inter", "##roga", "##tions", "are", "not", "over", "yet", "\"", "with", "in", "##vesti", "##gator", "##s", "." ], "ids": [ 18205, 16423, 10133, 44948, 10114, 49641, 10135, 10105, 48164, 22237, 29448, 117, 22807, 10893, 10189, 107, 10105, 22021, 59648, 15024, 10301, 10472, 10491, 21833, 107, 10169, 10106, 63996, 75791, 10107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "in", "##vesti", "##gator", "##s", "believed", "St", "##evan", "##in", "had", "su", "##ff", "##oca", "##ted", "them", "by", "putting", "plastic", "bag", "##s", "on", "their", "heads", "." ], "ids": [ 10377, 12415, 10106, 63996, 75791, 10107, 20718, 10838, 59427, 10245, 10374, 10198, 13820, 44207, 11912, 11345, 10155, 71028, 60280, 56332, 10107, 10135, 10455, 42399, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "##evan", "##in", "was", "first", "sentenced", "for", "assault", "but", "in", "##vesti", "##gator", "##s", "began", "dig", "##ging", "in", "the", "garden", "of", "his", "villa", "after", "the", "first", "body", "was", "found", "by", "a", "passer", "-", "by", "." ], "ids": [ 10838, 59427, 10245, 10134, 10422, 53365, 10142, 50150, 10473, 10106, 63996, 75791, 10107, 11941, 80592, 13808, 10106, 10105, 35651, 10108, 10226, 19863, 10662, 10105, 10422, 14333, 10134, 11823, 10155, 169, 34650, 118, 10155, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgium", "asks", "how", "pa", "##edo", "##phile", "suspect", "elu", "##ded", "police", "." ], "ids": [ 26519, 54031, 14796, 10931, 32435, 86247, 97881, 95575, 21597, 15034, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jeremy", "Love", "##ll" ], "ids": [ 27087, 11248, 11231 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "24" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgian", "police", "search", "##ed", "two", "more", "houses", "on", "Saturday", "for", "bodies", "in", "a", "child", "-", "sex", "scandal", "of", "murder", ",", "ki", "##dna", "##pping", "and", "por", "##nog", "##raphy", "that", "has", "sent", "a", "shock", "##wave", "of", "rev", "##ulsion", "throughout", "Europe", "." ], "ids": [ 36652, 15034, 22419, 10336, 10551, 10798, 21174, 10135, 24848, 10142, 34106, 10106, 169, 18048, 118, 18549, 83458, 10108, 29448, 117, 10879, 35630, 53570, 10111, 10183, 14567, 81503, 10189, 10393, 14541, 169, 62868, 85164, 10108, 86095, 101702, 15916, 11767, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Rec", "##rimi", "##nations", "built", "up", "over", "how", "the", "scandal", "'", "s", "central", "figure", ",", "convicted", "child", "rap", "##ist", "Marc", "Du", "##tro", "##ux", ",", "managed", "to", "prey", "on", "children", "un", "##hin", "##dere", "##d", "for", "so", "long", "." ], "ids": [ 97200, 102422, 105708, 12183, 10741, 10491, 14796, 10105, 83458, 112, 187, 12397, 17527, 117, 61487, 18048, 35562, 11293, 15254, 14925, 14239, 11855, 117, 22391, 10114, 94638, 10135, 12694, 10119, 14383, 20861, 10162, 10142, 10380, 11695, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "just", "over", "a", "week", "two", "young", "girls", "have", "been", "found", "dead", ",", "from", "star", "##vation", ",", "two", "have", "been", "free", "##d", "from", "a", "dung", "##eon", "-", "like", "secret", "com", "##part", "##ment", "and", "an", "international", "hun", "##t", "has", "started", "for", "at", "least", "two", "others", "." ], "ids": [ 10167, 12820, 10491, 169, 16118, 10551, 14739, 27833, 10529, 10590, 11823, 23457, 117, 10188, 16624, 39784, 117, 10551, 10529, 10590, 13961, 10162, 10188, 169, 50622, 27572, 118, 11850, 23658, 10212, 48433, 10426, 10111, 10151, 12533, 12041, 10123, 10393, 13457, 10142, 10160, 16298, 10551, 14633, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Saturday", "in", "##vesti", "##gator", "##s", "with", "dogs", "trained", "to", "find", "bodies", "search", "##ed", "one", "house", "at", "Ra", "##nsa", "##rt", "and", "one", "at", "Mont", "-", "sur", "-", "March", "##ienne", "-", "-", "both", "suburbs", "of", "the", "southern", "city", "of", "Charleroi", "." ], "ids": [ 10576, 24848, 10106, 63996, 75791, 10107, 10169, 67968, 33626, 10114, 17860, 34106, 22419, 10336, 10464, 13215, 10160, 38571, 19999, 10976, 10111, 10464, 10160, 19472, 118, 10326, 118, 11144, 29434, 118, 118, 11408, 89861, 10108, 10105, 17156, 11584, 10108, 88011, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Both", "houses", "are", "owned", "by", "Du", "##tro", "##ux", "." ], "ids": [ 20973, 21174, 10301, 17012, 10155, 14925, 14239, 11855, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Belgian", "media", "sp", "##ecu", "##lated", "that", "Du", "##tro", "##ux", ",", "charged", "with", "ab", "##duction", "and", "illegal", "imprisonment", "of", "children", ",", "must", "have", "had", "high", "level", "protection", "to", "mol", "##est", "young", "##sters", "." ], "ids": [ 36652, 12518, 32650, 97038, 50476, 10189, 14925, 14239, 11855, 117, 38253, 10169, 11357, 54366, 10111, 39806, 91044, 10108, 12694, 117, 14982, 10529, 10374, 11846, 13277, 20344, 10114, 39520, 13051, 14739, 47035, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "put", "forward", "no", "proof", "to", "support", "the", "sp", "##ecu", "##lation", ",", "but", "seized", "on", "a", "comment", "by", "chief", "prose", "##cutor", "Michel", "Bou", "##rle", "##t", "on", "Belgian", "television", "on", "Friday", "night", "that", "he", "would", "cha", "##se", "down", "everyone", "involved", "in", "the", "case", "\"", "if", "I", "am", "allowed", "to", "\"", "." ], "ids": [ 11696, 14499, 23307, 10192, 64153, 10114, 13145, 10105, 32650, 97038, 19718, 117, 10473, 80176, 10135, 169, 49641, 10155, 19421, 84145, 98957, 13273, 62583, 43539, 10123, 10135, 36652, 14162, 10135, 30767, 16903, 10189, 10261, 10894, 18939, 10341, 12935, 48628, 16247, 10106, 10105, 13474, 107, 12277, 146, 10392, 18162, 10114, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bou", "##rle", "##t", "said", "between", "300", "and", "400", "pa", "##edo", "##phile", "por", "##n", "video", "tape", "##s", "had", "been", "seized", ",", "some", "of", "which", "featured", "Du", "##tro", "##ux", "." ], "ids": [ 62583, 43539, 10123, 12415, 10948, 11093, 10111, 11176, 10931, 32435, 86247, 10183, 10115, 12078, 54260, 10107, 10374, 10590, 80176, 117, 11152, 10108, 10319, 15873, 14925, 14239, 11855, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Du", "##tro", "##ux", "was", "charged", "a", "week", "ago", "after", "police", "rescued", "two", "young", "girls", "from", "a", "concrete", "dung", "##eon", "in", "the", "basement", "of", "one", "of", "the", "six", "houses", "he", "owns", "in", "and", "around", "Charleroi", "." ], "ids": [ 14925, 14239, 11855, 10134, 38253, 169, 16118, 36390, 10662, 15034, 106435, 10551, 14739, 27833, 10188, 169, 41651, 50622, 27572, 10106, 10105, 98924, 10108, 10464, 10108, 10105, 12449, 21174, 10261, 76282, 10106, 10111, 12166, 88011, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Just", "a", "day", "later", "the", "national", "eu", "##ph", "##oria", "at", "the", "rescue", "turned", "to", "dis", "##gust", "as", "Du", "##tro", "##ux", "led", "police", "to", "the", "bodies", "of", "two", "eight", "-", "year", "-", "old", "girls", "in", "another", "of", "his", "houses", "." ], "ids": [ 17116, 169, 11940, 10873, 10105, 11844, 14444, 28088, 25584, 10160, 10105, 48022, 21031, 10114, 27920, 104277, 10146, 14925, 14239, 11855, 12857, 15034, 10114, 10105, 34106, 10108, 10551, 16222, 118, 10924, 118, 12898, 27833, 10106, 12864, 10108, 10226, 21174, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Julie", "Le", "##je", "##une", "and", "Melissa", "Russo", ",", "had", "been", "ki", "##dna", "##pped", "in", "June", "last", "year", "." ], "ids": [ 18152, 10281, 10381, 19659, 10111, 42409, 48183, 117, 10374, 10590, 10879, 35630, 44357, 10106, 11120, 12469, 10924, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Du", "##tro", "##ux", "said", "they", "star", "##ved", "to", "death", "nine", "months", "later", "." ], "ids": [ 14925, 14239, 11855, 12415, 10689, 16624, 20709, 10114, 12557, 19964, 15555, 10873, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "also", "admitted", "ki", "##dna", "##pping", "two", "other", "girls", ",", "An", "March", "##al", "and", "E", "##ef", "##je", "Lamb", "##reck", "##s", ",", "a", "year", "ago", "." ], "ids": [ 10357, 10379, 40345, 10879, 35630, 53570, 10551, 10684, 27833, 117, 10313, 11144, 10415, 10111, 142, 16822, 10381, 60005, 80442, 10107, 117, 169, 10924, 36390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fate", "of", "the", "girls", "is", "unknown", ",", "but", "there", "has", "been", "sp", "##ecu", "##lation", "they", "were", "sold", "into", "pro", "##stitution", "in", "Slovakia", "or", "the", "Czech", "Republic", "where", "Du", "##tro", "##ux", "was", "a", "frequent", "visit", "##or", "." ], "ids": [ 10117, 75633, 10108, 10105, 27833, 10124, 27306, 117, 10473, 11155, 10393, 10590, 32650, 97038, 19718, 10689, 10309, 15337, 10708, 11284, 68199, 10106, 43031, 10345, 10105, 22148, 13681, 10940, 14925, 14239, 11855, 10134, 169, 49975, 27541, 10667, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgian", "police", "have", "visited", "Bratislava", "and", "will", "visit", "Prague", "." ], "ids": [ 36652, 15034, 10529, 30270, 27576, 10111, 11337, 27541, 33745, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 1, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Five", "other", "people", "have", "been", "arrested", "including", "Du", "##tro", "##ux", "'", "s", "second", "wife", "Michelle", "Martin", ",", "charged", "as", "an", "ac", "##com", "##plice", "." ], "ids": [ 19268, 10684, 11426, 10529, 10590, 29479, 11198, 14925, 14239, 11855, 112, 187, 11132, 14384, 27062, 11235, 117, 38253, 10146, 10151, 13621, 22530, 62631, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "others", "have", "been", "charged", "with", "ab", "##duction", "and", "illegal", "imprisonment", "of", "children", "or", "are", "suspected", "of", "criminal", "association", "." ], "ids": [ 10117, 14633, 10529, 10590, 38253, 10169, 11357, 54366, 10111, 39806, 91044, 10108, 12694, 10345, 10301, 80337, 10108, 30931, 18061, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "police", "are", "also", "holding", "a", "74", "-", "year", "old", "Dutch", "##man", "in", "connection", "with", "the", "disa", "##ppe", "##aran", "##ce", "of", "An", "and", "E", "##ef", "##je", ",", "although", "a", "spoke", "##sman", "said", "no", "direct", "link", "had", "yet", "been", "established", "." ], "ids": [ 17693, 15034, 10301, 10379, 29008, 169, 12535, 118, 10924, 12898, 17693, 10589, 10106, 31671, 10169, 10105, 36474, 21092, 24367, 10419, 10108, 10313, 10111, 142, 16822, 10381, 117, 14779, 169, 50005, 24305, 12415, 10192, 16934, 26192, 10374, 21833, 10590, 13245, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "part", "of", "the", "sp", "##ecu", "##lation", "in", "the", "Belgian", "media", "of", "high", "-", "level", "protection", "for", "Du", "##tro", "##ux", "and", "his", "ac", "##com", "##plice", "##s", "is", "based", "on", "lea", "##ked", "documents", "catalog", "##uing", "a", "high", "degree", "of", "police", "bun", "##gli", "##ng", ",", "in", "##com", "##pet", "##ence", "and", "ind", "##iff", "##eren", "##ce", "." ], "ids": [ 11699, 16298, 10668, 10108, 10105, 32650, 97038, 19718, 10106, 10105, 36652, 12518, 10108, 11846, 118, 13277, 20344, 10142, 14925, 14239, 11855, 10111, 10226, 13621, 22530, 62631, 10107, 10124, 11610, 10135, 20169, 30511, 21784, 22677, 94213, 169, 11846, 16455, 10108, 15034, 59230, 20986, 10376, 117, 10106, 22530, 19094, 18492, 10111, 30386, 31025, 13653, 10419, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Among", "the", "revela", "##tions", "are", "the", "fact", "that", "the", "gen", "##darmerie", "was", "running", "a", "surveillance", "operation", "code", "##named", "\"", "O", "##the", "##llo", "\"", "against", "Du", "##tro", "##ux", "in", "1995", "-", "-", "when", "both", "Julie", "and", "Melissa", "and", "An", "and", "E", "##ef", "##je", "were", "ki", "##dna", "##pped", "." ], "ids": [ 24470, 10105, 63119, 15024, 10301, 10105, 18638, 10189, 10105, 15331, 103094, 10134, 18020, 169, 58553, 20080, 16964, 95196, 107, 152, 26900, 13660, 107, 11327, 14925, 14239, 11855, 10106, 10436, 118, 118, 10841, 11408, 18152, 10111, 42409, 10111, 10313, 10111, 142, 16822, 10381, 10309, 10879, 35630, 44357, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-PER", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 4, 9, 4, 9, 4, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "show", "that", "the", "gen", "##dar", "##mes", "were", "aware", "that", "Du", "##tro", "##ux", "was", "building", "cells", "in", "some", "of", "his", "houses", "for", "holding", "children", ",", "yet", "this", "information", "was", "either", "not", "passed", "on", "to", "other", "police", "forces", "search", "##ing", "for", "the", "missing", "girls", "or", "was", "over", "##lo", "##oked", "when", "it", "was", "." ], "ids": [ 11696, 11897, 10189, 10105, 15331, 15460, 13546, 10309, 66625, 10189, 14925, 14239, 11855, 10134, 12585, 23182, 10106, 11152, 10108, 10226, 21174, 10142, 29008, 12694, 117, 21833, 10531, 12929, 10134, 16106, 10472, 20006, 10135, 10114, 10684, 15034, 13729, 22419, 10230, 10142, 10105, 39542, 27833, 10345, 10134, 10491, 10715, 76792, 10841, 10271, 10134, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "also", "show", "that", "police", "in", "##vesti", "##gating", "a", "the", "##ft", "visited", "Du", "##tro", "##ux", "late", "last", "year", "at", "the", "house", "where", "Julie", "and", "Melissa", "were", "being", "held", "but", "accepted", "his", "word", "that", "the", "children", "'", "s", "c", "##ries", "they", "could", "hear", "came", "from", "nei", "##gh", "##bours", "." ], "ids": [ 11696, 10379, 11897, 10189, 15034, 10106, 63996, 91045, 169, 10105, 12961, 30270, 14925, 14239, 11855, 13002, 12469, 10924, 10160, 10105, 13215, 10940, 18152, 10111, 42409, 10309, 11223, 11991, 10473, 24926, 10226, 12307, 10189, 10105, 12694, 112, 187, 171, 15388, 10689, 12174, 62064, 13383, 10188, 11888, 15774, 97497, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Justice", "Minister", "St", "##efa", "##an", "De", "Cl", "##er", "##ck", "has", "admitted", "that", "mis", "##take", "##s", "were", "made", "and", "ordered", "an", "in", "##quiry", "at", "the", "same", "time", "as", "stress", "##ing", "there", "were", "no", "indication", "##s", "of", "a", "cover", "-", "up", "." ], "ids": [ 17086, 14355, 10838, 67712, 10206, 10190, 101989, 10165, 11263, 10393, 40345, 10189, 12606, 47529, 10107, 10309, 11019, 10111, 23782, 10151, 10106, 56914, 10160, 10105, 11561, 10635, 10146, 39608, 10230, 11155, 10309, 10192, 102383, 10107, 10108, 169, 16068, 118, 10741, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "is", "also", "widespread", "dis", "##beli", "##ef", "that", "no", "one", "appeared", "to", "question", "how", "Du", "##tro", "##ux", ",", "an", "une", "##mp", "##lo", "##yed", "father", "of", "three", "with", "no", "visible", "means", "of", "support", ",", "managed", "to", "own", "six", "houses", "." ], "ids": [ 11723, 10124, 10379, 48675, 27920, 35439, 16822, 10189, 10192, 10464, 14565, 10114, 20210, 14796, 14925, 14239, 11855, 117, 10151, 10231, 18573, 10715, 68159, 13194, 10108, 11003, 10169, 10192, 26877, 17574, 10108, 13145, 117, 22391, 10114, 12542, 12449, 21174, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Death", "toll", "of", "Algeria", "bomb", "put", "at", "seven", "-", "newspaper", "." ], "ids": [ 15467, 81754, 10108, 43776, 41654, 14499, 10160, 15767, 118, 22047, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "24" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Algeria", "##n", "newspaper", "on", "Saturday", "put", "at", "seven", "-", "-", "two", "women", "and", "five", "children", "-", "-", "the", "death", "toll", "of", "a", "bomb", "bl", "##ast", "in", "a", "market", "west", "of", "Al", "##giers", "on", "Friday", "." ], "ids": [ 10313, 43776, 10115, 22047, 10135, 24848, 14499, 10160, 15767, 118, 118, 10551, 13190, 10111, 12403, 12694, 118, 118, 10105, 12557, 81754, 10108, 169, 41654, 21484, 15171, 10106, 169, 17313, 13735, 10108, 10883, 92894, 10135, 30767, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Algeria", "##n", "security", "forces", "said", "on", "Friday", "three", "women", "and", "two", "children", "were", "killed", "and", "five", "people", "wounded", "when", "a", "home", "-", "made", "bomb", "ex", "##plo", "##ded", "at", "a", "market", "in", "the", "coastal", "town", "of", "Bou", "Har", "##oun", ",", "65", "km", "(", "40", "miles", ")", "west", "of", "Al", "##giers", "." ], "ids": [ 43776, 10115, 21849, 13729, 12415, 10135, 30767, 11003, 13190, 10111, 10551, 12694, 10309, 15875, 10111, 12403, 11426, 39127, 10841, 169, 11816, 118, 11019, 41654, 11419, 46128, 21597, 10160, 169, 17313, 10106, 10105, 41328, 12221, 10108, 62583, 55737, 43971, 117, 10843, 10204, 113, 10533, 14148, 114, 13735, 10108, 10883, 92894, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "The", "security", "forces", "also", "said", "a", "man", "carrying", "an", "ex", "##plosive", "device", "also", "died", "after", "it", "went", "off", "prema", "##ture", "##ly", "." ], "ids": [ 10117, 21849, 13729, 10379, 12415, 169, 10817, 39157, 10151, 11419, 83655, 33091, 10379, 12482, 10662, 10271, 13446, 11898, 14438, 16023, 10454, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "El", "-", "Wat", "##an", "paper", "said", "the", "bl", "##ast", "killed", "seven", "-", "-", "a", "mother", "and", "her", "25", "-", "year", "-", "old", "daughter", ",", "four", "young", "boys", "and", "a", "five", "-", "year", "-", "old", "girl", "." ], "ids": [ 10224, 118, 51082, 10206, 17895, 12415, 10105, 21484, 15171, 15875, 15767, 118, 118, 169, 15293, 10111, 10485, 10258, 118, 10924, 118, 12898, 15243, 117, 11598, 14739, 32647, 10111, 169, 12403, 118, 10924, 118, 12898, 24699, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Several", "people", "were", "also", "wounded", ",", "it", "said", "." ], "ids": [ 28604, 11426, 10309, 10379, 39127, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "explosion", "was", "the", "latest", "in", "series", "of", "bomb", "attacks", "in", "Algeria", "'", "s", "four", "-", "year", "-", "old", "civil", "str", "##ife", "." ], "ids": [ 10117, 53021, 10134, 10105, 50908, 10106, 11366, 10108, 41654, 26483, 10106, 43776, 112, 187, 11598, 118, 10924, 118, 12898, 14161, 17791, 46072, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "-", "appointed", "watch", "##dog", ",", "Human", "Rights", "National", "Observatory", ",", "was", "quoted", "this", "month", "by", "local", "newspapers", "as", "saying", "about", "1", ",", "400", "civilians", "have", "died", "in", "bomb", "attacks", "bl", "##amed", "on", "Mo", "##sle", "##m", "rebels", "in", "the", "past", "two", "years", "." ], "ids": [ 10117, 12047, 118, 14896, 34481, 62039, 117, 15426, 22305, 10655, 41495, 117, 10134, 70676, 10531, 14064, 10155, 11436, 48473, 10146, 22807, 10978, 122, 117, 11176, 77485, 10529, 12482, 10106, 41654, 26483, 21484, 83865, 10135, 34987, 42176, 10147, 57545, 10106, 10105, 17781, 10551, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "estimated", "50", ",", "000", "Algeria", "##ns", "and", "more", "than", "110", "foreign", "##ers", "have", "been", "killed", "in", "violence", "pit", "##ting", "Mo", "##sle", "##m", "rebels", "against", "government", "forces", "since", "early", "1992", ",", "when", "the", "authorities", "cancelled", "a", "general", "election", "in", "which", "radical", "Islam", "##ists", "had", "taken", "a", "commanding", "lead", "." ], "ids": [ 10313, 25267, 10462, 117, 10259, 43776, 10891, 10111, 10798, 11084, 13057, 20796, 10901, 10529, 10590, 15875, 10106, 26342, 55277, 12141, 34987, 42176, 10147, 57545, 11327, 12047, 13729, 11764, 11732, 10450, 117, 10841, 10105, 28308, 60557, 169, 11389, 13685, 10106, 10319, 31991, 14727, 18206, 10374, 15109, 169, 93644, 14107, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Malta", "police", "seize", "can", "##nabis", "among", "chi", "##lli", "sau", "##ce", "." ], "ids": [ 23259, 15034, 75325, 10944, 85215, 13328, 14325, 14088, 11731, 10419, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VA", "##LL", "##ET", "##TA", "1996", "-", "08", "-", "24" ], "ids": [ 69342, 82834, 52338, 24951, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "in", "Malta", "said", "on", "Saturday", "they", "had", "seized", "7", ".", "5", "tonnes", "of", "can", "##nabis", "con", "##cea", "##led", "in", "a", "ship", "##ment", "of", "chi", "##lli", "sau", "##ce", "on", "its", "way", "from", "Singapore", "to", "Romania", "." ], "ids": [ 18051, 10106, 23259, 12415, 10135, 24848, 10689, 10374, 80176, 128, 119, 126, 39435, 10108, 10944, 85215, 10173, 37839, 16376, 10106, 169, 17309, 10426, 10108, 14325, 14088, 11731, 10419, 10135, 10474, 13170, 10188, 19437, 10114, 13927, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Police", "commissione", "##r", "George", "G", "##rec", "##h", "said", "the", "can", "##nabis", "was", "found", "on", "Friday", "pack", "##ed", "in", "500", "boxes", "hidden", "behind", "chi", "##lli", "sau", "##ce", "in", "a", "contain", "##er", "that", "arrived", "at", "Malta", "Free", "##port", "a", "week", "ago", "." ], "ids": [ 18051, 96579, 10129, 10955, 144, 74755, 10237, 12415, 10105, 10944, 85215, 10134, 11823, 10135, 30767, 78978, 10336, 10106, 10757, 88530, 57786, 17155, 14325, 14088, 11731, 10419, 10106, 169, 36003, 10165, 10189, 22584, 10160, 23259, 16122, 15520, 169, 16118, 36390, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "The", "contain", "##er", "was", "on", "its", "way", "to", "Romania", "via", "the", "former", "Yugoslavia", "from", "Singapore", "and", "was", "the", "biggest", "drugs", "hau", "##l", "in", "Malta", ",", "police", "said", "." ], "ids": [ 10117, 36003, 10165, 10134, 10135, 10474, 13170, 10114, 13927, 11406, 10105, 11775, 38168, 10188, 19437, 10111, 10134, 10105, 36304, 40421, 20091, 10161, 10106, 23259, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "No", "street", "value", "was", "given", "for", "the", "can", "##nabis", "." ], "ids": [ 10657, 23840, 19211, 10134, 13507, 10142, 10105, 10944, 85215, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Czech", "coach", "in", "fatal", "crash", "in", "Austria", "." ], "ids": [ 22148, 15701, 10106, 71126, 42774, 10106, 14479, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "VI", "##EN", "##NA", "1996", "-", "08", "-", "24" ], "ids": [ 12262, 50655, 36742, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Czech", "coach", "crashed", "and", "bu", "##rst", "into", "fl", "##ames", "on", "a", "southern", "Austrian", "motor", "##way", "early", "on", "Saturday", ",", "killing", "one", "person", "and", "in", "##jur", "##ing", "15", ",", "police", "said", "." ], "ids": [ 138, 22148, 15701, 91126, 10111, 11499, 21328, 10708, 58768, 55497, 10135, 169, 17156, 32201, 15257, 14132, 11732, 10135, 24848, 117, 34248, 10464, 15042, 10111, 10106, 56671, 10230, 10208, 117, 15034, 12415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Austrian", "television", "said", "the", "coach", ",", "which", "was", "carrying", "45", ",", "was", "en", "route", "from", "the", "Czech", "Republic", "to", "Italy", "when", "the", "accident", "occurred", "near", "Stein", "##berg", ",", "200", "km", "southwest", "of", "Vienna", "." ], "ids": [ 32201, 14162, 12415, 10105, 15701, 117, 10319, 10134, 39157, 10827, 117, 10134, 10110, 13933, 10188, 10105, 22148, 13681, 10114, 11619, 10841, 10105, 25037, 25738, 12883, 23365, 11348, 117, 10777, 10204, 37297, 10108, 20590, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Most", "Spania", "##rds", "back", "talks", "with", "Basque", "rebels", "-", "-", "poll", "." ], "ids": [ 14361, 42751, 40725, 12014, 56672, 10169, 74950, 57545, 118, 118, 70156, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MA", "##D", "##RI", "##D", "1996", "-", "08", "-", "24" ], "ids": [ 27277, 11490, 46876, 11490, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Most", "Spania", "##rds", "would", "support", "government", "talks", "with", "the", "illegal", "Basque", "separat", "##ist", "group", "ETA", "if", "the", "rebels", "ren", "##oun", "##ced", "violence", "permanently", ",", "a", "survey", "published", "in", "daily", "El", "Mundo", "on", "Saturday", "said", "." ], "ids": [ 14361, 42751, 40725, 10894, 13145, 12047, 56672, 10169, 10105, 39806, 74950, 81806, 11293, 11795, 80559, 12277, 10105, 57545, 63256, 43971, 38039, 26342, 76494, 117, 169, 35035, 12304, 10106, 27636, 10224, 21540, 10135, 24848, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "While", "57", "percent", "of", "the", "population", "supported", "negotiations", "with", "ETA", "(", "Basque", "Home", "##land", "and", "Freedom", ")", ",", "30", "percent", "opposed", "it", ",", "the", "survey", "by", "the", "state", "-", "controlled", "Centre", "for", "Soc", "##iological", "Studies", "(", "C", "##IS", ")", "found", "." ], "ids": [ 14600, 11817, 22362, 10108, 10105, 11077, 19992, 61946, 10169, 80559, 113, 74950, 13898, 11080, 10111, 22326, 114, 117, 10244, 22362, 30488, 10271, 117, 10105, 35035, 10155, 10105, 11388, 118, 29050, 12838, 10142, 23104, 96522, 14024, 113, 140, 19088, 114, 11823, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "But", "80", "percent", "said", "ETA", "had", "shown", "little", "interest", "in", "achieving", "peace", "in", "the", "Basque", "country", "when", "it", "offered", "a", "one", "-", "week", "tr", "##uce", "in", "July", "while", "continuing", "to", "hold", "prison", "officer", "Jose", "Antonio", "Ortega", "Lara", ",", "ki", "##dna", "##pped", "in", "January", "." ], "ids": [ 16976, 10832, 22362, 12415, 80559, 10374, 19989, 16745, 17644, 10106, 102863, 28101, 10106, 10105, 74950, 12723, 10841, 10271, 20841, 169, 10464, 118, 16118, 32221, 24075, 10106, 11112, 11371, 47635, 10114, 18500, 20538, 19288, 23029, 11873, 51288, 32386, 117, 10879, 35630, 44357, 10106, 11238, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "problem", "of", "terrorism", "had", "neither", "worse", "##ned", "nor", "improved", "since", "the", "conservative", "Popular", "Party", "(", "PP", ")", "came", "to", "power", "in", "May", ",", "according", "to", "56", "percent", "of", "those", "questioned", ",", "while", "22", "percent", "said", "it", "had", "worse", "##ned", "." ], "ids": [ 10117, 18077, 10108, 96969, 10374, 51148, 110353, 17021, 31515, 34605, 11764, 10105, 50202, 18710, 12529, 113, 33428, 114, 13383, 10114, 13183, 10106, 10725, 117, 18071, 10114, 11628, 22362, 10108, 12676, 101173, 117, 11371, 10306, 22362, 12415, 10271, 10374, 110353, 17021, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "survey", "questioned", "2", ",", "496", "people", "between", "July", "17", "and", "21", "and", "has", "a", "margin", "of", "error", "of", "plus", "or", "minus", "two", "percent", "." ], "ids": [ 10117, 35035, 101173, 123, 117, 42498, 11426, 10948, 11112, 10273, 10111, 10296, 10111, 10393, 169, 53388, 10108, 34046, 10108, 10563, 10345, 84437, 10551, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thirty", "killed", "as", "flood", "##s", "plu", "##nge", "Lahore", "into", "chaos", "." ], "ids": [ 79446, 15875, 10146, 71027, 10107, 13651, 18180, 76624, 10708, 92108, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "IS", "##LA", "##MA", "##BA", "##D", "1996", "-", "08", "-", "24" ], "ids": [ 40214, 44376, 30696, 35999, 11490, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "30", "people", "have", "been", "killed", "and", "about", "100", "injured", "in", "the", "flood", "-", "hit", "Pakistani", "city", "of", "Lahore", ",", "newspapers", "reported", "on", "Saturday", "." ], "ids": [ 11699, 16298, 10244, 11426, 10529, 10590, 15875, 10111, 10978, 10407, 36081, 10106, 10105, 71027, 118, 14946, 66797, 11584, 10108, 76624, 117, 48473, 15943, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "461", "mm", "(", "18", "inches", ")", "of", "rain", "had", "dre", "##nche", "##d", "the", "Punjab", "provincial", "capital", "in", "36", "hours", ",", "turning", "streets", "into", "rivers", ",", "kn", "##ock", "##ing", "out", "power", ",", "water", "and", "telephone", "services", ",", "dis", "##rupt", "##ing", "air", "and", "rail", "traffic", ",", "and", "s", "##we", "##eping", "away", "houses", "and", "cars", "." ], "ids": [ 11696, 12415, 45705, 10366, 113, 10218, 42211, 114, 10108, 50939, 10374, 35028, 49457, 10162, 10105, 40638, 24900, 12185, 10106, 11055, 19573, 117, 48448, 41969, 10708, 46748, 117, 96820, 21863, 10230, 10950, 13183, 117, 12286, 10111, 69009, 12639, 117, 27920, 46791, 10230, 12566, 10111, 29547, 26482, 117, 10111, 187, 12577, 79654, 14942, 21174, 10111, 24602, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "News", "##paper", "##s", "quoted", "witnesses", "as", "saying", "they", "had", "seen", "bodies", "floating", "in", "the", "streets", "." ], "ids": [ 12219, 95596, 10107, 70676, 109898, 10146, 22807, 10689, 10374, 15652, 34106, 106720, 10106, 10105, 41969, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Among", "the", "dead", "were", "five", "members", "of", "the", "religious", "Jam", "##aat", "-", "i", "-", "Islam", "##i", "party", "who", "dro", "##wne", "##d", "while", "trying", "to", "remove", "books", "from", "a", "basement", "library", "." ], "ids": [ 24470, 10105, 23457, 10309, 12403, 12464, 10108, 10105, 19366, 30660, 27124, 118, 177, 118, 14727, 10116, 14039, 10479, 33741, 43201, 10162, 11371, 32862, 10114, 51600, 15174, 10188, 169, 98924, 23187, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "thousands", "of", "people", "had", "been", "made", "home", "##less", "after", "a", "br", "##each", "opened", "in", "the", "city", "canal", ",", "in", "##unda", "##ting", "residential", "areas", "." ], "ids": [ 11696, 12415, 39966, 10108, 11426, 10374, 10590, 11019, 11816, 14985, 10662, 169, 33989, 67208, 14377, 10106, 10105, 11584, 16910, 117, 10106, 20357, 12141, 37937, 14544, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Army", "troops", "were", "called", "in", "to", "eva", "##cua", "##te", "residents", "of", "low", "-", "lying", "areas", "to", "higher", "ground", "." ], "ids": [ 12762, 20836, 10309, 11552, 10106, 10114, 103730, 75545, 10216, 22058, 10108, 15626, 118, 74730, 14544, 10114, 17981, 16912, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Official", "##s", "said", "the", "Ravi", "and", "Chen", "##ab", "rivers", ",", "which", "both", "flow", "through", "Punjab", ",", "were", "in", "high", "flood", "and", "emergency", "services", "backed", "by", "troops", "were", "on", "full", "ale", "##rt", "." ], "ids": [ 17678, 10107, 12415, 10105, 93511, 10111, 22177, 16421, 46748, 117, 10319, 11408, 30676, 11222, 40638, 117, 10309, 10106, 11846, 71027, 10111, 44461, 12639, 61010, 10155, 20836, 10309, 10135, 13375, 11372, 10976, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Internet", "Start", "##up", "funded", "to", "develop", "Java", "software", "." ], "ids": [ 12416, 27172, 14590, 47845, 10114, 26800, 18507, 16042, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "MO", "##UN", "##TA", "##IN", "VI", "##E", "##W", ",", "Cali", "##f", ".", "1996", "-", "08", "-", "25" ], "ids": [ 102059, 69849, 24951, 27128, 12262, 11259, 13034, 117, 65458, 10575, 119, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "small", "team", "of", "engineers", "from", "Sun", "Micro", "##systems", "Inc", ".", "'", "s", "Java", "##S", "##oft", "unit", "said", "Sunday", "they", "have", "formed", "a", "new", "company", ",", "dubbed", "Internet", "Start", "##up", ",", "to", "build", "Java", "infrastructure", "software", "." ], "ids": [ 138, 12474, 11121, 10108, 75222, 10188, 13967, 78857, 95799, 13604, 119, 112, 187, 18507, 10731, 50532, 16511, 12415, 19731, 10689, 10529, 14629, 169, 10751, 12100, 117, 76902, 12416, 27172, 14590, 117, 10114, 23332, 18507, 44284, 16042, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "The", "fled", "##gli", "##ng", "company", ",", "established", "in", "a", "ground", "-", "floor", "office", "here", "over", "the", "last", "two", "weeks", ",", "has", "received", "venture", "fina", "##ncing", "from", "Be", "##ssem", "##er", "Ve", "##nture", "Partners", "of", "Men", "##lo", "Park", ",", "Cali", "##f", ".", "." ], "ids": [ 10117, 56598, 20986, 10376, 12100, 117, 13245, 10106, 169, 16912, 118, 23861, 14301, 19353, 10491, 10105, 12469, 10551, 20750, 117, 10393, 12296, 48709, 79420, 37730, 10188, 14321, 102130, 10165, 19561, 69927, 51257, 10108, 13026, 10715, 11239, 117, 65458, 10575, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 9, 1, 5, 9, 9 ] }, { "tokens": [ "David", "Co", "##wan", ",", "Internet", "Start", "##up", "founder", "and", "acting", "chief", "executive", ",", "is", "a", "general", "partner", "of", "Be", "##ssem", "##er", "." ], "ids": [ 10804, 13098, 14394, 117, 12416, 27172, 14590, 22826, 10111, 25086, 19421, 22676, 117, 10124, 169, 11389, 22825, 10108, 14321, 102130, 10165, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "startu", "##p", "company", "'", "s", "acting", "chairman", "is", "Jim", "Bi", "##dz", "##os", ",", "the", "president", "of", "RS", "##A", "Data", "Security", ",", "a", "unit", "of", "Security", "Dynamics", "Technologies", "Inc", ".", "as", "well", "as", "chairman", "of", "Ver", "##i", "##S", "##ign", "." ], "ids": [ 10117, 96077, 10410, 12100, 112, 187, 25086, 27627, 10124, 14178, 31156, 59880, 10310, 117, 10105, 12931, 10108, 33000, 10738, 12159, 20924, 117, 169, 16511, 10108, 20924, 64147, 49287, 13604, 119, 10146, 11206, 10146, 27627, 10108, 41357, 10116, 10731, 58445, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Internet", "Start", "##up", ",", "which", "opened", "its", "doors", "with", "about", "half", "a", "dozen", "initial", "employees", ",", "combine", "##s", "experience", "at", "Java", "##S", "##oft", ",", "Apple", "Computer", "Inc", ".", ",", "and", "Oracle", "Systems", "." ], "ids": [ 12416, 27172, 14590, 117, 10319, 14377, 10474, 56390, 10169, 10978, 13877, 169, 84956, 21713, 35056, 117, 96961, 10107, 20627, 10160, 18507, 10731, 50532, 117, 17216, 20683, 13604, 119, 117, 10111, 59933, 18953, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 9, 9, 3, 7, 9 ] }, { "tokens": [ "\"", "Java", "porte", "##nds", "dramatic", "changes", "in", "the", "way", "we", "use", "the", "Internet", ",", "\"", "said", "Hong", "Bu", "##i", ",", "vice", "president", "of", "engineering", "of", "the", "new", "company", "after", "serving", "as", "a", "senior", "engineer", "at", "Java", "##S", "##oft", "." ], "ids": [ 107, 18507, 17070, 27090, 60156, 19010, 10106, 10105, 13170, 11951, 11760, 10105, 12416, 117, 107, 12415, 15078, 11916, 10116, 117, 16543, 12931, 10108, 25008, 10108, 10105, 10751, 12100, 10662, 20252, 10146, 169, 17843, 26500, 10160, 18507, 10731, 50532, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Java", "is", "a", "computer", "programming", "language", "introduced", "by", "Sun", "Micro", "##systems", "in", "mid", "-", "1995", "which", "has", "immediately", "captured", "the", "attention", "of", "the", "industry", "for", "its", "ability", "to", "operate", "across", "virtually", "all", "computer", "system", "in", "a", "relatively", "secure", "manner", "." ], "ids": [ 18507, 10124, 169, 18765, 27917, 13702, 17037, 10155, 13967, 78857, 95799, 10106, 15607, 118, 10436, 10319, 10393, 24029, 25030, 10105, 21341, 10108, 10105, 17425, 10142, 10474, 23599, 10114, 34307, 15130, 83659, 10435, 18765, 11787, 10106, 169, 28436, 45853, 39750, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Just", "last", "week", ",", "Sun", "Micro", "##systems", "and", "the", "Silicon", "Valley", "venture", "capital", "giant", "Kleiner", "Perkins", "Ca", "##uf", "##ield", "&", "Bye", "##rs", "said", "they", "had", "completed", "fina", "##ncing", "of", "a", "$", "100", "million", "fund", "managed", "by", "Kleiner", "Perkins", "to", "fund", "startu", "##ps", "developing", "Java", "technologies", "." ], "ids": [ 17116, 12469, 16118, 117, 13967, 78857, 95799, 10111, 10105, 98747, 14390, 48709, 12185, 49429, 66563, 39658, 26037, 21598, 60685, 111, 58776, 10943, 12415, 10689, 10374, 15782, 79420, 37730, 10108, 169, 109, 10407, 12473, 31771, 22391, 10155, 66563, 39658, 10114, 31771, 96077, 13221, 30879, 18507, 43214, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 1, 5, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Java", "has", "been", "licensed", "by", "nearly", "50", "organisations", ",", "ranging", "from", "Microsoft", "Corp", ".", "and", "International", "Business", "Machines", "Corp", ".", "to", "the", "Taiwan", "government", "." ], "ids": [ 18507, 10393, 10590, 54044, 10155, 21377, 10462, 41536, 117, 55432, 10188, 15022, 44687, 119, 10111, 10771, 15281, 101213, 44687, 119, 10114, 10105, 19449, 12047, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 7, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Pr", "##asa", "##d", "W", "##agle", ",", "another", "former", "senior", "Java", "##S", "##oft", "engineer", "who", "is", "among", "the", "founding", "engineers", "at", "Internet", "Start", "##up", ",", "said", "the", "new", "company", "aims", "to", "build", "software", "infrastructure", "using", "Java", "to", "make", "network", "##ed", "applications", "ubi", "##qui", "##tio", "##us", "." ], "ids": [ 106482, 23031, 10162, 160, 103392, 117, 12864, 11775, 17843, 18507, 10731, 50532, 26500, 10479, 10124, 13328, 10105, 30704, 75222, 10160, 12416, 27172, 14590, 117, 12415, 10105, 10751, 12100, 67789, 10114, 23332, 16042, 44284, 13382, 18507, 10114, 13086, 17175, 10336, 26066, 75459, 39639, 24008, 10251, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "feature", "of", "the", "Java", "language", "is", "that", "small", "software", "programmes", ",", "known", "as", "\"", "app", "##lets", "\"", "because", "they", "are", "small", "applications", ",", "can", "be", "download", "##ed", "from", "the", "server", "computers", "at", "the", "centre", "of", "networks", "onto", "individual", "computers", "for", "use", "." ], "ids": [ 11340, 19072, 10108, 10105, 18507, 13702, 10124, 10189, 12474, 16042, 37364, 117, 11053, 10146, 107, 72894, 36630, 107, 12373, 10689, 10301, 12474, 26066, 117, 10944, 10347, 13737, 10336, 10188, 10105, 38854, 58838, 10160, 10105, 12672, 10108, 44570, 31095, 16080, 58838, 10142, 11760, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "this", "model", ",", "individual", "computer", "users", "can", "always", "gain", "access", "to", "the", "latest", "programmes", "and", "do", "not", "need", "to", "store", "more", "software", "than", "they", "are", "currently", "using", "on", "their", "computers", "at", "any", "one", "time", ",", "also", "saving", "costs", "of", "memory", "and", "storage", "." ], "ids": [ 10167, 10531, 13192, 117, 16080, 18765, 32095, 10944, 19540, 25881, 18314, 10114, 10105, 50908, 37364, 10111, 10149, 10472, 17367, 10114, 13708, 10798, 16042, 11084, 10689, 10301, 15313, 13382, 10135, 10455, 58838, 10160, 11178, 10464, 10635, 117, 10379, 90682, 34495, 10108, 25296, 10111, 38112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chris", "Zu", "##lee", "##g", ",", "a", "veteran", "of", "Apple", "and", "a", "former", "Java", "##S", "##oft", "marketing", "manager", ",", "is", "vice", "president", "of", "marketing", "at", "Internet", "Start", "##up", ",", "whose", "Web", "site", "is", "www", ".", "internet", "##start", "##up", ".", "com", "." ], "ids": [ 13151, 16229, 30188, 10240, 117, 169, 55669, 10108, 17216, 10111, 169, 11775, 18507, 10731, 50532, 29465, 16935, 117, 10124, 16543, 12931, 10108, 29465, 10160, 12416, 27172, 14590, 117, 16879, 14636, 11920, 10124, 10494, 119, 18938, 78022, 14590, 119, 10212, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 3, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Be", "##ssem", "##er", "has", "funded", "numerous", "Internet", "pioneer", "##s", ",", "including", "PS", "##I", "Net", ",", "Ver", "##i", "##S", "##ign", "and", "Individual", "." ], "ids": [ 14321, 102130, 10165, 10393, 47845, 19083, 12416, 65570, 10107, 117, 11198, 21290, 11281, 32577, 117, 41357, 10116, 10731, 58445, 10111, 58191, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "MI", "##C", "##K", "##EL", "##S", "##ON", "W", "##IN", "##S", "F", "##O", "##UR", "##TH", "T", "##IT", "##LE", "OF", "Y", "##EA", "##R", "IN", "AK", "##RO", "##N", "." ], "ids": [ 41525, 11369, 11565, 118, 75416, 10858, 11733, 68999, 10731, 30118, 160, 27128, 10731, 143, 11403, 98348, 109166, 157, 37611, 51036, 23240, 162, 36789, 11273, 36351, 36723, 35066, 11537, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "AK", "##RO", "##N", ",", "Ohio", "1996", "-", "08", "-", "25" ], "ids": [ 36723, 35066, 11537, 117, 13608, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Phil", "Mick", "##els", "##on", "bird", "##ied", "two", "of", "the", "last", "three", "holes", "to", "win", "World", "Series", "of", "Golf", "by", "three", "stroke", "##s", "over", "Billy", "May", "##fair", "on", "Sunday", "." ], "ids": [ 18144, 34847, 18338, 10263, 44519, 24140, 10551, 10108, 10105, 12469, 11003, 76956, 10114, 14125, 10315, 13239, 10108, 23870, 10155, 11003, 57071, 10107, 10491, 15894, 10725, 82198, 10135, 19731, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "It", "was", "the", "fourth", "tournament", "title", "this", "year", "for", "Mick", "##els", "##on", ",", "who", "shot", "an", "even", "-", "par", "70", ",", "after", "being", "tied", "for", "the", "lead", "with", "Billy", "May", "##fair", "with", "three", "holes", "to", "play", "." ], "ids": [ 10377, 10134, 10105, 16918, 17390, 12887, 10531, 10924, 10142, 34847, 18338, 10263, 117, 10479, 19508, 10151, 13246, 118, 10248, 10923, 117, 10662, 11223, 42780, 10142, 10105, 14107, 10169, 15894, 10725, 82198, 10169, 11003, 76956, 10114, 12253, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Along", "with", "May", "##fia", "##r", "at", "277", "for", "the", "tournament", "were", "Steve", "St", "##rick", "##er", ",", "who", "had", "a", "68", ",", "and", "Duffy", "Wald", "##orf", ",", "with", "a", "66", "." ], "ids": [ 40545, 10169, 10725, 29347, 10129, 10160, 28884, 10142, 10105, 17390, 10309, 13308, 10838, 35906, 10165, 117, 10479, 10374, 169, 12370, 117, 10111, 85837, 33903, 43920, 117, 10169, 169, 12215, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "was", "very", "hard", "to", "sleep", "last", "night", "because", "there", "was", "so", "much", "I", "could", "ac", "##com", "##pli", "##sh", "with", "this", "win", ",", "\"", "said", "Mick", "##els", "##on", ",", "who", "had", "a", "three", "-", "stroke", "lead", "entering", "the", "third", "round", ".", "\"" ], "ids": [ 107, 10377, 10134, 12558, 19118, 10114, 63658, 12469, 16903, 12373, 11155, 10134, 10380, 13172, 146, 12174, 13621, 22530, 62932, 13264, 10169, 10531, 14125, 117, 107, 12415, 34847, 18338, 10263, 117, 10479, 10374, 169, 11003, 118, 57071, 14107, 44824, 10105, 12628, 13569, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "was", "a", "win", "I", "wanted", "very", ",", "very", "much", ".", "\"" ], "ids": [ 10747, 10134, 169, 14125, 146, 22591, 12558, 117, 12558, 13172, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mick", "##els", "##on", "'", "s", "victory", "gave", "him", "a", "10", "year", "ex", "##em", "##ption", "to", "the", "PGA", "Tour", "." ], "ids": [ 34847, 18338, 10263, 112, 187, 19735, 15362, 10957, 169, 10150, 10924, 11419, 10451, 36478, 10114, 10105, 59115, 11595, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "The", "$", "378", ",", "000", "first", "place", "check", "brings", "Mick", "##els", "##on", "back", "to", "the", "top", "of", "the", "money", "list", "with", "$", "1", ",", "574", ",", "799", "won", "this", "year", "." ], "ids": [ 10117, 109, 37503, 117, 10259, 10422, 11192, 43662, 69315, 34847, 18338, 10263, 12014, 10114, 10105, 12364, 10108, 10105, 17920, 13416, 10169, 109, 122, 117, 57330, 117, 79739, 11367, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "is", "a", "major", "championship", "golf", "course", ",", "and", "for", "me", "to", "perform", "well", "on", "this", "style", "of", "course", "is", "a", "big", "step", "up", "for", "me", "in", "my", "career", "and", "my", "performance", "in", "future", "majors", ",", "\"", "he", "said", "." ], "ids": [ 107, 10747, 10124, 169, 11922, 20755, 32288, 15348, 117, 10111, 10142, 10911, 10114, 28840, 11206, 10135, 10531, 13351, 10108, 15348, 10124, 169, 22185, 31877, 10741, 10142, 10911, 10106, 15127, 13021, 10111, 15127, 14432, 10106, 16711, 86611, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mick", "##els", "##on", "three", "-", "stroke", "lead", "was", "cut", "to", "two", "when", "May", "##fair", "bird", "##ied", "the", "course", "'", "s", "only", "easy", "hole", ",", "the", "par", "five", "second", "hole", ",", "while", "Mick", "##els", "##on", "three", "-", "put", "##ted", "for", "par", "from", "25", "feet", "." ], "ids": [ 34847, 18338, 10263, 11003, 118, 57071, 14107, 10134, 21610, 10114, 10551, 10841, 10725, 82198, 44519, 24140, 10105, 15348, 112, 187, 10893, 44346, 51604, 117, 10105, 10248, 12403, 11132, 51604, 117, 11371, 34847, 18338, 10263, 11003, 118, 14499, 11912, 10142, 10248, 10188, 10258, 17296, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "the", "back", "nine", "Mick", "##els", "##on", "began", "driving", "er", "##rati", "##cally", ",", "and", "poor", "tee", "shots", "resulted", "in", "bog", "##ey", "##s", "on", "the", ",", "eighth", ",", "12th", "and", "13th", "holes", ",", "bringing", "Mick", "##els", "##on", "back", "to", "four", "under", "par", ",", "tied", "with", "May", "##fair", ",", "who", "had", "par", "##red", "14", "straight", "holes", "after", "the", "bird", "##ie", "on", "no", ".", "2", "." ], "ids": [ 10576, 10105, 12014, 19964, 34847, 18338, 10263, 11941, 37897, 10163, 22425, 72762, 117, 10111, 23247, 77711, 74437, 26633, 10106, 66298, 13005, 10107, 10135, 10105, 117, 46758, 117, 34505, 10111, 33937, 76956, 117, 45749, 34847, 18338, 10263, 12014, 10114, 11598, 10571, 10248, 117, 42780, 10169, 10725, 82198, 117, 10479, 10374, 10248, 15711, 10247, 31214, 76956, 10662, 10105, 44519, 10400, 10135, 10192, 119, 123, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mick", "##els", "##on", "then", "set", "up", "a", "tap", "in", "bird", "##ie", "on", "the", "16th", ",", "sending", "a", "we", "##dge", "shot", "to", "18", "inches", "." ], "ids": [ 34847, 18338, 10263, 11059, 11847, 10741, 169, 66956, 10106, 44519, 10400, 10135, 10105, 33581, 117, 67306, 169, 11951, 25431, 19508, 10114, 10218, 42211, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "had", "another", "bird", "##ie", "on", "the", "17th", ",", "where", "he", "his", "a", "6", "-", "iron", "to", "six", "feet", "." ], "ids": [ 10357, 10374, 12864, 44519, 10400, 10135, 10105, 32331, 117, 10940, 10261, 10226, 169, 127, 118, 32374, 10114, 12449, 17296, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "May", "##fair", "bog", "##eye", "##d", "the", "17th", ",", "missing", "a", "five", "foot", "par", "put", "##t", ",", "and", "dropped", "from", "solo", "second", "place", "to", "a", "three", "way", "tie", "for", "second", "." ], "ids": [ 10725, 82198, 66298, 59241, 10162, 10105, 32331, 117, 39542, 169, 12403, 24963, 10248, 14499, 10123, 117, 10111, 30241, 10188, 11395, 11132, 11192, 10114, 169, 11003, 13170, 27916, 10142, 11132, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "the", "second", "successive", "year", "in", "which", "May", "##fair", "has", "finished", "runner", "up", "in", "this", "tournament", "." ], "ids": [ 10377, 10134, 10105, 11132, 47525, 10924, 10106, 10319, 10725, 82198, 10393, 15972, 43037, 10741, 10106, 10531, 17390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "lost", "to", "Greg", "Norman", "in", "sudden", "death", "last", "year", "." ], "ids": [ 10357, 14172, 10114, 22438, 15332, 10106, 94994, 12557, 12469, 10924, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "defending", "champion", "was", "in", "content", "##ion", ",", "two", "behind", "Mick", "##els", "##on", "for", "much", "of", "the", "day", ",", "until", "he", "bog", "##eye", "##d", "the", "13th", "and", "14th", "holes", "." ], "ids": [ 10117, 53730, 17689, 10134, 10106, 19509, 11046, 117, 10551, 17155, 34847, 18338, 10263, 10142, 13172, 10108, 10105, 11940, 117, 11444, 10261, 66298, 59241, 10162, 10105, 33937, 10111, 38399, 76956, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "SC", "##OR", "##ES", "AT", "THE", "WORLD", "SE", "##RI", "##ES", "OF", "GO", "##L", "##F", "." ], "ids": [ 41525, 11369, 11565, 118, 18137, 42622, 25054, 30554, 17443, 67376, 23056, 46876, 25054, 23240, 41525, 11369, 11565, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "AK", "##RO", "##N", ",", "Ohio", "1996", "-", "08", "-", "24" ], "ids": [ 36723, 35066, 11537, 117, 13608, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", "after", "the", "final" ], "ids": [ 66875, 10107, 10662, 10105, 11070 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "round", "of", "the", "$", "2", ".", "1", "million", "NEC", "World", "Series", "of", "Golf", "at" ], "ids": [ 13569, 10108, 10105, 109, 123, 119, 122, 12473, 97104, 10315, 13239, 10108, 23870, 10160 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "Fire", "##stone", "C", ".", "C", ",", "714", "##9", "yards", ",", "par", "70", "(", "players", "U", ".", "S", ".", "unless", "noted", ")", ":" ], "ids": [ 16011, 23314, 140, 119, 140, 117, 56848, 11373, 25537, 117, 10248, 10923, 113, 16021, 158, 119, 156, 119, 60015, 18575, 114, 131 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "274", "Phil", "Mick", "##els", "##on", "70", "66", "68", "70" ], "ids": [ 28925, 18144, 34847, 18338, 10263, 10923, 12215, 12370, 10923 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "277", "Duffy", "Wald", "##orf", "70", "70", "71", "66", ",", "Steve", "St", "##rick", "##er", "68", "72", "69", "68", "," ], "ids": [ 28884, 85837, 33903, 43920, 10923, 10923, 12513, 12215, 117, 13308, 10838, 35906, 10165, 12370, 12120, 12573, 12370, 117 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Billy", "May", "##fair", "66", "71", "70", "70" ], "ids": [ 15894, 10725, 82198, 12215, 12513, 10923, 10923 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "278", "Greg", "Norman", "(", "Australia", ")", "70", "68", "69", "71" ], "ids": [ 29417, 22438, 15332, 113, 11729, 114, 10923, 12370, 12573, 12513 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "280", "Alexander", "Ce", "##jka", "(", "Germany", ")", "72", "71", "71", "66", ",", "Davis", "Love", "70", "74" ], "ids": [ 17859, 12063, 13338, 42978, 113, 12775, 114, 12120, 12513, 12513, 12215, 117, 14281, 11248, 10923, 12535 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "67", "69" ], "ids": [ 12316, 12573 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "281", "John", "Cook", "70", "69", "71", "71" ], "ids": [ 29215, 10421, 21115, 10923, 12573, 12513, 12513 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "282", "Corey", "Pa", "##vin", "73", "70", "70", "69" ], "ids": [ 28805, 72262, 26907, 15478, 12545, 10923, 10923, 12573 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "283", "Tom", "Le", "##hman", "72", "69", "74", "68", ",", "Fred", "Funk", "72", "70", "73", "68", ",", "Mark" ], "ids": [ 29857, 12275, 10281, 49811, 12120, 12573, 12535, 12370, 117, 16887, 47185, 12120, 10923, 12545, 12370, 117, 11997 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4 ] }, { "tokens": [ "Brooks", "69", "69", "74", "71", ",", "Nick", "Fa", "##ldo", "(", "Britain", ")", "70", "71", "68", "74" ], "ids": [ 27625, 12573, 12573, 12535, 12513, 117, 16126, 44271, 44750, 113, 16032, 114, 10923, 12513, 12370, 12535 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "284", "D", ".", "A", ".", "Wei", "##bring", "73", "69", "74", "68", ",", "Tim", "Herr", "##on", "70", "67", "75", "72", ",", "Mark" ], "ids": [ 29137, 141, 119, 138, 119, 37343, 109720, 12545, 12573, 12535, 12370, 117, 15318, 38000, 10263, 10923, 12316, 11417, 12120, 117, 11997 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4 ] }, { "tokens": [ "O", "'", "Me", "##ara", "73", "71", "69", "71", ",", "Jim", "Fury", "##k", "75", "69", "67", "73", ",", "Justin", "Leonard", "69" ], "ids": [ 152, 112, 11589, 12677, 12545, 12513, 12573, 12513, 117, 14178, 49286, 10174, 11417, 12573, 12316, 12545, 117, 21823, 20318, 12573 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "70", "71", "74" ], "ids": [ 10923, 12513, 12535 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "285", "Lor", "##en", "Roberts", "72", "73", "71", "69", ",", "Hal", "Sutton", "72", "69", "74", "70", ",", "Fred" ], "ids": [ 27485, 91473, 10136, 18468, 12120, 12545, 12513, 12573, 117, 21699, 49913, 12120, 12573, 12535, 10923, 117, 16887 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4 ] }, { "tokens": [ "Co", "##up", "##les", "73", "68", "72", "72", ",", "Craig", "Stad", "##ler", "73", "72", "67", "73" ], "ids": [ 13098, 14590, 11268, 12545, 12370, 12120, 12120, 117, 21703, 36841, 10815, 12545, 12120, 12316, 12545 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "286", "Hi", "##demi", "##chi", "Tanaka", "(", "Japan", ")", "66", "75", "75", "70", ",", "Steve", "Jones", "70", "69" ], "ids": [ 28747, 20065, 108986, 12806, 59616, 113, 11891, 114, 12215, 11417, 11417, 10923, 117, 13308, 12298, 10923, 12573 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "76", "71", ",", "Paul", "Go", "##yd", "##os", "66", "75", "74", "71", ",", "Ernie", "Els", "(", "South", "Africa", ")", "71", "71" ], "ids": [ 12428, 12513, 117, 10772, 14439, 18659, 10310, 12215, 11417, 12535, 12513, 117, 76063, 13075, 113, 11056, 12880, 114, 12513, 12513 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "71", "73" ], "ids": [ 12513, 12545 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "287", "Costa", "##ntino", "Rocca", "(", "Italy", ")", "74", "71", "75", "67", ",", "Clarence", "Rose", "72", "71" ], "ids": [ 29268, 13902, 44878, 63718, 113, 11619, 114, 12535, 12513, 11417, 12316, 117, 40653, 14873, 12120, 12513 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "72", "72", ",", "Craig", "Parry", "(", "Australia", ")", "73", "75", "67", "72", ",", "Willie", "Wood", "75", "69" ], "ids": [ 12120, 12120, 117, 21703, 81320, 113, 11729, 114, 12545, 11417, 12316, 12120, 117, 34085, 18315, 11417, 12573 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "69", "74" ], "ids": [ 12573, 12535 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "288", "Shi", "##ge", "##ki", "Mar", "##uya", "##ma", "(", "Japan", ")", "75", "71", "70", "72", ",", "Anders", "For", "##s", "##brand", "(" ], "ids": [ 27401, 44795, 10525, 10506, 15734, 105066, 10369, 113, 11891, 114, 11417, 12513, 10923, 12120, 117, 20751, 11399, 10107, 55520, 113 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Sweden", ")", "70", "75", "71", "72" ], "ids": [ 20937, 114, 10923, 11417, 12513, 12120 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "289", "Scott", "Ho", "##ch", "71", "68", "77", "73" ], "ids": [ 31990, 12812, 20220, 10269, 12513, 12370, 12527, 12545 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "290", "Tom", "Watson", "79", "70", "68", "73" ], "ids": [ 21138, 12275, 19229, 12791, 10923, 12370, 12545 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "292", "Wayne", "West", "##ner", "(", "South", "Africa", ")", "77", "68", "73", "74", ",", "Sven", "St", "##ru", "##ver", "(" ], "ids": [ 29477, 18547, 11164, 11129, 113, 11056, 12880, 114, 12527, 12370, 12545, 12535, 117, 33559, 10838, 11680, 12563, 113 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Germany", ")", "72", "72", "72", "76" ], "ids": [ 12775, 114, 12120, 12120, 12120, 12428 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "294", "Sato", "##shi", "Hi", "##gas", "##hi", "(", "Japan", ")", "75", "72", "74", "73", ",", "Scott", "M", "##c", "##C", "##ar", "##ron", "76", "70" ], "ids": [ 33041, 85266, 16119, 20065, 14644, 11924, 113, 11891, 114, 11417, 12120, 12535, 12545, 117, 12812, 150, 10350, 10858, 10354, 11620, 12428, 10923 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "74", "74" ], "ids": [ 12535, 12535 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "295", "Stewart", "G", "##inn", "(", "Australia", ")", "73", "72", "77", "73" ], "ids": [ 26089, 17493, 144, 24488, 113, 11729, 114, 12545, 12120, 12527, 12545 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "298", "Steve", "Sc", "##hne", "##iter", "77", "74", "76", "71", ",", "Paul", "Stan", "##kowski", "74", "75", "74", "75", "," ], "ids": [ 31543, 13308, 55260, 37893, 27295, 12527, 12535, 12428, 12513, 117, 10772, 26637, 36567, 12535, 11417, 12535, 11417, 117 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sei", "##ki", "Ok", "##uda", "(", "Japan", ")", "81", "70", "72", "75" ], "ids": [ 58901, 10506, 84591, 18497, 113, 11891, 114, 12324, 10923, 12120, 11417 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "301", "Brad", "Bryant", "73", "72", "77", "79" ], "ids": [ 26224, 29382, 29451, 12545, 12120, 12527, 12791 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "H", "##AM", "##LE", "##T", "C", "##UP", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 145, 36535, 51036, 11090, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "COM", "##MA", "##C", "##K", ",", "New", "York", "1996", "-", "08", "-", "24" ], "ids": [ 80645, 30696, 10858, 11733, 117, 10287, 10482, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "at", "the", "Hamlet" ], "ids": [ 33036, 10160, 10105, 48334 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Cup", "tennis", "tournament", "on", "Sunday", "(", "pre", "##fix", "number", "den", "##otes" ], "ids": [ 11544, 20944, 17390, 10135, 19731, 113, 12229, 57014, 11487, 10140, 54989 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "seed", "##ings", ":" ], "ids": [ 49282, 18800, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Finals", ",", "singles" ], "ids": [ 55094, 117, 20527 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "5", "-", "Andrei", "Medvedev", "(", "Ukraine", ")", "beat", "Martin", "Damm", "(", "Czech" ], "ids": [ 126, 118, 40594, 91681, 113, 19883, 114, 27868, 11235, 104698, 113, 22148 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 9, 1 ] }, { "tokens": [ "Republic", ")", "7", "-", "5", "6", "-", "3" ], "ids": [ 13681, 114, 128, 118, 126, 127, 118, 124 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finals", ",", "doubles" ], "ids": [ 55094, 117, 46255 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Luke", "Jensen", "and", "Murphy", "Jensen", "(", "U", ".", "S", ".", ")", "beat", "Alexander", "Volk", "##ov" ], "ids": [ 21489, 28663, 10111, 22430, 28663, 113, 158, 119, 156, 119, 114, 27868, 12063, 44613, 11024 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Russia", ")", "and", "Hand", "##rik", "Dre", "##ek", "##mann", "(", "Germany", ")", "6", "-", "3", "7", "-", "6", "(", "7", "-", "5", ")" ], "ids": [ 113, 14664, 114, 10111, 20749, 15914, 72531, 10707, 12350, 113, 12775, 114, 127, 118, 124, 128, 118, 127, 113, 128, 118, 126, 114 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "TO", "##SH", "##IB", "##A", "CL", "##AS", "##SI", "##C", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 58573, 64091, 72918, 10738, 75151, 38025, 44802, 10858, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "CA", "##R", "##LS", "##BA", "##D", ",", "California", "1996", "-", "08", "-", "25" ], "ids": [ 24707, 11273, 66934, 35999, 11490, 117, 11621, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the" ], "ids": [ 33036, 10188, 10105 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "$", "450", ",", "000", "To", "##shi", "##ba", "Classic", "tennis", "tournament", "on", "Sunday", "(", "pre", "##fix" ], "ids": [ 109, 16718, 117, 10259, 11469, 16119, 10537, 20542, 20944, 17390, 10135, 19731, 113, 12229, 57014 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finals", ":" ], "ids": [ 55094, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "4", "-", "Kimi", "##ko", "Date", "(", "Japan", ")", "beat", "1", "-", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", "(", "Spain", ")" ], "ids": [ 125, 118, 63038, 10440, 29897, 113, 11891, 114, 27868, 122, 118, 54789, 10368, 14220, 66007, 39574, 16780, 113, 16149, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "3", "-", "6", "6", "-", "3", "6", "-", "0", "." ], "ids": [ 124, 118, 127, 127, 118, 124, 127, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RA", "##LL", "##Y", "##ING", "-", "LE", "##AD", "##ING", "P", "##OS", "##IT", "##ION", "##S", "IN", "1", ",", "000", "LA", "##K", "##ES", "RA", "##LL", "##Y", "." ], "ids": [ 64007, 82834, 14703, 50183, 118, 84977, 55538, 50183, 153, 21793, 37611, 52980, 10731, 36351, 122, 117, 10259, 29079, 11733, 25054, 64007, 82834, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "J", "##Y", "##VA", "##S", "##K", "##L", "##Y", "##A", ",", "Finland", "1996", "-", "08", "-", "25" ], "ids": [ 147, 14703, 47172, 10731, 11733, 11369, 14703, 10738, 117, 15497, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "positions", "on" ], "ids": [ 100085, 23188, 10135 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Sunday", "after", "23", "special", "stages", "in", "the", "1", ",", "000", "Lakes", "Rally", ",", "sixth" ], "ids": [ 19731, 10662, 10328, 14478, 35023, 10106, 10105, 122, 117, 10259, 42052, 42161, 117, 28913 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9 ] }, { "tokens": [ "round", "of", "the", "world", "championship", ":" ], "ids": [ 13569, 10108, 10105, 11356, 20755, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Tom", "##mi", "Ma", "##kinen", "(", "Finland", ")", "Mitsubishi", "Lance", "##r", "three", "hours" ], "ids": [ 122, 119, 12275, 10500, 13744, 108088, 113, 15497, 114, 44296, 45013, 10129, 11003, 19573 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "eight", "minutes", "one", "second" ], "ids": [ 16222, 15304, 10464, 11132 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Juha", "Kan", "##kku", "##nen", "(", "Finland", ")", "Toyota", "Cel", "##ica", "12", "seconds" ], "ids": [ 123, 119, 99441, 57528, 70691, 11216, 113, 15497, 114, 28995, 82804, 11043, 10186, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "behind" ], "ids": [ 17155 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "3", ".", "Marcus", "G", "##ron", "##holm", "(", "Finland", ")", "Toyota", "Cel", "##ica", "2", ":", "09" ], "ids": [ 124, 119, 15818, 144, 11620, 35673, 113, 15497, 114, 28995, 82804, 11043, 123, 131, 11035 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Jar", "##mo", "Ky", "##tol", "##eht", "##o", "(", "Finland", ")", "Ford", "Es", "##cor", "##t", "2", ":", "23" ], "ids": [ 125, 119, 91531, 11033, 60082, 48530, 92533, 10133, 113, 15497, 114, 14255, 10912, 49167, 10123, 123, 131, 10328 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Kenneth", "Eriksson", "(", "Sweden", ")", "Subaru", "Im", "##pre", "##za", "2", ":", "39" ], "ids": [ 126, 119, 22369, 70145, 113, 20937, 114, 100668, 10796, 30619, 10637, 123, 131, 11303 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Carlos", "Sai", "##nz", "(", "Spain", ")", "Ford", "Es", "##cor", "##t", "3", ":", "03" ], "ids": [ 127, 119, 12050, 77710, 20259, 113, 16149, 114, 14255, 10912, 49167, 10123, 124, 131, 10907 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "MO", "##TO", "##C", "##RO", "##SS", "-", "SW", "##ED", "##IS", "##H", "500", "##CC", "GR", "##AN", "##D", "PR", "##IX", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 102059, 60493, 10858, 35066, 49248, 118, 92438, 33809, 19088, 12396, 10757, 65622, 58787, 41275, 11490, 23837, 67403, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LAN", "##DS", "##K", "##RO", "##NA", ",", "Sweden", "1996", "-", "08", "-", "25" ], "ids": [ 94057, 33953, 11733, 35066, 36742, 117, 20937, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "in", "the" ], "ids": [ 100085, 17466, 10106, 10105 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Swedish", "500", "##cc", "moto", "##cross", "Grand", "Prix", "on", "Sunday", ":" ], "ids": [ 21381, 10757, 28044, 46322, 61635, 11319, 12835, 10135, 19731, 131 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "First", "race" ], "ids": [ 12128, 14025 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", ".", "Joel", "Sm", "##ets", "(", "Belgium", ")", "Hus", "##abe", "##rg" ], "ids": [ 122, 119, 24468, 41922, 17137, 113, 26519, 114, 109022, 40929, 20251 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "2", ".", "Peter", "Johansson", "(", "Sweden", ")", "Hus", "##q", "##var", "##na" ], "ids": [ 123, 119, 10979, 40211, 113, 20937, 114, 109022, 11703, 16648, 10219 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 7, 7 ] }, { "tokens": [ "3", ".", "Gert", "Jan", "Van", "Door", "##n", "(", "Netherlands", ")", "Honda" ], "ids": [ 124, 119, 84687, 11806, 11474, 21848, 10115, 113, 22043, 114, 25290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "4", ".", "Jack", "##y", "Martens", "(", "Belgium", ")", "Hus", "##q", "##var", "##na" ], "ids": [ 125, 119, 12342, 10157, 98734, 113, 26519, 114, 109022, 11703, 16648, 10219 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 7 ] }, { "tokens": [ "5", ".", "Peter", "Dirk", "##x", "(", "Belgium", ")", "K", "##TM" ], "ids": [ 126, 119, 10979, 38535, 10686, 113, 26519, 114, 148, 55032 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "6", ".", "Danny", "They", "##bers", "(", "Belgium", ")", "Honda" ], "ids": [ 127, 119, 20340, 11696, 56186, 113, 26519, 114, 25290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "Second", "race" ], "ids": [ 14181, 14025 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", ".", "Sha", "##yne", "King", "(", "New", "Zealand", ")", "K", "##TM" ], "ids": [ 122, 119, 106583, 29591, 11515, 113, 10287, 14451, 114, 148, 55032 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 3, 7 ] }, { "tokens": [ "2", ".", "Martens" ], "ids": [ 123, 119, 98734 ], "entity": [ "O", "O", "B-PER" ], "entity_ids": [ 9, 9, 4 ] }, { "tokens": [ "3", ".", "They", "##bers" ], "ids": [ 124, 119, 11696, 56186 ], "entity": [ "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8 ] }, { "tokens": [ "4", ".", "Johan", "Boone", "##n", "(", "Belgium", ")", "Hus", "##q", "##var", "##na" ], "ids": [ 125, 119, 15706, 71801, 10115, 113, 26519, 114, 109022, 11703, 16648, 10219 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 7 ] }, { "tokens": [ "5", ".", "Dietmar", "La", "##lch", "##er", "(", "Germany", ")", "Honda" ], "ids": [ 126, 119, 102411, 10159, 93049, 10165, 113, 12775, 114, 25290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "6", ".", "Claus", "Mann", "##e", "Nielsen", "(", "Denmark", ")", "K", "##TM" ], "ids": [ 127, 119, 41051, 15898, 10112, 25223, 113, 25854, 114, 148, 55032 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "Overall", "on", "day", ":" ], "ids": [ 58877, 10135, 11940, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Martens", "30", "points" ], "ids": [ 122, 119, 98734, 10244, 12789 ], "entity": [ "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9 ] }, { "tokens": [ "2", ".", "Sha", "##yne", "King", "28" ], "ids": [ 123, 119, 106583, 29591, 11515, 10348 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "3", ".", "Sm", "##ets", "27" ], "ids": [ 124, 119, 41922, 17137, 10365 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "4", ".", "They", "##bers", "25" ], "ids": [ 125, 119, 11696, 56186, 10258 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "5", ".", "Van", "Door", "##n", "24" ], "ids": [ 126, 119, 11474, 21848, 10115, 10233 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "6", ".", "Johansson", "17" ], "ids": [ 127, 119, 40211, 10273 ], "entity": [ "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 4, 9 ] }, { "tokens": [ "World", "championship", "standing", "##s", "(", "after", "11", "of", "12", "rounds", ")", ":" ], "ids": [ 10315, 20755, 32173, 10107, 113, 10662, 10193, 10108, 10186, 44759, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Sha", "##yne", "King", "323", "points" ], "ids": [ 122, 119, 106583, 29591, 11515, 28550, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "2", ".", "Sm", "##ets", "290" ], "ids": [ 123, 119, 41922, 17137, 21138 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "3", ".", "Johansson", "236" ], "ids": [ 124, 119, 40211, 26318 ], "entity": [ "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 4, 9 ] }, { "tokens": [ "4", ".", "Lac", "##her", "219" ], "ids": [ 125, 119, 12602, 14206, 25874 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "5", ".", "Dar", "##ryl", "##l", "King", "(", "New", "Zealand", ")", "Honda", "178" ], "ids": [ 126, 119, 35368, 60702, 10161, 11515, 113, 10287, 14451, 114, 25290, 22475 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 3, 9 ] }, { "tokens": [ "6", ".", "Van", "Door", "##n", "176" ], "ids": [ 127, 119, 11474, 21848, 10115, 21613 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "MO", "##TO", "##C", "##RO", "##SS", "-", "GE", "##R", "##MA", "##N", "125", "##CC", "GR", "##AN", "##D", "PR", "##IX", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 102059, 60493, 10858, 35066, 49248, 118, 62997, 11273, 30696, 11537, 14048, 65622, 58787, 41275, 11490, 23837, 67403, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##OL", "##Z", "##GE", "##R", "##L", "##ING", "##EN", ",", "Germany", "1996", "-", "08", "-", "25" ], "ids": [ 145, 39272, 13966, 58719, 11273, 11369, 50183, 50655, 117, 12775, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "in" ], "ids": [ 100085, 17466, 10106 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "the", "German", "125", "##cc", "moto", "##cross", "Grand", "Prix", "on", "Sunday", ":" ], "ids": [ 10105, 12026, 14048, 28044, 46322, 61635, 11319, 12835, 10135, 19731, 131 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "First", "race" ], "ids": [ 12128, 14025 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", ".", "Se", "##bas", "##tien", "Tor", "##telli", "(", "France", ")", "Kawasaki" ], "ids": [ 122, 119, 11045, 21322, 20322, 24446, 82127, 113, 10688, 114, 74270 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "2", ".", "Bob", "Moore", "(", "U", ".", "S", ".", ")", "Yamaha" ], "ids": [ 123, 119, 13583, 15373, 113, 158, 119, 156, 119, 114, 56988 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 3 ] }, { "tokens": [ "3", ".", "Luigi", "Se", "##gu", "##y", "(", "France", ")", "TM" ], "ids": [ 124, 119, 17268, 11045, 12589, 10157, 113, 10688, 114, 70023 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "4", ".", "And", "##i", "Kan", "##sting", "##er", "(", "Germany", ")", "Honda" ], "ids": [ 125, 119, 12689, 10116, 57528, 85660, 10165, 113, 12775, 114, 25290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "5", ".", "Nicolas", "Charlie", "##r", "(", "France", ")", "Kawasaki" ], "ids": [ 126, 119, 16443, 16303, 10129, 113, 10688, 114, 74270 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "6", ".", "Erik", "Came", "##rle", "##ngo", "(", "Italy", ")", "Yamaha" ], "ids": [ 127, 119, 16925, 73206, 43539, 32448, 113, 11619, 114, 56988 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "Second", "race" ], "ids": [ 14181, 14025 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", ".", "Tor", "##telli" ], "ids": [ 122, 119, 24446, 82127 ], "entity": [ "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8 ] }, { "tokens": [ "2", ".", "Moore" ], "ids": [ 123, 119, 15373 ], "entity": [ "O", "O", "B-PER" ], "entity_ids": [ 9, 9, 4 ] }, { "tokens": [ "3", ".", "Alex", "Belo", "##metti", "(", "Italy", ")", "Honda" ], "ids": [ 124, 119, 14728, 54514, 98217, 113, 11619, 114, 25290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "4", ".", "Frederic", "Via", "##lle", "(", "France", ")", "Yamaha" ], "ids": [ 125, 119, 43120, 21280, 11270, 113, 10688, 114, 56988 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3 ] }, { "tokens": [ "5", ".", "Coll", "##in", "Du", "##g", "##more", "(", "South", "Africa", ")", "Honda" ], "ids": [ 126, 119, 65689, 10245, 14925, 10240, 19594, 113, 11056, 12880, 114, 25290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 9, 3 ] }, { "tokens": [ "6", ".", "Came", "##rle", "##ngo" ], "ids": [ 127, 119, 73206, 43539, 32448 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 8 ] }, { "tokens": [ "Overall", "on", "day", ":" ], "ids": [ 58877, 10135, 11940, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Tor", "##telli", "40", "points" ], "ids": [ 122, 119, 24446, 82127, 10533, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "2", ".", "Moore", "34" ], "ids": [ 123, 119, 15373, 11069 ], "entity": [ "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 4, 9 ] }, { "tokens": [ "3", ".", "Se", "##gu", "##y", "24" ], "ids": [ 124, 119, 11045, 12589, 10157, 10233 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "4", ".", "Via", "##lle", "22" ], "ids": [ 125, 119, 21280, 11270, 10306 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "5", ".", "Came", "##rle", "##ngo", "20" ], "ids": [ 126, 119, 73206, 43539, 32448, 10197 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "6", ".", "Belo", "##metti", "19" ], "ids": [ 127, 119, 54514, 98217, 10270 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "Final", "world", "championship", "standing", "##s", ":" ], "ids": [ 14924, 11356, 20755, 32173, 10107, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Tor", "##telli", "432", "points" ], "ids": [ 122, 119, 24446, 82127, 36173, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "2", ".", "Paul", "Mali", "##n", "(", "Britain", ")", "Yamaha", "317" ], "ids": [ 123, 119, 10772, 24427, 10115, 113, 16032, 114, 56988, 30986 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "3", ".", "Via", "##lle", "293" ], "ids": [ 124, 119, 21280, 11270, 30435 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "4", ".", "Se", "##gu", "##y", "192" ], "ids": [ 125, 119, 11045, 12589, 10157, 19206 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "5", ".", "Michele", "Fan", "##ton", "(", "Italy", ")", "Kawasaki", "160" ], "ids": [ 126, 119, 26654, 30126, 11183, 113, 11619, 114, 74270, 13849 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "6", ".", "Du", "##g", "##more", "152" ], "ids": [ 127, 119, 14925, 10240, 19594, 18591 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "MO", "##TO", "##R", "RA", "##CI", "##NG", "-", "LE", "##AD", "##ING", "PL", "##AC", "##ING", "##S", "IN", "P", "##OK", "##KA", "1", ",", "000", "KM", "RA", "##CE", "." ], "ids": [ 102059, 60493, 11273, 64007, 89955, 34065, 118, 84977, 55538, 50183, 71341, 30340, 50183, 10731, 36351, 153, 63310, 67813, 122, 117, 10259, 38706, 64007, 43161, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SU", "##Z", "##U", "##KA", ",", "Japan", "1996", "-", "08", "-", "25" ], "ids": [ 86643, 13966, 12022, 67813, 117, 11891, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "placing", "##s", "in" ], "ids": [ 100085, 66959, 10107, 10106 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Sunday", "'", "s", "Po", "##kka", "1", ",", "000", "km", "motor", "race", ",", "seventh", "round", "of", "the" ], "ids": [ 19731, 112, 187, 11255, 20878, 122, 117, 10259, 10204, 15257, 14025, 117, 37192, 13569, 10108, 10105 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "International", "End", "##urance", "GT", "championship", ":" ], "ids": [ 10771, 16777, 41078, 27987, 20755, 131 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "1", ".", "Ray", "Bel", "##im", "(", "Britain", ")", "/", "James", "Weaver", "(", "Britain", ")", "/", "J", ".", "J", ".", "Le", "##hto" ], "ids": [ 122, 119, 13871, 47197, 11759, 113, 16032, 114, 120, 10900, 63417, 113, 16032, 114, 120, 147, 119, 147, 119, 10281, 81727 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Finland", ")", "Gulf", "McLaren", "F", "##I", "GT", "##R", "171", "laps", "-", "6", "hours", "18", "minutes" ], "ids": [ 113, 15497, 114, 28239, 38084, 143, 11281, 27987, 11273, 22478, 82786, 118, 127, 19573, 10218, 15304 ], "entity": [ "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "48", ".", "637", "seconds", "(", "average", "speed", "158", ".", "82", "k", "##ph", ")" ], "ids": [ 11300, 119, 58966, 34290, 113, 13551, 19085, 21240, 119, 12180, 179, 28088, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Anders", "Olof", "##sson", "(", "Sweden", ")", "/", "Luciano", "della", "No", "##ce", "(", "Italy", ")", "Enn", "##ea" ], "ids": [ 123, 119, 20751, 54687, 14650, 113, 20937, 114, 120, 35491, 10286, 10657, 10419, 113, 11619, 114, 65047, 11233 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6 ] }, { "tokens": [ "Ferrari", "F", "##40", "170", "laps" ], "ids": [ 20586, 143, 38109, 15410, 82786 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9 ] }, { "tokens": [ "3", ".", "Andy", "Ball", "##ace", "(", "Britain", ")", "/", "Olivier", "G", "##rou", "##illa", "##rd", "(", "France", ")", "Har", "##rod", "##s" ], "ids": [ 124, 119, 16802, 19479, 19929, 113, 16032, 114, 120, 22383, 144, 20217, 14250, 12023, 113, 10688, 114, 55737, 46114, 10107 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 2, 6, 6 ] }, { "tokens": [ "McLaren", "F", "##I", "GT", "##R", "169" ], "ids": [ 38084, 143, 11281, 27987, 11273, 22083 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "4", ".", "Thomas", "B", "##scher", "(", "Germany", ")", "/", "Peter", "Ko", "##x", "(", "Netherlands", ")", "West", "McLaren" ], "ids": [ 125, 119, 11096, 139, 21045, 113, 12775, 114, 120, 10979, 30186, 10686, 113, 22043, 114, 11164, 38084 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 2, 6 ] }, { "tokens": [ "F1", "GT", "##R", "168" ], "ids": [ 27985, 27987, 11273, 20436 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 6, 6, 9 ] }, { "tokens": [ "5", ".", "Fa", "##bien", "Giro", "##ix", "(", "France", ")", "/", "Jean", "-", "Denis", "Del", "##et", "##raz", "(", "Switzerland", ")" ], "ids": [ 126, 119, 44271, 42200, 27962, 13274, 113, 10688, 114, 120, 10766, 118, 18454, 15973, 10308, 29948, 113, 26002, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Muller", "McLaren", "F1", "GT", "##R", "167" ], "ids": [ 54854, 38084, 27985, 27987, 11273, 20905 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "6", ".", "Lindsay", "Owen", "-", "Jones", "(", "Britain", ")", "/", "Pierre", "-", "Henri", "Rap", "##hane", "##l" ], "ids": [ 127, 119, 42228, 23850, 118, 12298, 113, 16032, 114, 120, 11609, 118, 13612, 47957, 53437, 10161 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "(", "France", ")", "/", "David", "Brabham", "(", "Australia", ")", "Gulf", "McLaren", "F", "!" ], "ids": [ 113, 10688, 114, 120, 10804, 103355, 113, 11729, 114, 28239, 38084, 143, 106 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 9, 1, 9, 2, 6, 6, 6 ] }, { "tokens": [ "GT", "##R" ], "ids": [ 27987, 11273 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "167" ], "ids": [ 20905 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "7", ".", "Jean", "-", "Marc", "Go", "##uno", "##n", "(", "France", ")", "/", "Eric", "Bernard", "(", "France", ")", "/", "Paul" ], "ids": [ 128, 119, 10766, 118, 15254, 14439, 25091, 10115, 113, 10688, 114, 120, 14057, 14450, 113, 10688, 114, 120, 10772 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 4 ] }, { "tokens": [ "Bel", "##mondo", "(", "France", ")", "Enn", "##ea", "Ferrari", "F", "##40", "167" ], "ids": [ 47197, 74862, 113, 10688, 114, 65047, 11233, 20586, 143, 38109, 20905 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "8", ".", "Bruno", "Ei", "##chmann", "(", "Germany", ")", "/", "Gerd", "R", "##uch", "(", "Germany", ")", "/", "Ralf", "Ke", "##llen", "##ers" ], "ids": [ 129, 119, 16663, 35278, 74385, 113, 12775, 114, 120, 56155, 155, 20591, 113, 12775, 114, 120, 63424, 47124, 16815, 10901 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "Germany", ")", "GT", "##2", "R", "##oo", "##ck", "Porsche", "911", "164" ], "ids": [ 113, 12775, 114, 27987, 10729, 155, 22659, 11263, 34722, 38375, 21575 ], "entity": [ "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 1, 9, 2, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "9", ".", "Stephan", "##e", "Orte", "##lli", "(", "France", ")", "/", "Bob", "Wo", "##lle", "##k", "(", "France", ")", "/", "Franz", "Konrad" ], "ids": [ 130, 119, 31556, 10112, 50773, 14088, 113, 10688, 114, 120, 13583, 102204, 11270, 10174, 113, 10688, 114, 120, 13752, 27616 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8 ] }, { "tokens": [ "(", "Austria", ")", "GT", "##2", "Konrad", "Porsche", "911", "164" ], "ids": [ 113, 14479, 114, 27987, 10729, 27616, 34722, 38375, 21575 ], "entity": [ "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 1, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "10", ".", "Cor", "Eu", "##ser", "(", "Netherlands", ")", "/", "H", ".", "W", "##ada", "(", "Japan", ")", "/", "N", ".", "Fu", "##ru", "##ya", "(", "Japan", ")", "GT", "##2" ], "ids": [ 10150, 119, 93495, 41859, 12754, 113, 22043, 114, 120, 145, 119, 160, 11153, 113, 11891, 114, 120, 151, 119, 17056, 11680, 10679, 113, 11891, 114, 27987, 10729 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 2, 6 ] }, { "tokens": [ "Marcos", "LM", "##60", "##0", "162" ], "ids": [ 24936, 107879, 50924, 10929, 21638 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6 ] }, { "tokens": [ "Fast", "##est", "lap", ":", "Go", "##uno", "##n", ",", "2", "minutes", "03", ".", "684", "seconds", "(", "170", ".", "680", "k", "##ph", ")" ], "ids": [ 28191, 13051, 38553, 131, 14439, 25091, 10115, 117, 123, 15304, 10907, 119, 53608, 34290, 113, 15410, 119, 35922, 179, 28088, 114 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Championship", "standing", "##s", "after", "seven", "rounds", ":" ], "ids": [ 12341, 32173, 10107, 10662, 15767, 44759, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Bel", "##im", ",", "Weaver", "156", "points" ], "ids": [ 122, 119, 47197, 11759, 117, 63417, 20410, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 4, 9, 9 ] }, { "tokens": [ "2", ".", "Ei", "##chmann", ",", "R", "##uch", "116" ], "ids": [ 123, 119, 35278, 74385, 117, 155, 20591, 17095 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 4, 8, 9 ] }, { "tokens": [ "3", ".", "B", "##scher", "112" ], "ids": [ 124, 119, 139, 21045, 16129 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "4", ".", "Go", "##uno", "##n", ",", "Bernard", ",", "Bel", "##mondo", "98" ], "ids": [ 125, 119, 14439, 25091, 10115, 117, 14450, 117, 47197, 74862, 12327 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 9, 4, 8, 9 ] }, { "tokens": [ "5", ".", "Olof", "##sson", ",", "della", "No", "##ce", "93" ], "ids": [ 126, 119, 54687, 14650, 117, 10286, 10657, 10419, 12479 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "6", ".", "Owen", "-", "Jones", ",", "Rap", "##hane", "##l", "82" ], "ids": [ 127, 119, 23850, 118, 12298, 117, 47957, 53437, 10161, 12180 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "LE", "##AD", "##ING", "RE", "##SU", "##L", "##TS", "AT", "SH", "##EF", "##F", "##IE", "##LD", "IN", "##TER", "##NA", "##TION", "##AL", "ME", "##ET", "##ING", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 84977, 55538, 50183, 71033, 88592, 11369, 36545, 30554, 38702, 95981, 11565, 71655, 62943, 36351, 99552, 36742, 98207, 32002, 47430, 52338, 50183, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SH", "##EF", "##F", "##IE", "##LD", ",", "England", "1996", "-", "08", "-", "25" ], "ids": [ 38702, 95981, 11565, 71655, 62943, 117, 11701, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "at", "an" ], "ids": [ 100085, 17466, 10160, 10151 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "international", "meeting", "on", "Sunday", ":" ], "ids": [ 12533, 19822, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "triple", "jump" ], "ids": [ 13536, 112, 187, 40159, 54941 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Sar", "##ka", "Kaspar", "##kova", "(", "Czech", "Republic", ")", "14", ".", "84", "metres" ], "ids": [ 122, 119, 64696, 10371, 105813, 61653, 113, 22148, 13681, 114, 10247, 119, 11761, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Ash", "##ia", "Hansen", "(", "Britain", ")", "14", ".", "78" ], "ids": [ 123, 119, 45707, 10280, 22126, 113, 16032, 114, 10247, 119, 12492 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Rod", "##ica", "Mate", "##scu", "(", "Romania", ")", "14", ".", "18" ], "ids": [ 124, 119, 30602, 11043, 99603, 41747, 113, 13927, 114, 10247, 119, 10218 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "400", "metres", "hur", "##dles" ], "ids": [ 13536, 112, 187, 11176, 16393, 52824, 92503 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "De", "##on", "He", "##mming", "##s", "(", "Jamaica", ")", "55", ".", "13", "seconds" ], "ids": [ 122, 119, 10190, 10263, 10357, 97469, 10107, 113, 32699, 114, 11358, 119, 10249, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Anne", "Marke", "##n", "(", "Belgium", ")", "55", ".", "90" ], "ids": [ 123, 119, 13490, 73879, 10115, 113, 26519, 114, 11358, 119, 10919 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Susan", "Smith", "(", "Ireland", ")", "56", ".", "00" ], "ids": [ 124, 119, 14476, 11673, 113, 14637, 114, 11628, 119, 11025 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "ja", "##veli", "##n" ], "ids": [ 13536, 112, 187, 10201, 57318, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Is", "##el", "Lopez", "(", "Cuba", ")", "61", ".", "36" ], "ids": [ 122, 119, 12034, 10570, 34054, 113, 17226, 114, 12314, 119, 11055 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Louise", "M", "##c", "##Pa", "##ul", "(", "Australia", ")", "60", ".", "66" ], "ids": [ 123, 119, 18605, 150, 10350, 89525, 10604, 113, 11729, 114, 10709, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Silk", "##e", "Ren", "##k", "(", "Germany", ")", "60", ".", "66" ], "ids": [ 124, 119, 93401, 10112, 52712, 10174, 113, 12775, 114, 10709, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "200", "metres" ], "ids": [ 13536, 112, 187, 10777, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Cathy", "Freeman", "(", "Australia", ")", "22", ".", "53" ], "ids": [ 122, 119, 88672, 33044, 113, 11729, 114, 10306, 119, 11756 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Fa", "##lila", "##t", "Og", "##unk", "##oya", "(", "Nigeria", ")", "22", ".", "58" ], "ids": [ 123, 119, 44271, 81523, 10123, 69519, 33551, 51814, 113, 22045, 114, 10306, 119, 11824 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Juliet", "Cut", "##h", "##bert", "(", "Jamaica", ")", "22", ".", "77" ], "ids": [ 124, 119, 60980, 51275, 10237, 18072, 113, 32699, 114, 10306, 119, 12527 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "100", "metres", "hur", "##dles" ], "ids": [ 10407, 16393, 52824, 92503 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Dion", "##ne", "Rose", "(", "Jamaica", ")", "12", ".", "83" ], "ids": [ 122, 119, 54765, 10238, 14873, 113, 32699, 114, 10186, 119, 12408 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Michelle", "Freeman", "(", "Jamaica", ")", "12", ".", "91" ], "ids": [ 123, 119, 27062, 33044, 113, 32699, 114, 10186, 119, 12519 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Gill", "##ian", "Russell", "(", "Jamaica", ")", "12", ".", "95" ], "ids": [ 124, 119, 33787, 11630, 13481, 113, 32699, 114, 10186, 119, 11978 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "800", "metres" ], "ids": [ 13536, 112, 187, 11900, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Cha", "##rma", "##ine", "C", "##rook", "##s", "(", "Canada", ")", "two", "minutes", "00", ".", "42", "seconds" ], "ids": [ 122, 119, 53453, 25248, 11088, 140, 95898, 10107, 113, 11635, 114, 10551, 15304, 11025, 119, 11276, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "In", "##ez", "Turner", "(", "Jamaica", ")", "2", ":", "01", ".", "98" ], "ids": [ 123, 119, 10167, 12715, 18339, 113, 32699, 114, 123, 131, 10669, 119, 12327 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Margaret", "Crowley", "(", "Australia", ")", "2", ":", "02", ".", "40" ], "ids": [ 124, 119, 18014, 87019, 113, 11729, 114, 123, 131, 10983, 119, 10533 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "pole", "va", "##ult" ], "ids": [ 13026, 112, 187, 21326, 10321, 16203 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "T", "##rond", "Bath", "##el", "(", "Norway", ")", "5", ".", "60" ], "ids": [ 122, 119, 157, 58694, 44895, 10570, 113, 22582, 114, 126, 119, 10709 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Pat", "Manson", "(", "U", ".", "S", ".", ")", "5", ".", "60" ], "ids": [ 123, 119, 24714, 64723, 113, 158, 119, 156, 119, 114, 126, 119, 10709 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Tim", "Lo", "##bing", "##er", "(", "Germany", ")", "5", ".", "50" ], "ids": [ 124, 119, 15318, 13069, 27300, 10165, 113, 12775, 114, 126, 119, 10462 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "ja", "##veli", "##n" ], "ids": [ 13026, 112, 187, 10201, 57318, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Tom", "P", "##uks", "##tys", "(", "U", ".", "S", ".", ")", "86", ".", "82" ], "ids": [ 122, 119, 12275, 153, 75706, 47917, 113, 158, 119, 156, 119, 114, 12224, 119, 12180 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Steve", "Back", "##ley", "(", "Britain", ")", "82", ".", "20" ], "ids": [ 123, 119, 13308, 15925, 12105, 113, 16032, 114, 12180, 119, 10197 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Nick", "Nie", "##land", "(", "Britain", ")", "81", ".", "12" ], "ids": [ 124, 119, 16126, 25879, 11080, 113, 16032, 114, 12324, 119, 10186 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "400", "metres" ], "ids": [ 13536, 112, 187, 11176, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Marcel", "Malone", "(", "U", ".", "S", ".", ")", "51", ".", "50" ], "ids": [ 122, 119, 18475, 69614, 113, 158, 119, 156, 119, 114, 11524, 119, 10462 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Kim", "Graham", "(", "U", ".", "S", ".", ")", "52", ".", "17" ], "ids": [ 123, 119, 13539, 16928, 113, 158, 119, 156, 119, 114, 11525, 119, 10273 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Ph", "##yli", "##s", "Smith", "(", "Britain", ")", "52", ".", "53" ], "ids": [ 124, 119, 29343, 46977, 10107, 11673, 113, 16032, 114, 11525, 119, 11756 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "200", "metres" ], "ids": [ 13026, 112, 187, 10777, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Jeff", "Williams", "(", "U", ".", "S", ".", ")", "20", ".", "45" ], "ids": [ 122, 119, 17218, 12494, 113, 158, 119, 156, 119, 114, 10197, 119, 10827 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Doug", "Turner", "(", "Britain", ")", "20", ".", "48" ], "ids": [ 123, 119, 34008, 18339, 113, 16032, 114, 10197, 119, 11300 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "John", "Regis", "(", "Britain", ")", "20", ".", "63" ], "ids": [ 124, 119, 10421, 105798, 113, 16032, 114, 10197, 119, 12256 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "high", "jump" ], "ids": [ 13026, 112, 187, 11846, 54941 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Charles", "Austin", "(", "U", ".", "S", ".", ")", "2", ".", "30" ], "ids": [ 122, 119, 10925, 18846, 113, 158, 119, 156, 119, 114, 123, 119, 10244 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Tim", "For", "##sy", "##th", "(", "Australia", ")", "2", ".", "30" ], "ids": [ 123, 119, 15318, 11399, 16105, 11143, 113, 11729, 114, 123, 119, 10244 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Pat", "##rik", "S", "##jo", "##berg", "(", "Sweden", ")", "2", ".", "25" ], "ids": [ 124, 119, 24714, 15914, 156, 11039, 11348, 113, 20937, 114, 123, 119, 10258 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "800", "metres" ], "ids": [ 13026, 112, 187, 11900, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Ver", "##b", "##jorn", "Roda", "##l", "(", "Norway", ")", "1", ":", "44", ".", "93" ], "ids": [ 122, 119, 41357, 10457, 72603, 97751, 10161, 113, 22582, 114, 122, 131, 11126, 119, 12479 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Benson", "Ko", "##ech", "(", "Kenya", ")", "1", ":", "45", ".", "96" ], "ids": [ 123, 119, 44221, 30186, 16200, 113, 19686, 114, 122, 131, 10827, 119, 12308 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Vincent", "Mala", "##k", "##wen", "(", "Kenya", ")", "1", ":", "46", ".", "18" ], "ids": [ 124, 119, 16179, 58335, 10174, 19584, 113, 19686, 114, 122, 131, 11528, 119, 10218 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "mile" ], "ids": [ 13026, 112, 187, 21128 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "William", "Tan", "##ui", "(", "Kenya", ")", "3", ":", "54", ".", "57" ], "ids": [ 122, 119, 10694, 30594, 11990, 113, 19686, 114, 124, 131, 11653, 119, 11817 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "John", "Mayo", "##ck", "(", "Britain", ")", "3", ":", "54", ".", "60" ], "ids": [ 123, 119, 10421, 24611, 11263, 113, 16032, 114, 124, 131, 11653, 119, 10709 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Tony", "White", "##man", "(", "Britain", ")", "3", ":", "54", ".", "87" ], "ids": [ 124, 119, 13749, 12136, 10589, 113, 16032, 114, 124, 131, 11653, 119, 12581 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "400", "metres" ], "ids": [ 13026, 112, 187, 11176, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Roger", "Black", "(", "Britain", ")", "45", ".", "05" ], "ids": [ 122, 119, 13513, 11750, 113, 16032, 114, 10827, 119, 10831 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Mark", "Richardson", "(", "Britain", ")", "45", ".", "38" ], "ids": [ 123, 119, 11997, 29188, 113, 16032, 114, 10827, 119, 11171 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Derek", "Mills", "(", "U", ".", "S", ".", ")", "45", ".", "48" ], "ids": [ 124, 119, 30815, 29250, 113, 158, 119, 156, 119, 114, 10827, 119, 11300 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "100", "metres" ], "ids": [ 13026, 112, 187, 10407, 16393 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Os", "##mond", "Ez", "##in", "##wa", "(", "Nigeria", ")", "10", ".", "06" ], "ids": [ 122, 119, 12087, 25677, 17599, 10245, 11037, 113, 22045, 114, 10150, 119, 10719 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Ian", "Mack", "##ie", "(", "Britain", ")", "10", ".", "17" ], "ids": [ 123, 119, 16582, 48944, 10400, 113, 16032, 114, 10150, 119, 10273 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Lin", "##ford", "Christie", "(", "Britain", ")", "10", ".", "19" ], "ids": [ 124, 119, 35207, 13387, 34964, 113, 16032, 114, 10150, 119, 10270 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##TO", "##R", "RA", "##CI", "##NG", "-", "BE", "##L", "##GI", "##AN", "GR", "##AN", "##D", "PR", "##IX", "RE", "##SU", "##L", "##T", "." ], "ids": [ 102059, 60493, 11273, 64007, 89955, 34065, 118, 46291, 11369, 100075, 41275, 58787, 41275, 11490, 23837, 67403, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SP", "##A", "-", "FR", "##AN", "##CO", "##RC", "##HA", "##MP", "##S", ",", "Belgium", "1996", "-", "08", "-", "25" ], "ids": [ 22570, 10738, 118, 64655, 41275, 82272, 52932, 58132, 79936, 10731, 117, 26519, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of" ], "ids": [ 32070, 16203, 10108 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Sunday", "'", "s", "Belgian", "Grand", "Prix", "motor", "race", ":" ], "ids": [ 19731, 112, 187, 36652, 11319, 12835, 15257, 14025, 131 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Michael", "Schumacher", "(", "Germany", ")", "Ferrari", "1", "hour", "28", "minutes" ], "ids": [ 122, 119, 10631, 37761, 113, 12775, 114, 20586, 122, 24730, 10348, 15304 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "15", ".", "125", "seconds", "(", "average", "speed", "208", ".", "442", "k", "##ph", ")" ], "ids": [ 10208, 119, 14048, 34290, 113, 13551, 19085, 21881, 119, 38334, 179, 28088, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Jacques", "Villeneuve", "(", "Canada", ")", "Williams", "5", ".", "602", "seconds" ], "ids": [ 123, 119, 12745, 40761, 113, 11635, 114, 12494, 126, 119, 50321, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "behind" ], "ids": [ 17155 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "3", ".", "Mika", "Ha", "##kki", "##nen", "(", "Finland", ")", "McLaren", "15", ".", "710" ], "ids": [ 124, 119, 53379, 13740, 30859, 11216, 113, 15497, 114, 38084, 10208, 119, 46887 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Jean", "Ale", "##si", "(", "France", ")", "Ben", "##etto", "##n", "19", ".", "125" ], "ids": [ 125, 119, 10766, 59340, 10449, 113, 10688, 114, 13304, 24327, 10115, 10270, 119, 14048 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Damon", "Hill", "(", "Britain", ")", "Williams", "29", ".", "179" ], "ids": [ 126, 119, 50633, 12289, 113, 16032, 114, 12494, 10386, 119, 22399 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 4, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Gerhard", "Berger", "(", "Austria", ")", "Ben", "##etto", "##n", "29", ".", "896" ], "ids": [ 127, 119, 23148, 27121, 113, 14479, 114, 13304, 24327, 10115, 10386, 119, 68802 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Mika", "Sal", "##o", "(", "Finland", ")", "Ty", "##rrell", "1", ":", "00", ".", "754" ], "ids": [ 128, 119, 53379, 64831, 10133, 113, 15497, 114, 64515, 68122, 122, 131, 11025, 119, 58534 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "U", "##ky", "##o", "Kata", "##yama", "(", "Japan", ")", "Ty", "##rrell", "1", ":", "40", ".", "227" ], "ids": [ 129, 119, 158, 11445, 10133, 76496, 32529, 113, 11891, 114, 64515, 68122, 122, 131, 10533, 119, 25359 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Ricardo", "Ross", "##et", "(", "Brazil", ")", "Arrow", "##s", "one", "lap" ], "ids": [ 130, 119, 20261, 16690, 10308, 113, 16765, 114, 48567, 10107, 10464, 38553 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9 ] }, { "tokens": [ "10", ".", "Pedro", "Lam", "##y", "(", "Portugal", ")", "Mina", "##rdi", "one", "lap" ], "ids": [ 10150, 119, 12849, 44068, 10157, 113, 12939, 114, 43495, 18177, 10464, 38553 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Did", "not", "finish", ":" ], "ids": [ 50133, 10472, 26282, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "11", ".", "David", "Co", "##ult", "##hard", "(", "Britain", ")", "McLaren", "37", "laps", "completed" ], "ids": [ 10193, 119, 10804, 13098, 16203, 29352, 113, 16032, 114, 38084, 11204, 82786, 15782 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9 ] }, { "tokens": [ "12", ".", "Martin", "Brun", "##dle", "(", "Britain", ")", "Jordan", "34" ], "ids": [ 10186, 119, 11235, 102877, 27477, 113, 16032, 114, 16366, 11069 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "13", ".", "Eddie", "Irvine", "(", "Britain", ")", "Ferrari", "29" ], "ids": [ 10249, 119, 19414, 69493, 113, 16032, 114, 20586, 10386 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "14", ".", "Rubens", "Barr", "##iche", "##llo", "(", "Brazil", ")", "Jordan", "29" ], "ids": [ 10247, 119, 61903, 79283, 16528, 13660, 113, 16765, 114, 16366, 10386 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "15", ".", "Pedro", "Din", "##iz", "(", "Brazil", ")", "Ligi", "##er", "22" ], "ids": [ 10208, 119, 12849, 20031, 15834, 113, 16765, 114, 32874, 10165, 10306 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "16", ".", "Jos", "Vers", "##ta", "##ppen", "(", "Net", "##her", "##land", ")", "Arrow", "##s", "11" ], "ids": [ 10250, 119, 28162, 46744, 10213, 20197, 113, 32577, 14206, 11080, 114, 48567, 10107, 10193 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 9, 3, 7, 9 ] }, { "tokens": [ "Did", "not", "start", "(", "failed", "to", "complete", "one", "lap", ")", ":" ], "ids": [ 50133, 10472, 15148, 113, 20775, 10114, 17876, 10464, 38553, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Olivier", "Pan", "##is", "(", "France", ")", "Ligi", "##er" ], "ids": [ 22383, 18661, 10291, 113, 10688, 114, 32874, 10165 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "Johnny", "Herbert", "(", "Britain", ")", "Sau", "##ber" ], "ids": [ 15551, 16861, 113, 16032, 114, 19076, 12212 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 4, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "Heinz", "-", "Harald", "Fr", "##ent", "##zen", "(", "Germany", ")", "Sau", "##ber" ], "ids": [ 23406, 118, 25475, 33884, 11405, 11985, 113, 12775, 114, 19076, 12212 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "Fast", "##est", "lap", ":", "Berger", "1", ":", "53", ".", "067", "(", "221", ".", "857", "k", "##ph", ")" ], "ids": [ 28191, 13051, 38553, 131, 27121, 122, 131, 11756, 119, 107401, 113, 23360, 119, 73898, 179, 28088, 114 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##TO", "##R", "RA", "##CI", "##NG", "-", "SC", "##H", "##UM", "##AC", "##H", "##ER", "W", "##IN", "##S", "BE", "##L", "##GI", "##AN", "GR", "##AN", "##D", "PR", "##IX", "." ], "ids": [ 102059, 60493, 11273, 64007, 89955, 34065, 118, 18137, 12396, 72679, 30340, 12396, 24093, 160, 27128, 10731, 46291, 11369, 100075, 41275, 58787, 41275, 11490, 23837, 67403, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "SP", "##A", "-", "FR", "##AN", "##CO", "##CH", "##AM", "##PS", "1996", "-", "08", "-", "25" ], "ids": [ 22570, 10738, 118, 64655, 41275, 82272, 86448, 36535, 46983, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "Schumacher", "of" ], "ids": [ 10631, 37761, 10108 ], "entity": [ "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 9 ] }, { "tokens": [ "Germany", ",", "driving", "a", "Ferrari", ",", "won", "the", "Belgian", "Grand", "Prix", "motor" ], "ids": [ 12775, 117, 37897, 169, 20586, 117, 11367, 10105, 36652, 11319, 12835, 15257 ], "entity": [ "B-LOC", "O", "O", "O", "B-ORG", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 1, 9, 9, 9, 3, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "race", "on", "Sunday", "." ], "ids": [ 14025, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Canada", "'", "s", "Jacques", "Villeneuve", "finished", "second", "in", "his", "Williams" ], "ids": [ 11635, 112, 187, 12745, 40761, 15972, 11132, 10106, 10226, 12494 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG" ], "entity_ids": [ 1, 9, 9, 4, 8, 9, 9, 9, 9, 3 ] }, { "tokens": [ "and", "Mika", "Ha", "##kki", "##nen", "of", "Finland", "was", "third", "in", "a", "McLaren", "." ], "ids": [ 10111, 53379, 13740, 30859, 11216, 10108, 15497, 10134, 12628, 10106, 169, 38084, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "French", "##man", "Jean", "Ale", "##si", "came", "fourth", "in", "his", "Ben", "##etto", "##n", "with" ], "ids": [ 11894, 10589, 10766, 59340, 10449, 13383, 16918, 10106, 10226, 13304, 24327, 10115, 10169 ], "entity": [ "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 6, 4, 8, 8, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Britain", "'", "s", "Damon", "Hill", "fifth", "in", "a", "Williams", "and", "Gerhard", "Berger", "of" ], "ids": [ 16032, 112, 187, 50633, 12289, 22237, 10106, 169, 12494, 10111, 23148, 27121, 10108 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 9, 9, 9, 3, 9, 4, 8, 9 ] }, { "tokens": [ "Austria", "sixth", "in", "the", "other", "Ben", "##etto", "##n", "." ], "ids": [ 14479, 28913, 10106, 10105, 10684, 13304, 24327, 10115, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "World", "drivers", "'", "championship", "standing", "##s", "(", "after", "13", "rounds", ")", ":" ], "ids": [ 10315, 54598, 112, 20755, 32173, 10107, 113, 10662, 10249, 44759, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Damon", "Hill", "(", "Britain", ")", "81", "points" ], "ids": [ 122, 119, 50633, 12289, 113, 16032, 114, 12324, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Jacques", "Villeneuve", "(", "Canada", ")", "68" ], "ids": [ 123, 119, 12745, 40761, 113, 11635, 114, 12370 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "3", ".", "Michael", "Schumacher", "(", "Germany", ")", "39" ], "ids": [ 124, 119, 10631, 37761, 113, 12775, 114, 11303 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "4", ".", "Jean", "Ale", "##si", "(", "France", ")", "38" ], "ids": [ 125, 119, 10766, 59340, 10449, 113, 10688, 114, 11171 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "5", ".", "Mika", "Ha", "##kki", "##nen", "(", "Finland", ")", "23" ], "ids": [ 126, 119, 53379, 13740, 30859, 11216, 113, 15497, 114, 10328 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "6", ".", "David", "Co", "##ult", "##hard", "(", "Britain", ")", "18" ], "ids": [ 127, 119, 10804, 13098, 16203, 29352, 113, 16032, 114, 10218 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "7", ".", "Gerhard", "Berger", "(", "Austria", ")", "17" ], "ids": [ 128, 119, 23148, 27121, 113, 14479, 114, 10273 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "8", ".", "Olivier", "Pan", "##is", "(", "France", ")", "13" ], "ids": [ 129, 119, 22383, 18661, 10291, 113, 10688, 114, 10249 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "9", ".", "Rubens", "Barr", "##iche", "##llo", "(", "Brazil", ")", "12" ], "ids": [ 130, 119, 61903, 79283, 16528, 13660, 113, 16765, 114, 10186 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "10", ".", "Eddie", "Irvine", "(", "Britain", ")", "9" ], "ids": [ 10150, 119, 19414, 69493, 113, 16032, 114, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "11", ".", "Heinz", "-", "Harald", "Fr", "##ent", "##zen", "(", "Germany", ")", "6" ], "ids": [ 10193, 119, 23406, 118, 25475, 33884, 11405, 11985, 113, 12775, 114, 127 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "12", ".", "Mika", "Sal", "##o", "(", "Finland", ")", "5" ], "ids": [ 10186, 119, 53379, 64831, 10133, 113, 15497, 114, 126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "13", ".", "Johnny", "Herbert", "(", "Britain", ")", "4" ], "ids": [ 10249, 119, 15551, 16861, 113, 16032, 114, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "14", ".", "Martin", "Brun", "##dle", "(", "Britain", ")", "3" ], "ids": [ 10247, 119, 11235, 102877, 27477, 113, 16032, 114, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "15", "equal", "." ], "ids": [ 10208, 32943, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Jos", "Vers", "##ta", "##ppen", "(", "Netherlands", ")", "1" ], "ids": [ 28162, 46744, 10213, 20197, 113, 22043, 114, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "15", "equal", "." ], "ids": [ 10208, 32943, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Pedro", "Din", "##iz", "(", "Brazil", ")", "1" ], "ids": [ 12849, 20031, 15834, 113, 16765, 114, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "Con", "##stru", "##ctors", "'", "championship", ":" ], "ids": [ 12845, 42461, 72933, 112, 20755, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Williams", "149", "points" ], "ids": [ 122, 119, 12494, 19438, 12789 ], "entity": [ "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9 ] }, { "tokens": [ "2", ".", "Ben", "##etto", "##n", "55" ], "ids": [ 123, 119, 13304, 24327, 10115, 11358 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "3", ".", "Ferrari", "48" ], "ids": [ 124, 119, 20586, 11300 ], "entity": [ "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 3, 9 ] }, { "tokens": [ "4", ".", "McLaren", "41" ], "ids": [ 125, 119, 38084, 11349 ], "entity": [ "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 3, 9 ] }, { "tokens": [ "5", ".", "Jordan", "15" ], "ids": [ 126, 119, 16366, 10208 ], "entity": [ "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 3, 9 ] }, { "tokens": [ "6", ".", "Ligi", "##er", "14" ], "ids": [ 127, 119, 32874, 10165, 10247 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 3, 7, 9 ] }, { "tokens": [ "7", ".", "Sau", "##ber", "10" ], "ids": [ 128, 119, 19076, 12212, 10150 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 3, 7, 9 ] }, { "tokens": [ "8", ".", "Ty", "##rrell", "5" ], "ids": [ 129, 119, 64515, 68122, 126 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 3, 7, 9 ] }, { "tokens": [ "9", ".", "Foot", "##work", "1" ], "ids": [ 130, 119, 47239, 37382, 122 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "RA", "##LL", "##Y", "##ING", "-", "LE", "##AD", "##ING", "P", "##OS", "##IT", "##ION", "##S", "IN", "1", ",", "000", "LA", "##K", "##ES", "RA", "##LL", "##Y", "." ], "ids": [ 64007, 82834, 14703, 50183, 118, 84977, 55538, 50183, 153, 21793, 37611, 52980, 10731, 36351, 122, 117, 10259, 29079, 11733, 25054, 64007, 82834, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "J", "##Y", "##VA", "##S", "##K", "##Y", "##LA", ",", "Finland", "1996", "-", "08", "-", "25" ], "ids": [ 147, 14703, 47172, 10731, 11733, 14703, 44376, 117, 15497, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "positions" ], "ids": [ 100085, 23188 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "after", "six", "of", "Sunday", "'", "s", "12", "special", "stages", "in", "the", "1", ",", "000", "Lakes" ], "ids": [ 10662, 12449, 10108, 19731, 112, 187, 10186, 14478, 35023, 10106, 10105, 122, 117, 10259, 42052 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6 ] }, { "tokens": [ "Rally", ",", "sixth", "round", "of", "the", "world", "championship", ":" ], "ids": [ 42161, 117, 28913, 13569, 10108, 10105, 11356, 20755, 131 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Juha", "Kan", "##kku", "##nen", "(", "Finland", ")", "Toyota", "Cel", "##ica", "2", "hours", "30", "minutes" ], "ids": [ 122, 119, 99441, 57528, 70691, 11216, 113, 15497, 114, 28995, 82804, 11043, 123, 19573, 10244, 15304 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "52", "seconds" ], "ids": [ 11525, 34290 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "3", ".", "Tom", "##mi", "Ma", "##kinen", "(", "Finland", ")", "Mitsubishi", "Lance", "##r", "8", "seconds" ], "ids": [ 124, 119, 12275, 10500, 13744, 108088, 113, 15497, 114, 44296, 45013, 10129, 129, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "behind" ], "ids": [ 17155 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "2", ".", "Marcus", "G", "##ron", "##holm", "(", "Finland", ")", "Toyota", "Cel", "##ica", "1", ":", "46" ], "ids": [ 123, 119, 15818, 144, 11620, 35673, 113, 15497, 114, 28995, 82804, 11043, 122, 131, 11528 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Jar", "##mo", "Ky", "##tol", "##eht", "##o", "(", "Finland", ")", "Ford", "Es", "##cor", "##t", "1", ":", "56" ], "ids": [ 125, 119, 91531, 11033, 60082, 48530, 92533, 10133, 113, 15497, 114, 14255, 10912, 49167, 10123, 122, 131, 11628 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Kenneth", "Eriksson", "(", "Sweden", ")", "Subaru", "Im", "##pre", "##za", "2", ":", "05" ], "ids": [ 126, 119, 22369, 70145, 113, 20937, 114, 100668, 10796, 30619, 10637, 123, 131, 10831 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Thomas", "Rad", "##strom", "(", "Sweden", ")", "Toyota", "Cel", "##ica", "2", ":", "23" ], "ids": [ 127, 119, 11096, 71204, 83474, 113, 20937, 114, 28995, 82804, 11043, 123, 131, 10328 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "MO", "##TO", "##RC", "##Y", "##CL", "##ING", "-", "WORLD", "SU", "##PER", "##B", "##I", "##K", "##E", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 102059, 60493, 52932, 14703, 100886, 50183, 118, 67376, 86643, 108408, 11274, 11281, 11733, 11259, 39774, 36535, 11127, 52980, 64091, 30331, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SU", "##GO", ",", "Japan", "1996", "-", "08", "-", "25" ], "ids": [ 86643, 83821, 117, 11891, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "from", "round" ], "ids": [ 100085, 17466, 10188, 13569 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "nine", "of", "the", "super", "##bik", "##e", "world", "championship", "on", "Sunday", ":" ], "ids": [ 19964, 10108, 10105, 25212, 59155, 10112, 11356, 20755, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "race" ], "ids": [ 12128, 14025 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", ".", "Yu", "##uchi", "Take", "##da", "(", "Japan", ")", "Honda", "38", "minutes", "30", ".", "054", "seconds" ], "ids": [ 122, 119, 19387, 62922, 21200, 10229, 113, 11891, 114, 25290, 11171, 15304, 10244, 119, 70967, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Nor", "##iy", "##uki", "Ha", "##ga", "(", "Japan", ")", "Yamaha", "38", ":", "30", ".", "140" ], "ids": [ 123, 119, 98837, 25729, 39821, 13740, 10483, 113, 11891, 114, 56988, 11171, 131, 10244, 119, 13958 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Wat", "##aru", "Yo", "##shi", "##kawa", "(", "Japan", ")", "Yamaha", "38", ":", "32", ".", "353" ], "ids": [ 124, 119, 51082, 41417, 30665, 16119, 56784, 113, 11891, 114, 56988, 11171, 131, 10842, 119, 35373 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Troy", "Corse", "##r", "(", "Australia", ")", "Duca", "##ti", "38", ":", "34", ".", "436" ], "ids": [ 125, 119, 40777, 50024, 10129, 113, 11729, 114, 86883, 10325, 11171, 131, 11069, 119, 43630 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "John", "Ko", "##cin", "##ski", "(", "U", ".", "S", ".", ")", "Duca", "##ti", "38", ":", "36", ".", "306" ], "ids": [ 126, 119, 10421, 30186, 43093, 11401, 113, 158, 119, 156, 119, 114, 86883, 10325, 11171, 131, 11055, 119, 26114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Aaron", "S", "##light", "(", "New", "Zealand", ")", "Honda", "38", ":", "41", ".", "756" ], "ids": [ 127, 119, 24354, 156, 24310, 113, 10287, 14451, 114, 25290, 11171, 131, 11349, 119, 65821 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Nor", "##ih", "##iko", "Fujiwara", "(", "Japan", ")", "Yamaha", "38", ":", "43", ".", "253" ], "ids": [ 128, 119, 98837, 13187, 18924, 87396, 113, 11891, 114, 56988, 11171, 131, 11370, 119, 25124 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Carl", "F", "##oga", "##rty", "(", "Britain", ")", "Honda", "38", ":", "49", ".", "595" ], "ids": [ 129, 119, 12225, 143, 25201, 51079, 113, 16032, 114, 25290, 11171, 131, 11580, 119, 53584 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Akira", "R", "##yo", "(", "Japan", ")", "Kawasaki", "38", ":", "50", ".", "269" ], "ids": [ 130, 119, 53425, 155, 15594, 113, 11891, 114, 74270, 11171, 131, 10462, 119, 29745 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Shi", "##ya", "Take", "##ishi", "(", "Japan", ")", "Kawasaki", "38", ":", "52", ".", "271" ], "ids": [ 10150, 119, 44795, 10679, 21200, 46071, 113, 11891, 114, 74270, 11171, 131, 11525, 119, 27102 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fast", "##est", "lap", ":", "Ha", "##ga", "147", ".", "159", "k", "##ph", "." ], "ids": [ 28191, 13051, 38553, 131, 13740, 10483, 19811, 119, 20406, 179, 28088, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "race" ], "ids": [ 14181, 14025 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", ".", "Tak", "##uma", "Ao", "##ki", "(", "Japan", ")", "Honda", "38", ":", "18", ".", "759" ], "ids": [ 122, 119, 38217, 16746, 17607, 10506, 113, 11891, 114, 25290, 11171, 131, 10218, 119, 69717 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Ko", "##cin", "##ski", "38", ":", "19", ".", "313" ], "ids": [ 123, 119, 30186, 43093, 11401, 11171, 131, 10270, 119, 25940 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Ha", "##ga", "38", ":", "32", ".", "040" ], "ids": [ 124, 119, 13740, 10483, 11171, 131, 10842, 119, 82738 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "S", "##light", "38", ":", "32", ".", "149" ], "ids": [ 125, 119, 156, 24310, 11171, 131, 10842, 119, 19438 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "F", "##oga", "##rty", "38", ":", "32", ".", "719" ], "ids": [ 126, 119, 143, 25201, 51079, 11171, 131, 10842, 119, 67375 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Fujiwara", "38", ":", "33", ".", "595" ], "ids": [ 127, 119, 87396, 11171, 131, 11000, 119, 53584 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "R", "##yo", "38", ":", "34", ".", "682" ], "ids": [ 128, 119, 155, 15594, 11171, 131, 11069, 119, 66691 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Take", "##ishi", "38", ":", "34", ".", "999" ], "ids": [ 129, 119, 21200, 46071, 11171, 131, 11069, 119, 37830 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Yo", "##shi", "##kawa", "38", ":", "35", ".", "297" ], "ids": [ 130, 119, 30665, 16119, 56784, 11171, 131, 10803, 119, 29469 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Corse", "##r", "38", ":", "42", ".", "015" ], "ids": [ 10150, 119, 50024, 10129, 11171, 131, 11276, 119, 75737 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fast", "##est", "lap", ":", "Ao", "##ki", "147", ".", "786", "k", "##ph" ], "ids": [ 28191, 13051, 38553, 131, 17607, 10506, 19811, 119, 69032, 179, 28088 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "World", "championship", "standing", "##s", "(", "after", "nine", "rounds", ")", ":" ], "ids": [ 10315, 20755, 32173, 10107, 113, 10662, 19964, 44759, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "S", "##light", "280", "points" ], "ids": [ 122, 119, 156, 24310, 17859, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "2", ".", "Corse", "##r", "269" ], "ids": [ 123, 119, 50024, 10129, 29745 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "3", ".", "Ko", "##cin", "##ski", "254" ], "ids": [ 124, 119, 30186, 43093, 11401, 26257 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "4", ".", "F", "##oga", "##rty", "236" ], "ids": [ 125, 119, 143, 25201, 51079, 26318 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "5", ".", "Colin", "Edwards", "(", "U", ".", "S", ".", ")", "Yamaha", "176" ], "ids": [ 126, 119, 20766, 17263, 113, 158, 119, 156, 119, 114, 56988, 21613 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 3, 9 ] }, { "tokens": [ "6", ".", "Pier", "Francesco", "Chili", "(", "Italy", ")", "Duca", "##ti", "175" ], "ids": [ 127, 119, 41941, 13747, 37931, 113, 11619, 114, 86883, 10325, 18101 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "7", ".", "Simon", "C", "##raf", "##ar", "(", "New", "Zealand", ")", "Kawasaki", "132" ], "ids": [ 128, 119, 12237, 140, 29552, 10354, 113, 10287, 14451, 114, 74270, 18385 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 3, 9 ] }, { "tokens": [ "8", ".", "Anthony", "Go", "##bert", "(", "Australia", ")", "Kawasaki", "117" ], "ids": [ 129, 119, 14751, 14439, 18072, 113, 11729, 114, 74270, 16628 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "9", ".", "Yo", "##shi", "##kawa", "107" ], "ids": [ 130, 119, 30665, 16119, 56784, 15844 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "10", ".", "Neil", "Hodgson", "(", "Britain", ")", "Duca", "##ti", "82" ], "ids": [ 10150, 119, 19687, 98460, 113, 16032, 114, 86883, 10325, 12180 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "Revised", "placing", "##s", "for", "second", "race", "after", "the", "dis", "##qual", "##ification" ], "ids": [ 63697, 66959, 10107, 10142, 11132, 14025, 10662, 10105, 27920, 102260, 29748 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "of", "Japanese", "rider", "Nor", "##iy", "##uki", "Ha", "##ga", "for", "using", "an", "illegal", "car", "##bur", "##etto", "##r" ], "ids": [ 10108, 13847, 95232, 98837, 25729, 39821, 13740, 10483, 10142, 13382, 10151, 39806, 13000, 34660, 24327, 10129 ], "entity": [ "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "part", ":" ], "ids": [ 10668, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", ".", "Tak", "##uma", "Ao", "##ki", "(", "Japan", ")", "Honda", "38", ":", "18", ".", "759" ], "ids": [ 122, 119, 38217, 16746, 17607, 10506, 113, 11891, 114, 25290, 11171, 131, 10218, 119, 69717 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Ko", "##cin", "##ski", "38", ":", "19", ".", "313" ], "ids": [ 123, 119, 30186, 43093, 11401, 11171, 131, 10270, 119, 25940 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "S", "##light", "38", ":", "32", ".", "149" ], "ids": [ 124, 119, 156, 24310, 11171, 131, 10842, 119, 19438 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "F", "##oga", "##rty", "38", ":", "32", ".", "719" ], "ids": [ 125, 119, 143, 25201, 51079, 11171, 131, 10842, 119, 67375 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Fujiwara", "38", ":", "33", ".", "595" ], "ids": [ 126, 119, 87396, 11171, 131, 11000, 119, 53584 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "R", "##yo", "38", ":", "34", ".", "682" ], "ids": [ 127, 119, 155, 15594, 11171, 131, 11069, 119, 66691 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Take", "##ishi", "38", ":", "34", ".", "999" ], "ids": [ 128, 119, 21200, 46071, 11171, 131, 11069, 119, 37830 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Yo", "##shi", "##kawa", "38", ":", "35", ".", "297" ], "ids": [ 129, 119, 30665, 16119, 56784, 11171, 131, 10803, 119, 29469 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Corse", "##r", "38", ":", "42", ".", "015" ], "ids": [ 130, 119, 50024, 10129, 11171, 131, 11276, 119, 75737 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Kei", "##ichi", "Kit", "##iga", "##wa", "(", "Japan", ")", "Suzuki", "38", ":", "42", ".", "333" ], "ids": [ 10150, 119, 103883, 35230, 45301, 15342, 11037, 113, 11891, 114, 31698, 11171, 131, 11276, 119, 27243 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fast", "##est", "lap", ":", "Ao", "##ki", "147", ".", "786", "k", "##ph" ], "ids": [ 28191, 13051, 38553, 131, 17607, 10506, 19811, 119, 69032, 179, 28088 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Revised", "world", "championship", "standing", "##s", "(", "after", "nine", "rounds", ")", ":" ], "ids": [ 63697, 11356, 20755, 32173, 10107, 113, 10662, 19964, 44759, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "S", "##light", "283", "points" ], "ids": [ 122, 119, 156, 24310, 29857, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "2", ".", "Corse", "##r", "270" ], "ids": [ 123, 119, 50024, 10129, 18302 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "3", ".", "Ko", "##cin", "##ski", "254" ], "ids": [ 124, 119, 30186, 43093, 11401, 26257 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "4", ".", "F", "##oga", "##rty", "238" ], "ids": [ 125, 119, 143, 25201, 51079, 24388 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "5", ".", "Colin", "Edwards", "(", "U", ".", "S", ".", ")", "Yamaha", "176" ], "ids": [ 126, 119, 20766, 17263, 113, 158, 119, 156, 119, 114, 56988, 21613 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 3, 9 ] }, { "tokens": [ "6", ".", "Pier", "Francesco", "Chili", "(", "Italy", ")", "Duca", "##ti", "175" ], "ids": [ 127, 119, 41941, 13747, 37931, 113, 11619, 114, 86883, 10325, 18101 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "7", ".", "Simon", "C", "##raf", "##ar", "(", "New", "Zealand", ")", "Kawasaki", "133" ], "ids": [ 128, 119, 12237, 140, 29552, 10354, 113, 10287, 14451, 114, 74270, 18665 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 3, 9 ] }, { "tokens": [ "8", ".", "Anthony", "Go", "##bert", "(", "Australia", ")", "Kawasaki", "117" ], "ids": [ 129, 119, 14751, 14439, 18072, 113, 11729, 114, 74270, 16628 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "9", ".", "Yo", "##shi", "##kawa", "108" ], "ids": [ 130, 119, 30665, 16119, 56784, 15845 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "10", ".", "Neil", "Hodgson", "(", "Britain", ")", "Duca", "##ti", "82" ], "ids": [ 10150, 119, 19687, 98460, 113, 16032, 114, 86883, 10325, 12180 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "MO", "##TO", "##RC", "##Y", "##CL", "##ING", "-", "JAPAN", "##ES", "##E", "W", "##IN", "B", "##OT", "##H", "R", "##O", "##UN", "##D", "N", "##INE", "SU", "##PER", "##B", "##I", "##K", "##E", "RA", "##CE", "##S", "." ], "ids": [ 102059, 60493, 52932, 14703, 100886, 50183, 118, 82791, 25054, 11259, 160, 27128, 139, 62146, 12396, 155, 11403, 69849, 11490, 151, 83198, 86643, 108408, 11274, 11281, 11733, 11259, 64007, 43161, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SU", "##GO", ",", "Japan", "1996", "-", "08", "-", "25" ], "ids": [ 86643, 83821, 117, 11891, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Teenage", "##r", "Yu", "##ui", "##chi", "Take", "##da", ",", "racing", "in", "only", "his", "first", "season", ",", "out", "##cla", "##ssed", "the", "big", "names", "to", "win", "the", "first", "race", "in", "round", "nine", "of", "the", "world", "super", "##bik", "##e", "championship", "on", "Sunday", "." ], "ids": [ 74274, 10129, 19387, 11990, 12806, 21200, 10229, 117, 31008, 10106, 10893, 10226, 10422, 11226, 117, 10950, 60582, 50987, 10105, 22185, 17978, 10114, 14125, 10105, 10422, 14025, 10106, 13569, 19964, 10108, 10105, 11356, 25212, 59155, 10112, 20755, 10135, 19731, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Take", "##da", ",", "18", ",", "showed", "pois", "##e", "far", "beyond", "his", "years", "to", "over", "##take", "Australian", "Duca", "##ti", "rider", "Troy", "Corse", "##r", ",", "last", "year", "'", "s", "championship", "runner", "-", "up", ",", "with", "four", "of", "the", "25", "laps", "left", "." ], "ids": [ 21200, 10229, 117, 10218, 117, 27463, 20487, 10112, 13301, 28569, 10226, 10855, 10114, 10491, 47529, 12829, 86883, 10325, 95232, 40777, 50024, 10129, 117, 12469, 10924, 112, 187, 20755, 43037, 118, 10741, 117, 10169, 11598, 10108, 10105, 10258, 82786, 12153, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 3, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Honda", "'", "s", "Take", "##da", "was", "pursued", "past", "Corse", "##r", "by", "the", "Yamaha", "duo", "of", "Nor", "##iy", "##uki", "Ha", "##ga", "and", "Wat", "##aru", "Yo", "##shi", "##kawa", "with", "Ha", "##ga", "briefly", "taking", "the", "lead", "in", "the", "final", "chica", "##ne", "on", "the", "last", "lap", "." ], "ids": [ 25290, 112, 187, 21200, 10229, 10134, 84640, 17781, 50024, 10129, 10155, 10105, 56988, 23000, 10108, 98837, 25729, 39821, 13740, 10483, 10111, 51082, 41417, 30665, 16119, 56784, 10169, 13740, 10483, 36327, 18084, 10105, 14107, 10106, 10105, 11070, 96813, 10238, 10135, 10105, 12469, 38553, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 3, 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Take", "##da", "found", "one", "more", "sp", "##urt", "of", "power", "to", "just", "take", "the", "flag", "first", "with", "Ha", "##ga", "second", "and", "Yo", "##shi", "##kawa", "third", "." ], "ids": [ 16976, 21200, 10229, 11823, 10464, 10798, 32650, 30546, 10108, 13183, 10114, 12820, 13574, 10105, 31773, 10422, 10169, 13740, 10483, 11132, 10111, 30665, 16119, 56784, 12628, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Ha", "##ga", "had", "the", "con", "##sola", "##tion", "of", "recording", "the", "fastest", "lap", "at", "147", ".", "159", "k", "##ph", "." ], "ids": [ 13740, 10483, 10374, 10105, 10173, 50293, 10822, 10108, 19880, 10105, 61823, 38553, 10160, 19811, 119, 20406, 179, 28088, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Corse", "##r", ",", "who", "crashed", "during", "practice", "on", "Friday", ",", "li", "##mpe", "##d", "in", "fourth", ",", "four", "seconds", "behind", "Take", "##da", "with", "championship", "leader", "Aaron", "S", "##light", "of", "New", "Zealand", "11", "seconds", "behind", "the", "winner", "." ], "ids": [ 50024, 10129, 117, 10479, 91126, 10939, 18194, 10135, 30767, 117, 11614, 29165, 10162, 10106, 16918, 117, 11598, 34290, 17155, 21200, 10229, 10169, 20755, 15014, 24354, 156, 24310, 10108, 10287, 14451, 10193, 34290, 17155, 10105, 20826, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "second", "race", ",", "Take", "##da", "again", "challenged", "strongly", "until", "the", "fifth", "lap", "from", "the", "end", "when", "he", "crashed", "while", "running", "second", "to", "eventual", "race", "winner", "Tak", "##uma", "Ao", "##ki", "." ], "ids": [ 10167, 10105, 11132, 14025, 117, 21200, 10229, 13123, 72921, 44125, 11444, 10105, 22237, 38553, 10188, 10105, 11572, 10841, 10261, 91126, 11371, 18020, 11132, 10114, 57231, 14025, 20826, 38217, 16746, 17607, 10506, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Ao", "##ki", ",", "the", "elder", "brother", "of", "reign", "##ing", "125", "##cc", "world", "champion", "Har", "##uchi", "##ka", ",", "had", "a", "race", "-", "long", "duel", "with", "John", "Ko", "##cin", "##ski", "of", "the", "United", "States", "on", "a", "Duca", "##ti", "before", "taking", "the", "che", "##quer", "##ed", "flag", "." ], "ids": [ 17607, 10506, 117, 10105, 70179, 15739, 10108, 38587, 10230, 14048, 28044, 11356, 17689, 55737, 62922, 10371, 117, 10374, 169, 14025, 118, 11695, 66330, 10169, 10421, 30186, 43093, 11401, 10108, 10105, 10609, 10859, 10135, 169, 86883, 10325, 11360, 18084, 10105, 10262, 28531, 10336, 31773, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 1, 5, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ko", "##cin", "##ski", "led", "for", "the", "early", "laps", "before", "he", "was", "passed", "first", "by", "Ao", "##ki", ",", "who", "recorded", "the", "fastest", "lap", "of", "147", ".", "786", "k", "##ph", ",", "and", "then", "by", "Take", "##da", "." ], "ids": [ 30186, 43093, 11401, 12857, 10142, 10105, 11732, 82786, 11360, 10261, 10134, 20006, 10422, 10155, 17607, 10506, 117, 10479, 14227, 10105, 61823, 38553, 10108, 19811, 119, 69032, 179, 28088, 117, 10111, 11059, 10155, 21200, 10229, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "With", "Take", "##da", "out", "of", "the", "race", ",", "Ko", "##cin", "##ski", "re", "##gain", "##ed", "second", "place", "but", "he", "could", "not", "over", "##take", "Ao", "##ki", "." ], "ids": [ 12613, 21200, 10229, 10950, 10108, 10105, 14025, 117, 30186, 43093, 11401, 11639, 85473, 10336, 11132, 11192, 10473, 10261, 12174, 10472, 10491, 47529, 17607, 10506, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Ha", "##ga", "again", "was", "the", "un", "##lu", "##cky", "rider", "finishing", "third", "ahead", "of", "S", "##light", "with", "Corse", "##r", "in", "10th", "place", "." ], "ids": [ 13740, 10483, 13123, 10134, 10105, 10119, 11435, 30742, 95232, 34348, 12628, 35629, 10108, 156, 24310, 10169, 50024, 10129, 10106, 31004, 11192, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "strong", "showing", "by", "the", "Japanese", "riders", "did", "not", "alter", "the", "championship", "table", "with", "S", "##light", "still", "leading", "on", "280", "points", ",", "followed", "by", "Corse", "##r", "with", "269", "and", "Ko", "##cin", "##ski", "with", "254", "." ], "ids": [ 16976, 10105, 18093, 37501, 10155, 10105, 13847, 93076, 12172, 10472, 42141, 10105, 20755, 21783, 10169, 156, 24310, 12647, 16018, 10135, 17859, 12789, 117, 15689, 10155, 50024, 10129, 10169, 29745, 10111, 30186, 43093, 11401, 10169, 26257, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "LE", "##AG", "##UE", "-", "EU", "##RO", "##P", "##EA", "##N", "SU", "##PER", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 155, 12022, 32469, 14703, 84977, 109865, 62674, 118, 17751, 35066, 11127, 36789, 11537, 86643, 108408, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "European", "Super", "League" ], "ids": [ 33036, 10108, 11914, 12786, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6, 6 ] }, { "tokens": [ "rugby", "league", "matches", "on", "Sunday", ":" ], "ids": [ 19812, 15616, 18258, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Halifax", "64", "Leeds", "24" ], "ids": [ 49933, 11295, 28654, 10233 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "London", "56", "Castle", "##ford", "0" ], "ids": [ 10829, 11628, 17064, 13387, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", ":" ], "ids": [ 58592, 10107, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Wigan", "22", "19", "1", "2", "902", "326", "39" ], "ids": [ 85593, 10306, 10270, 122, 123, 74273, 32558, 11303 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "21", "19", "0", "2", "884", "441", "38" ], "ids": [ 10838, 21338, 10107, 10296, 10270, 121, 123, 74395, 41347, 11171 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bradford", "22", "17", "0", "5", "767", "409", "34" ], "ids": [ 40141, 10306, 10273, 121, 126, 50181, 37659, 11069 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "22", "12", "1", "9", "611", "462", "25" ], "ids": [ 10829, 10306, 10186, 122, 130, 56267, 44574, 10258 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "War", "##rington", "21", "12", "0", "9", "555", "499", "24" ], "ids": [ 11277, 82194, 10296, 10186, 121, 130, 44517, 40975, 10233 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Halifax", "22", "10", "1", "11", "667", "576", "21" ], "ids": [ 49933, 10306, 10150, 122, 10193, 52541, 44332, 10296 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", "22", "10", "0", "12", "599", "730", "20" ], "ids": [ 31695, 10306, 10150, 121, 10186, 53296, 45177, 10197 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oldham", "22", "9", "1", "12", "473", "681", "19" ], "ids": [ 109860, 10306, 130, 122, 10186, 39130, 63632, 10270 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Castle", "##ford", "22", "9", "0", "13", "548", "599", "18" ], "ids": [ 17064, 13387, 10306, 130, 121, 10249, 48774, 53296, 10218 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leeds", "22", "6", "0", "16", "555", "745", "12" ], "ids": [ 28654, 10306, 127, 121, 10250, 44517, 66431, 10186 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "22", "3", "1", "18", "398", "795", "7" ], "ids": [ 10728, 10306, 124, 122, 10218, 43338, 71882, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Working", "##ton", "22", "2", "1", "19", "325", "1021", "5" ], "ids": [ 38194, 11183, 10306, 123, 122, 10270, 25843, 30538, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "P", "##OL", "##L", "##OCK", "CO", "##NC", "##L", "##UD", "##ES", "W", "##AR", "##W", "##IC", "##KS", "##HI", "##RE", "CA", "##RE", "##ER", "W", "##IT", "##H", "FL", "##O", "##UR", "##IS", "##H", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 153, 39272, 11369, 96608, 32992, 100230, 11369, 86888, 25054, 160, 52188, 13034, 30889, 62828, 108880, 66014, 24707, 66014, 24093, 160, 37611, 12396, 83243, 11403, 98348, 19088, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "African", "fast", "bowl", "##er", "Shaun", "Poll", "##ock", "concluded", "his", "Warwick", "##shire", "career", "with", "a", "fl", "##our", "##ish", "on", "Sunday", "by", "taking", "the", "final", "three", "wickets", "during", "the", "county", "'", "s", "Sunday", "league", "victory", "over", "Worcester", "##shire", "." ], "ids": [ 11056, 13839, 15040, 99380, 10165, 82113, 89951, 21863, 37074, 10226, 48234, 19684, 13021, 10169, 169, 58768, 17964, 15529, 10135, 19731, 10155, 18084, 10105, 11070, 11003, 83839, 10939, 10105, 17382, 112, 187, 19731, 15616, 19735, 10491, 55518, 19684, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 4, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Poll", "##ock", ",", "who", "returns", "home", "on", "Tuesday", "for", "an", "an", "##kle", "operation", ",", "took", "the", "last", "three", "wickets", "in", "nine", "balls", "as", "Worcester", "##shire", "were", "dismissed", "for", "154", "." ], "ids": [ 89951, 21863, 117, 10479, 38302, 11816, 10135, 70245, 10142, 10151, 10151, 24006, 20080, 117, 12149, 10105, 12469, 11003, 83839, 10106, 19964, 88301, 10146, 55518, 19684, 10309, 59379, 10142, 20481, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "an", "hour", "'", "s", "inter", "##ruption", "for", "rain", ",", "Warwick", "##shire", "then", "reached", "an", "ad", "##justed", "target", "of", "109", "with", "13", "balls", "to", "sp", "##are", "and", "record", "their", "fifth", "win", "in", "the", "last", "six", "games", "." ], "ids": [ 11301, 10151, 24730, 112, 187, 22021, 56615, 10142, 50939, 117, 48234, 19684, 11059, 17087, 10151, 10840, 101762, 28564, 10108, 16296, 10169, 10249, 88301, 10114, 32650, 11591, 10111, 12410, 10455, 22237, 14125, 10106, 10105, 12469, 12449, 13332, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Warwick", "##shire", "are", "currently", "in", "fourth", "position", "behind", "Yorkshire", ",", "Nottingham", "##shire", "and", "Surrey", "." ], "ids": [ 48234, 19684, 10301, 15313, 10106, 16918, 12956, 17155, 27577, 117, 43396, 19684, 10111, 42858, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 3, 9, 3, 7, 9, 3, 9 ] }, { "tokens": [ "Yorkshire", "captain", "David", "By", "##as", "completed", "his", "third", "Sunday", "league", "century", "as", "his", "side", "s", "##we", "##pt", "clear", "at", "the", "top", "of", "the", "table", ",", "reaching", "a", "career", "best", "111", "not", "out", "against", "Lancashire", "." ], "ids": [ 27577, 28157, 10804, 12716, 10403, 15782, 10226, 12628, 19731, 15616, 11943, 10146, 10226, 12250, 187, 12577, 14971, 24866, 10160, 10105, 12364, 10108, 10105, 21783, 117, 34186, 169, 13021, 12504, 15821, 10472, 10950, 11327, 48487, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Lancashire", "'", "s", "total", "of", "205", "for", "eight", "from", "40", "over", "##s", "looked", "reason", "##able", "before", "By", "##as", "put", "their", "attack", "to", "the", "sword", ",", "collecting", "his", "runs", "from", "just", "100", "balls", "with", "three", "six", "##es", "and", "nine", "four", "##s", "." ], "ids": [ 48487, 112, 187, 11339, 10108, 20862, 10142, 16222, 10188, 10533, 10491, 10107, 59822, 27949, 13096, 11360, 12716, 10403, 14499, 10455, 16342, 10114, 10105, 79400, 117, 88737, 10226, 17913, 10188, 12820, 10407, 88301, 10169, 11003, 12449, 10171, 10111, 19964, 11598, 10107, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yorkshire", "eventually", "reached", "their", "target", "with", "only", "four", "wickets", "down", "and", "7", ".", "5", "over", "##s", "to", "sp", "##are", "." ], "ids": [ 27577, 16328, 17087, 10455, 28564, 10169, 10893, 11598, 83839, 12935, 10111, 128, 119, 126, 10491, 10107, 10114, 32650, 11591, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "H", "##IN", "##CH", "##CL", "##IF", "##F", "##E", "CA", "##LL", "##ED", "IN", "##TO", "EN", "##GL", "##AN", "##D", "S", "##Q", "##U", "##AD", "." ], "ids": [ 71020, 65622, 24093, 118, 145, 27128, 86448, 100886, 53668, 11565, 11259, 24707, 82834, 33809, 36351, 60493, 31278, 104780, 41275, 11490, 156, 19282, 12022, 55538, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "manager", "Glenn", "Ho", "##ddle", "called", "up", "un", "##cap", "##ped", "Everton", "defender", "Andy", "Hi", "##nch", "##cliffe", "on", "Sunday", "to", "the", "national", "squad", "for", "the", "opening", "World", "Cup", "qualifier", "against", "Moldova", "next", "weekend", "." ], "ids": [ 11701, 16935, 26202, 20220, 73182, 11552, 10741, 10119, 93103, 16898, 57936, 36426, 16802, 20065, 31215, 100059, 10135, 19731, 10114, 10105, 11844, 30580, 10142, 10105, 17975, 10315, 11544, 96076, 11327, 29733, 13451, 43440, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Left", "-", "back", "Hi", "##nch", "##cliffe", ",", "27", ",", "replace", "##s", "Tottenham", "'", "s", "Darren", "And", "##erto", "##n", "who", "has", "a", "recurring", "gr", "##oin", "problem", "." ], "ids": [ 35343, 118, 12014, 20065, 31215, 100059, 117, 10365, 117, 37156, 10107, 53092, 112, 187, 53337, 12689, 52012, 10115, 10479, 10393, 169, 99152, 30518, 64512, 18077, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "326", "AND", "74", "-", "0", ";", "PA", "##KI", "##ST", "##AN", "521", "-", "8", "DE", "##CL", "##AR", "##ED", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 32558, 52428, 12535, 118, 121, 132, 32349, 59879, 32995, 41275, 21022, 118, 129, 25067, 100886, 52188, 33809, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "were", "74", "for", "no", "wi", "##cket", "in" ], "ids": [ 11701, 10309, 12535, 10142, 10192, 23040, 28721, 10106 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "their", "second", "innings", "at", "the", "close", "of", "the", "fourth", "day", "of", "the", "third" ], "ids": [ 10455, 11132, 48974, 10160, 10105, 16065, 10108, 10105, 16918, 11940, 10108, 10105, 12628 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "and", "final", "test", "at", "The", "Oval", "on", "Sunday", "." ], "ids": [ 10111, 11070, 15839, 10160, 10117, 98765, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", ":", "England", "326", "and", "74", "-", "0", ";", "Pakistan", "521", "-", "8", "declared", "." ], "ids": [ 66875, 10107, 131, 11701, 32558, 10111, 12535, 118, 121, 132, 15437, 21022, 118, 129, 25019, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "PR", "##EM", "##IE", "##R", "LE", "##AG", "##UE", "SU", "##MM", "##AR", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 23837, 67753, 71655, 11273, 84977, 109865, 62674, 86643, 93252, 52188, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "an", "English", "premier" ], "ids": [ 42027, 10108, 10151, 11616, 11913 ], "entity": [ "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 2, 9 ] }, { "tokens": [ "league", "soccer", "match", "on", "Sunday", ":" ], "ids": [ 15616, 41356, 12356, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Manchester", "United", "2", "(", "C", "##ru", "##yf", "##f", "39", "##th", "minute", ",", "Sol", "##sk", "##ja", "##er", "70", "##th", ")" ], "ids": [ 15349, 10609, 123, 113, 140, 11680, 62026, 10575, 11303, 11143, 21760, 117, 19655, 11478, 10320, 10165, 10923, 11143, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Blackburn", "2", "(", "War", "##hurst", "34", "##th", ",", "Bo", "##hine", "##n", "51", "##st", ")", "." ], "ids": [ 46006, 123, 113, 11277, 68091, 11069, 11143, 117, 27622, 76648, 10115, 11524, 10562, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "1", "-", "1", "." ], "ids": [ 33100, 18086, 122, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "54", ",", "178", "." ], "ids": [ 46080, 11653, 117, 22475, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "English", "league", "soccer" ], "ids": [ 33036, 10108, 11616, 15616, 41356 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "on", "Sunday", ":" ], "ids": [ 18258, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Premier", "league" ], "ids": [ 14717, 15616 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Manchester", "United", "2", "Blackburn", "2" ], "ids": [ 15349, 10609, 123, 46006, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Standing", "##s", "(", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", "Wednesday", "3", "3", "0", "0", "6", "2", "9" ], "ids": [ 31695, 57611, 124, 124, 121, 121, 127, 123, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chelsea", "3", "2", "1", "0", "3", "0", "7" ], "ids": [ 21450, 124, 123, 122, 121, 124, 121, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arsenal", "3", "2", "0", "1", "4", "2", "6" ], "ids": [ 25587, 124, 123, 121, 122, 125, 123, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aston", "Villa", "3", "2", "0", "1", "4", "2", "6" ], "ids": [ 40757, 13875, 124, 123, 121, 122, 125, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Manchester", "United", "3", "1", "2", "0", "7", "4", "5" ], "ids": [ 15349, 10609, 124, 122, 123, 121, 128, 125, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sunderland", "3", "1", "2", "0", "4", "1", "5" ], "ids": [ 60269, 124, 122, 123, 121, 125, 122, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Liverpool", "3", "1", "2", "0", "5", "3", "5" ], "ids": [ 18376, 124, 122, 123, 121, 126, 124, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Everton", "3", "1", "2", "0", "4", "2", "5" ], "ids": [ 57936, 124, 122, 123, 121, 125, 123, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tottenham", "3", "1", "2", "0", "3", "1", "5" ], "ids": [ 53092, 124, 122, 123, 121, 124, 122, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nottingham", "Forest", "3", "1", "1", "1", "5", "5", "4" ], "ids": [ 43396, 17666, 124, 122, 122, 122, 126, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "West", "Ham", "3", "1", "1", "1", "3", "4", "4" ], "ids": [ 11164, 39135, 124, 122, 122, 122, 124, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leicester", "3", "1", "1", "1", "2", "3", "4" ], "ids": [ 38789, 124, 122, 122, 122, 123, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Newcastle", "3", "1", "0", "2", "3", "4", "3" ], "ids": [ 28060, 124, 122, 121, 123, 124, 125, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Middlesbrough", "3", "0", "2", "1", "4", "5", "2" ], "ids": [ 105141, 124, 121, 123, 122, 125, 126, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Derby", "3", "0", "2", "1", "4", "6", "2" ], "ids": [ 24703, 124, 121, 123, 122, 125, 127, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leeds", "2", "0", "1", "1", "3", "5", "1" ], "ids": [ 28654, 123, 121, 122, 122, 124, 126, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Southampton", "3", "0", "1", "2", "2", "4", "1" ], "ids": [ 45113, 124, 121, 122, 123, 123, 125, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Blackburn", "3", "0", "1", "2", "2", "5", "1" ], "ids": [ 46006, 124, 121, 122, 123, 123, 126, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Coventry", "3", "0", "1", "2", "1", "6", "1" ], "ids": [ 58183, 124, 121, 122, 123, 122, 127, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wimbledon", "2", "0", "0", "2", "0", "5", "0" ], "ids": [ 37932, 123, 121, 121, 123, 121, 126, 121 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Division", "one" ], "ids": [ 11987, 10464 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Barn", "##sley", "3", "Hu", "##dder", "##sfield", "1" ], "ids": [ 61802, 28428, 124, 43707, 42113, 53495, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", ":" ], "ids": [ 58592, 10107, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Bolton", "3", "2", "1", "0", "5", "2", "7" ], "ids": [ 34462, 124, 123, 122, 121, 126, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barn", "##sley", "2", "2", "0", "0", "5", "2", "6" ], "ids": [ 61802, 28428, 123, 123, 121, 121, 126, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wolverhampton", "2", "2", "0", "0", "4", "1", "6" ], "ids": [ 98739, 123, 123, 121, 121, 125, 122, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Queens", "Park", "Rangers", "2", "2", "0", "0", "4", "2", "6" ], "ids": [ 34140, 11239, 23042, 123, 123, 121, 121, 125, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stoke", "2", "2", "0", "0", "4", "2", "6" ], "ids": [ 60824, 123, 123, 121, 121, 125, 123, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Birmingham", "2", "1", "1", "0", "5", "4", "4" ], "ids": [ 22712, 123, 122, 122, 121, 126, 125, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tra", "##n", "##mere", "2", "1", "1", "0", "4", "3", "4" ], "ids": [ 21469, 10115, 32732, 123, 122, 122, 121, 125, 124, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oxford", "2", "1", "0", "1", "6", "2", "3" ], "ids": [ 11109, 123, 122, 121, 122, 127, 123, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ipswich", "2", "1", "0", "1", "5", "3", "3" ], "ids": [ 86146, 123, 122, 121, 122, 126, 124, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bradford", "2", "1", "0", "1", "3", "2", "3" ], "ids": [ 40141, 123, 122, 121, 122, 124, 123, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Crystal", "Palace", "2", "1", "0", "1", "3", "2", "3" ], "ids": [ 28459, 22015, 123, 122, 121, 122, 124, 123, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hu", "##dder", "##sfield", "2", "1", "0", "1", "3", "3", "3" ], "ids": [ 43707, 42113, 53495, 123, 122, 121, 122, 124, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Norwich", "2", "1", "0", "1", "3", "3", "3" ], "ids": [ 51816, 123, 122, 121, 122, 124, 124, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reading", "2", "1", "0", "1", "3", "5", "3" ], "ids": [ 10629, 123, 122, 121, 122, 124, 126, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Manchester", "City", "3", "1", "0", "2", "2", "3", "3" ], "ids": [ 15349, 10773, 124, 122, 121, 123, 123, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Port", "Vale", "2", "0", "2", "0", "2", "2", "2" ], "ids": [ 14734, 32286, 123, 121, 123, 121, 123, 123, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", "United", "2", "0", "1", "1", "4", "5", "1" ], "ids": [ 31695, 10609, 123, 121, 122, 122, 125, 126, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "West", "Bro", "##m", "##wich", "2", "0", "1", "1", "2", "3", "1" ], "ids": [ 11164, 32470, 10147, 33544, 123, 121, 122, 122, 123, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Charlton", "2", "0", "1", "1", "1", "3", "1" ], "ids": [ 68730, 123, 121, 122, 122, 122, 124, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##wind", "##on", "2", "0", "1", "1", "1", "3", "1" ], "ids": [ 156, 47673, 10263, 123, 121, 122, 122, 122, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "##end", "2", "0", "1", "1", "1", "6", "1" ], "ids": [ 11056, 19342, 123, 121, 122, 122, 122, 127, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##rim", "##sby", "2", "0", "0", "2", "3", "6", "0" ], "ids": [ 144, 23760, 38243, 123, 121, 121, 123, 124, 127, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oldham", "2", "0", "0", "2", "2", "5", "0" ], "ids": [ 109860, 123, 121, 121, 123, 123, 126, 121 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portsmouth", "2", "0", "0", "2", "2", "5", "0" ], "ids": [ 46933, 123, 121, 121, 123, 123, 126, 121 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "V", "PA", "##KI", "##ST", "##AN", "F", "##IN", "##AL", "T", "##ES", "##T", "SC", "##OR", "##EB", "##O", "##AR", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 159, 32349, 59879, 32995, 41275, 143, 27128, 32002, 157, 25054, 11090, 18137, 42622, 89922, 11403, 52188, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##board", "on", "the", "fourth", "day", "of" ], "ids": [ 66875, 25690, 10135, 10105, 16918, 11940, 10108 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "the", "third", "and", "final", "test", "between", "England", "and", "Pakistan", "at", "The" ], "ids": [ 10105, 12628, 10111, 11070, 15839, 10948, 11701, 10111, 15437, 10160, 10117 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9 ] }, { "tokens": [ "Oval", "on", "Sunday", ":" ], "ids": [ 98765, 10135, 19731, 131 ], "entity": [ "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9 ] }, { "tokens": [ "England", "first", "innings", "326", "(", "J", ".", "C", "##ra", "##wley", "106", ",", "G", ".", "Thorpe", "54", ";", "W", "##aq", "##ar" ], "ids": [ 11701, 10422, 48974, 32558, 113, 147, 119, 140, 10288, 62381, 16084, 117, 144, 119, 84855, 11653, 132, 160, 49277, 10354 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8 ] }, { "tokens": [ "You", "##nis", "4", "-", "95", ")" ], "ids": [ 11065, 12597, 125, 118, 11978, 114 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "first", "innings", "(", "over", "##night", "339", "-", "4", ")" ], "ids": [ 15437, 10422, 48974, 113, 10491, 45217, 34753, 118, 125, 114 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sa", "##eed", "Anwar", "c", "C", "##roft", "b", "Cork", "176" ], "ids": [ 12404, 40154, 92168, 171, 140, 101860, 170, 42049, 21613 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 9, 4, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "c", "Cork", "b", "C", "##roft", "46" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 171, 42049, 170, 140, 101860, 11528 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 9, 4, 8, 9 ] }, { "tokens": [ "I", "##ja", "##z", "Ahmed", "c", "Stewart", "b", "Mu", "##lla", "##lly", "61" ], "ids": [ 146, 10320, 10305, 25530, 171, 17493, 170, 49056, 11083, 17903, 12314 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 9, 4, 8, 8, 9 ] }, { "tokens": [ "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", "c", "Hus", "##sain", "b", "Mu", "##lla", "##lly", "35" ], "ids": [ 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 171, 109022, 82083, 170, 49056, 11083, 17903, 10803 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Salim", "Malik", "not", "out", "100" ], "ids": [ 98284, 45783, 10472, 10950, 10407 ], "entity": [ "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9 ] }, { "tokens": [ "As", "##if", "Mu", "##jta", "##ba", "run", "out", "13" ], "ids": [ 10882, 13918, 49056, 51465, 10537, 14095, 10950, 10249 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Was", "##im", "Ak", "##ram", "st", "Stewart", "b", "C", "##roft", "40" ], "ids": [ 22034, 11759, 71275, 13845, 28780, 17493, 170, 140, 101860, 10533 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 9, 4, 8, 9 ] }, { "tokens": [ "Moi", "##n", "Khan", "b", "Salisbury", "23" ], "ids": [ 82447, 10115, 16324, 170, 55933, 10328 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 9 ] }, { "tokens": [ "Mus", "##hta", "##q", "Ahmed", "c", "C", "##ra", "##wley", "b", "Mu", "##lla", "##lly", "2" ], "ids": [ 31013, 32493, 11703, 25530, 171, 140, 10288, 62381, 170, 49056, 11083, 17903, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "W", "##aq", "##ar", "You", "##nis", "not", "out", "0" ], "ids": [ 160, 49277, 10354, 11065, 12597, 10472, 10950, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "b", "-", "4", "lb", "-", "5", "n", "##b", "-", "16", ")", "25" ], "ids": [ 50821, 10107, 113, 170, 118, 125, 23989, 118, 126, 182, 10457, 118, 10250, 114, 10258 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "eight", "wickets", ",", "declared", ")", "521" ], "ids": [ 25220, 113, 10142, 16222, 83839, 117, 25019, 114, 21022 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "106", "2", "-", "239", "3", "-", "334", "4", "-", "334", "5", "-", "365", "6", "-", "440", "7", "-", "502" ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 16084, 123, 118, 25338, 124, 118, 33956, 125, 118, 33956, 126, 118, 25385, 127, 118, 24653, 128, 118, 44963 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", "-", "519" ], "ids": [ 129, 118, 52224 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Did", "not", "bat", ":", "Mohammad", "Ak", "##am" ], "ids": [ 50133, 10472, 11519, 131, 40036, 71275, 11008 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "Bowling", ":", "Lewis", "23", "-", "3", "-", "112", "-", "0", ",", "Mu", "##lla", "##lly", "37", ".", "1", "-", "7", "-", "97", "-", "3", ",", "C", "##roft" ], "ids": [ 100017, 131, 13759, 10328, 118, 124, 118, 16129, 118, 121, 117, 49056, 11083, 17903, 11204, 119, 122, 118, 128, 118, 12328, 118, 124, 117, 140, 101860 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "47", "-", "10", "-", "116", "-", "2", ",", "Cork", "23", "-", "5", "-", "71", "-", "1", ",", "Salisbury", "29", "-", "3", "-", "116", "-", "1" ], "ids": [ 11413, 118, 10150, 118, 17095, 118, 123, 117, 42049, 10328, 118, 126, 118, 12513, 118, 122, 117, 55933, 10386, 118, 124, 118, 17095, 118, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "second", "innings" ], "ids": [ 11701, 11132, 48974 ], "entity": [ "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9 ] }, { "tokens": [ "M", ".", "At", "##hert", "##on", "not", "out", "26" ], "ids": [ 150, 119, 11699, 102855, 10263, 10472, 10950, 10314 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "A", ".", "Stewart", "not", "out", "40" ], "ids": [ 138, 119, 17493, 10472, 10950, 10533 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "n", "##b", "-", "8", ")", "8" ], "ids": [ 50821, 10107, 113, 182, 10457, 118, 129, 114, 129 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "no", "wi", "##cket", ")", "74" ], "ids": [ 25220, 113, 10142, 10192, 23040, 28721, 114, 12535 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bowling", "(", "to", "date", ")", ":", "Was", "##im", "Ak", "##ram", "7", "-", "0", "-", "35", "-", "0", ",", "W", "##aq", "##ar", "You", "##nis" ], "ids": [ 100017, 113, 10114, 13664, 114, 131, 22034, 11759, 71275, 13845, 128, 118, 121, 118, 10803, 118, 121, 117, 160, 49277, 10354, 11065, 12597 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "7", "-", "1", "-", "24", "-", "0", ",", "Mus", "##hta", "##q", "Ahmed", "7", "-", "2", "-", "11", "-", "0", ",", "Aa", "##mir", "So", "##hai", "##l", "2", "-", "1", "-", "4", "-", "0" ], "ids": [ 128, 118, 122, 118, 10233, 118, 121, 117, 31013, 32493, 11703, 25530, 128, 118, 123, 118, 10193, 118, 121, 117, 80131, 20825, 12882, 37821, 10161, 123, 118, 122, 118, 125, 118, 121 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "PA", "##KI", "##ST", "##AN", "DE", "##CL", "##AR", "##E", "F", "##IR", "##ST", "IN", "##NI", "##NG", "##S", "AT", "521", "-", "8", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 32349, 59879, 32995, 41275, 25067, 100886, 52188, 11259, 143, 73522, 32995, 36351, 52898, 34065, 10731, 30554, 21022, 118, 129, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "declared", "their", "first" ], "ids": [ 15437, 25019, 10455, 10422 ], "entity": [ "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9 ] }, { "tokens": [ "innings", "at", "521", "-", "8", "on", "the", "fourth", "day", "of", "the", "third", "and", "final", "test" ], "ids": [ 48974, 10160, 21022, 118, 129, 10135, 10105, 16918, 11940, 10108, 10105, 12628, 10111, 11070, 15839 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "against", "England", "at", "The", "Oval", "on", "Sunday", "." ], "ids": [ 11327, 11701, 10160, 10117, 98765, 10135, 19731, 119 ], "entity": [ "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", ":", "England", "326", ";", "Pakistan", "521", "-", "8", "." ], "ids": [ 66875, 10107, 131, 11701, 32558, 132, 15437, 21022, 118, 129, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SC", "##OT", "##TI", "##SH", "PR", "##EM", "##IE", "##R", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##T", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 18137, 62146, 72286, 64091, 23837, 67753, 71655, 11273, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 11090, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GL", "##AS", "##GO", "##W", "1996", "-", "08", "-", "25" ], "ids": [ 108755, 38025, 83821, 13034, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "Scottish", "premier" ], "ids": [ 32070, 16203, 10108, 169, 18879, 11913 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "match", "on", "Sunday", ":" ], "ids": [ 13751, 41356, 12356, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aberdeen", "4", "Hearts", "0" ], "ids": [ 49317, 125, 33385, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rangers", "3", "3", "0", "0", "7", "2", "9" ], "ids": [ 23042, 124, 124, 121, 121, 128, 123, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Celtic", "3", "2", "1", "0", "9", "4", "7" ], "ids": [ 30948, 124, 123, 122, 121, 130, 125, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aberdeen", "3", "1", "2", "0", "8", "4", "5" ], "ids": [ 49317, 124, 122, 123, 121, 129, 125, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mother", "##well", "3", "1", "2", "0", "6", "3", "5" ], "ids": [ 23625, 15862, 124, 122, 123, 121, 127, 124, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hi", "##bern", "##ian", "3", "1", "1", "1", "2", "2", "4" ], "ids": [ 20065, 74158, 11630, 124, 122, 122, 122, 123, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hearts", "2", "1", "0", "1", "3", "6", "3" ], "ids": [ 33385, 123, 122, 121, 122, 124, 127, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ki", "##lma", "##rno", "##ck", "3", "1", "0", "2", "5", "7", "3" ], "ids": [ 28941, 23303, 22611, 11263, 124, 122, 121, 123, 126, 128, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dundee", "United", "3", "0", "1", "2", "1", "3", "1" ], "ids": [ 60426, 10609, 124, 121, 122, 123, 122, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Du", "##n", "##fer", "##mli", "##ne", "2", "0", "1", "1", "2", "5", "1" ], "ids": [ 14925, 10115, 14854, 98373, 10238, 123, 121, 122, 122, 123, 126, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rai", "##th", "3", "0", "0", "3", "1", "8", "0" ], "ids": [ 31249, 11143, 124, 121, 121, 124, 122, 129, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "PA", "##KI", "##ST", "##AN", "473", "-", "6", "AT", "T", "##EA", "ON", "F", "##O", "##UR", "##TH", "DA", "##Y", "T", "##HI", "##RD", "T", "##ES", "##T", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 32349, 59879, 32995, 41275, 39130, 118, 127, 30554, 157, 36789, 49339, 143, 11403, 98348, 109166, 47855, 14703, 157, 108880, 84444, 157, 25054, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "were", "473", "-", "6", "at", "tea", "on", "the", "fourth", "day", "of", "the", "third", "and", "final", "test", "at", "The", "Oval", "on", "Sunday", "in", "rep", "##ly", "to", "England", "'", "s", "326", "." ], "ids": [ 15437, 10309, 39130, 118, 127, 10160, 57675, 10135, 10105, 16918, 11940, 10108, 10105, 12628, 10111, 11070, 15839, 10160, 10117, 98765, 10135, 19731, 10106, 76456, 10454, 10114, 11701, 112, 187, 32558, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", ":", "England", "326", ";", "Pakistan", "473", "-", "6", "." ], "ids": [ 66875, 10107, 131, 11701, 32558, 132, 15437, 39130, 118, 127, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "R", "##UN", "-", "O", "##UT", "G", "##IV", "##ES", "LE", "##W", "##IS", "AND", "EN", "##GL", "##AN", "##D", "SL", "##IM", "SA", "##TI", "##SF", "##AC", "##TION", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 155, 69849, 118, 152, 65729, 144, 91238, 25054, 84977, 13034, 19088, 52428, 31278, 104780, 41275, 11490, 52671, 42031, 21318, 72286, 46378, 30340, 98207, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chris", "Lewis", "did", "his", "best", "to", "for", "##get", "his", "controversial", "om", "##ission", "from", "the", "England", "one", "-", "day", "squad", "on", "Sunday", "but", "could", "not", "prevent", "Pakistan", "reas", "##sert", "##ing", "their", "domina", "##nce", "in", "the", "final", "test", "at", "The", "Oval", "." ], "ids": [ 13151, 13759, 12172, 10226, 12504, 10114, 10142, 14908, 10226, 45475, 10209, 58334, 10188, 10105, 11701, 10464, 118, 11940, 30580, 10135, 19731, 10473, 12174, 10472, 29320, 15437, 36120, 37368, 10230, 10455, 90399, 12150, 10106, 10105, 11070, 15839, 10160, 10117, 98765, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "A", "super", "piece", "of", "field", "##ing", "by", "Lewis", ",", "dropped", "as", "a", "disciplina", "##ry", "measure", "after", "arriving", "only", "35", "minutes", "before", "the", "start", "on", "the", "fourth", "morning", ",", "provided", "the", "only", "bright", "spot", "for", "England", "as", "the", "touring", "team", "bat", "##ted", "on", "to", "reach", "413", "for", "five", "at", "the", "interval", ",", "a", "lead", "of", "87", "." ], "ids": [ 138, 25212, 26767, 10108, 13939, 10230, 10155, 13759, 117, 30241, 10146, 169, 40104, 10908, 38713, 10662, 65200, 10893, 10803, 15304, 11360, 10105, 15148, 10135, 10105, 16918, 28757, 117, 16491, 10105, 10893, 72041, 28504, 10142, 11701, 10146, 10105, 54538, 11121, 11519, 11912, 10135, 10114, 24278, 39245, 10142, 12403, 10160, 10105, 72331, 117, 169, 14107, 10108, 12581, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "soli", "##tary", "wi", "##cket", "to", "fall", "was", "As", "##if", "Mu", "##jta", "##ba", ",", "run", "out", "for", "13", "attempting", "a", "second", "run", "to", "third", "man", "where", "Lewis", "was", "lu", "##rkin", "##g", "with", "a", "point", "to", "prove", "." ], "ids": [ 10117, 36766, 65597, 23040, 28721, 10114, 18042, 10134, 10882, 13918, 49056, 51465, 10537, 117, 14095, 10950, 10142, 10249, 63494, 169, 11132, 14095, 10114, 12628, 10817, 10940, 13759, 10134, 14657, 93068, 10240, 10169, 169, 12331, 10114, 35905, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "seemed", "s", "##cant", "danger", "until", "the", "Surrey", "player", "s", "##wo", "##ope", "##d", "on", "to", "the", "ball", "and", "returned", "off", "balance", "to", "county", "team", "mate", "Alec", "Stewart", "who", "w", "##hip", "##ped", "off", "the", "bai", "##ls", "." ], "ids": [ 11723, 64676, 187, 62745, 45882, 11444, 10105, 42858, 12928, 187, 16828, 38978, 10162, 10135, 10114, 10105, 20724, 10111, 14030, 11898, 40162, 10114, 17382, 11121, 43465, 61961, 17493, 10479, 191, 17883, 16898, 11898, 10105, 48775, 11747, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lewis", ",", "though", ",", "could", "not", "make", "similar", "waves", "with", "the", "ball", "as", "Salim", "Malik", "and", "Was", "##im", "Ak", "##ram", "bat", "##ted", "through", "the", "rest", "of", "the", "session", "with", "few", "ala", "##rms", "." ], "ids": [ 13759, 117, 15102, 117, 12174, 10472, 13086, 13213, 65613, 10169, 10105, 20724, 10146, 98284, 45783, 10111, 22034, 11759, 71275, 13845, 11519, 11912, 11222, 10105, 17333, 10108, 10105, 30066, 10169, 13824, 21739, 77372, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Was", "##im", "rat", "##tle", "##d", "along", "to", "30", "not", "out", ",", "out", "##sco", "##ring", "his", "partner", "who", "was", "un", "##beat", "##en", "on", "24", "at", "the", "break", ",", "although", "the", "weather", "was", "again", "threat", "##ening", "to", "play", "the", "dominant", "role", "." ], "ids": [ 22034, 11759, 33062, 16406, 10162, 12400, 10114, 10244, 10472, 10950, 117, 10950, 22402, 13135, 10226, 22825, 10479, 10134, 10119, 68939, 10136, 10135, 10233, 10160, 10105, 24194, 117, 14779, 10105, 35660, 10134, 13123, 41256, 24428, 10114, 12253, 10105, 36705, 12971, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rain", "arrived", "just", "as", "the", "players", "left", "the", "field", "for", "lu", "##nch", ",", "forcing", "the", "ground", "-", "staff", "into", "action", "yet", "again", "." ], "ids": [ 23292, 22584, 12820, 10146, 10105, 16021, 12153, 10105, 13939, 10142, 14657, 31215, 117, 75098, 10105, 16912, 118, 18927, 10708, 14204, 21833, 13123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "weather", "delayed", "the", "res", "##umption", "for", "over", "an", "hour", ",", "the", "um", "##pire", "##s", "finally", "anno", "##un", "##cing", "play", "would", "start", "again", "at", "1445", "local", "time", "(", "1345", "GMT", ")", "." ], "ids": [ 10117, 35660, 67058, 10105, 39429, 94118, 10142, 10491, 10151, 24730, 117, 10105, 10293, 72079, 10107, 21256, 11671, 11107, 19113, 12253, 10894, 15148, 13123, 10160, 78983, 11436, 10635, 113, 83889, 20362, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "NA", "##ME", "S", "##Q", "##U", "##AD", "FOR", "ONE", "-", "DA", "##Y", "IN", "##TER", "##NA", "##TION", "##AL", "##S", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 56586, 42424, 156, 19282, 12022, 55538, 109544, 57929, 118, 47855, 14703, 36351, 99552, 36742, 98207, 32002, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "England", "cricket", "squad", "was", "announced", "on", "Sunday", "for", "the", "one", "-", "day", "international", "series", "against", "Pakistan", "starting", "on", "Thursday", "." ], "ids": [ 10117, 11701, 32289, 30580, 10134, 13854, 10135, 19731, 10142, 10105, 10464, 118, 11940, 12533, 11366, 11327, 15437, 21868, 10135, 67067, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Squad", ":", "Michael", "At", "##hert", "##on", "(", "captain", ")", ",", "Alec", "Stewart", ",", "Graham", "Thorpe", ",", "Nick", "Knight", ",", "Graham", "Lloyd", ",", "Matthew", "Maynard", ",", "Ronnie", "Iran", "##i", ",", "Adam", "Ho", "##llio", "##ake", ",", "Robert", "C", "##roft", ",", "Darren", "Go", "##ugh", ",", "Peter", "Martin", ",", "Dean", "Head", "##ley", ",", "Alan", "Mu", "##lla", "##lly", "." ], "ids": [ 53150, 131, 10631, 11699, 102855, 10263, 113, 28157, 114, 117, 61961, 17493, 117, 16928, 84855, 117, 16126, 19848, 117, 16928, 19345, 117, 18168, 92517, 117, 39219, 12901, 10116, 117, 13072, 20220, 93590, 26389, 117, 10820, 140, 101860, 117, 53337, 14439, 25905, 117, 10979, 11235, 117, 18657, 16830, 12105, 117, 14309, 49056, 11083, 17903, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "CAN", "##AD", "##IA", "##N", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 98038, 55538, 35976, 11537, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "25" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the", "Canadian", "Open" ], "ids": [ 33036, 10188, 10105, 14023, 11919 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 2, 6 ] }, { "tokens": [ "tennis", "tournament", "on", "Sunday", "(", "pre", "##fix", "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 20944, 17390, 10135, 19731, 113, 12229, 57014, 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Final" ], "ids": [ 14924 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "3", "-", "Wayne", "Ferreira", "(", "South", "Africa", ")", "beat", "Todd", "Wood", "##bridge" ], "ids": [ 124, 118, 18547, 39227, 113, 11056, 12880, 114, 27868, 24708, 18315, 29273 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Australia", ")", "6", "-", "2", "6", "-", "4" ], "ids": [ 113, 11729, 114, 127, 118, 123, 127, 118, 125 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "RE", "##SU", "##L", "##TS", "AT", "CAN", "##AD", "##IA", "##N", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 71033, 88592, 11369, 36545, 30554, 98038, 55538, 35976, 11537, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "24" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10233 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the", "Canadian", "Open" ], "ids": [ 33036, 10188, 10105, 14023, 11919 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 2, 6 ] }, { "tokens": [ "tennis", "tournament", "on", "Saturday", "(", "pre", "##fix", "numbers", "den", "##otes" ], "ids": [ 20944, 17390, 10135, 24848, 113, 12229, 57014, 20953, 10140, 54989 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "seed", "##ings", ")", ":" ], "ids": [ 49282, 18800, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Semi", "##finals" ], "ids": [ 71467, 47791 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "3", "-", "Wayne", "Ferreira", "(", "South", "Africa", ")", "beat", "7", "-", "Todd", "Martin", "(", "U", ".", "S", ".", ")" ], "ids": [ 124, 118, 18547, 39227, 113, 11056, 12880, 114, 27868, 128, 118, 24708, 11235, 113, 158, 119, 156, 119, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "4", "-", "6", "6", "-", "3", "7", "-", "5" ], "ids": [ 125, 118, 127, 127, 118, 124, 128, 118, 126 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Todd", "Wood", "##bridge", "(", "Australia", ")", "beat", "4", "-", "Marcelo", "Rio", "##s", "(", "Chile", ")", "6", "-", "0" ], "ids": [ 24708, 18315, 29273, 113, 11729, 114, 27868, 125, 118, 38165, 12109, 10107, 113, 13218, 114, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "3" ], "ids": [ 127, 118, 124 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "TO", "##GO", "BE", "##AT", "CO", "##NG", "##O", "1", "-", "0", "IN", "AF", "##RI", "##CA", "NA", "##TION", "##S", "C", "##UP", "Q", "##U", "##AL", "##IF", "##IE", "##R", "." ], "ids": [ 71020, 65622, 24093, 118, 58573, 83821, 46291, 32071, 32992, 34065, 11403, 122, 118, 121, 36351, 55640, 46876, 46900, 56586, 98207, 10731, 140, 57487, 154, 12022, 32002, 53668, 71655, 11273, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 5, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OM", "##E", "1996", "-", "08", "-", "25" ], "ids": [ 149, 37079, 11259, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Togo", "beat", "Congo", "1", "-", "0", "(", "half", "##time", "0", "-", "0", ")" ], "ids": [ 56492, 27868, 20633, 122, 118, 121, 113, 13877, 18086, 121, 118, 121, 114 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "in", "their", "African", "Nations", "Cup", "preliminary", "round", ",", "second", "leg" ], "ids": [ 10106, 10455, 13839, 15145, 11544, 68097, 13569, 117, 11132, 33810 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "qualifying", "match", "on", "Sunday", "." ], "ids": [ 43631, 12356, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##r", ":", "Sal", "##ou", "Bach", "##iro", "##u", "(", "53", "##rd", "minute", ")" ], "ids": [ 66875, 10129, 131, 64831, 11010, 18965, 14213, 10138, 113, 11756, 12023, 21760, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "18", ",", "000" ], "ids": [ 46080, 131, 10218, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Togo", "win", "1", "-", "0", "on", "aggregate", "." ], "ids": [ 56492, 14125, 122, 118, 121, 10135, 75063, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "ET", "##HI", "##OP", "##IA", "BE", "##AT", "U", "##GA", "##ND", "##A", "ON", "PE", "##NA", "##L", "##TI", "##ES", "IN", "AF", "##RI", "##CA", "##N", "NA", "##TION", "##S", "C", "##UP", "." ], "ids": [ 71020, 65622, 24093, 118, 74568, 108880, 44917, 35976, 46291, 32071, 158, 39061, 58521, 10738, 49339, 80468, 36742, 11369, 72286, 25054, 36351, 55640, 46876, 46900, 11537, 56586, 98207, 10731, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "AD", "##DI", "##S", "ABA", "##BA", "1996", "-", "08", "-", "25" ], "ids": [ 22992, 58730, 10731, 93292, 35999, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ethiopia", "and", "Uganda", "drew", "1", "-", "1" ], "ids": [ 49281, 10111, 29675, 49098, 122, 118, 122 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "(", "half", "##time", "1", "-", "0", ")", "in", "their", "African", "Nations", "Cup", "preliminary", "round", "," ], "ids": [ 113, 13877, 18086, 122, 118, 121, 114, 10106, 10455, 13839, 15145, 11544, 68097, 13569, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "second", "leg", "match", "on", "Sunday", "." ], "ids": [ 11132, 33810, 12356, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "25", ",", "000" ], "ids": [ 46080, 131, 10258, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##gg", "##regat", "##e", "2", "-", "2", "." ], "ids": [ 138, 21127, 100232, 10112, 123, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ethiopia", "won", "4", "-", "2", "penal", "##ties", "." ], "ids": [ 49281, 11367, 125, 118, 123, 69270, 14197, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "Y", "##U", "##GO", "##SL", "##AV", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 162, 12022, 83821, 51960, 99903, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "25" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Yugoslav", "league" ], "ids": [ 33036, 10108, 93444, 15616 ], "entity": [ "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 2, 9 ] }, { "tokens": [ "soccer", "matches", "played", "on", "Sunday", ":" ], "ids": [ 41356, 18258, 11553, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Division", "A" ], "ids": [ 11987, 138 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Vo", "##j", "##vodi", "##na", "1", "Partizan", "1" ], "ids": [ 59482, 10418, 45523, 10219, 122, 93130, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "C", "##rven", "##a", "z", "##vez", "##da", "3", "Pro", "##lete", "##r", "1" ], "ids": [ 140, 58327, 10113, 194, 27468, 10229, 124, 14021, 46192, 10129, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Division", "B" ], "ids": [ 11987, 139 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Ze", "##les", "##nik", "0", "R", "##uda", "##r", "1" ], "ids": [ 15536, 11268, 12027, 121, 155, 18497, 10129, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "LE", "##AD", "##ING", "GO", "##AL", "##SC", "##OR", "##ER", "##S", "IN", "P", "##OL", "##IS", "##H", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "." ], "ids": [ 71020, 65622, 24093, 118, 84977, 55538, 50183, 41525, 32002, 36175, 42622, 24093, 10731, 36351, 153, 39272, 19088, 12396, 143, 73522, 32995, 110014, 90939, 44802, 30118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AR", "##SA", "##W", "1996", "-", "08", "-", "25" ], "ids": [ 160, 52188, 27138, 13034, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "goals", "##core", "##rs", "in", "the", "Polish" ], "ids": [ 100085, 18173, 45811, 10943, 10106, 10105, 19870 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "first", "division", "after", "the", "weekend", "'", "s", "matches", ":" ], "ids": [ 10422, 13751, 10662, 10105, 43440, 112, 187, 18258, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "Bogdan", "Pr", "##use", "##k", "(", "Sokol", "Ty", "##chy", ")" ], "ids": [ 128, 118, 68194, 106482, 12730, 10174, 113, 104869, 64515, 27199, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9 ] }, { "tokens": [ "5", "-", "S", "##law", "##omir", "Wojciech", "##owski", "(", "G", "##KS", "Katowice", ")" ], "ids": [ 126, 118, 156, 37811, 77516, 51603, 27098, 113, 144, 62828, 75494, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 7, 9 ] }, { "tokens": [ "4", "-", "Jacek", "Dem", "##bin", "##ski", "(", "Wi", "##dze", "##w", "Lo", "##dz", ")", ",", "Marcin", "Mi", "##ecie", "##l" ], "ids": [ 125, 118, 66924, 37312, 16473, 11401, 113, 52742, 40098, 10874, 13069, 59880, 114, 117, 69116, 19803, 69495, 10161 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 7, 7, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "Le", "##gia", "Warsaw", ")", ",", "Ryszard", "Wie", "##cz", "##ore", "##k", "(", "Od", "##ra", "Wo", "##dzi", "##sla", "##w", ")" ], "ids": [ 113, 10281, 15414, 43669, 114, 117, 84076, 23789, 20868, 13024, 10174, 113, 11936, 10288, 102204, 45637, 61432, 10874, 114 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "3", "-", "Jacek", "Bere", "##ns", "##zta", "##in", "(", "G", "##KS", "Bel", "##chat", "##ow", ")", ",", "Marek", "Ci", "##tko", "(", "Wi", "##dze", "##w", ")", "," ], "ids": [ 124, 118, 66924, 40575, 10891, 32950, 10245, 113, 144, 62828, 47197, 73267, 16602, 114, 117, 37443, 51457, 46627, 113, 52742, 40098, 10874, 114, 117 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 7, 7, 7, 9, 9, 4, 8, 8, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Adam", "Fed", "##oru", "##k", ",", "Darius", "##z", "Jackie", "##wicz", "(", "both", "Ami", "##ca", "W", "##ron", "##ki", ")", "," ], "ids": [ 13072, 91335, 25230, 10174, 117, 76384, 10305, 30567, 38147, 113, 11408, 80157, 10425, 160, 11620, 10506, 114, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 9, 3, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Bart", "##lom", "##iej", "Jam", "##ro", "##z", "(", "Hut", "##nik", "Kr", "##ako", "##w", ")", ",", "Tomasz", "Mo", "##ska", "##l" ], "ids": [ 33849, 19248, 25108, 30660, 10567, 10305, 113, 104185, 12027, 17640, 20293, 10874, 114, 117, 50983, 34987, 11485, 10161 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 7, 7, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "S", "##las", "##k", "W", "##roc", "##law", ")", ",", "Krzysztof", "Pi", "##sku", "##la", "(", "Lech", "Po", "##zna", "##n", ")", ",", "Marius", "##z" ], "ids": [ 113, 156, 13983, 10174, 160, 87015, 37811, 114, 117, 43295, 38329, 14836, 10330, 113, 66161, 11255, 24710, 10115, 114, 117, 39339, 10305 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 7, 9, 9, 4, 8 ] }, { "tokens": [ "Sr", "##ut", "##wa", "(", "R", "##uch", "Chor", "##zo", "##w", ")", ",", "Emmanuel", "Te", "##tte", "##h", "(", "Polonia", "Warszawa", ")", "," ], "ids": [ 26064, 11159, 11037, 113, 155, 20591, 38955, 12096, 10874, 114, 117, 21189, 21452, 12131, 10237, 113, 21915, 21206, 114, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 3, 7, 7, 7, 7, 9, 9, 4, 8, 8, 8, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Krzysztof", "Za", "##gor", "##ski", "(", "Od", "##ra", ")" ], "ids": [ 43295, 14074, 28025, 11401, 113, 11936, 10288, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 3, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "ROM", "##AN", "##IA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 41068, 41275, 35976, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UC", "##HA", "##RE", "##ST", "1996", "-", "08", "-", "25" ], "ids": [ 139, 93089, 58132, 66014, 32995, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "first", "division" ], "ids": [ 33036, 10108, 10422, 13751 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "soccer", "matches", "played", "over", "the", "weekend", ":" ], "ids": [ 41356, 18258, 11553, 10491, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", ".", "S", ".", "Ba", "##ca", "##u", "1", "Cea", "##hla", "##ul", "Pia", "##tra", "Ne", "##amt", "1" ], "ids": [ 138, 119, 156, 119, 21333, 10425, 10138, 122, 109435, 74935, 10604, 52051, 13207, 19416, 24981, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "O", "##tel", "##ul", "Gala", "##ti", "1", "F", ".", "C", ".", "Ar", "##ges", "Dacia", "Pit", "##esti", "0" ], "ids": [ 152, 15636, 10604, 60231, 10325, 122, 143, 119, 140, 119, 18484, 13156, 92320, 79321, 32413, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "F", ".", "C", ".", "Far", "##ul", "Constant", "##a", "3", "Chin", "##dia", "Ti", "##rgo", "##viste", "1" ], "ids": [ 143, 119, 140, 119, 26747, 10604, 71297, 10113, 124, 51529, 13852, 29033, 69518, 37628, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Sport", "##ul", "Student", "##esc", "4", "Universitatea", "C", "##rai", "##ova", "2" ], "ids": [ 15062, 10604, 33541, 43694, 125, 59795, 140, 33186, 12804, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "F", ".", "C", ".", "Petro", "##lul", "Pl", "##oi", "##esti", "4", "Pol", "##ite", "##hn", "##ica", "Tim", "##iso", "##ara", "5" ], "ids": [ 143, 119, 140, 119, 82470, 69836, 48932, 14638, 32413, 125, 38432, 12704, 15797, 11043, 15318, 48832, 12677, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "F", ".", "C", ".", "Br", "##aso", "##v", "1", "F", ".", "C", ".", "National", "Bucharest", "1" ], "ids": [ 143, 119, 140, 119, 38508, 63321, 10477, 122, 143, 119, 140, 119, 10655, 100824, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Ji", "##ul", "Petro", "##san", "##i", "1", "Dinamo", "Bucharest", "0" ], "ids": [ 30822, 10604, 82470, 14434, 10116, 122, 35011, 100824, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Gloria", "Bis", "##tri", "##ta", "0", "Universitatea", "Cluj", "1" ], "ids": [ 26209, 18516, 21570, 10213, 121, 59795, 43188, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Rapid", "Bucharest", "0", "Steaua", "Bucharest", "2" ], "ids": [ 41047, 100824, 121, 105747, 100824, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dinamo", "Bucharest", "4", "3", "0", "1", "6", "2", "9" ], "ids": [ 35011, 100824, 125, 124, 121, 122, 127, 123, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ji", "##ul", "Petro", "##san", "##i", "4", "3", "0", "1", "6", "4", "9" ], "ids": [ 30822, 10604, 82470, 14434, 10116, 125, 124, 121, 122, 127, 125, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", ".", "C", ".", "Far", "##ul", "Constant", "##a", "4", "2", "2", "0", "6", "2", "8" ], "ids": [ 143, 119, 140, 119, 26747, 10604, 71297, 10113, 125, 123, 123, 121, 127, 123, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Universitatea", "Cluj", "4", "2", "2", "0", "6", "4", "8" ], "ids": [ 59795, 43188, 125, 123, 123, 121, 127, 125, 129 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", ".", "S", ".", "Ba", "##ca", "##u", "4", "2", "1", "1", "7", "3", "7" ], "ids": [ 138, 119, 156, 119, 21333, 10425, 10138, 125, 123, 122, 122, 128, 124, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pol", "##ite", "##hn", "##ica", "Tim", "##iso", "##ara", "4", "2", "1", "1", "11", "9", "7" ], "ids": [ 38432, 12704, 15797, 11043, 15318, 48832, 12677, 125, 123, 122, 122, 10193, 130, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", ".", "C", ".", "National", "Bucharest", "4", "2", "1", "1", "7", "6", "7" ], "ids": [ 143, 119, 140, 119, 10655, 100824, 125, 123, 122, 122, 128, 127, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##tel", "##ul", "Gala", "##ti", "4", "2", "0", "2", "4", "3", "6" ], "ids": [ 152, 15636, 10604, 60231, 10325, 125, 123, 121, 123, 125, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", ".", "C", ".", "Chin", "##dia", "Ti", "##rgo", "##viste", "4", "2", "0", "2", "3", "4", "6" ], "ids": [ 143, 119, 140, 119, 51529, 13852, 29033, 69518, 37628, 125, 123, 121, 123, 124, 125, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Steaua", "Bucharest", "4", "2", "0", "2", "5", "7", "6" ], "ids": [ 105747, 100824, 125, 123, 121, 123, 126, 128, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", ".", "C", ".", "Ar", "##ges", "Dacia", "Pit", "##esti", "4", "1", "2", "1", "4", "2", "5" ], "ids": [ 143, 119, 140, 119, 18484, 13156, 92320, 79321, 32413, 125, 122, 123, 122, 125, 123, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Universitatea", "C", "##rai", "##ova", "4", "1", "1", "2", "8", "6", "4" ], "ids": [ 59795, 140, 33186, 12804, 125, 122, 122, 123, 129, 127, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sport", "##ul", "Student", "##esc", "4", "1", "1", "2", "7", "9", "4" ], "ids": [ 15062, 10604, 33541, 43694, 125, 122, 122, 123, 128, 130, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cea", "##hla", "##ul", "Pia", "##tra", "Ne", "##amt", "4", "1", "1", "2", "2", "4", "4" ], "ids": [ 109435, 74935, 10604, 52051, 13207, 19416, 24981, 125, 122, 122, 123, 123, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", ".", "C", ".", "Br", "##aso", "##v", "4", "1", "1", "2", "6", "10", "4" ], "ids": [ 143, 119, 140, 119, 38508, 63321, 10477, 125, 122, 122, 123, 127, 10150, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gloria", "Bis", "##tri", "##ta", "4", "1", "0", "3", "3", "9", "3" ], "ids": [ 26209, 18516, 21570, 10213, 125, 122, 121, 124, 124, 130, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", ".", "C", ".", "Petro", "##lul", "Pl", "##oi", "##esti", "4", "0", "2", "2", "5", "7", "2" ], "ids": [ 143, 119, 140, 119, 82470, 69836, 48932, 14638, 32413, 125, 121, 123, 123, 126, 128, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rapid", "Bucharest", "4", "0", "1", "3", "4", "9", "1" ], "ids": [ 41047, 100824, 125, 121, 122, 124, 125, 130, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "P", "##OL", "##IS", "##H", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 153, 39272, 19088, 12396, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AR", "##SA", "##W", "1996", "-", "08", "-", "25" ], "ids": [ 160, 52188, 27138, 13034, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Polish", "first", "division" ], "ids": [ 33036, 10108, 19870, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "matches", "played", "over", "the", "weekend", ":" ], "ids": [ 41356, 18258, 11553, 10491, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ami", "##ca", "W", "##ron", "##ki", "3", "Hut", "##nik", "Kr", "##ako", "##w", "0" ], "ids": [ 80157, 10425, 160, 11620, 10506, 124, 104185, 12027, 17640, 20293, 10874, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Sokol", "Ty", "##chy", "5", "Lech", "Po", "##zna", "##n", "3" ], "ids": [ 104869, 64515, 27199, 126, 66161, 11255, 24710, 10115, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Ra", "##kow", "C", "##zes", "##to", "##chow", "##a", "1", "St", "##omi", "##l", "Ol", "##szt", "##yn", "4" ], "ids": [ 38571, 72275, 140, 19579, 10340, 105962, 10113, 122, 10838, 32013, 10161, 60160, 57719, 13379, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Wi", "##sla", "Kr", "##ako", "##w", "1", "Go", "##rnik", "Za", "##br", "##ze", "0" ], "ids": [ 52742, 61432, 17640, 20293, 10874, 122, 14439, 83247, 14074, 36867, 10870, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "S", "##las", "##k", "W", "##roc", "##law", "3", "Od", "##ra", "Wo", "##dzi", "##sla", "##w", "1" ], "ids": [ 156, 13983, 10174, 160, 87015, 37811, 124, 11936, 10288, 102204, 45637, 61432, 10874, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "G", "##KS", "Katowice", "1", "Polonia", "Warsaw", "0" ], "ids": [ 144, 62828, 75494, 122, 21915, 43669, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Za", "##gle", "##bie", "Lu", "##bin", "2", "L", "##KS", "Lo", "##dz", "1" ], "ids": [ 14074, 23239, 18545, 23859, 16473, 123, 149, 62828, 13069, 59880, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Le", "##gia", "Warsaw", "3", "G", "##KS", "Bel", "##chat", "##ow", "2" ], "ids": [ 10281, 15414, 43669, 124, 144, 62828, 47197, 73267, 16602, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Wi", "##dze", "##w", "Lo", "##dz", "3", "R", "##uch", "Chor", "##zo", "##w", "0" ], "ids": [ 52742, 40098, 10874, 13069, 59880, 124, 155, 20591, 38955, 12096, 10874, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ami", "##ca", "W", "##ron", "##ki", "7", "5", "1", "1", "13", "8", "16" ], "ids": [ 80157, 10425, 160, 11620, 10506, 128, 126, 122, 122, 10249, 129, 10250 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Le", "##gia", "Warsaw", "7", "5", "1", "1", "13", "7", "16" ], "ids": [ 10281, 15414, 43669, 128, 126, 122, 122, 10249, 128, 10250 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lech", "Po", "##zna", "##n", "7", "5", "0", "2", "12", "9", "15" ], "ids": [ 66161, 11255, 24710, 10115, 128, 126, 121, 123, 10186, 130, 10208 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wi", "##dze", "##w", "Lo", "##dz", "7", "4", "2", "1", "13", "3", "14" ], "ids": [ 52742, 40098, 10874, 13069, 59880, 128, 125, 123, 122, 10249, 124, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##KS", "Katowice", "7", "4", "2", "1", "12", "9", "14" ], "ids": [ 144, 62828, 75494, 128, 125, 123, 122, 10186, 130, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sokol", "Ty", "##chy", "7", "4", "0", "3", "14", "15", "12" ], "ids": [ 104869, 64515, 27199, 128, 125, 121, 124, 10247, 10208, 10186 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Od", "##ra", "Wo", "##dzi", "##sla", "##w", "7", "3", "1", "3", "13", "10", "10" ], "ids": [ 11936, 10288, 102204, 45637, 61432, 10874, 128, 124, 122, 124, 10249, 10150, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##las", "##k", "W", "##roc", "##law", "7", "3", "1", "3", "8", "7", "10" ], "ids": [ 156, 13983, 10174, 160, 87015, 37811, 128, 124, 122, 124, 129, 128, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Polonia", "Warsaw", "7", "3", "1", "3", "7", "9", "10" ], "ids": [ 21915, 43669, 128, 124, 122, 124, 128, 130, 10150 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##KS", "Bel", "##chat", "##ow", "7", "3", "0", "4", "9", "9", "9" ], "ids": [ 144, 62828, 47197, 73267, 16602, 128, 124, 121, 125, 130, 130, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "##omi", "##l", "Ol", "##szt", "##yn", "7", "2", "3", "2", "9", "9", "9" ], "ids": [ 10838, 32013, 10161, 60160, 57719, 13379, 128, 123, 124, 123, 130, 130, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wi", "##sla", "Kr", "##ako", "##w", "7", "2", "3", "2", "3", "4", "9" ], "ids": [ 52742, 61432, 17640, 20293, 10874, 128, 123, 124, 123, 124, 125, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hut", "##nik", "Kr", "##ako", "##w", "7", "3", "0", "4", "8", "10", "9" ], "ids": [ 104185, 12027, 17640, 20293, 10874, 128, 124, 121, 125, 129, 10150, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ra", "##kow", "C", "##zes", "##to", "##chow", "##a", "7", "2", "1", "4", "6", "10", "7" ], "ids": [ 38571, 72275, 140, 19579, 10340, 105962, 10113, 128, 123, 122, 125, 127, 10150, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Za", "##gle", "##bie", "Lu", "##bin", "7", "1", "3", "3", "10", "12", "6" ], "ids": [ 14074, 23239, 18545, 23859, 16473, 128, 122, 124, 124, 10150, 10186, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##uch", "Chor", "##zo", "##w", "7", "1", "2", "4", "7", "13", "5" ], "ids": [ 155, 20591, 38955, 12096, 10874, 128, 122, 123, 125, 128, 10249, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Go", "##rnik", "Za", "##br", "##ze", "7", "1", "1", "5", "6", "10", "4" ], "ids": [ 14439, 83247, 14074, 36867, 10870, 128, 122, 122, 126, 127, 10150, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##KS", "Lo", "##dz", "7", "0", "2", "5", "4", "13", "2" ], "ids": [ 149, 62828, 13069, 59880, 128, 121, 123, 126, 125, 10249, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "R", "##US", "##SI", "##AN", "PR", "##EM", "##IE", "##R", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 155, 32612, 44802, 41275, 23837, 67753, 71655, 11273, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "25" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Russian", "premier", "league" ], "ids": [ 33036, 10108, 13463, 11913, 15616 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "played", "on", "Saturday", ":" ], "ids": [ 18258, 11553, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alan", "##iya", "Vlad", "##ika", "##vka", "##z", "3", "Z", "##hem", "##chu", "##zhi", "##na", "Soc", "##hi", "1" ], "ids": [ 14309, 14990, 101895, 13060, 38299, 10305, 124, 163, 25947, 22882, 79728, 10219, 23104, 11924, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Bal", "##tika", "Kaliningrad", "2", "Zen", "##it", "St", "Petersburg", "0" ], "ids": [ 93352, 24511, 95679, 123, 61916, 10486, 10838, 22801, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Cher", "##nom", "##ore", "##ts", "Novo", "##ross", "##iis", "##k", "2", "Ros", "##tse", "##lma", "##sh", "Rostov", "1" ], "ids": [ 35554, 13294, 13024, 10806, 28649, 105572, 54369, 10174, 123, 109292, 45507, 23303, 13264, 91801, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Lok", "##omotiv", "Moscow", "2", "Torpedo", "Moscow", "1" ], "ids": [ 63998, 106912, 18744, 123, 87669, 18744, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Rot", "##or", "Vol", "##go", "##grad", "0", "Dynamo", "Moscow", "1" ], "ids": [ 56115, 10667, 12546, 10797, 34486, 121, 49013, 18744, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "CSKA", "Moscow", "4", "Ka", "##maz", "Na", "##bere", "##zh", "##nye", "Che", "##lny", "2" ], "ids": [ 73229, 18744, 125, 25444, 39125, 10685, 102410, 15104, 66436, 44131, 27302, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "La", "##da", "To", "##glia", "##tti", "1", "Spartak", "Moscow", "1" ], "ids": [ 10159, 10229, 11469, 27965, 12683, 122, 59281, 18744, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Tekst", "##ils", "##hik", "Ka", "##mys", "##hin", "2", "Kr", "##yl", "##ya", "Sovet", "##ov", "Samara", "1" ], "ids": [ 105227, 38308, 87600, 25444, 107297, 14383, 123, 17640, 27652, 10679, 73572, 11024, 99536, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Lok", "##omotiv", "Ni", "##zh", "##ny", "Novgorod", "2", "Ural", "##mas", "##h", "Ye", "##kate", "##rin", "##burg", "2" ], "ids": [ 63998, 106912, 30409, 15104, 10756, 67649, 123, 89256, 12922, 10237, 20567, 82574, 13778, 12248, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "games", "played", ",", "won", ",", "drawn", ",", "lost", "," ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 13332, 11553, 117, 11367, 117, 34788, 117, 14172, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "goals", "for", ",", "goals", "against", ",", "points", ")", "." ], "ids": [ 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Note", "-", "if", "more", "than", "one", "team", "has", "the", "same", "number", "of", "points", "," ], "ids": [ 20231, 118, 12277, 10798, 11084, 10464, 11121, 10393, 10105, 11561, 11487, 10108, 12789, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "pre", "##cede", "##nce", "is", "given", "to", "the", "one", "with", "most", "wins", "." ], "ids": [ 12229, 46701, 12150, 10124, 13507, 10114, 10105, 10464, 10169, 10992, 27279, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "more", "than", "one" ], "ids": [ 14535, 10798, 11084, 10464 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "team", "has", "the", "same", "number", "of", "wins", "and", "points", ",", "pre", "##cede", "##nce", "goes", "to" ], "ids": [ 11121, 10393, 10105, 11561, 11487, 10108, 27279, 10111, 12789, 117, 12229, 46701, 12150, 25441, 10114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "the", "side", "with", "the", "most", "successful", "record", "against", "the", "others", ")", "." ], "ids": [ 10105, 12250, 10169, 10105, 10992, 17330, 12410, 11327, 10105, 14633, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alan", "##iya", "Vlad", "##ika", "##vka", "##z", "24", "16", "5", "3", "48", "25", "53" ], "ids": [ 14309, 14990, 101895, 13060, 38299, 10305, 10233, 10250, 126, 124, 11300, 10258, 11756 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dynamo", "Moscow", "25", "15", "7", "3", "43", "21", "52" ], "ids": [ 49013, 18744, 10258, 10208, 128, 124, 11370, 10296, 11525 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rot", "##or", "Vol", "##go", "##grad", "23", "15", "5", "3", "42", "17", "50" ], "ids": [ 56115, 10667, 12546, 10797, 34486, 10328, 10208, 126, 124, 11276, 10273, 10462 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spartak", "Moscow", "25", "14", "7", "4", "48", "24", "49" ], "ids": [ 59281, 18744, 10258, 10247, 128, 125, 11300, 10233, 11580 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CSKA", "Moscow", "25", "13", "6", "6", "40", "27", "45" ], "ids": [ 73229, 18744, 10258, 10249, 127, 127, 10533, 10365, 10827 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lok", "##omotiv", "Ni", "##zh", "##ny", "Novgorod", "25", "11", "4", "10", "27", "35", "37" ], "ids": [ 63998, 106912, 30409, 15104, 10756, 67649, 10258, 10193, 125, 10150, 10365, 10803, 11204 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lok", "##omotiv", "Moscow", "25", "9", "9", "7", "30", "24", "36" ], "ids": [ 63998, 106912, 18744, 10258, 130, 130, 128, 10244, 10233, 11055 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bal", "##tika", "Kaliningrad", "25", "8", "10", "7", "29", "26", "34" ], "ids": [ 93352, 24511, 95679, 10258, 129, 10150, 128, 10386, 10314, 11069 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Torpedo", "Moscow", "25", "8", "9", "8", "31", "33", "33" ], "ids": [ 87669, 18744, 10258, 129, 130, 129, 10413, 11000, 11000 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zen", "##it", "St", "Petersburg", "24", "9", "4", "11", "24", "26", "31" ], "ids": [ 61916, 10486, 10838, 22801, 10233, 130, 125, 10193, 10233, 10314, 10413 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kr", "##yl", "##ya", "Sovet", "##ov", "Samara", "25", "8", "7", "10", "19", "29", "31" ], "ids": [ 17640, 27652, 10679, 73572, 11024, 99536, 10258, 129, 128, 10150, 10270, 10386, 10413 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Z", "##hem", "##chu", "##zhi", "##na", "Soc", "##hi", "25", "8", "4", "13", "26", "38", "28" ], "ids": [ 163, 25947, 22882, 79728, 10219, 23104, 11924, 10258, 129, 125, 10249, 10314, 11171, 10348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ros", "##tse", "##lma", "##sh", "Rostov", "24", "7", "7", "10", "42", "38", "28" ], "ids": [ 109292, 45507, 23303, 13264, 91801, 10233, 128, 128, 10150, 11276, 11171, 10348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cher", "##nom", "##ore", "##ts", "Novo", "##ross", "##iis", "##k", "25", "7", "5", "13", "25", "38", "26" ], "ids": [ 35554, 13294, 13024, 10806, 28649, 105572, 54369, 10174, 10258, 128, 126, 10249, 10258, 11171, 10314 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ka", "##maz", "Na", "##bere", "##zh", "##nye", "Che", "##lny", "24", "5", "4", "15", "25", "42", "19" ], "ids": [ 25444, 39125, 10685, 102410, 15104, 66436, 44131, 27302, 10233, 126, 125, 10208, 10258, 11276, 10270 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "La", "##da", "To", "##glia", "##tti", "24", "4", "6", "14", "15", "37", "18" ], "ids": [ 10159, 10229, 11469, 27965, 12683, 10233, 125, 127, 10247, 10208, 11204, 10218 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tekst", "##ils", "##h", "##chi", "##k", "Ka", "##mys", "##hin", "25", "3", "9", "13", "15", "30", "18" ], "ids": [ 105227, 38308, 10237, 12806, 10174, 25444, 107297, 14383, 10258, 124, 130, 10249, 10208, 10244, 10218 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ural", "##mas", "##h", "Ye", "##kate", "##rin", "##burg", "24", "3", "8", "13", "24", "43", "16" ], "ids": [ 89256, 12922, 10237, 20567, 82574, 13778, 12248, 10233, 124, 129, 10249, 10233, 11370, 10250 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AU", "##ST", "##RA", "##L", "##IA", "##N", "R", "##UL", "##ES", "-", "AFL", "RE", "##SU", "##L", "##TS", "AND", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 29088, 32995, 29990, 11369, 35976, 11537, 155, 100673, 25054, 118, 61984, 71033, 88592, 11369, 36545, 52428, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##L", "##B", "##O", "##UR", "##NE", "1996", "-", "08", "-", "25" ], "ids": [ 47430, 11369, 11274, 11403, 98348, 93280, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Australian", "Rules" ], "ids": [ 33036, 10108, 12829, 37759 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "matches", "played", "at", "the", "weekend", "." ], "ids": [ 18258, 11553, 10160, 10105, 43440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "Sunday", ":" ], "ids": [ 17712, 10336, 19731, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Adelaide", "14", ".", "12", "(", "96", ")", "Coll", "##ing", "##wood", "24", "." ], "ids": [ 27228, 10247, 119, 10186, 113, 12308, 114, 65689, 10230, 14759, 10233, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "9", "(", "153", ")" ], "ids": [ 130, 113, 19032, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "West", "Coast", "24", "." ], "ids": [ 11164, 17498, 10233, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9 ] }, { "tokens": [ "7", "(", "151", ")", "Melbourne", "11", ".", "12", "(", "78", ")" ], "ids": [ 128, 113, 20330, 114, 17784, 10193, 119, 10186, 113, 12492, 114 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Richmond", "28", ".", "19", "(", "187", ")", "Fi", "##tz", "##roy", "5", "." ], "ids": [ 25451, 10348, 119, 10270, 113, 23228, 114, 36448, 13695, 29099, 126, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "6", "(", "36", ")" ], "ids": [ 127, 113, 11055, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "Saturday", ":" ], "ids": [ 17712, 10336, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Carlton", "13", ".", "18", "(", "96", ")", "Foot", "##sc", "##ray", "9", ".", "12", "(", "66", ")" ], "ids": [ 61678, 10249, 119, 10218, 113, 12308, 114, 47239, 31505, 23432, 130, 119, 10186, 113, 12215, 114 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essen", "##don", "14", ".", "16", "(", "100", ")", "Sydney", "12", ".", "10", "(", "82", ")" ], "ids": [ 34803, 15081, 10247, 119, 10250, 113, 10407, 114, 14470, 10186, 119, 10150, 113, 12180, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Ki", "##lda", "9", "." ], "ids": [ 10838, 28941, 23388, 130, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9 ] }, { "tokens": [ "9", "(", "63", ")", "Ha", "##w", "##th", "##orn", "12", "." ], "ids": [ 130, 113, 12256, 114, 13740, 10874, 11143, 26302, 10186, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "8", "(", "80", ")" ], "ids": [ 129, 113, 10832, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Brisbane", "10", ".", "11", "(", "71", ")", "Fr", "##eman", "##tle", "10", ".", "10", "(", "70", ")" ], "ids": [ 29493, 10150, 119, 10193, 113, 12513, 114, 33884, 31087, 16406, 10150, 119, 10150, 113, 10923, 114 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "Friday", ":" ], "ids": [ 17712, 10336, 30767, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "North", "Melbourne", "14", ".", "12", "(", "96", ")", "G", "##eel", "##ong", "16", ".", "13", "(", "109", ")" ], "ids": [ 11225, 17784, 10247, 119, 10186, 113, 12308, 114, 144, 22618, 13891, 10250, 119, 10249, 113, 16296, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "points" ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 12789 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "percentage", ",", "total", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 46971, 117, 11339, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brisbane", "21", "15", "1", "5", "212", "##3", "1631", "130", ".", "2", "62" ], "ids": [ 29493, 10296, 10208, 122, 126, 22023, 10884, 46342, 13389, 119, 123, 12066 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "21", "15", "1", "5", "206", "##7", "1687", "122", ".", "5", "62" ], "ids": [ 14470, 10296, 10208, 122, 126, 21717, 11305, 43047, 17484, 119, 126, 12066 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "West", "Coast", "21", "15", "0", "6", "215", "##1", "1673", "128", ".", "6", "60" ], "ids": [ 11164, 17498, 10296, 10208, 121, 127, 22050, 10759, 45292, 16196, 119, 127, 10709 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "North", "Melbourne", "21", "15", "0", "6", "238", "##5", "1873", "127", ".", "3", "60" ], "ids": [ 11225, 17784, 10296, 10208, 121, 127, 24388, 11166, 13789, 17592, 119, 124, 10709 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Carlton", "21", "14", "0", "7", "2009", "1844", "108", ".", "9", "56" ], "ids": [ 61678, 10296, 10247, 121, 128, 10195, 16047, 15845, 119, 130, 11628 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##eel", "##ong", "21", "13", "1", "7", "228", "##8", "1940", "117", ".", "9", "54" ], "ids": [ 144, 22618, 13891, 10296, 10249, 122, 128, 25646, 11396, 10888, 16628, 119, 130, 11653 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essen", "##don", "21", "13", "1", "7", "213", "##0", "1947", "109", ".", "4", "54" ], "ids": [ 34803, 15081, 10296, 10249, 122, 128, 22066, 10929, 11113, 16296, 119, 125, 11653 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Richmond", "21", "11", "0", "10", "217", "##3", "1803", "120", ".", "5", "44" ], "ids": [ 25451, 10296, 10193, 121, 10150, 21651, 10884, 18988, 12048, 119, 126, 11126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ha", "##w", "##th", "##orn", "21", "10", "1", "10", "1791", "1820", "98", ".", "4", "42" ], "ids": [ 13740, 10874, 11143, 26302, 10296, 10150, 122, 10150, 20361, 16776, 12327, 119, 125, 11276 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Ki", "##lda", "21", "9", "0", "12", "1909", "1958", "97", ".", "5", "36" ], "ids": [ 10838, 28941, 23388, 10296, 130, 121, 10186, 11944, 10947, 12328, 119, 126, 11055 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Coll", "##ing", "##wood", "21", "8", "0", "13", "210", "##3", "209", "##1", "100", ".", "6", "32" ], "ids": [ 65689, 10230, 14759, 10296, 129, 121, 10249, 17131, 10884, 23404, 10759, 10407, 119, 127, 10842 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Adelaide", "21", "8", "0", "13", "215", "##8", "218", "##3", "98", ".", "9", "32" ], "ids": [ 27228, 10296, 129, 121, 10249, 22050, 11396, 24599, 10884, 12327, 119, 130, 10842 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Melbourne", "21", "7", "0", "14", "1642", "236", "##1", "69", ".", "5", "28" ], "ids": [ 17784, 10296, 128, 121, 10247, 37248, 26318, 10759, 12573, 119, 126, 10348 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fr", "##eman", "##tle", "21", "6", "0", "15", "1673", "1912", "87", ".", "5", "24" ], "ids": [ 33884, 31087, 16406, 10296, 127, 121, 10208, 45292, 11507, 12581, 119, 126, 10233 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Foot", "##sc", "##ray", "21", "5", "1", "15", "1578", "206", "##0", "76", ".", "6", "22" ], "ids": [ 47239, 31505, 23432, 10296, 126, 122, 10208, 46261, 21717, 10929, 12428, 119, 127, 10306 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fi", "##tz", "##roy", "21", "1", "0", "20", "1381", "277", "##8", "49", ".", "7", "4" ], "ids": [ 36448, 13695, 29099, 10296, 122, 121, 10197, 89276, 28884, 11396, 11580, 119, 128, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "LE", "##AG", "##UE", "-", "AU", "##ST", "##RA", "##L", "##IA", "##N", "R", "##U", "##GB", "##Y", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 155, 12022, 32469, 14703, 84977, 109865, 62674, 118, 29088, 32995, 29990, 11369, 35976, 11537, 155, 12022, 32469, 14703, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "25" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Australian", "rugby", "league", "matches", "played", "at", "the", "weekend", "." ], "ids": [ 33036, 10108, 12829, 19812, 15616, 18258, 11553, 10160, 10105, 43440, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "Sunday", ":" ], "ids": [ 17712, 10336, 19731, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "Bulldogs", "17", "South", "Queensland", "16", "Brisbane", "38", "Gold", "Coast", "10" ], "ids": [ 14470, 108221, 10273, 11056, 20008, 10250, 29493, 11171, 14363, 17498, 10150 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 3, 9, 3, 7, 9 ] }, { "tokens": [ "North", "Sydney", "46", "South", "Sydney", "4" ], "ids": [ 11225, 14470, 11528, 11056, 14470, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Illa", "##war", "##ra", "42", "Pen", "##rit", "##h", "2" ], "ids": [ 76697, 29445, 10288, 11276, 52559, 16598, 10237, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "St", "George", "20", "North", "Queensland", "24" ], "ids": [ 10838, 10955, 10197, 11225, 20008, 10233 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Man", "##ly", "42", "Western", "Sub", "##ur", "##bs", "12" ], "ids": [ 11343, 10454, 11276, 13163, 24358, 10546, 19528, 10186 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Play", "##ed", "Saturday", ":" ], "ids": [ 17712, 10336, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Parra", "##matta", "14", "Sydney", "Tigers", "26" ], "ids": [ 95966, 93263, 10247, 14470, 38640, 10314 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Newcastle", "24", "Western", "Reds", "20" ], "ids": [ 28060, 10233, 13163, 74652, 10197 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Play", "##ed", "Friday", ":" ], "ids": [ 17712, 10336, 30767, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Canberra", "30", "Auckland", "6" ], "ids": [ 46452, 10244, 33920, 127 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Premier", "##ship", "standing", "##s", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", "," ], "ids": [ 14717, 21544, 32173, 10107, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "points", "for", ",", "against", ",", "total", "points", ")", ":" ], "ids": [ 14172, 117, 12789, 10142, 117, 11327, 117, 11339, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Man", "##ly", "21", "17", "0", "4", "501", "181", "34" ], "ids": [ 11343, 10454, 10296, 10273, 121, 125, 34067, 22534, 11069 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brisbane", "21", "16", "0", "5", "569", "257", "32" ], "ids": [ 29493, 10296, 10250, 121, 126, 53670, 26992, 10842 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "North", "Sydney", "21", "14", "2", "5", "560", "317", "30" ], "ids": [ 11225, 14470, 10296, 10247, 123, 126, 29524, 30986, 10244 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "City", "20", "14", "1", "5", "487", "293", "29" ], "ids": [ 14470, 10773, 10197, 10247, 122, 126, 49270, 30435, 10386 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##ron", "##ulla", "20", "12", "2", "6", "359", "258", "26" ], "ids": [ 140, 11620, 63486, 10197, 10186, 123, 127, 35403, 29226, 10314 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Canberra", "21", "12", "1", "8", "502", "374", "25" ], "ids": [ 46452, 10296, 10186, 122, 129, 44963, 38922, 10258 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "George", "21", "12", "1", "8", "421", "344", "25" ], "ids": [ 10838, 10955, 10296, 10186, 122, 129, 38648, 34107, 10258 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Newcastle", "21", "11", "1", "9", "416", "366", "23" ], "ids": [ 28060, 10296, 10193, 122, 130, 33833, 35612, 10328 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Western", "Sub", "##ur", "##bs", "21", "11", "1", "9", "382", "426", "23" ], "ids": [ 13163, 24358, 10546, 19528, 10296, 10193, 122, 130, 37309, 39645, 10328 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Auckland", "21", "11", "0", "10", "406", "389", "22" ], "ids": [ 33920, 10296, 10193, 121, 10150, 28081, 40064, 10306 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "Tigers", "21", "11", "0", "10", "309", "435", "22" ], "ids": [ 14470, 38640, 10296, 10193, 121, 10150, 30667, 36898, 10306 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Parra", "##matta", "21", "10", "1", "10", "388", "391", "21" ], "ids": [ 95966, 93263, 10296, 10150, 122, 10150, 38317, 40366, 10296 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "Bulldogs", "21", "10", "0", "11", "325", "356", "20" ], "ids": [ 14470, 108221, 10296, 10150, 121, 10193, 25843, 33303, 10197 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Illa", "##war", "##ra", "21", "8", "0", "13", "395", "432", "16" ], "ids": [ 76697, 29445, 10288, 10296, 129, 121, 10249, 30432, 36173, 10250 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Western", "Reds", "21", "6", "1", "14", "297", "398", "13" ], "ids": [ 13163, 74652, 10296, 127, 122, 10247, 29469, 43338, 10249 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pen", "##rit", "##h", "21", "6", "1", "14", "339", "448", "13" ], "ids": [ 52559, 16598, 10237, 10296, 127, 122, 10247, 34753, 38611, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "North", "Queensland", "21", "6", "0", "15", "266", "593", "12" ], "ids": [ 11225, 20008, 10296, 127, 121, 10208, 28477, 54619, 10186 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gold", "Coast", "21", "5", "1", "15", "351", "483", "11" ], "ids": [ 14363, 17498, 10296, 126, 122, 10208, 34487, 49863, 10193 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Sydney", "21", "5", "1", "15", "304", "586", "11" ], "ids": [ 11056, 14470, 10296, 126, 122, 10208, 26263, 53461, 10193 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Queensland", "21", "4", "0", "17", "210", "460", "8" ], "ids": [ 11056, 20008, 10296, 125, 121, 10273, 17131, 27296, 129 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##DM", "##IN", "##TO", "##N", "-", "MA", "##LA", "##YS", "##IA", "##N", "OP", "##EN", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 39999, 94138, 27128, 60493, 11537, 118, 27277, 44376, 93202, 35976, 11537, 55355, 50655, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##U", "##AL", "##A", "L", "##UM", "##P", "##UR", "1996", "-", "08", "-", "25" ], "ids": [ 148, 12022, 32002, 10738, 149, 72679, 11127, 98348, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "finals", "in", "the" ], "ids": [ 33036, 10108, 21758, 10106, 10105 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Malaysian", "Open", "badminton", "tournament", "on", "Sunday", "(", "pre", "##fix", "numbers" ], "ids": [ 72413, 11919, 109973, 17390, 10135, 19731, 113, 12229, 57014, 20953 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "den", "##ote", "seed", "##ings", ")", ":" ], "ids": [ 10140, 24831, 49282, 18800, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "On", "##g", "E", "##we", "Ho", "##ck", "(", "Malaysia", ")", "beat", "Indra", "Wi", "##jaya", "(", "Indonesia", ")", "1", "-", "15" ], "ids": [ 123, 118, 10576, 10240, 142, 12577, 20220, 11263, 113, 13625, 114, 27868, 102937, 52742, 58471, 113, 11658, 114, 122, 118, 10208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "1", "15", "-", "7" ], "ids": [ 10208, 118, 122, 10208, 118, 128 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "Zhang", "Ni", "##ng", "(", "China", ")", "beat", "1", "-", "Wang", "Chen", "(", "China", ")", "11", "-", "7", "11", "-", "8" ], "ids": [ 123, 118, 24551, 30409, 10376, 113, 11593, 114, 27868, 122, 118, 17250, 22177, 113, 11593, 114, 10193, 118, 128, 10193, 118, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "doubles" ], "ids": [ 13536, 112, 187, 46255 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "3", "/", "4", "-", "Marlene", "Thom", "##sen", "/", "Li", "##s", "##bet", "St", "##uer", "-", "Lauri", "##dsen", "(", "Denmark", ")", "beat" ], "ids": [ 124, 120, 125, 118, 90440, 93759, 10917, 120, 13258, 10107, 20125, 10838, 19047, 118, 94139, 82569, 113, 25854, 114, 27868 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "3", "/", "4", "-", "Qi", "##ang", "Hong", "/", "Liu", "Lu", "(", "China", ")", "10", "-", "15", "17", "-", "14", "17", "-", "16" ], "ids": [ 124, 120, 125, 118, 88454, 11889, 15078, 120, 23456, 23859, 113, 11593, 114, 10150, 118, 10208, 10273, 118, 10247, 10273, 118, 10250 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "doubles" ], "ids": [ 13026, 112, 187, 46255 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "Ya", "##p", "Kim", "Ho", "##ck", "/", "Che", "##ah", "Soon", "Kit", "(", "Malaysia", ")", "beat", "Lee", "Wan", "W", "##ah", "/", "Chong" ], "ids": [ 122, 118, 25148, 10410, 13539, 20220, 11263, 120, 44131, 12257, 40456, 45301, 113, 13625, 114, 27868, 12006, 47426, 160, 12257, 120, 105442 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 4 ] }, { "tokens": [ "Tan", "F", "##ook", "(", "Malaysia", ")", "15", "-", "5", "15", "-", "3" ], "ids": [ 30594, 143, 46921, 113, 13625, 114, 10208, 118, 126, 10208, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "RE", "##SU", "##L", "##TS", "OF", "S", ".", "KO", "##RE", "##AN", "PR", "##O", "-", "BA", "##SE", "##BA", "##LL", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 71033, 88592, 11369, 36545, 23240, 156, 119, 67422, 66014, 41275, 23837, 11403, 118, 39999, 39039, 35999, 82834, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "25" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "South", "Korean" ], "ids": [ 33036, 10108, 11056, 20501 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "pro", "-", "baseball", "games", "played", "on", "Saturday", "." ], "ids": [ 11284, 118, 22450, 13332, 11553, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hai", "##tai", "10", "Han", "##w", "##ha", "4" ], "ids": [ 26329, 26812, 10150, 10818, 10874, 10921, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Hyundai", "5", "Samsung", "4" ], "ids": [ 72344, 126, 37077, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "S", "##sang", "##bang", "##wo", "##ol", "4", "LG", "1" ], "ids": [ 156, 45952, 26337, 16828, 11481, 125, 49780, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "O", "##B", "1", "Lotte", "1" ], "ids": [ 152, 11274, 122, 102530, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "O" ], "entity_ids": [ 3, 7, 9, 4, 9 ] }, { "tokens": [ "Lotte", "1", "O", "##B", "0", "*" ], "ids": [ 102530, 122, 152, 11274, 121, 115 ], "entity": [ "B-PER", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 9, 3, 7, 9, 9 ] }, { "tokens": [ "*", "Note", "-", "O", "##B", "and", "Lotte", "played", "two", "games", "." ], "ids": [ 115, 20231, 118, 152, 11274, 10111, 102530, 11553, 10551, 13332, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "after", "games", "played", "on", "Saturday", "(", "won", ",", "drawn", ",", "lost", "," ], "ids": [ 58592, 10107, 10662, 13332, 11553, 10135, 24848, 113, 11367, 117, 34788, 117, 14172, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "winning", "percentage", ",", "games", "behind", "first", "place", ")" ], "ids": [ 16542, 46971, 117, 13332, 17155, 10422, 11192, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "D", "L", "PC", "##T", "GB" ], "ids": [ 160, 141, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hai", "##tai", "63", "2", "40", ".", "610", "-" ], "ids": [ 26329, 26812, 12256, 123, 10533, 119, 33427, 118 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##sang", "##bang", "##wo", "##ol", "57", "2", "47", ".", "547", "6", "1", "/", "2" ], "ids": [ 156, 45952, 26337, 16828, 11481, 11817, 123, 11413, 119, 53491, 127, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hyundai", "55", "5", "47", ".", "537", "7", "1", "/", "2" ], "ids": [ 72344, 11358, 126, 11413, 119, 49980, 128, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Han", "##w", "##ha", "55", "1", "48", ".", "534", "8" ], "ids": [ 10818, 10874, 10921, 11358, 122, 11300, 119, 43177, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Samsung", "47", "5", "54", ".", "467", "15" ], "ids": [ 37077, 11413, 126, 11653, 119, 47763, 10208 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lotte", "44", "6", "52", ".", "461", "15", "1", "/", "2" ], "ids": [ 102530, 11126, 127, 11525, 119, 45705, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LG", "44", "5", "57", ".", "439", "18" ], "ids": [ 49780, 11126, 126, 11817, 119, 43400, 10218 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##B", "40", "6", "60", ".", "406", "21", "1", "/", "2" ], "ids": [ 152, 11274, 10533, 127, 10709, 119, 28081, 10296, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "SU", "##ND", "##A", "##Y", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 86643, 58521, 10738, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "25" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Major", "League" ], "ids": [ 33036, 10108, 14988, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "Baseball", "games", "played", "on", "Sunday", "(", "home", "team", "in", "CA", "##PS", ")", ":" ], "ids": [ 27084, 13332, 11553, 10135, 19731, 113, 11816, 11121, 10106, 24707, 46983, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "League" ], "ids": [ 10536, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "8", "Seattle", "5" ], "ids": [ 139, 21793, 60493, 11537, 129, 20902, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "8", "Milwaukee", "5" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 129, 36413, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "California", "13", "BA", "##L", "##TI", "##M", "##OR", "##E", "0" ], "ids": [ 11621, 10249, 39999, 11369, 72286, 11517, 42622, 11259, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Oakland", "6", "NE", "##W", "Y", "##OR", "##K", "4" ], "ids": [ 38340, 127, 86607, 13034, 162, 42622, 11733, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "10", "Toronto", "9", "(", "10", ")" ], "ids": [ 39774, 30889, 109865, 11403, 10150, 15256, 130, 113, 10150, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Texas", "13", "MI", "##N", "##NE", "##S", "##OT", "##A", "2" ], "ids": [ 12466, 10249, 75416, 11537, 93280, 10731, 62146, 10738, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Detroit", "7", "KA", "##NS", "##AS", "C", "##IT", "##Y", "4" ], "ids": [ 19727, 128, 85314, 69196, 38025, 140, 37611, 14703, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "AF", "##TER", "SA", "##T", "##UR", "##DA", "##Y", "'", "S", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 55640, 99552, 21318, 11090, 98348, 36382, 14703, 112, 156, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "25" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "League", "Baseball" ], "ids": [ 14988, 11074, 27084 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "standing", "##s", "after", "games", "played", "on", "Saturday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 32173, 10107, 10662, 13332, 11553, 10135, 24848, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "winning", "percentage", "and", "games", "behind", ")", ":" ], "ids": [ 14172, 117, 16542, 46971, 10111, 13332, 17155, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ER", "##IC", "##AN", "LE", "##AG", "##UE" ], "ids": [ 24339, 24093, 30889, 41275, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "74", "54", ".", "578", "-" ], "ids": [ 86607, 13034, 162, 42622, 11733, 12535, 11653, 119, 58203, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "68", "60", ".", "531", "6" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 12370, 10709, 119, 49041, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "65", "65", ".", "500", "10" ], "ids": [ 139, 21793, 60493, 11537, 10843, 10843, 119, 10757, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "61", "69", ".", "469", "14" ], "ids": [ 58573, 35066, 77261, 11403, 12314, 12573, 119, 39731, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "46", "83", ".", "357", "28", "1", "/", "2" ], "ids": [ 25067, 11090, 35066, 37611, 11528, 12408, 119, 33590, 10348, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "76", "53", ".", "589", "-" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 12428, 11756, 119, 50384, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "69", "62", ".", "527", "8" ], "ids": [ 39774, 30889, 109865, 11403, 12573, 12066, 119, 43963, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "65", "64", ".", "504", "11" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 10843, 11295, 119, 43098, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "62", "68", ".", "477", "14", "1", "/", "2" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 12066, 12370, 119, 46621, 10247, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "59", "72", ".", "450", "18" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 11867, 12120, 119, 16718, 10218 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "74", "56", ".", "569", "-" ], "ids": [ 157, 11259, 12674, 38025, 12535, 11628, 119, 53670, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "66", "62", ".", "516", "7" ], "ids": [ 23056, 32071, 11090, 51036, 12215, 12066, 119, 50521, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "62", "70", ".", "470", "13" ], "ids": [ 152, 10738, 11733, 44376, 58521, 12066, 10923, 119, 29231, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "60", "69", ".", "465", "13", "1", "/", "2" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 10709, 12573, 119, 36307, 10249, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SU", "##ND", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "25", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 86643, 58521, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10258, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "AT", "B", "##OS", "##TO", "##N" ], "ids": [ 23056, 32071, 11090, 51036, 30554, 139, 21793, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "AT", "CL", "##E", "##VE", "##LA", "##ND" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 30554, 75151, 11259, 68560, 44376, 58521 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "AT", "BA", "##L", "##TI", "##M", "##OR", "##E" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 30554, 39999, 11369, 72286, 11517, 42622, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "AT", "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 152, 10738, 11733, 44376, 58521, 30554, 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "AT", "CH", "##IC", "##AG", "##O" ], "ids": [ 58573, 35066, 77261, 11403, 30554, 39774, 30889, 109865, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "AT", "MI", "##N", "##NE", "##S", "##OT", "##A" ], "ids": [ 157, 11259, 12674, 38025, 30554, 75416, 11537, 93280, 10731, 62146, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "AT", "KA", "##NS", "##AS", "C", "##IT", "##Y" ], "ids": [ 25067, 11090, 35066, 37611, 30554, 85314, 69196, 38025, 140, 37611, 14703 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "NA", "##TION", "##AL", "LE", "##AG", "##UE" ], "ids": [ 56586, 98207, 32002, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "81", "47", ".", "633", "-" ], "ids": [ 30554, 44376, 77261, 10738, 12324, 11413, 119, 58616, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "70", "58", ".", "547", "11" ], "ids": [ 102059, 77261, 66014, 32002, 10923, 11824, 119, 53491, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "60", "70", ".", "462", "22" ], "ids": [ 83243, 42622, 28895, 10738, 10709, 10923, 119, 44574, 10306 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "59", "71", ".", "454", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 11867, 12513, 119, 44233, 10328 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "53", "77", ".", "408", "29" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 11756, 12527, 119, 36899, 10386 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "69", "61", ".", "531", "-" ], "ids": [ 145, 11403, 32612, 60493, 11537, 12573, 12314, 119, 49041, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "68", "61", ".", "527", "1", "/", "2" ], "ids": [ 53317, 149, 11403, 83259, 10731, 12370, 12314, 119, 43963, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "64", "64", ".", "500", "4" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 11295, 11295, 119, 10757, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "63", "64", ".", "496", "4", "1", "/", "2" ], "ids": [ 39774, 30889, 109865, 11403, 12256, 11295, 119, 42498, 125, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "55", "74", ".", "426", "13", "1", "/", "2" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 11358, 12535, 119, 39645, 10249, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "71", "60", ".", "542", "-" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 12513, 10709, 119, 51620, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "69", "60", ".", "535", "1" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 12573, 10709, 119, 45269, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "67", "63", ".", "515", "3", "1", "/", "2" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 12316, 12256, 119, 41211, 124, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "54", "73", ".", "425", "15" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 11653, 12545, 119, 33437, 10208 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SU", "##ND", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "25", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 86643, 58521, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10258, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "AT", "AT", "##LA", "##NT", "##A" ], "ids": [ 39774, 30889, 109865, 11403, 30554, 30554, 44376, 77261, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "AT", "CO", "##L", "##OR", "##AD", "##O" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 30554, 32992, 11369, 42622, 55538, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "AT", "L", "##OS", "AN", "##GE", "##LE", "##S" ], "ids": [ 86607, 13034, 162, 42622, 11733, 30554, 149, 21793, 50972, 58719, 51036, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "AT", "SA", "##N", "DI", "##EG", "##O" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 30554, 21318, 11537, 110014, 104036, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "AT", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O" ], "ids": [ 102059, 77261, 66014, 32002, 30554, 21318, 11537, 64655, 41275, 89955, 36175, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "AT", "FL", "##OR", "##ID", "##A" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 30554, 83243, 42622, 28895, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "AT", "H", "##O", "##US", "##TO", "##N" ], "ids": [ 53317, 149, 11403, 83259, 10731, 30554, 145, 11403, 32612, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "OR", "##IO", "##LE", "##S", "SN", "##EA", "##K", "PA", "##ST", "AN", "##GE", "##LS", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 69308, 37174, 51036, 10731, 62342, 36789, 11733, 32349, 32995, 50972, 58719, 66934, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "1996", "-", "08", "-", "25" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rafael", "Palm", "##eiro", "'", "s", "two", "-", "out", "single", "in", "the", "sixth", "inning", "scored", "Roberto", "Al", "##oma", "##r", "with", "the", "go", "-", "ahead", "run", "as", "the", "Baltimore", "Or", "##iol", "##es", "ra", "##lli", "##ed", "past", "the", "California", "Angels", "5", "-", "4", "and", "took", "over", "the", "American", "League", "'", "s", "wild", "-", "card", "be", "##rth", "on", "Saturday", "." ], "ids": [ 17673, 35158, 25868, 112, 187, 10551, 118, 10950, 11376, 10106, 10105, 28913, 110505, 17233, 14948, 10883, 17039, 10129, 10169, 10105, 11783, 118, 35629, 14095, 10146, 10105, 21413, 19372, 35493, 10171, 11859, 14088, 10336, 17781, 10105, 11621, 28132, 126, 118, 125, 10111, 12149, 10491, 10105, 10536, 11074, 112, 187, 32290, 118, 23050, 10347, 32510, 10135, 24848, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Or", "##iol", "##es", "trail", "##ed", "4", "-", "3", "when", "pin", "##ch", "-", "hit", "##ter", "Mike", "Dev", "##erea", "##ux", "led", "off", "the", "sixth", "with", "a", "triple", "against", "relieve", "##r", "Kyle", "Abbott", "(", "0", "-", "1", ")", "and", "scored", "the", "ty", "##ing", "run", "on", "Al", "##oma", "##r", "'", "s", "single", "." ], "ids": [ 10117, 19372, 35493, 10171, 56559, 10336, 125, 118, 124, 10841, 59227, 10269, 118, 14946, 10877, 13270, 89586, 54386, 11855, 12857, 11898, 10105, 28913, 10169, 169, 40159, 11327, 85440, 10129, 31462, 55033, 113, 121, 118, 122, 114, 10111, 17233, 10105, 26864, 10230, 14095, 10135, 10883, 17039, 10129, 112, 187, 11376, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "After", "Brady", "Anderson", "sacrifice", "##d", ",", "Palm", "##eiro", "hit", "the", "first", "pitch", "into", "right", "field", "for", "a", "single", ",", "scoring", "Al", "##oma", "##r", "." ], "ids": [ 11301, 45982, 15007, 81063, 10162, 117, 35158, 25868, 14946, 10105, 10422, 50892, 10708, 13448, 13939, 10142, 169, 11376, 117, 27346, 10883, 17039, 10129, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "In", "Boston", ",", "former", "Marine", "##r", "Darren", "Br", "##agg", "'", "s", "first", "career", "grand", "sl", "##am", "in", "the", "sixth", "inning", "off", "relieve", "##r", "Randy", "Johnson", "lift", "##ed", "the", "Boston", "Red", "Sox", "to", "their", "fifth", "win", "in", "six", "games", ",", "a", "9", "-", "5", "victory", "over", "Seattle", "." ], "ids": [ 10167, 13683, 117, 11775, 12425, 10129, 53337, 38508, 99274, 112, 187, 10422, 13021, 13023, 38523, 11008, 10106, 10105, 28913, 110505, 11898, 85440, 10129, 29769, 13241, 63376, 10336, 10105, 13683, 11641, 55687, 10114, 10455, 22237, 14125, 10106, 12449, 13332, 117, 169, 130, 118, 126, 19735, 10491, 20902, 119 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "Just", "one", "of", "those", "things", ",", "I", "was", "just", "trying", "to", "make", "contact", ",", "\"", "said", "Br", "##agg", ".", "\"" ], "ids": [ 107, 17116, 10464, 10108, 12676, 24682, 117, 146, 10134, 12820, 32862, 10114, 13086, 20637, 117, 107, 12415, 38508, 99274, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "The", "bases", "were", "loaded", "and", "I", "had", "two", "strikes", "." ], "ids": [ 10117, 23213, 10309, 103927, 10111, 146, 10374, 10551, 86206, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "was", "just", "trying", "to", "put", "the", "ball", "in", "play", "." ], "ids": [ 146, 10134, 12820, 32862, 10114, 14499, 10105, 20724, 10106, 12253, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "got", "the", "good", "part", "of", "the", "bat", "on", "it", "and", "it", "carried", "out", ".", "\"" ], "ids": [ 146, 19556, 10105, 15198, 10668, 10108, 10105, 11519, 10135, 10271, 10111, 10271, 21086, 10950, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Cleveland", ",", "Kevin", "Seitz", "##er", "'", "s", "two", "-", "out", "single", "in", "the", "top", "of", "the", "10th", "brought", "home", "David", "Hu", "##lse", "with", "the", "winning", "run", "as", "the", "Milwaukee", "Brewer", "##s", "sent", "the", "Cleveland", "Indians", "to", "their", "third", "straight", "extra", "-", "inning", "defeat", "4", "-", "3", "." ], "ids": [ 10167, 21342, 117, 15377, 70903, 10165, 112, 187, 10551, 118, 10950, 11376, 10106, 10105, 12364, 10108, 10105, 31004, 17327, 11816, 10804, 43707, 14433, 10169, 10105, 16542, 14095, 10146, 10105, 36413, 109040, 10107, 14541, 10105, 21342, 33032, 10114, 10455, 12628, 31214, 19868, 118, 110505, 24800, 125, 118, 124, 119 ], "entity": [ "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bob", "Wi", "##ckman", "(", "5", "-", "1", ")", ",", "acquired", "from", "the", "New", "York", "Yankees", "on", "Friday", ",", "earned", "the", "win", "in", "his", "Milwaukee", "debut", "despite", "allowing", "the", "ty", "##ing", "run", "in", "the", "eighth", "inning", "." ], "ids": [ 13583, 52742, 79391, 113, 126, 118, 122, 114, 117, 21011, 10188, 10105, 10287, 10482, 60799, 10135, 30767, 117, 21293, 10105, 14125, 10106, 10226, 36413, 13424, 22087, 28357, 10105, 26864, 10230, 14095, 10106, 10105, 46758, 110505, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Minnesota", ",", "Marty", "Cor", "##dova", "and", "Matt", "Law", "##ton", "hit", "solo", "home", "##rs", "and", "Frankie", "Rodriguez", "allowed", "six", "hits", "over", "seven", "innings", "to", "earn", "his", "first", "win", "as", "a", "starter", "in", "a", "month", "as", "the", "Minnesota", "Twins", "held", "on", "to", "beat", "the", "Texas", "Rangers", "6", "-", "5", "." ], "ids": [ 11699, 16306, 117, 47730, 93495, 64927, 10111, 16975, 13216, 11183, 14946, 11395, 11816, 10943, 10111, 51059, 41778, 18162, 12449, 27922, 10491, 15767, 48974, 10114, 65065, 10226, 10422, 14125, 10146, 169, 59099, 10106, 169, 14064, 10146, 10105, 16306, 68084, 11991, 10135, 10114, 27868, 10105, 12466, 23042, 127, 118, 126, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Yeah", ",", "you", "know", "it", "'", "s", "fun", ",", "it", "'", "s", "always", "fun", "when", "you", "'", "ve", "got", "a", "chance", "to", "go", "to", "the", "ball", "##park", "and", "win", "a", "game", "that", "'", "s", "important", ",", "\"", "said", "Rodriguez", ".", "\"" ], "ids": [ 107, 103014, 117, 13028, 21852, 10271, 112, 187, 41807, 117, 10271, 112, 187, 19540, 41807, 10841, 13028, 112, 10323, 19556, 169, 27893, 10114, 11783, 10114, 10105, 20724, 23938, 10111, 14125, 169, 11661, 10189, 112, 187, 12452, 117, 107, 12415, 41778, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "Every", "game", "should", "be", "important", ",", "but", "it", "'", "s", "a", "little", "more", "important", "now", ".", "\"" ], "ids": [ 30929, 11661, 14819, 10347, 12452, 117, 10473, 10271, 112, 187, 169, 16745, 10798, 12452, 11858, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "New", "York", ",", "Wally", "White", "##hurst", "allowed", "two", "runs", "over", "seven", "innings", "for", "his", "first", "win", "in", "more", "than", "two", "years", "and", "Paul", "O", "'", "Neill", "'", "s", "three", "-", "run", "double", "sna", "##pped", "a", "sixth", "-", "inning", "tie", "as", "the", "New", "York", "Yankees", "held", "on", "for", "a", "5", "-", "4", "victory", "over", "the", "Oakland", "Athletics", "." ], "ids": [ 10167, 10287, 10482, 117, 76701, 12136, 68091, 18162, 10551, 17913, 10491, 15767, 48974, 10142, 10226, 10422, 14125, 10106, 10798, 11084, 10551, 10855, 10111, 10772, 152, 112, 38269, 112, 187, 11003, 118, 14095, 15790, 62541, 44357, 169, 28913, 118, 110505, 27916, 10146, 10105, 10287, 10482, 60799, 11991, 10135, 10142, 169, 126, 118, 125, 19735, 10491, 10105, 38340, 46800, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "White", "##hurst", ",", "promoted", "from", "Triple", "-", "A", "Columbus", "on", "Wednesday", ",", "allowed", "seven", "hits", "and", "struck", "out", "one", "without", "a", "walk", "." ], "ids": [ 12136, 68091, 117, 22312, 10188, 30248, 118, 138, 30290, 10135, 57611, 117, 18162, 15767, 27922, 10111, 45622, 10950, 10464, 13663, 169, 33734, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "his", "first", "win", "since", "defeating", "the", "St", ".", "Louis", "Cardinals", "on", "May", "28", "##th", ",", "1994", "when", "he", "was", "with", "the", "San", "Diego", "Padre", "##s", "." ], "ids": [ 10377, 10134, 10226, 10422, 14125, 11764, 42385, 10105, 10838, 119, 11334, 57877, 10135, 10725, 10348, 11143, 117, 10444, 10841, 10261, 10134, 10169, 10105, 10469, 14665, 34958, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "In", "Kansas", "City", ",", "Jose", "Rosa", "##do", "came", "within", "one", "out", "of", "his", "third", "complete", "game", "and", "Michael", "Tucker", "home", "##red", "and", "drove", "in", "three", "runs", "as", "the", "Kansas", "City", "Royals", "broke", "a", "six", "-", "game", "losing", "streak", "with", "a", "9", "-", "2", "victory", "over", "the", "Detroit", "Tigers", "in", "a", "battle", "of", "cell", "##ar", "-", "d", "##well", "##ers", "." ], "ids": [ 10167, 16735, 10773, 117, 23029, 16670, 10317, 13383, 12381, 10464, 10950, 10108, 10226, 12628, 17876, 11661, 10111, 10631, 40518, 11816, 15711, 10111, 72256, 10106, 11003, 17913, 10146, 10105, 16735, 10773, 97906, 30500, 169, 12449, 118, 11661, 27817, 88302, 10169, 169, 130, 118, 123, 19735, 10491, 10105, 19727, 38640, 10106, 169, 18758, 10108, 20748, 10354, 118, 172, 15862, 10901, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rosa", "##do", "(", "5", "-", "3", ")", "allowed", "two", "runs", "-", "-", "one", "earned", "-", "-", "and", "seven", "hits", "over", "8", "-", "2", "/", "3", "innings", "with", "three", "walks", "and", "six", "strike", "##outs", "." ], "ids": [ 16670, 10317, 113, 126, 118, 124, 114, 18162, 10551, 17913, 118, 118, 10464, 21293, 118, 118, 10111, 15767, 27922, 10491, 129, 118, 123, 120, 124, 48974, 10169, 11003, 106216, 10111, 12449, 37456, 72199, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "his", "last", "four", "starts", ",", "the", "21", "-", "year", "-", "old", "left", "-", "hand", "##er", "has", "given", "up", "only", "four", "earned", "runs", "in", "29", "-", "2", "/", "3", "innings", "." ], "ids": [ 10167, 10226, 12469, 11598, 33039, 117, 10105, 10296, 118, 10924, 118, 12898, 12153, 118, 15230, 10165, 10393, 13507, 10741, 10893, 11598, 21293, 17913, 10106, 10386, 118, 123, 120, 124, 48974, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "BR", "##AV", "##ES", "RA", "##LL", "##Y", "TO", "BE", "##AT", "C", "##UB", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 49351, 99903, 25054, 64007, 82834, 14703, 58573, 46291, 32071, 140, 82439, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "1996", "-", "08", "-", "25" ], "ids": [ 30554, 44376, 77261, 10738, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fred", "M", "##c", "##G", "##riff", "went", "5", "-", "for", "-", "5", "and", "home", "##red", "twice", ",", "including", "a", "three", "-", "run", "bl", "##ast", "with", "two", "out", "in", "the", "bottom", "of", "the", "ninth", "inning", "that", "lift", "##ed", "the", "Atlanta", "Braves", "to", "a", "6", "-", "5", "victory", "over", "the", "Chicago", "Cubs", "on", "Saturday", "." ], "ids": [ 16887, 150, 10350, 11447, 40738, 13446, 126, 118, 10142, 118, 126, 10111, 11816, 15711, 26261, 117, 11198, 169, 11003, 118, 14095, 21484, 15171, 10169, 10551, 10950, 10106, 10105, 34787, 10108, 10105, 54905, 110505, 10189, 63376, 10336, 10105, 19600, 97242, 10114, 169, 127, 118, 126, 19735, 10491, 10105, 12317, 97605, 10135, 24848, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "was", "just", "trying", "to", "hang", "in", "there", "and", "hit", "it", "up", "the", "middle", ",", "\"", "said", "M", "##c", "##G", "##riff", "about", "his", "home", "##r", "in", "the", "ninth", ".", "\"" ], "ids": [ 107, 146, 10134, 12820, 32862, 10114, 60083, 10106, 11155, 10111, 14946, 10271, 10741, 10105, 20181, 117, 107, 12415, 150, 10350, 11447, 40738, 10978, 10226, 11816, 10129, 10106, 10105, 54905, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "was", "just", "looking", "for", "the", "ball", ",", "trying", "to", "stay", "on", "it", "." ], "ids": [ 146, 10134, 12820, 34279, 10142, 10105, 20724, 117, 32862, 10114, 29597, 10135, 10271, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brad", "Cl", "##ont", "##z", "(", "6", "-", "2", ")", "picked", "up", "the", "win", "in", "relief", "for", "Atlanta", ",", "which", "has", "won", "11", "of", "its", "last", "13", "games", "." ], "ids": [ 29382, 101989, 18999, 10305, 113, 127, 118, 123, 114, 52289, 10741, 10105, 14125, 10106, 31276, 10142, 19600, 117, 10319, 10393, 11367, 10193, 10108, 10474, 12469, 10249, 13332, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Colorado", ",", "Mark", "Thompson", "threw", "an", "eight", "-", "hit", "##ter", "for", "his", "third", "complete", "game", "and", "Ellis", "Bu", "##rks", "home", "##red", "and", "drove", "in", "three", "runs", "as", "the", "Colorado", "Rock", "##ies", "beat", "the", "Pittsburgh", "Pirates", "9", "-", "3", "." ], "ids": [ 10167, 17111, 117, 11997, 13288, 80516, 10151, 16222, 118, 14946, 10877, 10142, 10226, 12628, 17876, 11661, 10111, 27899, 11916, 76982, 11816, 15711, 10111, 72256, 10106, 11003, 17913, 10146, 10105, 17111, 12158, 11624, 27868, 10105, 23812, 41839, 130, 118, 124, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Vi", "##nny", "Castilla", "and", "Dante", "Bi", "##chet", "##te", "each", "added", "two", "RB", "##I", "for", "Colorado", ",", "which", "improved", "the", "major", "league", "'", "s", "best", "home", "mark", "to", "44", "-", "20", "." ], "ids": [ 31826, 58916, 25570, 10111, 29566, 31156, 42298, 10216, 11948, 16288, 10551, 71201, 11281, 10142, 17111, 117, 10319, 34605, 10105, 11922, 15616, 112, 187, 12504, 11816, 29221, 10114, 11126, 118, 10197, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 2, 6, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Florida", ",", "Kevin", "Brown", "scattered", "seven", "hits", "over", "eight", "innings", "and", "Kurt", "Abbott", "sna", "##pped", "a", "sixth", "-", "inning", "tie", "with", "a", "two", "-", "run", "double", "as", "the", "Florida", "Mar", "##lins", "defeated", "the", "tire", "##d", "Cincinnati", "Reds", "5", "-", "3", "." ], "ids": [ 11699, 13668, 117, 15377, 12623, 95335, 15767, 27922, 10491, 16222, 48974, 10111, 18190, 55033, 62541, 44357, 169, 28913, 118, 110505, 27916, 10169, 169, 10551, 118, 14095, 15790, 10146, 10105, 13668, 15734, 68541, 18058, 10105, 71841, 10162, 31257, 74652, 126, 118, 124, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Mar", "##lins", "won", "for", "just", "the", "third", "time", "in", "nine", "games", ",", "taking", "advantage", "of", "a", "Reds", "'", "team", "that", "has", "not", "had", "a", "day", "off", "since", "August", "8th", "and", "was", "playing", "its", "fourth", "game", "in", "43", "hours", "." ], "ids": [ 10117, 15734, 68541, 11367, 10142, 12820, 10105, 12628, 10635, 10106, 19964, 13332, 117, 18084, 38119, 10108, 169, 74652, 112, 11121, 10189, 10393, 10472, 10374, 169, 11940, 11898, 11764, 10735, 32074, 10111, 10134, 14879, 10474, 16918, 11661, 10106, 11370, 19573, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Los", "Angeles", ",", "Tom", "Can", "##dio", "##tti", "allowed", "two", "runs", "in", "seven", "innings", "and", "single", "##d", "home", "the", "go", "-", "ahead", "run", "and", "Mike", "Piazza", "and", "Todd", "Holland", "##sworth", "drove", "in", "two", "runs", "apie", "##ce", "as", "the", "Los", "Angeles", "Dodgers", "defeated", "the", "New", "York", "Mets", "7", "-", "5", "." ], "ids": [ 10167, 10630, 12233, 117, 12275, 14820, 16994, 12683, 18162, 10551, 17913, 10106, 15767, 48974, 10111, 11376, 10162, 11816, 10105, 11783, 118, 35629, 14095, 10111, 13270, 39214, 10111, 24708, 18272, 64621, 72256, 10106, 10551, 17913, 20456, 10419, 10146, 10105, 10630, 12233, 82958, 18058, 10105, 10287, 10482, 90707, 128, 118, 126, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Can", "##dio", "##tti", "(", "8", "-", "9", ")", "walk", "##ed", "one", ",", "allowed", "five", "hits", "and", "struck", "out", "a", "season", "-", "high", "eight", "bat", "##ters", "for", "Los", "Angeles", ",", "which", "has", "won", "10", "of", "its", "last", "14", "games", "." ], "ids": [ 14820, 16994, 12683, 113, 129, 118, 130, 114, 33734, 10336, 10464, 117, 18162, 12403, 27922, 10111, 45622, 10950, 169, 11226, 118, 11846, 16222, 11519, 21891, 10142, 10630, 12233, 117, 10319, 10393, 11367, 10150, 10108, 10474, 12469, 10247, 13332, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "San", "Diego", ",", "Joey", "Hamilton", "allowed", "two", "hits", "over", "seven", "innings", "and", "Rick", "##ey", "Henderson", "hit", "his", "major", "league", "-", "record", "69", "##th", "lead", "##off", "home", "##r", "as", "the", "San", "Diego", "Padre", "##s", "defeated", "the", "Philadelphia", "Phil", "##lies", "7", "-", "1", "for", "their", "fifth", "win", "in", "six", "games", "." ], "ids": [ 10167, 10469, 14665, 117, 33684, 15846, 18162, 10551, 27922, 10491, 15767, 48974, 10111, 20093, 13005, 30018, 14946, 10226, 11922, 15616, 118, 12410, 12573, 11143, 14107, 20584, 11816, 10129, 10146, 10105, 10469, 14665, 34958, 10107, 18058, 10105, 15979, 18144, 22201, 128, 118, 122, 10142, 10455, 22237, 14125, 10106, 12449, 13332, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hamilton", "(", "12", "-", "7", ")", "won", "his", "second", "straight", "start", ",", "allowing", "just", "a", "sixth", "-", "inning", "run", "and", "a", "pair", "of", "singles", "." ], "ids": [ 15846, 113, 10186, 118, 128, 114, 11367, 10226, 11132, 31214, 15148, 117, 28357, 12820, 169, 28913, 118, 110505, 14095, 10111, 169, 27643, 10108, 20527, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "San", "Francisco", ",", "Pedro", "Martinez", "allowed", "two", "hits", "in", "eight", "innings", "and", "David", "Se", "##gui", "drove", "in", "two", "runs", "as", "the", "Montreal", "Expo", "##s", "shut", "out", "the", "San", "Francisco", "Giants", "3", "-", "0", "for", "their", "third", "straight", "win", "." ], "ids": [ 10167, 10469, 11798, 117, 12849, 50203, 18162, 10551, 27922, 10106, 16222, 48974, 10111, 10804, 11045, 55818, 72256, 10106, 10551, 17913, 10146, 10105, 20990, 52947, 10107, 70323, 10950, 10105, 10469, 11798, 36658, 124, 118, 121, 10142, 10455, 12628, 31214, 14125, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martinez", "(", "11", "-", "7", ")", ",", "who", "lasted", "just", "1", "-", "1", "/", "3", "innings", "in", "his", "last", "start", "against", "San", "Diego", "five", "days", "ago", ",", "pitched", "eight", "-", "plus", "innings", ",", "walking", "four", "and", "striking", "out", "10", "." ], "ids": [ 50203, 113, 10193, 118, 128, 114, 117, 10479, 47547, 12820, 122, 118, 122, 120, 124, 48974, 10106, 10226, 12469, 15148, 11327, 10469, 14665, 12403, 13990, 36390, 117, 80525, 16222, 118, 10563, 48974, 117, 59381, 11598, 10111, 87894, 10950, 10150, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Houston", ",", "Orlando", "Miller", "'", "s", "two", "-", "run", "home", "##r", "with", "one", "out", "in", "the", "bottom", "of", "the", "ninth", "off", "Todd", "St", "##ott", "##lem", "##yre", "gave", "the", "Houston", "Astro", "##s", "a", "3", "-", "1", "win", "over", "the", "St", ".", "Louis", "Cardinals", "and", "left", "the", "teams", "in", "a", "virtual", "tie", "for", "the", "lead", "in", "the", "NL", "Central", "division", "." ], "ids": [ 10167, 18551, 117, 25978, 14615, 112, 187, 10551, 118, 14095, 11816, 10129, 10169, 10464, 10950, 10106, 10105, 34787, 10108, 10105, 54905, 11898, 24708, 10838, 15434, 19343, 31993, 15362, 10105, 18551, 87075, 10107, 169, 124, 118, 122, 14125, 10491, 10105, 10838, 119, 11334, 57877, 10111, 12153, 10105, 14404, 10106, 169, 37859, 27916, 10142, 10105, 14107, 10106, 10105, 81130, 11885, 13751, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "Shane", "Reynolds", "(", "16", "-", "6", ")", "fired", "a", "five", "-", "hit", "##ter", ",", "walking", "one", "and", "striking", "out", "six", "." ], "ids": [ 40429, 30130, 113, 10250, 118, 127, 114, 38903, 169, 12403, 118, 14946, 10877, 117, 59381, 10464, 10111, 87894, 10950, 12449, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "SA", "##T", "##UR", "##DA", "##Y", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 21318, 11090, 98348, 36382, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "25" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Major", "League" ], "ids": [ 33036, 10108, 14988, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "Baseball", "games", "played", "on", "Saturday", "(", "home", "team", "in", "CA", "##PS", ")", ":" ], "ids": [ 27084, 13332, 11553, 10135, 24848, 113, 11816, 11121, 10106, 24707, 46983, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "National", "League" ], "ids": [ 10655, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "6", "Chicago", "5" ], "ids": [ 30554, 44376, 77261, 10738, 127, 12317, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "3", "St", "Louis", "1" ], "ids": [ 145, 11403, 32612, 60493, 11537, 124, 10838, 11334, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "7", "New", "York", "5" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 128, 10287, 10482, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Montreal", "3", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "0" ], "ids": [ 20990, 124, 21318, 11537, 64655, 41275, 89955, 36175, 11403, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "5", "Cincinnati", "3" ], "ids": [ 83243, 42622, 28895, 10738, 126, 31257, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "9", "Pittsburgh", "3" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 130, 23812, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "7", "Philadelphia", "1" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 128, 15979, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "American", "League" ], "ids": [ 10536, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "9", "Seattle", "5" ], "ids": [ 139, 21793, 60493, 11537, 130, 20902, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Milwaukee", "4", "CL", "##E", "##VE", "##LA", "##ND", "3", "(", "10", "innings", ")" ], "ids": [ 36413, 125, 75151, 11259, 68560, 44376, 58521, 124, 113, 10150, 48974, 114 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "5", "California", "4" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 126, 11621, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Toronto", "9", "CH", "##IC", "##AG", "##O", "2" ], "ids": [ 15256, 130, 39774, 30889, 109865, 11403, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "5", "Oakland", "4" ], "ids": [ 86607, 13034, 162, 42622, 11733, 126, 38340, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "9", "Detroit", "2" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 130, 19727, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "6", "Texas", "5" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 127, 12466, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "CH", "##AM", "##P", "##ION", "##S", "P", "##OR", "##TO", "K", "##IC", "##K", "OF", "##F", "SE", "##AS", "##ON", "W", "##IT", "##H", "A", "DR", "##A", "##W", "." ], "ids": [ 71020, 65622, 24093, 118, 39774, 36535, 11127, 52980, 10731, 153, 42622, 60493, 148, 30889, 11733, 23240, 11565, 23056, 38025, 30118, 160, 37611, 12396, 138, 45457, 10738, 13034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##B", "##ON", "1996", "-", "08", "-", "25" ], "ids": [ 149, 19088, 11274, 30118, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portuguese", "champions", "Porto", "kick", "##ed", "off", "the", "season", "with", "a", "disa", "##ppo", "##inti", "##ng", "2", "-", "2", "home", "draw", "against", "Set", "##uba", "##l", "and", "were", "lu", "##cky", "to", "sq", "##ue", "##eze", "in", "an", "equal", "##iser", "in", "extra", "time", "." ], "ids": [ 25550, 27745, 16408, 55321, 10336, 11898, 10105, 11226, 10169, 169, 36474, 45565, 49886, 10376, 123, 118, 123, 11816, 25974, 11327, 14245, 39393, 10161, 10111, 10309, 14657, 30742, 10114, 27164, 12772, 41641, 10106, 10151, 32943, 25004, 10106, 19868, 10635, 119 ], "entity": [ "B-MISC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Porto", ",", "who", "are", "fighting", "to", "take", "their", "third", "consecutive", "title", "this", "season", ",", "were", "2", "-", "0", "down", "until", "the", "86", "##th", "minute", "when", "a", "head", "##er", "by", "Mario", "Jar", "##del", "found", "the", "net", "after", "a", "string", "of", "missed", "opportunities", ",", "including", "a", "penalty", "taken", "by", "top", "league", "scorer", "Domingo", "##s", "Oliveira", "in", "the", "60", "##th", "minute", "." ], "ids": [ 16408, 117, 10479, 10301, 27535, 10114, 13574, 10455, 12628, 29864, 12887, 10531, 11226, 117, 10309, 123, 118, 121, 12935, 11444, 10105, 12224, 11143, 21760, 10841, 169, 13578, 10165, 10155, 14011, 91531, 14494, 11823, 10105, 11988, 10662, 169, 33714, 10108, 55233, 49337, 117, 11198, 169, 40924, 15109, 10155, 12364, 15616, 99782, 22173, 10107, 33748, 10106, 10105, 10709, 11143, 21760, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Domingo", "##s", "rede", "##eme", "##d", "himself", "by", "net", "##ting", "the", "equal", "##iser", "just", "into", "extra", "time", "." ], "ids": [ 22173, 10107, 30940, 36947, 10162, 14764, 10155, 11988, 12141, 10105, 32943, 25004, 12820, 10708, 19868, 10635, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Set", "##uba", "##l", ",", "who", "put", "on", "a", "ski", "##lf", "##ul", "counter", "-", "attack", "throughout", "the", "game", ",", "opened", "the", "scoring", "16", "minutes", "into", "the", "match", "when", "an", "un", "##marked", "Chi", "##quin", "##ho", "Conde", "shot", "around", "Porto", "'", "s", "new", "Polish", "keep", "##er", "Andrej", "##ez", "Wo", "##zni", "##ak", "." ], "ids": [ 14245, 39393, 10161, 117, 10479, 14499, 10135, 169, 40122, 35173, 10604, 46298, 118, 16342, 15916, 10105, 11661, 117, 14377, 10105, 27346, 10250, 15304, 10708, 10105, 12356, 10841, 10151, 10119, 88425, 21946, 35336, 10758, 35061, 19508, 12166, 16408, 112, 187, 10751, 19870, 23819, 10165, 51975, 12715, 102204, 23613, 10710, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 3, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Conde", "scored", "his", "second", "in", "the", "70", "##th", "minute", "." ], "ids": [ 35061, 17233, 10226, 11132, 10106, 10105, 10923, 11143, 21760, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Benfica", ",", "also", "playing", "their", "first", "game", "of", "the", "season", "at", "home", ",", "were", "held", "to", "a", "1", "-", "1", "draw", "by", "northern", "side", "Braga", "despite", "the", "fact", "that", "the", "visitors", "were", "reduced", "to", "10", "men", "in", "the", "54", "##th", "minute", "after", "Rodrigo", "Car", "##nei", "##ro", "was", "sent", "off", "for", "a", "second", "book", "##able", "offen", "##ce", "." ], "ids": [ 57679, 117, 10379, 14879, 10455, 10422, 11661, 10108, 10105, 11226, 10160, 11816, 117, 10309, 11991, 10114, 169, 122, 118, 122, 25974, 10155, 17335, 12250, 55045, 22087, 10105, 18638, 10189, 10105, 44291, 10309, 25724, 10114, 10150, 10588, 10106, 10105, 11653, 11143, 21760, 10662, 29767, 23962, 34773, 10567, 10134, 14541, 11898, 10142, 169, 11132, 12748, 13096, 84646, 10419, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Benfica", "dominated", "the", "game", "but", "their", "lack", "of", "a", "first", "-", "class", "striker", "was", "apparent", "throughout", "and", "in", "the", "30th", "minute", "they", "lost", "key", "Brazilian", "midfielder", "Val", "##do", "who", "suffered", "a", "light", "knee", "injury", "." ], "ids": [ 57679, 49365, 10105, 11661, 10473, 10455, 23582, 10108, 169, 10422, 118, 13596, 103325, 10134, 51200, 15916, 10111, 10106, 10105, 95539, 21760, 10689, 14172, 18444, 32818, 68049, 16190, 10317, 10479, 26090, 169, 15765, 75217, 27443, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "substitute", "##d", "by", "Paula", "##o", "." ], "ids": [ 10357, 10134, 58808, 10162, 10155, 24392, 10133, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Benfica", "finally", "opened", "the", "scoring", "in", "the", "81", "##st", "minute", "with", "a", "penalty", "taken", "by", "Held", "##er", "after", "Luis", "Bal", "##tas", "##ar", "trip", "##ped", "up", "captain", "Jo", "##ao", "Pinto", "under", "the", "referee", "'", "s", "nose", "." ], "ids": [ 57679, 21256, 14377, 10105, 27346, 10106, 10105, 12324, 10562, 21760, 10169, 169, 40924, 15109, 10155, 77764, 10165, 10662, 12816, 93352, 11390, 10354, 37307, 16898, 10741, 28157, 20977, 14875, 46050, 10571, 10105, 102479, 112, 187, 63800, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Braga", "defender", "Ida", "##lec", "##io", "gave", "his", "team", "their", "equal", "##iser", "seven", "minutes", "from", "the", "final", "w", "##his", "##tle", "with", "a", "head", "##er", "into", "the", "back", "of", "the", "net", "." ], "ids": [ 55045, 36426, 29262, 42507, 10638, 15362, 10226, 11121, 10455, 32943, 25004, 15767, 15304, 10188, 10105, 11070, 191, 49311, 16406, 10169, 169, 13578, 10165, 10708, 10105, 12014, 10108, 10105, 11988, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "P", "##OR", "##T", "##U", "##G", "##UE", "##SE", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 153, 42622, 11090, 12022, 11447, 62674, 39039, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##B", "##ON", "1996", "-", "08", "-", "25" ], "ids": [ 149, 19088, 11274, 30118, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Portuguese", "first" ], "ids": [ 33036, 10108, 25550, 10422 ], "entity": [ "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "matches", "on", "Sunday", ":" ], "ids": [ 13751, 41356, 18258, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Porto", "2", "Set", "##uba", "##l", "2" ], "ids": [ 11529, 16408, 123, 14245, 39393, 10161, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Benfica", "1", "Braga", "1" ], "ids": [ 57679, 122, 55045, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "G", "##ui", "##mara", "##es", "4", "Gil", "Vicente", "2" ], "ids": [ 144, 11990, 41244, 10171, 125, 26463, 21089, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "F", "##IO", "##RE", "##NT", "##IN", "##A", "W", "##IN", "W", "##IT", "##H", "BA", "##TI", "##ST", "##UT", "##A", "DO", "##UB", "##LE", "." ], "ids": [ 71020, 65622, 24093, 118, 143, 37174, 66014, 77261, 27128, 10738, 160, 27128, 160, 37611, 12396, 39999, 72286, 32995, 65729, 10738, 99843, 82439, 51036, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##LA", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 75416, 44376, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Argentine", "striker", "Gabriel", "Bat", "##ist", "##uta", "gave", "Fiorentina", "the", "perfect", "70", "##th", "birthday", "present", "on", "Sunday", "with", "two", "goals", "that", "gave", "the", "Italian", "Cup", "winners", "a", "2", "-", "1", "Super", "##cup", "victory", "over", "serie", "A", "champions", "Milan", "." ], "ids": [ 31469, 103325, 15447, 62949, 11293, 14118, 15362, 85774, 10105, 43477, 10923, 11143, 56396, 12254, 10135, 19731, 10169, 10551, 18173, 10189, 15362, 10105, 11667, 11544, 33525, 169, 123, 118, 122, 12786, 41739, 19735, 10491, 11185, 138, 27745, 15807, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "O", "B-ORG", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 6, 9, 9, 2, 6, 9, 3, 9 ] }, { "tokens": [ "The", "victory", ",", "coming", "on", "the", "ev", "##e", "of", "the", "founding", "of", "the", "Florence", "club", "in", "1926", ",", "also", "marked", "the", "first", "time", "since", "the", "pre", "-", "season", "trophy", "between", "the", "Cup", "winners", "and", "league", "champions", "was", "started", "in", "1988", "that", "the", "Cup", "winners", "had", "won", "." ], "ids": [ 10117, 19735, 117, 23959, 10135, 10105, 38034, 10112, 10108, 10105, 30704, 10108, 10105, 23283, 11111, 10106, 11472, 117, 10379, 26981, 10105, 10422, 10635, 11764, 10105, 12229, 118, 11226, 103045, 10948, 10105, 11544, 33525, 10111, 15616, 27745, 10134, 13457, 10106, 10548, 10189, 10105, 11544, 33525, 10374, 11367, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Bat", "##ist", "##uta", "gave", "Fiorentina", "the", "lead", "in", "the", "11th", "minute", "." ], "ids": [ 62949, 11293, 14118, 15362, 85774, 10105, 14107, 10106, 10105, 34062, 21760, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sweden", "'", "s", "Stefan", "Schwarz", "picked", "him", "out", "with", "a", "lo", "##b", "to", "the", "edge", "of", "the", "box", "and", "Bat", "##ist", "##uta", "did", "the", "rest", ",", "chip", "##ping", "veteran", "defender", "Franco", "Bare", "##si", "and", "scoring", "at", "the", "near", "post", "." ], "ids": [ 20937, 112, 187, 17399, 39050, 52289, 10957, 10950, 10169, 169, 10406, 10457, 10114, 10105, 30599, 10108, 10105, 21509, 10111, 62949, 11293, 14118, 12172, 10105, 17333, 117, 64008, 15398, 55669, 36426, 16644, 104412, 10449, 10111, 27346, 10160, 10105, 12883, 11841, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Monte", "##neg", "##rin", "midfielder", "De", "##jan", "Sa", "##vice", "##vic", "equal", "##ised", "for", "the", "home", "team", ",", "we", "##avi", "##ng", "past", "a", "defender", ",", "check", "##ing", "and", "firing", "in", "a", "left", "-", "foot", "##ed", "shot", "in", "the", "21st", "minute", "that", "gave", "young", "Fiorentina", "goalkeeper", "Francesco", "Tol", "##do", "little", "chance", "." ], "ids": [ 14915, 84249, 13778, 68049, 10190, 14376, 12404, 30997, 48175, 32943, 20666, 10142, 10105, 11816, 11121, 117, 11951, 30266, 10376, 17781, 169, 36426, 117, 43662, 10230, 10111, 68573, 10106, 169, 12153, 118, 24963, 10336, 19508, 10106, 10105, 38408, 21760, 10189, 15362, 14739, 85774, 84159, 13747, 91845, 10317, 16745, 27893, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "The", "scored", "stayed", "level", "to", "the", "final", "minutes", "but", "with", "a", "penalty", "shoot", "out", "lo", "##omi", "##ng", ",", "Bat", "##ist", "##uta", "took", "charge", "." ], "ids": [ 10117, 17233, 42296, 13277, 10114, 10105, 11070, 15304, 10473, 10169, 169, 40924, 53839, 10950, 10406, 32013, 10376, 117, 62949, 11293, 14118, 12149, 18163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "French", "international", "midfielder", "Marcel", "Desa", "##illy", "fou", "##led", "the", "Argentine", ",", "whose", "coach", "at", "Boca", "Juniors", "before", "he", "joined", "Fiorentina", "in", "1991", "was", "new", "Milan", "coach", "Oscar", "Ta", "##bare", "##z", ",", "and", "Bat", "##ist", "##uta", "ra", "##mme", "##d", "home", "the", "free", "kick", "from", "30", "metres", "out", "." ], "ids": [ 11894, 12533, 68049, 18475, 19482, 65805, 12688, 16376, 10105, 31469, 117, 16879, 15701, 10160, 39527, 51756, 11360, 10261, 13914, 85774, 10106, 10442, 10134, 10751, 15807, 15701, 14036, 14248, 19693, 10305, 117, 10111, 62949, 11293, 14118, 11859, 21209, 10162, 11816, 10105, 13961, 55321, 10188, 10244, 16393, 10950, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 9, 9, 9, 3, 9, 9, 9, 9, 3, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "83", "##rd", "minute", "shot", ",", "cu", "##rling", "over", "the", "defence", "and", "di", "##pping", "in", "under", "the", "bar", "from", "the", "striker", "dubbed", "Bat", "##igo", "##l", "by", "ado", "##ring", "Fiorentina", "fans", ",", "was", "just", "re", "##ward", "for", "Fiorentina", "who", "looked", "a", "far", "more", "impressive", "team", "." ], "ids": [ 10117, 12408, 12023, 21760, 19508, 117, 10854, 47558, 10491, 10105, 47245, 10111, 10120, 53570, 10106, 10571, 10105, 18121, 10188, 10105, 103325, 76902, 62949, 21899, 10161, 10155, 64325, 13135, 85774, 20950, 117, 10134, 12820, 11639, 16988, 10142, 85774, 10479, 59822, 169, 13301, 10798, 80914, 11121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Milan", "'", "s", "player", "of", "the", "year", "George", "We", "##ah", "missed", "a", "good", "first", "half", "opportunity", "but", "otherwise", "looked", "a", "little", "rus", "##ty", "while", "Italian", "team", "mate", "Roberto", "Ba", "##ggio", "did", "not", "play", "due", "to", "injury", "." ], "ids": [ 15807, 112, 187, 12928, 10108, 10105, 10924, 10955, 12865, 12257, 55233, 169, 15198, 10422, 13877, 34468, 10473, 39712, 59822, 169, 16745, 19867, 11195, 11371, 11667, 11121, 43465, 14948, 21333, 14756, 12172, 10472, 12253, 10850, 10114, 27443, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "Dutch", "signing", "Edgar", "David", "##s", "came", "on", "late", "in", "the", "second", "half", "as", "a", "Milan", "substitute", "but", "made", "little", "impact", "." ], "ids": [ 10287, 17693, 46529, 21002, 10804, 10107, 13383, 10135, 13002, 10106, 10105, 11132, 13877, 10146, 169, 15807, 58808, 10473, 11019, 16745, 21316, 119 ], "entity": [ "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "league", "season", "starts", "on", "September", "8", "." ], "ids": [ 10117, 15616, 11226, 33039, 10135, 10596, 129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "F", "##IO", "##RE", "##NT", "##IN", "##A", "BE", "##AT", "MI", "##LA", "##N", "IN", "IT", "##AL", "##IA", "##N", "SU", "##PER", "##C", "##UP", "." ], "ids": [ 71020, 65622, 24093, 118, 143, 37174, 66014, 77261, 27128, 10738, 46291, 32071, 75416, 44376, 11537, 36351, 26956, 32002, 35976, 11537, 86643, 108408, 10858, 57487, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "MI", "##LA", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 75416, 44376, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "Cup", "winners", "Fiorentina", "beat" ], "ids": [ 11667, 11544, 33525, 85774, 27868 ], "entity": [ "B-MISC", "B-MISC", "O", "B-ORG", "O" ], "entity_ids": [ 2, 2, 9, 3, 9 ] }, { "tokens": [ "league", "champions", "Milan", "2", "-", "1", "(", "half", "##time", "1", "-", "1", ")", "in", "the", "pre", "-", "season" ], "ids": [ 15616, 27745, 15807, 123, 118, 122, 113, 13877, 18086, 122, 118, 122, 114, 10106, 10105, 12229, 118, 11226 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Supercoppa", "(", "Super", "##C", "##up", ")", "in", "Milan", "on", "Sunday", ":" ], "ids": [ 90896, 113, 12786, 10858, 14590, 114, 10106, 15807, 10135, 19731, 131 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Fiorentina", "-", "Gabriel", "Bat", "##ist", "##uta", "(", "11th", ",", "83", "##rd", ")" ], "ids": [ 85774, 118, 15447, 62949, 11293, 14118, 113, 34062, 117, 12408, 12023, 114 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Milan", "-", "De", "##jan", "Sa", "##vice", "##vic", "(", "21st", ")" ], "ids": [ 15807, 118, 10190, 14376, 12404, 30997, 48175, 113, 38408, 114 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "29", ",", "582" ], "ids": [ 46080, 131, 10386, 117, 50254 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "NO", "##R", "##WA", "##Y", "EL", "##IT", "##E", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 49307, 11273, 42196, 14703, 69765, 37611, 11259, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OS", "##L", "##O", "1996", "-", "08", "-", "25" ], "ids": [ 18398, 11369, 11403, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Norwegian", "elite", "division" ], "ids": [ 33036, 10108, 24783, 43163, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "matches", "at", "the", "weekend", ":" ], "ids": [ 41356, 18258, 10160, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Troms", "##o", "2", "Kong", "##s", "##vinger", "1" ], "ids": [ 105576, 10133, 123, 14577, 10107, 90222, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Vale", "##reng", "##a", "3", "S", "##kei", "##d", "0" ], "ids": [ 32286, 67398, 10113, 124, 156, 97345, 10162, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Stab", "##ae", "##k", "4", "Strom", "##sg", "##ods", "##et", "0" ], "ids": [ 106307, 14193, 10174, 125, 66091, 84105, 70150, 10308, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Molde", "1", "Bo", "##do", "/", "Gli", "##mt", "2" ], "ids": [ 100508, 122, 27622, 10317, 120, 17782, 18193, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Viking", "1", "Moss", "0" ], "ids": [ 36543, 122, 38963, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Br", "##ann", "7", "Start", "1" ], "ids": [ 38508, 20801, 128, 27172, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Rosenborg", "7", "Lille", "##strom", "2" ], "ids": [ 102507, 128, 28372, 83474, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "after", "weekend", "matches", "(", "tab", "##ulate", "under", "played", ",", "won", "," ], "ids": [ 58592, 10107, 10662, 43440, 18258, 113, 100781, 70863, 10571, 11553, 117, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "drawn", ",", "lost", ",", "goals", "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 34788, 117, 14172, 117, 18173, 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rosenborg", "20", "14", "4", "2", "68", "21", "46" ], "ids": [ 102507, 10197, 10247, 125, 123, 12370, 10296, 11528 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lille", "##strom", "19", "9", "5", "5", "38", "29", "32" ], "ids": [ 28372, 83474, 10270, 130, 126, 126, 11171, 10386, 10842 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##kei", "##d", "19", "10", "2", "7", "29", "30", "32" ], "ids": [ 156, 97345, 10162, 10270, 10150, 123, 128, 10386, 10244, 10842 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stab", "##ae", "##k", "20", "7", "8", "5", "41", "34", "29" ], "ids": [ 106307, 14193, 10174, 10197, 128, 129, 126, 11349, 11069, 10386 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Br", "##ann", "19", "8", "5", "6", "40", "37", "29" ], "ids": [ 38508, 20801, 10270, 129, 126, 127, 10533, 11204, 10386 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Troms", "##o", "20", "8", "5", "7", "34", "33", "29" ], "ids": [ 105576, 10133, 10197, 129, 126, 128, 11069, 11000, 10386 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Viking", "20", "7", "7", "6", "33", "24", "28" ], "ids": [ 36543, 10197, 128, 128, 127, 11000, 10233, 10348 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Molde", "19", "8", "3", "8", "36", "25", "27" ], "ids": [ 100508, 10270, 129, 124, 129, 11055, 10258, 10365 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bo", "##do", "/", "Gli", "##mt", "20", "7", "4", "9", "33", "41", "25" ], "ids": [ 27622, 10317, 120, 17782, 18193, 10197, 128, 125, 130, 11000, 11349, 10258 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kong", "##s", "##vinger", "20", "7", "4", "9", "26", "38", "25" ], "ids": [ 14577, 10107, 90222, 10197, 128, 125, 130, 10314, 11171, 10258 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Strom", "##sg", "##ods", "##et", "20", "7", "4", "9", "27", "40", "25" ], "ids": [ 66091, 84105, 70150, 10308, 10197, 128, 125, 130, 10365, 10533, 10258 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vale", "##reng", "##a", "20", "6", "6", "8", "26", "32", "24" ], "ids": [ 32286, 67398, 10113, 10197, 127, 127, 129, 10314, 10842, 10233 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Moss", "20", "4", "6", "10", "23", "40", "18" ], "ids": [ 38963, 10197, 125, 127, 10150, 10328, 10533, 10218 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Start", "20", "3", "3", "14", "26", "56", "12" ], "ids": [ 27172, 10197, 124, 124, 10247, 10314, 11628, 10186 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SU", "##MM", "##AR", "##Y", "OF", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "MA", "##TC", "##H", "." ], "ids": [ 71020, 65622, 24093, 118, 86643, 93252, 52188, 14703, 23240, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "German", "first", "division" ], "ids": [ 42027, 10108, 12026, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "match", "played", "on", "Sunday", ":" ], "ids": [ 12356, 11553, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "MS", "##V", "Du", "##is", "##berg", "0", "Bayern", "Munich", "4", "(", "K", "##lins", "##mann", "15th", ",", "Zie", "##ger", "24", "##th", "and" ], "ids": [ 21018, 11779, 14925, 10291, 11348, 121, 17200, 27349, 125, 113, 148, 68541, 12350, 36293, 117, 47926, 11446, 10233, 11143, 10111 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "90", "##th", ",", "Wit", "##eche", "##k", "59", "##th", ")", "." ], "ids": [ 10919, 11143, 117, 83735, 53137, 10174, 11867, 11143, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "2", "." ], "ids": [ 33100, 18086, 121, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "30", ",", "000", "." ], "ids": [ 46080, 131, 10244, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "RE", "##SU", "##L", "##T", "OF", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "MA", "##TC", "##H", "." ], "ids": [ 71020, 65622, 24093, 118, 71033, 88592, 11369, 11090, 23240, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "German", "first", "division" ], "ids": [ 32070, 16203, 10108, 12026, 10422, 13751 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "match", "on", "Sunday", ":" ], "ids": [ 41356, 12356, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "MS", "##V", "Du", "##is", "##berg", "0", "Bayern", "Munich", "4" ], "ids": [ 21018, 11779, 14925, 10291, 11348, 121, 17200, 27349, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Bundesliga", "standing", "##s", "after", "Sunday", "'", "s", "game", "(", "tab", "##ulate", "under" ], "ids": [ 21436, 32173, 10107, 10662, 19731, 112, 187, 11661, 113, 100781, 70863, 10571 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals", "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cologne", "3", "3", "0", "0", "7", "1", "9" ], "ids": [ 52577, 124, 124, 121, 121, 128, 122, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayern", "Munich", "3", "2", "1", "0", "7", "2", "7" ], "ids": [ 17200, 27349, 124, 123, 122, 121, 128, 123, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VfB", "Stuttgart", "2", "2", "0", "0", "6", "1", "6" ], "ids": [ 76227, 16048, 123, 123, 121, 121, 127, 122, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Dortmund", "3", "2", "0", "1", "9", "5", "6" ], "ids": [ 48007, 33962, 124, 123, 121, 122, 130, 126, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hamburg", "3", "2", "0", "1", "7", "3", "6" ], "ids": [ 15021, 124, 123, 121, 122, 128, 124, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayer", "Leverkusen", "3", "2", "0", "1", "7", "4", "6" ], "ids": [ 42806, 84961, 124, 123, 121, 122, 128, 125, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VfL", "Bochum", "3", "1", "2", "0", "3", "2", "5" ], "ids": [ 77307, 63359, 124, 122, 123, 121, 124, 123, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karlsruhe", "2", "1", "1", "0", "5", "3", "4" ], "ids": [ 36954, 123, 122, 122, 121, 126, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "3", "1", "1", "1", "7", "7", "4" ], "ids": [ 10838, 54583, 124, 122, 122, 122, 128, 128, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1860", "Munich", "3", "1", "0", "2", "3", "5", "3" ], "ids": [ 13336, 27349, 124, 122, 121, 123, 124, 126, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Freiburg", "3", "1", "0", "2", "5", "10", "3" ], "ids": [ 29283, 124, 122, 121, 123, 126, 10150, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Due", "##ssel", "##dorf", "3", "1", "0", "2", "1", "7", "3" ], "ids": [ 59890, 20896, 49235, 16631, 124, 122, 121, 123, 122, 128, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hansa", "Rostock", "3", "0", "2", "1", "3", "4", "2" ], "ids": [ 77740, 47090, 124, 121, 123, 122, 124, 125, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Armin", "##ia", "Bielefeld", "3", "0", "2", "1", "2", "3", "2" ], "ids": [ 78283, 10280, 67943, 124, 121, 123, 122, 123, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Moe", "##nche", "##ng", "##lad", "##bach", "3", "0", "2", "1", "1", "3", "2" ], "ids": [ 48007, 80790, 49457, 10376, 19505, 14135, 124, 121, 123, 122, 122, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Schalke", "3", "0", "2", "1", "4", "8", "2" ], "ids": [ 87909, 124, 121, 123, 122, 125, 129, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Werder", "Bremen", "3", "0", "1", "2", "4", "6", "1" ], "ids": [ 89919, 21360, 124, 121, 122, 123, 125, 127, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MS", "##V", "Duisburg", "3", "0", "0", "3", "1", "8", "0" ], "ids": [ 21018, 11779, 65064, 124, 121, 121, 124, 122, 129, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SW", "##IS", "##S", "PR", "##EM", "##IE", "##R", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 92438, 19088, 10731, 23837, 67753, 71655, 11273, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GE", "##NE", "##VA", "1996", "-", "08", "-", "25" ], "ids": [ 62997, 93280, 47172, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Swiss", "premier", "division" ], "ids": [ 33036, 10108, 22984, 11913, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "played", "at", "the", "weekend", ":" ], "ids": [ 18258, 11553, 10160, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aa", "##rau", "1", "Young", "Boys", "0" ], "ids": [ 80131, 40088, 122, 12478, 16432, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Grass", "##hop", "##per", "2", "Luce", "##rne", "2" ], "ids": [ 68236, 57654, 12713, 123, 99549, 14366, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Lugano", "1", "Bas", "##le", "1" ], "ids": [ 73726, 122, 21237, 10284, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Neu", "##chat", "##el", "3", "St", "Gallen", "0" ], "ids": [ 46437, 73267, 10570, 124, 10838, 62472, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Sion", "3", "Ser", "##vette", "1" ], "ids": [ 82683, 124, 39759, 34553, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Neu", "##chat", "##el", "8", "6", "1", "1", "12", "7", "19" ], "ids": [ 46437, 73267, 10570, 129, 127, 122, 122, 10186, 128, 10270 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Grass", "##hop", "##per", "9", "4", "4", "1", "17", "11", "16" ], "ids": [ 68236, 57654, 12713, 130, 125, 125, 122, 10273, 10193, 10250 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", ".", "Gallen", "9", "4", "4", "1", "6", "5", "16" ], "ids": [ 10838, 119, 62472, 130, 125, 125, 122, 127, 126, 10250 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lausanne", "9", "4", "2", "3", "18", "13", "14" ], "ids": [ 37570, 130, 125, 123, 124, 10218, 10249, 10247 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aa", "##rau", "8", "4", "1", "3", "9", "4", "13" ], "ids": [ 80131, 40088, 129, 125, 122, 124, 130, 125, 10249 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sion", "9", "3", "4", "2", "13", "11", "13" ], "ids": [ 82683, 130, 124, 125, 123, 10249, 10193, 10249 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zurich", "9", "2", "5", "2", "9", "9", "11" ], "ids": [ 55885, 130, 123, 126, 123, 130, 130, 10193 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bas", "##le", "8", "2", "3", "3", "12", "11", "9" ], "ids": [ 21237, 10284, 129, 123, 124, 124, 10186, 10193, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ser", "##vette", "9", "2", "3", "4", "10", "12", "9" ], "ids": [ 39759, 34553, 130, 123, 124, 125, 10150, 10186, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Luce", "##rne", "8", "1", "5", "2", "10", "11", "8" ], "ids": [ 99549, 14366, 129, 122, 126, 123, 10150, 10193, 129 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lugano", "9", "1", "4", "4", "6", "15", "7" ], "ids": [ 73726, 130, 122, 125, 125, 127, 10208, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Young", "Boys", "9", "1", "0", "8", "6", "19", "3" ], "ids": [ 12478, 16432, 130, 122, 121, 129, 127, 10270, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "LE", "##AD", "##ING", "PR", "##I", "##Z", "##E", "MO", "##NE", "##Y", "W", "##IN", "##NE", "##RS", "ON", "EU", "##RO", "##P", "##EA", "##N", "TOUR", "." ], "ids": [ 41525, 11369, 11565, 118, 84977, 55538, 50183, 23837, 11281, 13966, 11259, 102059, 93280, 14703, 160, 27128, 93280, 39469, 49339, 17751, 35066, 11127, 36789, 11537, 86526, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "ST", "##UT", "##T", "##GA", "##RT", ",", "Germany", "1996", "-", "08", "-", "25" ], "ids": [ 53317, 65729, 11090, 39061, 46935, 117, 12775, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "prize", "money" ], "ids": [ 100085, 32929, 17920 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "winners", "on", "the", "European", "Tour", "after", "Sunday", "'", "s", "German", "Open", "(", "Britain" ], "ids": [ 33525, 10135, 10105, 11914, 11595, 10662, 19731, 112, 187, 12026, 11919, 113, 16032 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 9, 1 ] }, { "tokens": [ "unless", "stated", ")", ":" ], "ids": [ 60015, 17067, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Ian", "Woo", "##sna", "##m", "480", ",", "618", "pounds", "ster", "##ling" ], "ids": [ 122, 119, 16582, 84270, 45981, 10147, 23144, 117, 45806, 61982, 78342, 11945 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Colin", "Mont", "##gom", "##erie", "429", ",", "449" ], "ids": [ 123, 119, 20766, 19472, 72757, 25433, 37624, 117, 44263 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Lee", "Westwood", "301", ",", "972" ], "ids": [ 124, 119, 12006, 65507, 26224, 117, 69879 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Robert", "Allen", "##by", "(", "Australia", ")", "291", ",", "08", "##8" ], "ids": [ 125, 119, 10820, 15101, 11530, 113, 11729, 114, 31240, 117, 11052, 11396 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Mark", "M", "##c", "##N", "##ult", "##y", "(", "Zimbabwe", ")", "254", ",", "247" ], "ids": [ 126, 119, 11997, 150, 10350, 11537, 16203, 10157, 113, 34577, 114, 26257, 117, 27994 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Costa", "##ntino", "Rocca", "(", "Italy", ")", "253", ",", "337" ], "ids": [ 127, 119, 13902, 44878, 63718, 113, 11619, 114, 25124, 117, 32225 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Andrew", "Colt", "##art", "246", ",", "07", "##7" ], "ids": [ 128, 119, 13999, 69952, 15391, 26439, 117, 10878, 11305 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Wayne", "Riley", "(", "Australia", ")", "233", ",", "713" ], "ids": [ 129, 119, 18547, 35643, 113, 11729, 114, 25818, 117, 64456 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Raymond", "Russell", "229", ",", "360" ], "ids": [ 130, 119, 17326, 13481, 26216, 117, 15935 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Stephen", "Ames", "(", "Trinidad", ")", "211", ",", "175" ], "ids": [ 10150, 119, 13866, 69604, 113, 31327, 114, 22448, 117, 18101 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "11", ".", "Frank", "No", "##bil", "##o", "(", "New", "Zealand", ")", "209", ",", "412" ], "ids": [ 10193, 119, 11872, 10657, 17513, 10133, 113, 10287, 14451, 114, 23404, 117, 32736 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "12", ".", "Paul", "M", "##c", "##G", "##in", "##ley", "(", "Ireland", ")", "208", ",", "978" ], "ids": [ 10186, 119, 10772, 150, 10350, 11447, 10245, 12105, 113, 14637, 114, 21881, 117, 10584 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "13", ".", "Paul", "Law", "##rie", "207", ",", "990" ], "ids": [ 10249, 119, 10772, 13216, 12904, 22730, 117, 55291 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "14", ".", "Pa", "##dra", "##ig", "Harrington", "(", "Ireland", ")", "202", ",", "593" ], "ids": [ 10247, 119, 26907, 14951, 11142, 93157, 113, 14637, 114, 22171, 117, 54619 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "15", ".", "Re", "##tief", "Goose", "##n", "(", "South", "Africa", ")", "188", ",", "143" ], "ids": [ 10208, 119, 20304, 108386, 106354, 10115, 113, 11056, 12880, 114, 22345, 117, 19510 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "16", ".", "Jonathan", "Loma", "##s", "181", ",", "005" ], "ids": [ 10250, 119, 16395, 26110, 10107, 22534, 117, 48313 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "17", ".", "Paul", "Broad", "##hurst", "172", ",", "580" ], "ids": [ 10273, 119, 10772, 86606, 68091, 21906, 117, 33283 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "18", ".", "Peter", "Mitchell", "170", ",", "952" ], "ids": [ 10218, 119, 10979, 19906, 15410, 117, 56114 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "19", ".", "Jim", "Payne", "165", ",", "150" ], "ids": [ 10270, 119, 14178, 48644, 19233, 117, 11766 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "20", ".", "Russell", "Clay", "##don", "156", ",", "996" ], "ids": [ 10197, 119, 13481, 36130, 15081, 20410, 117, 65499 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "SW", "##IS", "##S", "GR", "##AN", "##D", "PR", "##IX", "RE", "##SU", "##L", "##T", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 92438, 19088, 10731, 58787, 41275, 11490, 23837, 67403, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Z", "##UR", "##IC", "##H", "1996", "-", "08", "-", "25" ], "ids": [ 163, 98348, 30889, 12396, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "in", "the", "232", "-", "km" ], "ids": [ 100085, 17466, 10106, 10105, 23944, 118, 10204 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "Grand", "Prix", "World", "Cup", "c", "##ycling", "race", "on", "Sunday", ":" ], "ids": [ 22984, 11319, 12835, 10315, 11544, 171, 87497, 14025, 10135, 19731, 131 ], "entity": [ "B-MISC", "B-MISC", "I-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 2, 6, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Andrea", "Fe", "##rri", "##gato", "(", "Italy", ")", "5", "hours", "51", "minutes", "52", "seconds" ], "ids": [ 122, 119, 16101, 20187, 24874, 45445, 113, 11619, 114, 126, 19573, 11524, 15304, 11525, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Michele", "Bart", "##oli", "(", "Italy", ")" ], "ids": [ 123, 119, 26654, 33849, 15847, 113, 11619, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "3", ".", "Johan", "Muse", "##eu", "##w", "(", "Belgium", ")" ], "ids": [ 124, 119, 15706, 66149, 16831, 10874, 113, 26519, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "4", ".", "Lance", "Armstrong", "(", "U", ".", "S", ".", ")" ], "ids": [ 125, 119, 45013, 24472, 113, 158, 119, 156, 119, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "5", ".", "Francesco", "Casa", "##gra", "##nde", "(", "Italy", ")" ], "ids": [ 126, 119, 13747, 15076, 25635, 11382, 113, 11619, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", ".", "Alessandro", "Baron", "##ti", "(", "Italy", ")" ], "ids": [ 127, 119, 21771, 20443, 10325, 113, 11619, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "7", ".", "Frank", "Van", "##den", "##bro", "##uck", "##e", "(", "Belgium", ")", "all", "same", "time" ], "ids": [ 128, 119, 11872, 11474, 10633, 20923, 31746, 10112, 113, 26519, 114, 10435, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Fabio", "Bald", "##ato", "(", "Italy", ")", "11", "seconds", "behind" ], "ids": [ 129, 119, 42311, 92339, 12720, 113, 11619, 114, 10193, 34290, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Maurizio", "F", "##ond", "##ries", "##t", "(", "Italy", ")" ], "ids": [ 130, 119, 52776, 143, 26029, 15388, 10123, 113, 11619, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "10", ".", "Laurent", "Ja", "##lab", "##ert", "(", "France", ")", "both", "same", "time" ], "ids": [ 10150, 119, 19982, 28248, 41284, 11605, 113, 10688, 114, 11408, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "World", "Cup", "standing", "##s", "(", "after", "8", "of", "11", "rounds", ")", ":" ], "ids": [ 100085, 10315, 11544, 32173, 10107, 113, 10662, 129, 10108, 10193, 44759, 114, 131 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Muse", "##eu", "##w", "162", "points" ], "ids": [ 122, 119, 66149, 16831, 10874, 21638, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "2", ".", "Fe", "##rri", "##gato", "112" ], "ids": [ 123, 119, 20187, 24874, 45445, 16129 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "3", ".", "Bart", "##oli", "108" ], "ids": [ 124, 119, 33849, 15847, 15845 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "4", ".", "Stefano", "Za", "##nini", "(", "Italy", ")", "88" ], "ids": [ 125, 119, 26381, 14074, 62322, 113, 11619, 114, 12074 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "5", ".", "Armstrong", "81" ], "ids": [ 126, 119, 24472, 12324 ], "entity": [ "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 4, 9 ] }, { "tokens": [ "6", ".", "Bald", "##ato", "77" ], "ids": [ 127, 119, 92339, 12720, 12527 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "7", ".", "Alexandre", "Go", "##nt", "##chenko", "##v", "(", "Ukraine", ")", "67" ], "ids": [ 128, 119, 18009, 14439, 10368, 87665, 10477, 113, 19883, 114, 12316 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "8", ".", "Gabriele", "Colombo", "(", "Italy", ")", "58" ], "ids": [ 129, 119, 50194, 40367, 113, 11619, 114, 11824 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "9", ".", "Andrei", "T", "##ch", "##mil", "(", "Ukraine", ")", "56" ], "ids": [ 130, 119, 40594, 157, 10269, 55177, 113, 19883, 114, 11628 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "10", ".", "Max", "Sci", "##and", "##ri", "(", "Britain", ")", "55" ], "ids": [ 10150, 119, 12854, 23359, 14752, 10401, 113, 16032, 114, 11358 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "F", "##ER", "##RI", "##GA", "##TO", "SP", "##RI", "##NT", "##S", "TO", "SEC", "##ON", "##D", "ST", "##RA", "##IG", "##HT", "WORLD", "C", "##UP", "W", "##IN", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 143, 24093, 46876, 39061, 60493, 22570, 46876, 77261, 10731, 58573, 92031, 30118, 11490, 53317, 29990, 89696, 81012, 67376, 140, 57487, 160, 27128, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Z", "##UR", "##IC", "##H", "1996", "-", "08", "-", "25" ], "ids": [ 163, 98348, 30889, 12396, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Andrea", "Fe", "##rri", "##gato", "of", "Italy", "sprint", "##ed", "to", "his", "second", "c", "##ycling", "World", "Cup", "win", "in", "successive", "weekend", "##s", "with", "victory", "in", "the", "Swiss", "Grand", "Prix", "on", "Sunday", "." ], "ids": [ 16101, 20187, 24874, 45445, 10108, 11619, 42707, 10336, 10114, 10226, 11132, 171, 87497, 10315, 11544, 14125, 10106, 47525, 43440, 10107, 10169, 19735, 10106, 10105, 22984, 11319, 12835, 10135, 19731, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Fe", "##rri", "##gato", ",", "winner", "of", "the", "Leeds", "Classic", "last", "Sunday", "with", "a", "one", "second", "win", "over", "Britain", "'", "s", "Max", "Sci", "##and", "##ri", ",", "posted", "a", "similarly", "narrow", "margin", "of", "victory", "again", "." ], "ids": [ 20187, 24874, 45445, 117, 20826, 10108, 10105, 28654, 20542, 12469, 19731, 10169, 169, 10464, 11132, 14125, 10491, 16032, 112, 187, 12854, 23359, 14752, 10401, 117, 51232, 169, 81607, 41444, 53388, 10108, 19735, 13123, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "26", "-", "year", "-", "old", "Italian", "surge", "##d", "past", "com", "##pat", "##riot", "Michele", "Bart", "##oli", "and", "last", "year", "'", "s", "winner", "and", "defending", "World", "Cup", "champion", "Johan", "Muse", "##eu", "##w", "of", "Belgium", "in", "the", "final", "few", "metres", "of", "the", "237", "##km", "race", "." ], "ids": [ 10117, 10314, 118, 10924, 118, 12898, 11667, 69824, 10162, 17781, 10212, 18115, 92113, 26654, 33849, 15847, 10111, 12469, 10924, 112, 187, 20826, 10111, 53730, 10315, 11544, 17689, 15706, 66149, 16831, 10874, 10108, 26519, 10106, 10105, 11070, 13824, 16393, 10108, 10105, 27173, 23440, 14025, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "three", "clock", "##ed", "the", "same", "time", "of", "five", "hours", "51", "minutes", ",", "52", "seconds", "." ], "ids": [ 11101, 11003, 52843, 10336, 10105, 11561, 10635, 10108, 12403, 19573, 11524, 15304, 117, 11525, 34290, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "world", "champion", "Lance", "Armstrong", "of", "the", "United", "States", "was", "in", "front", "as", "the", "leading", "pack", "of", "seven", "riders", "turned", "into", "the", "O", "##er", "##liko", "##n", "vel", "##od", "##rome", "for", "the", "final", "one", "lap", "sprint", "but", "quickly", "fa", "##ded", "and", "settled", "for", "fourth", "." ], "ids": [ 42355, 11356, 17689, 45013, 24472, 10108, 10105, 10609, 10859, 10134, 10106, 14589, 10146, 10105, 16018, 78978, 10108, 15767, 93076, 21031, 10708, 10105, 152, 10165, 43208, 10115, 21861, 12680, 43110, 10142, 10105, 11070, 10464, 38553, 42707, 10473, 23590, 12211, 21597, 10111, 29014, 10142, 16918, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "back", "-", "to", "-", "back", "wins", "va", "##ult", "Fe", "##rri", "##gato", "from", "sixth", "to", "second", "in", "the", "overall", "World", "Cup", "rankings", "with", "112", "points", "but", "Muse", "##eu", "##w", "continues", "to", "hold", "a", "commanding", "lead", "with", "162", "points", "after", "eight", "of", "the", "11", "rounds", "." ], "ids": [ 10117, 12014, 118, 10114, 118, 12014, 27279, 10321, 16203, 20187, 24874, 45445, 10188, 28913, 10114, 11132, 10106, 10105, 20947, 10315, 11544, 97410, 10169, 16129, 12789, 10473, 66149, 16831, 10874, 25266, 10114, 18500, 169, 93644, 14107, 10169, 21638, 12789, 10662, 16222, 10108, 10105, 10193, 44759, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "GE", "##R", "##MA", "##N", "OP", "##EN", "SC", "##OR", "##ES", "." ], "ids": [ 41525, 11369, 11565, 118, 62997, 11273, 30696, 11537, 55355, 50655, 18137, 42622, 25054, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##UT", "##T", "##GA", "##RT", ",", "Germany", "1996", "-", "08", "-", "25" ], "ids": [ 53317, 65729, 11090, 39061, 46935, 117, 12775, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brit", "##on", "Ian", "Woo", "##sna", "##m", "won" ], "ids": [ 68447, 10263, 16582, 84270, 45981, 10147, 11367 ], "entity": [ "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 2, 6, 4, 8, 8, 8, 9 ] }, { "tokens": [ "the", "German", "Open", "golf", "championship", "on", "Sunday", "after", "the", "final" ], "ids": [ 10105, 12026, 11919, 32288, 20755, 10135, 19731, 10662, 10105, 11070 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "round", "was", "abandoned", "because", "of", "torre", "##ntial", "rain", "." ], "ids": [ 13569, 10134, 32296, 12373, 10108, 21438, 109902, 50939, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", "after", "three", "rounds", "(", "Britain", "unless", "stated", ")", ":" ], "ids": [ 66875, 10107, 10662, 11003, 44759, 113, 16032, 60015, 17067, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "193", "Ian", "Woo", "##sna", "##m", "64", "64", "65", "." ], "ids": [ 22524, 16582, 84270, 45981, 10147, 11295, 11295, 10843, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "199", "Thomas", "Go", "##gel", "##e", "(", "Germany", ")", "67", "65", "67", ",", "Robert", "Karlsson" ], "ids": [ 23366, 11096, 14439, 16039, 10112, 113, 12775, 114, 12316, 10843, 12316, 117, 10820, 85716 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "(", "Sweden", ")", "67", "62", "70", ",", "Ian", "P", "##yman", "66", "64", "69", ",", "Fernando", "Roca" ], "ids": [ 113, 20937, 114, 12316, 12066, 10923, 117, 16582, 153, 66654, 12215, 11295, 12573, 117, 14022, 58384 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "(", "Spain", ")", "66", "64", "69", "." ], "ids": [ 113, 16149, 114, 12215, 11295, 12573, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "200", "Diego", "Bo", "##rre", "##go", "(", "Spain", ")", "69", "63", "68", ",", "Miguel", "Angel", "Martin" ], "ids": [ 10777, 14665, 27622, 19243, 10797, 113, 16149, 114, 12573, 12256, 12370, 117, 13905, 17567, 11235 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Spain", ")", "66", "66", "68", "." ], "ids": [ 113, 16149, 114, 12215, 12215, 12370, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "201", "Stephen", "Ames", "(", "Trinidad", ")", "68", "65", "68", ",", "Roger", "Chapman", "72", "62", "67", "," ], "ids": [ 20726, 13866, 69604, 113, 31327, 114, 12370, 10843, 12370, 117, 13513, 33069, 12120, 12066, 12316, 117 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Paul", "Broad", "##hurst", "62", "70", "69", ",", "Stephen", "Field", "66", "65", "70", "," ], "ids": [ 10772, 86606, 68091, 12066, 10923, 12573, 117, 13866, 16003, 12215, 10843, 10923, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Carl", "Sun", "##eson", "(", "Spain", ")", "65", "66", "70" ], "ids": [ 12225, 13967, 81420, 113, 16149, 114, 10843, 12215, 10923 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "202", "Greg", "Turner", "(", "New", "Zealand", ")", "70", "67", "65", ",", "Heinz", "-", "Peter", "Thu", "##l" ], "ids": [ 22171, 22438, 18339, 113, 10287, 14451, 114, 10923, 12316, 10843, 117, 23406, 118, 10979, 93332, 10161 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Germany", ")", "70", "67", "65", ",", "Ron", "##an", "Ra", "##ffer", "##ty", "64", "72", "66", ",", "Barry", "Lane" ], "ids": [ 113, 12775, 114, 10923, 12316, 10843, 117, 20368, 10206, 38571, 22888, 11195, 11295, 12120, 12215, 117, 18120, 20845 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "68", "67", "67", ",", "David", "Carter", "66", "69", "67", ",", "Michael", "Jon", "##zon", "(", "Sweden", ")" ], "ids": [ 12370, 12316, 12316, 117, 10804, 18047, 12215, 12573, 12316, 117, 10631, 17749, 22742, 113, 20937, 114 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "67", "67", "68", ",", "David", "Williams", "67", "67", "68" ], "ids": [ 12316, 12316, 12370, 117, 10804, 12494, 12316, 12316, 12370 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "203", "Lee", "Westwood", "66", "71", "66", ",", "Gary", "Emerson", "68", "69", "66", ",", "Peter", "Baker" ], "ids": [ 20235, 12006, 65507, 12215, 12513, 12215, 117, 15516, 43604, 12370, 12573, 12215, 117, 10979, 16865 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "70", "66", "67", ",", "Des", "Sm", "##yth", "(", "Ireland", ")", "66", "69", "68", ",", "Paul", "Law", "##rie" ], "ids": [ 10923, 12215, 12316, 117, 13810, 41922, 96362, 113, 14637, 114, 12215, 12573, 12370, 117, 10772, 13216, 12904 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "66", "69", "68", ",", "Francisco", "Cea", "(", "Spain", ")", "68", "66", "69", ",", "Pedro", "Linha", "##rt" ], "ids": [ 12215, 12573, 12370, 117, 11798, 109435, 113, 16149, 114, 12370, 12215, 12573, 117, 12849, 85861, 10976 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Spain", ")", "67", "67", "69", ",", "Jonathan", "Loma", "##s", "67", "67", "69", ",", "Paul", "Ea", "##les" ], "ids": [ 113, 16149, 114, 12316, 12316, 12573, 117, 16395, 26110, 10107, 12316, 12316, 12573, 117, 10772, 47132, 11268 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "67", "68", "68", ",", "Raymond", "Russell", "63", "69", "71" ], "ids": [ 12316, 12370, 12370, 117, 17326, 13481, 12256, 12573, 12513 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "PSV", "BE", "##AT", "GR", "##ON", "##ING", "##EN", "4", "-", "1", "TO", "P", "##UL", "##L", "A", "##WA", "##Y", "FR", "##OM", "AJ", "##AX", "." ], "ids": [ 71020, 65622, 24093, 118, 66922, 46291, 32071, 58787, 30118, 50183, 50655, 125, 118, 122, 58573, 153, 100673, 11369, 138, 42196, 14703, 64655, 37079, 41191, 83026, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "25" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgian", "international", "Luc", "Nil", "##is", "scored", "twice", "on", "Sunday", "as", "PSV", "Eindhoven", "came", "from", "behind", "to", "beat", "Groningen", "4", "-", "1", "in", "Eindhoven", "." ], "ids": [ 36652, 12533, 26589, 66163, 10291, 17233, 26261, 10135, 19731, 10146, 66922, 55552, 13383, 10188, 17155, 10114, 27868, 36806, 125, 118, 122, 10106, 55552, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "PSV", "and", "Vi", "##tesse", "Arnhem", "are", "the", "only", "un", "##beat", "##en", "teams", "after", "two", "rounds", "of", "the", "Dutch", "league", "." ], "ids": [ 66922, 10111, 31826, 100319, 76323, 10301, 10105, 10893, 10119, 68939, 10136, 14404, 10662, 10551, 44759, 10108, 10105, 17693, 15616, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Def", "##ending", "champions", "Ajax", "Amsterdam", "were", "defeated", "2", "-", "0", "loss", "away", "to", "Heer", "##en", "##veen", "on", "Saturday", "." ], "ids": [ 77955, 107292, 27745, 37057, 14017, 10309, 18058, 123, 118, 121, 18576, 14942, 10114, 49764, 10136, 53467, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Groningen", "took", "the", "lead", "in", "the", "seventh", "minute", "when", "Dean", "Go", "##rre", "inter", "##cept", "##ed", "a", "back", "pass", "from", "Ernest", "Faber", "to", "goalkeeper", "Ronald", "Water", "##reus", "and", "shot", "home", "." ], "ids": [ 36806, 12149, 10105, 14107, 10106, 10105, 37192, 21760, 10841, 18657, 14439, 19243, 22021, 97782, 10336, 169, 12014, 23392, 10188, 19070, 49810, 10114, 84159, 21474, 17702, 51831, 10111, 19508, 11816, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Faber", "made", "am", "##end", "##s", "in", "the", "32", "##nd", "minute", "when", "he", "headed", "in", "a", "corner", "to", "score", "the", "equal", "##iser", "." ], "ids": [ 49810, 11019, 10392, 19342, 10107, 10106, 10105, 10842, 11534, 21760, 10841, 10261, 33336, 10106, 169, 33625, 10114, 17704, 10105, 32943, 25004, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PSV", "took", "control", "in", "the", "second", "half", "but", "could", "not", "score", "until", "Groningen", "striker", "Romano", "Sion", "was", "sent", "off", "in", "the", "58", "##th", "minute", "." ], "ids": [ 66922, 12149, 12608, 10106, 10105, 11132, 13877, 10473, 12174, 10472, 17704, 11444, 36806, 103325, 24845, 82683, 10134, 14541, 11898, 10106, 10105, 11824, 11143, 21760, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Five", "minutes", "after", "his", "di", "##missa", "##l", ",", "Nil", "##is", "gave", "PSV", "the", "lead", "and", "in", "the", "final", "15", "minutes", "he", "added", "another", "as", "did", "Ze", "##lj", "##ko", "Petrov", "##ic", "." ], "ids": [ 19268, 15304, 10662, 10226, 10120, 94397, 10161, 117, 66163, 10291, 15362, 66922, 10105, 14107, 10111, 10106, 10105, 11070, 10208, 15304, 10261, 16288, 12864, 10146, 12172, 15536, 58254, 10440, 108972, 11130, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Vi", "##tesse", "Arnhem", "ups", "##tage", "##d", "Utrecht", "1", "-", "0", "despite", "ending", "the", "match", "with", "only", "nine", "men", "following", "the", "dis", "##missa", "##l", "of", "defender", "##s", "Raymond", "At", "##tev", "##eld", "and", "Erwin", "van", "der", "Lo", "##oi", "." ], "ids": [ 31826, 100319, 76323, 107717, 42767, 10162, 24890, 122, 118, 121, 22087, 29077, 10105, 12356, 10169, 10893, 19964, 10588, 11901, 10105, 27920, 94397, 10161, 10108, 36426, 10107, 17326, 11699, 70623, 24317, 10111, 36922, 10145, 10118, 13069, 14638, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Gaston", "Tau", "##ment", "scored", "twice", "and", "newly", "signed", "Argentine", "Pablo", "Sanchez", "once", "in", "Feyenoord", "Rotterdam", "'", "s", "3", "-", "0", "victory", "over", "Vol", "##enda", "##m", "." ], "ids": [ 36369, 88233, 10426, 17233, 26261, 10111, 26574, 14775, 31469, 17199, 66007, 14907, 10106, 103340, 25136, 112, 187, 124, 118, 121, 19735, 10491, 12546, 27808, 10147, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 2, 4, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "BE", "##L", "##GI", "##AN", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 46291, 11369, 100075, 41275, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "25" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Belgian", "first" ], "ids": [ 33036, 10108, 36652, 10422 ], "entity": [ "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "matches", "at", "the", "weekend", ":" ], "ids": [ 13751, 41356, 18258, 10160, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gen", "##k", "1", "Club", "Brugge", "1" ], "ids": [ 32560, 10174, 122, 11316, 57847, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Hare", "##lbe", "##ke", "3", "Mechelen", "3" ], "ids": [ 61535, 74563, 10550, 124, 98376, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Standard", "Lie", "##ge", "3", "Mol", "##en", "##beek", "0" ], "ids": [ 17861, 39710, 10525, 124, 58895, 10136, 71276, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Anderlecht", "2", "Lok", "##eren", "2" ], "ids": [ 88092, 123, 63998, 13653, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Cercle", "Brugge", "2", "Mo", "##us", "##cro", "##n", "2" ], "ids": [ 75154, 57847, 123, 34987, 10251, 37615, 10115, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Antwerp", "1", "Lo", "##mmel", "4" ], "ids": [ 85332, 122, 13069, 79968, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "G", "##hen", "##t", "3", "Aa", "##lst", "2" ], "ids": [ 144, 14786, 10123, 124, 80131, 55533, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Lie", "##rse", "4", "Charleroi", "0" ], "ids": [ 39710, 16239, 125, 88011, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Sint", "T", "##rui", "##den", "3", "Ek", "##eren", "1" ], "ids": [ 20160, 157, 59559, 10633, 124, 35769, 13653, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##hen", "##t", "4", "3", "1", "0", "9", "5", "10" ], "ids": [ 144, 14786, 10123, 125, 124, 122, 121, 130, 126, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standard", "Lie", "##ge", "4", "3", "0", "1", "7", "3", "9" ], "ids": [ 17861, 39710, 10525, 125, 124, 121, 122, 128, 124, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Club", "Brugge", "4", "2", "2", "0", "10", "4", "8" ], "ids": [ 11316, 57847, 125, 123, 123, 121, 10150, 125, 129 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mo", "##us", "##cro", "##n", "4", "2", "2", "0", "7", "4", "8" ], "ids": [ 34987, 10251, 37615, 10115, 125, 123, 123, 121, 128, 125, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anderlecht", "4", "1", "3", "0", "9", "3", "6" ], "ids": [ 88092, 125, 122, 124, 121, 130, 124, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lie", "##rse", "4", "1", "3", "0", "7", "3", "6" ], "ids": [ 39710, 16239, 125, 122, 124, 121, 128, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Antwerp", "4", "2", "0", "2", "6", "10", "6" ], "ids": [ 85332, 125, 123, 121, 123, 127, 10150, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gen", "##k", "4", "1", "2", "1", "6", "5", "5" ], "ids": [ 32560, 10174, 125, 122, 123, 122, 127, 126, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mol", "##en", "##beek", "4", "1", "2", "1", "4", "5", "5" ], "ids": [ 58895, 10136, 71276, 125, 122, 123, 122, 125, 126, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hare", "##lbe", "##ke", "4", "1", "1", "2", "6", "7", "4" ], "ids": [ 61535, 74563, 10550, 125, 122, 122, 123, 127, 128, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aa", "##lst", "4", "1", "1", "2", "5", "6", "4" ], "ids": [ 80131, 55533, 125, 122, 122, 123, 126, 127, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lok", "##eren", "4", "1", "1", "2", "4", "5", "4" ], "ids": [ 63998, 13653, 125, 122, 122, 123, 125, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ek", "##eren", "4", "1", "1", "2", "6", "8", "4" ], "ids": [ 35769, 13653, 125, 122, 122, 123, 127, 129, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lo", "##mmel", "4", "1", "1", "2", "5", "10", "4" ], "ids": [ 13069, 79968, 125, 122, 122, 123, 126, 10150, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mechelen", "4", "0", "3", "1", "6", "7", "3" ], "ids": [ 98376, 125, 121, 124, 122, 127, 128, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cercle", "Brugge", "4", "0", "3", "1", "4", "5", "3" ], "ids": [ 75154, 57847, 125, 121, 124, 122, 125, 126, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Charleroi", "4", "1", "0", "3", "4", "8", "3" ], "ids": [ 88011, 125, 122, 121, 124, 125, 129, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sint", "T", "##rui", "##den", "4", "1", "0", "3", "4", "11", "3" ], "ids": [ 20160, 157, 59559, 10633, 125, 122, 121, 124, 125, 10193, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##IE", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 71655, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "25" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "Dutch", "first", "division" ], "ids": [ 42027, 10108, 17693, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "played", "on", "Sunday", ":" ], "ids": [ 41356, 11553, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Feyenoord", "Rotterdam", "3", "(", "Sanchez", "27", "##th", ",", "Tau", "##ment", "44", "##th", ",", "57", "##th", ")" ], "ids": [ 103340, 25136, 124, 113, 66007, 10365, 11143, 117, 88233, 10426, 11126, 11143, 117, 11817, 11143, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vol", "##enda", "##m", "0", "." ], "ids": [ 12546, 27808, 10147, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9 ] }, { "tokens": [ "Half", "##time", "2", "-", "0", "." ], "ids": [ 33100, 18086, 123, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "not", "given", "." ], "ids": [ 46080, 10472, 13507, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "NEC", "Nijmegen", "0", "AZ", "Al", "##km", "##aar", "0", "." ], "ids": [ 97104, 81444, 121, 81705, 10883, 23440, 21960, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Attendance", "not", "given", "." ], "ids": [ 46080, 10472, 13507, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Vi", "##tesse", "Arnhem", "1", "(", "Van", "Wan", "##ro", "##oy", "58", "##th", ")", "Utrecht", "0", "." ], "ids": [ 31826, 100319, 76323, 122, 113, 11474, 47426, 10567, 20712, 11824, 11143, 114, 24890, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "0", "." ], "ids": [ 33100, 18086, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "7", ",", "032", "." ], "ids": [ 46080, 128, 117, 104038, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Twente", "En", "##sche", "##de", "1", "(", "Ho", "##og", "##ma", "30th", ")", "Roda", "JC", "Kerk", "##rade", "1", "(", "R", "##oel", "##of", "##sen" ], "ids": [ 104879, 10243, 12279, 10253, 122, 113, 20220, 12717, 10369, 95539, 114, 97751, 76199, 36156, 18752, 122, 113, 155, 58802, 20324, 10917 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 4, 8, 8, 9, 9, 3, 7, 7, 7, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "28", "##th", ")", "." ], "ids": [ 10348, 11143, 114, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "1", "-", "1", "." ], "ids": [ 33100, 18086, 122, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "not", "given", "." ], "ids": [ 46080, 10472, 13507, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "PSV", "Eindhoven", "4", "(", "Faber", "32", "##nd", ",", "Nil", "##is", "63", "##rd", "79", "##th", ",", "Petrov", "##ic", "78", "##th", ")" ], "ids": [ 66922, 55552, 125, 113, 49810, 10842, 11534, 117, 66163, 10291, 12256, 12023, 12791, 11143, 117, 108972, 11130, 12492, 11143, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Groningen", "1", "(", "Go", "##rre", "7th", ")", "." ], "ids": [ 36806, 122, 113, 14439, 19243, 15582, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "1", "-", "1", "." ], "ids": [ 33100, 18086, 122, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "27", ",", "500" ], "ids": [ 46080, 10365, 117, 10757 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "on", "Saturday", ":" ], "ids": [ 17712, 10336, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##raaf", "##schap", "Doe", "##tin", "##chem", "3", "(", "Ibrahim", "20th", "63", "##rd", ",", "God", "##ee", "54", "##th", ")", "RK", "##C" ], "ids": [ 144, 71647, 21289, 71335, 15364, 34884, 124, 113, 30727, 18604, 12256, 12023, 117, 14015, 13321, 11653, 11143, 114, 105546, 10858 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 4, 9, 9, 9, 9, 4, 8, 9, 9, 9, 3, 7 ] }, { "tokens": [ "W", "##aal", "##wijk", "2", "(", "Dos", "Santos", "38", "##th", ",", "Van", "Ar", "##um", "73", "##th", "penalty", ")", "." ], "ids": [ 160, 19641, 42727, 123, 113, 23846, 17223, 11171, 11143, 117, 11474, 18484, 10465, 12545, 11143, 40924, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time" ], "ids": [ 33100, 18086 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", "-", "1", "." ], "ids": [ 122, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "7", ",", "000" ], "ids": [ 46080, 128, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Willem", "II", "Til", "##burg", "0", "Fortuna", "Sitt", "##ard", "1", "(", "Hamm", "##ing", "65", "##th", ")", "." ], "ids": [ 20903, 10335, 27853, 12248, 121, 59890, 105987, 13167, 122, 113, 51324, 10230, 10843, 11143, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time" ], "ids": [ 33100, 18086 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "0", "-", "0", "." ], "ids": [ 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "7", ",", "250", "." ], "ids": [ 46080, 128, 117, 12214, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##C", "Breda", "1", "(", "Arnold", "70", "##th", ")", "Sparta", "Rotterdam", "0", "." ], "ids": [ 56586, 10858, 57883, 122, 113, 17733, 10923, 11143, 114, 36354, 25136, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Hal", "##dt", "##ime", "0", "-", "0", "." ], "ids": [ 21699, 14892, 19151, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "11", ",", "500", "." ], "ids": [ 46080, 10193, 117, 10757, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Heer", "##en", "##veen", "2", "(", "Wo", "##uden", "53", "##rd", ",", "Dahl", "Tomas", "##son", "74", "##th", ")", "Ajax", "Amsterdam" ], "ids": [ 49764, 10136, 53467, 123, 113, 102204, 23280, 11756, 12023, 117, 55809, 41889, 11599, 12535, 11143, 114, 37057, 14017 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 3, 7 ] }, { "tokens": [ "0", ".", "Half", "##time", "0", "-", "0", "." ], "ids": [ 121, 119, 33100, 18086, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "13", ",", "500", "." ], "ids": [ 46080, 10249, 117, 10757, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "TA", "##BL", "##E", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 91075, 94701, 11259, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "25" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "Dutch", "first", "division" ], "ids": [ 32070, 16203, 10108, 17693, 10422, 13751 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "match", "played", "on", "Sunday", ":" ], "ids": [ 41356, 12356, 11553, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Feyenoord", "Rotterdam", "3", "Vol", "##enda", "##m", "0" ], "ids": [ 103340, 25136, 124, 12546, 27808, 10147, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "NEC", "Nijmegen", "0", "AZ", "Al", "##km", "##aar", "0" ], "ids": [ 97104, 81444, 121, 81705, 10883, 23440, 21960, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Vi", "##tesse", "Arnhem", "1", "Utrecht", "0" ], "ids": [ 31826, 100319, 76323, 122, 24890, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Twente", "En", "##sche", "##de", "1", "Roda", "JC", "1" ], "ids": [ 104879, 10243, 12279, 10253, 122, 97751, 76199, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "PSV", "Eindhoven", "4", "Groningen", "1" ], "ids": [ 66922, 55552, 125, 36806, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Play", "##ed", "on", "Saturday", ":" ], "ids": [ 17712, 10336, 10135, 24848, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##raaf", "##schap", "Doe", "##tin", "##chem", "3", "RK", "##C", "W", "##aal", "##wijk", "2" ], "ids": [ 144, 71647, 21289, 71335, 15364, 34884, 124, 105546, 10858, 160, 19641, 42727, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Willem", "II", "Til", "##burg", "0", "Fortuna", "Sitt", "##ard", "1" ], "ids": [ 20903, 10335, 27853, 12248, 121, 59890, 105987, 13167, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "NA", "##C", "Breda", "1", "Sparta", "Rotterdam", "0" ], "ids": [ 56586, 10858, 57883, 122, 36354, 25136, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Heer", "##en", "##veen", "2", "Ajax", "Amsterdam", "0" ], "ids": [ 49764, 10136, 53467, 123, 37057, 14017, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PSV", "Eindhoven", "2", "2", "0", "0", "8", "2", "6" ], "ids": [ 66922, 55552, 123, 123, 121, 121, 129, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vi", "##tesse", "Arnhem", "2", "2", "0", "0", "3", "0", "6" ], "ids": [ 31826, 100319, 76323, 123, 123, 121, 121, 124, 121, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Feyenoord", "Rotterdam", "2", "1", "1", "0", "4", "1", "4" ], "ids": [ 103340, 25136, 123, 122, 122, 121, 125, 122, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##raaf", "##schap", "Doe", "##tin", "##chem", "2", "1", "1", "0", "4", "3", "4" ], "ids": [ 144, 71647, 21289, 71335, 15364, 34884, 123, 122, 122, 121, 125, 124, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Twente", "En", "##sche", "##de", "2", "1", "1", "0", "4", "2", "4" ], "ids": [ 104879, 10243, 12279, 10253, 123, 122, 122, 121, 125, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Sitt", "##ard", "2", "1", "1", "0", "1", "0", "4" ], "ids": [ 59890, 105987, 13167, 123, 122, 122, 121, 122, 121, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Heer", "##en", "##veen", "2", "1", "0", "1", "3", "3", "3" ], "ids": [ 49764, 10136, 53467, 123, 122, 121, 122, 124, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##C", "Breda", "2", "1", "0", "1", "1", "1", "3" ], "ids": [ 56586, 10858, 57883, 123, 122, 121, 122, 122, 122, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ajax", "Amsterdam", "2", "1", "0", "1", "1", "2", "3" ], "ids": [ 37057, 14017, 123, 122, 121, 122, 122, 123, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Roda", "JC", "Kerk", "##rade", "2", "0", "2", "0", "2", "2", "2" ], "ids": [ 97751, 76199, 36156, 18752, 123, 121, 123, 121, 123, 123, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Utrecht", "2", "0", "1", "1", "2", "3", "1" ], "ids": [ 24890, 123, 121, 122, 122, 123, 124, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RK", "##C", "W", "##aal", "##wijk", "2", "0", "1", "1", "4", "5", "1" ], "ids": [ 105546, 10858, 160, 19641, 42727, 123, 121, 122, 122, 125, 126, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sparta", "Rotterdam", "2", "0", "1", "1", "0", "1", "1" ], "ids": [ 36354, 25136, 123, 121, 122, 122, 121, 122, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Willem", "II", "Til", "##burg", "2", "0", "1", "1", "0", "1", "1" ], "ids": [ 20903, 10335, 27853, 12248, 123, 121, 122, 122, 121, 122, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AZ", "Al", "##km", "##aar", "2", "0", "1", "1", "0", "2", "1" ], "ids": [ 81705, 10883, 23440, 21960, 123, 121, 122, 122, 121, 123, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vol", "##enda", "##m", "2", "0", "1", "1", "1", "4", "1" ], "ids": [ 12546, 27808, 10147, 123, 121, 122, 122, 122, 125, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Groningen", "2", "0", "1", "1", "1", "4", "1" ], "ids": [ 36806, 123, 121, 122, 122, 122, 125, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NEC", "Nijmegen", "2", "0", "1", "1", "1", "4", "1" ], "ids": [ 97104, 81444, 123, 121, 122, 122, 122, 125, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "D", "##UT", "##CH", "CA", "##P", "##TA", "##IN", "BL", "##IN", "##D", "EN", "##DS", "IN", "##TER", "##NA", "##TION", "##AL", "CA", "##RE", "##ER", "." ], "ids": [ 141, 65729, 86448, 24707, 11127, 24951, 27128, 102549, 27128, 11490, 31278, 33953, 36351, 99552, 36742, 98207, 32002, 24707, 66014, 24093, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "25" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "soccer", "captain", "Danny", "Blind", "has", "decided", "to", "end", "his", "international", "career", ",", "Ajax", "spoke", "##sman", "David", "End", "##t", "said", "on", "Sunday", "." ], "ids": [ 17693, 41356, 28157, 20340, 41343, 10393, 17270, 10114, 11572, 10226, 12533, 13021, 117, 37057, 50005, 24305, 10804, 16777, 10123, 12415, 10135, 19731, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "End", "##t", "told", "Dutch", "news", "agency", "AN", "##P", "that", "Blind", ",", "35", ",", "would", "no", "longer", "be", "available", "for", "selection", "for", "the", "national", "squad", "." ], "ids": [ 16777, 10123, 21937, 17693, 14424, 34649, 50972, 11127, 10189, 41343, 117, 10803, 117, 10894, 10192, 20165, 10347, 14579, 10142, 30641, 10142, 10105, 11844, 30580, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 2, 9, 9, 3, 7, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Ajax", "defender", ",", "who", "led", "the", "Netherlands", "into", "the", "quarter", "-", "finals", "at", "June", "'", "s", "European", "championship", "finals", "in", "England", ",", "had", "decided", "to", "de", "##vot", "##e", "his", "attention", "to", "playing", "for", "his", "Amsterdam", "club", ",", "End", "##t", "said", "." ], "ids": [ 10117, 37057, 36426, 117, 10479, 12857, 10105, 22043, 10708, 10105, 28330, 118, 21758, 10160, 11120, 112, 187, 11914, 20755, 21758, 10106, 11701, 117, 10374, 17270, 10114, 10104, 63129, 10112, 10226, 21341, 10114, 14879, 10142, 10226, 14017, 11111, 117, 16777, 10123, 12415, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Blind", ",", "who", "played", "in", "the", "1990", "World", "Cup", "and", "the", "1992", "European", "championship", ",", "was", "cap", "##ped", "42", "times", "for", "the", "Netherlands", "." ], "ids": [ 41343, 117, 10479, 11553, 10106, 10105, 10420, 10315, 11544, 10111, 10105, 10450, 11914, 20755, 117, 10134, 13337, 16898, 11276, 13465, 10142, 10105, 22043, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "IN", "##DI", "##A", "BA", "##NS", "SI", "##DH", "##U", "FOR", "50", "DA", "##YS", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 36351, 58730, 10738, 39999, 69196, 39675, 58606, 12022, 109544, 10462, 47855, 93202, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "DE", "##L", "##HI", "1996", "-", "08", "-", "25" ], "ids": [ 86607, 13034, 25067, 11369, 108880, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indian", "open", "##er", "Na", "##v", "##jot", "Singh", "Sid", "##hu", "was", "on", "Sunday", "given", "a", "50", "-", "day", "ban", "from", "international", "cricket", "for", "quit", "##ting", "this", "year", "'", "s", "tour", "of", "England", ",", "the", "Press", "Trust", "of", "India", "said", "." ], "ids": [ 12544, 14087, 10165, 10685, 10477, 62788, 20550, 31091, 13723, 10134, 10135, 19731, 13507, 169, 10462, 118, 11940, 11915, 10188, 12533, 32289, 10142, 101237, 12141, 10531, 10924, 112, 187, 12842, 10108, 11701, 117, 10105, 10568, 22271, 10108, 11098, 12415, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "The", "right", "-", "handed", "bat", "##sman", "will", "have", "to", "for", "##fe", "##it", "half", "the", "money", "he", "was", "due", "to", "earn", "from", "the", "tour", ",", "the", "news", "agency", "said", "after", "a", "disciplina", "##ry", "committee", "set", "up", "by", "the", "Board", "of", "Control", "for", "Cricket", "in", "India", "met", "at", "Mo", "##hali", ",", "near", "the", "northern", "city", "of", "Chan", "##dig", "##ar", "##h", "." ], "ids": [ 10117, 13448, 118, 44040, 11519, 24305, 11337, 10529, 10114, 10142, 14601, 10486, 13877, 10105, 17920, 10261, 10134, 10850, 10114, 65065, 10188, 10105, 12842, 117, 10105, 14424, 34649, 12415, 10662, 169, 40104, 10908, 27634, 11847, 10741, 10155, 10105, 14743, 10108, 20083, 10142, 31125, 10106, 11098, 10428, 10160, 34987, 63889, 117, 12883, 10105, 17335, 11584, 10108, 27602, 17208, 10354, 10237, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Sid", "##hu", "abandoned", "the", "Indian", "team", "after", "the", "third", "one", "-", "day", "international", "against", "England", "at", "Old", "Tra", "##fford", "in", "Manchester", "on", "May", "26", ",", "before", "India", "began", "a", "three", "-", "test", "series", ",", "citing", "serious", "differences", "with", "captain", "Mohammed", "Az", "##haru", "##ddin", "." ], "ids": [ 31091, 13723, 32296, 10105, 12544, 11121, 10662, 10105, 12628, 10464, 118, 11940, 12533, 11327, 11701, 10160, 13773, 21469, 98680, 10106, 15349, 10135, 10725, 10314, 117, 11360, 11098, 11941, 169, 11003, 118, 15839, 11366, 117, 71306, 32342, 39336, 10169, 28157, 32415, 11122, 65734, 51256, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Az", "##haru", "##ddin", "was", "sac", "##ked", "after", "the", "tour", "and", "replaced", "by", "Sa", "##chin", "Ten", "##dul", "##kar", "." ], "ids": [ 11122, 65734, 51256, 10134, 109436, 30511, 10662, 10105, 12842, 10111, 16478, 10155, 12404, 43849, 16411, 42918, 15190, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Sid", "##hu", "was", "not", "considered", "for", "the", "four", "-", "nation", "Singer", "Cup", "beginning", "in", "Sri", "Lanka", "this", "month", "and", "the", "Sahara", "Cup", "against", "Pakistan", "scheduled", "to", "be", "played", "in", "Canada", "next", "month", "." ], "ids": [ 31091, 13723, 10134, 10472, 14289, 10142, 10105, 11598, 118, 22274, 29842, 11544, 17967, 10106, 16098, 20828, 10531, 14064, 10111, 10105, 38836, 11544, 11327, 15437, 34081, 10114, 10347, 11553, 10106, 11635, 13451, 14064, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9, 9, 9, 9, 2, 6, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Sid", "##hu", ",", "whose", "ban", "ends", "on", "October", "14", ",", "will", "be", "free", "to", "play", "domestic", "cricket", "." ], "ids": [ 31091, 13723, 117, 16879, 11915, 29047, 10135, 11212, 10247, 117, 11337, 10347, 13961, 10114, 12253, 31084, 32289, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "will", "not", "be", "considered", "for", "a", "test", "match", "against", "Australia", "starting", "on", "October", "10", "in", "New", "Delhi", ",", "the", "United", "News", "of", "India", "said", "." ], "ids": [ 10357, 11337, 10472, 10347, 14289, 10142, 169, 15839, 12356, 11327, 11729, 21868, 10135, 11212, 10150, 10106, 10287, 18720, 117, 10105, 10609, 12219, 10108, 11098, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "LE", "##AG", "##UE", "-", "Australian", "rugby", "league", "standing", "##s", "." ], "ids": [ 155, 12022, 32469, 14703, 84977, 109865, 62674, 118, 12829, 19812, 15616, 32173, 10107, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "26" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australian", "rugby", "league", "premiers", "##hip", "standing", "##s", "after", "matches", "played", "at", "the", "weekend", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "points", "for", ",", "against", ",", "total", "points", ")", ":" ], "ids": [ 12829, 19812, 15616, 18682, 17883, 32173, 10107, 10662, 18258, 11553, 10160, 10105, 43440, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 12789, 10142, 117, 11327, 117, 11339, 12789, 114, 131 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Man", "##ly", "21", "17", "0", "4", "501", "181", "34" ], "ids": [ 11343, 10454, 10296, 10273, 121, 125, 34067, 22534, 11069 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brisbane", "21", "16", "0", "5", "569", "257", "32" ], "ids": [ 29493, 10296, 10250, 121, 126, 53670, 26992, 10842 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "North", "Sydney", "21", "14", "2", "5", "560", "317", "30" ], "ids": [ 11225, 14470, 10296, 10247, 123, 126, 29524, 30986, 10244 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "City", "20", "14", "1", "5", "487", "293", "29" ], "ids": [ 14470, 10773, 10197, 10247, 122, 126, 49270, 30435, 10386 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##ron", "##ulla", "20", "12", "2", "6", "359", "258", "26" ], "ids": [ 140, 11620, 63486, 10197, 10186, 123, 127, 35403, 29226, 10314 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Canberra", "21", "12", "1", "8", "502", "374", "25" ], "ids": [ 46452, 10296, 10186, 122, 129, 44963, 38922, 10258 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "George", "21", "12", "1", "8", "421", "344", "25" ], "ids": [ 10838, 10955, 10296, 10186, 122, 129, 38648, 34107, 10258 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Newcastle", "21", "11", "1", "9", "416", "366", "23" ], "ids": [ 28060, 10296, 10193, 122, 130, 33833, 35612, 10328 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Western", "Sub", "##ur", "##bs", "21", "11", "1", "9", "382", "426", "23" ], "ids": [ 13163, 24358, 10546, 19528, 10296, 10193, 122, 130, 37309, 39645, 10328 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Auckland", "21", "11", "0", "10", "406", "389", "22" ], "ids": [ 33920, 10296, 10193, 121, 10150, 28081, 40064, 10306 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "Tigers", "21", "11", "0", "10", "309", "435", "22" ], "ids": [ 14470, 38640, 10296, 10193, 121, 10150, 30667, 36898, 10306 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Parra", "##matta", "21", "10", "1", "10", "388", "391", "21" ], "ids": [ 95966, 93263, 10296, 10150, 122, 10150, 38317, 40366, 10296 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "Bulldogs", "21", "10", "0", "11", "325", "356", "20" ], "ids": [ 14470, 108221, 10296, 10150, 121, 10193, 25843, 33303, 10197 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Illa", "##war", "##ra", "21", "8", "0", "13", "395", "432", "16" ], "ids": [ 76697, 29445, 10288, 10296, 129, 121, 10249, 30432, 36173, 10250 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Western", "Reds", "21", "6", "1", "14", "297", "398", "13" ], "ids": [ 13163, 74652, 10296, 127, 122, 10247, 29469, 43338, 10249 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pen", "##rit", "##h", "21", "6", "1", "14", "339", "448", "13" ], "ids": [ 52559, 16598, 10237, 10296, 127, 122, 10247, 34753, 38611, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "North", "Queensland", "21", "6", "0", "15", "266", "593", "12" ], "ids": [ 11225, 20008, 10296, 127, 121, 10208, 28477, 54619, 10186 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gold", "Coast", "21", "5", "1", "15", "351", "483", "11" ], "ids": [ 14363, 17498, 10296, 126, 122, 10208, 34487, 49863, 10193 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Sydney", "21", "5", "1", "15", "304", "586", "11" ], "ids": [ 11056, 14470, 10296, 126, 122, 10208, 26263, 53461, 10193 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Queensland", "21", "4", "0", "17", "210", "460", "8" ], "ids": [ 11056, 20008, 10296, 125, 121, 10273, 17131, 27296, 129 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "UN", "##ION", "-", "All", "Blacks", "re", "##liv", "##e", "tri", "##ump", "##h", "." ], "ids": [ 155, 12022, 32469, 14703, 26578, 52980, 118, 11101, 107375, 11639, 49385, 10112, 15633, 67299, 10237, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ET", "##OR", "##IA", ",", "Aug", "25", "-", "Captain", "Sean", "Fi", "##tz", "##patrick", "and", "his", "All", "Blacks", "rev", "##isited", "the", "test", "venue", "today", "to", "re", "##liv", "##e", "some", "of", "the", "magic", "moments", "of", "ye", "##ster", "##day", "'", "s", "momento", "##us", "rugby", "victory", "over", "South", "Africa", ",", "NZ", "##PA", "reported", "." ], "ids": [ 23837, 52338, 42622, 35976, 117, 53012, 10258, 118, 17448, 21286, 36448, 13695, 81573, 10111, 10226, 11101, 107375, 86095, 94157, 10105, 15839, 39975, 18745, 10114, 11639, 49385, 10112, 11152, 10108, 10105, 55909, 47641, 10108, 11023, 12765, 24558, 112, 187, 13782, 10251, 19812, 19735, 10491, 11056, 12880, 117, 105920, 52099, 15943, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Most", "of", "the", "test", "15", "who", "beat", "the", "Spring", "##bok", "##s", "33", "-", "26", "to", "secure", "New", "Zealand", "'", "s", "first", "-", "ever", "rugby", "series", "in", "South", "Africa", "stood", "in", "the", "middle", "of", "the", "empty", "50", ",", "000", "-", "seat", "Lo", "##ft", "##us", "Vers", "##feld", "." ], "ids": [ 14361, 10108, 10105, 15839, 10208, 10479, 27868, 10105, 18698, 30980, 10107, 11000, 118, 10314, 10114, 45853, 10287, 14451, 112, 187, 10422, 118, 17038, 19812, 11366, 10106, 11056, 12880, 39320, 10106, 10105, 20181, 10108, 10105, 65042, 10462, 117, 10259, 118, 17687, 13069, 12961, 10251, 46744, 14457, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9 ] }, { "tokens": [ "Mag", "##nificent", ",", "'", "'", "said", "Fi", "##tz", "##patrick", ",", "New", "Zealand", "'", "s", "most", "cap", "##ped", "player", "and", "the", "world", "'", "s", "most", "cap", "##ped", "forward", "." ], "ids": [ 63672, 97026, 117, 112, 112, 12415, 36448, 13695, 81573, 117, 10287, 14451, 112, 187, 10992, 13337, 16898, 12928, 10111, 10105, 11356, 112, 187, 10992, 13337, 16898, 23307, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "players", "re", "##liv", "##ed", "the", "moves", "and", "tries", ",", "the", "tackles", "and", "what", "might", "have", "been", "as", "the", "em", "##otions", "of", "victory", "continued", "." ], "ids": [ 10117, 16021, 11639, 49385, 10336, 10105, 49157, 10111, 38106, 117, 10105, 84845, 10111, 12976, 20970, 10529, 10590, 10146, 10105, 10266, 94409, 10108, 19735, 14278, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zi", "##nza", "##n", "Brooke", ",", "the", "only", "No", "8", "in", "test", "rugby", "to", "have", "scored", "a", "dropped", "goal", "when", "he", "kick", "##ed", "a", "three", "-", "pointe", "##r", "against", "England", "during", "last", "year", "'", "s", "World", "Cup", ",", "added", "a", "second", "to", "his", "name", "ye", "##ster", "##day", "." ], "ids": [ 99890, 13371, 10115, 46456, 117, 10105, 10893, 10657, 129, 10106, 15839, 19812, 10114, 10529, 17233, 169, 30241, 16586, 10841, 10261, 55321, 10336, 169, 11003, 118, 66219, 10129, 11327, 11701, 10939, 12469, 10924, 112, 187, 10315, 11544, 117, 16288, 169, 11132, 10114, 10226, 11324, 11023, 12765, 24558, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "was", "right", "here", ",", "'", "'", "he", "said", "standing", "at", "the", "spot", "where", "he", "had", "received", "the", "ball", "for", "the", "kick", "." ], "ids": [ 146, 10134, 13448, 19353, 117, 112, 112, 10261, 12415, 32173, 10160, 10105, 28504, 10940, 10261, 10374, 12296, 10105, 20724, 10142, 10105, 55321, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "mau", "##l", "was", "there", "and", "I", "was", "going", "to", "go", "in", "but", "I", "thought", "I", "should", "hold", "off", "because", "we", "had", "the", "ball", "." ], "ids": [ 10117, 43024, 10161, 10134, 11155, 10111, 146, 10134, 19090, 10114, 11783, 10106, 10473, 146, 18957, 146, 14819, 18500, 11898, 12373, 11951, 10374, 10105, 20724, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "(", "half", "##back", ")", "Justin", "Marshall", "got", "the", "ball", "he", "was", "going", "to", "go", "on", "the", "opens", "##ide", "where", "Jon", "Preston", "was", "so", "I", "em", "##pti", "##ed", "my", "lung", "at", "him", "to", "get", "the", "ball", "this", "way", "." ], "ids": [ 12242, 113, 13877, 18666, 114, 21823, 17705, 19556, 10105, 20724, 10261, 10134, 19090, 10114, 11783, 10135, 10105, 70702, 13315, 10940, 17749, 35119, 10134, 10380, 146, 10266, 94618, 10336, 15127, 66041, 10160, 10957, 10114, 15329, 10105, 20724, 10531, 13170, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "just", "hit", "through", "and", "I", "was", "pun", "##ching", "the", "air", "before", "the", "ball", "got", "there", "." ], "ids": [ 146, 12820, 14946, 11222, 10111, 146, 10134, 32310, 41247, 10105, 12566, 11360, 10105, 20724, 19556, 11155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "cost", "me", "a", "few", "bu", "##cks", "at", "the", "bar", ".", "'" ], "ids": [ 10377, 18849, 10911, 169, 13824, 11499, 18676, 10160, 10105, 18121, 119, 112 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "'" ], "ids": [ 112 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "The", "decision", "to", "attempt", "a", "dropped", "goal", "was", "a", "sp", "##onta", "##neous", "one", ",", "Brooke", "said", "." ], "ids": [ 10117, 19231, 10114, 21395, 169, 30241, 16586, 10134, 169, 32650, 107835, 76330, 10464, 117, 46456, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "It", "was", "just", "like", "the", "World", "Cup", ",", "the", "ball", "came", "and", "the", "chance", "was", "there", ".", "'" ], "ids": [ 10377, 10134, 12820, 11850, 10105, 10315, 11544, 117, 10105, 20724, 13383, 10111, 10105, 27893, 10134, 11155, 119, 112 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "'" ], "ids": [ 112 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Centre", "Frank", "Bu", "##nce", "said", "he", "had", "never", "felt", "so", "ex", "##haus", "##ted", "during", "a", "match", "." ], "ids": [ 12838, 11872, 11916, 12150, 12415, 10261, 10374, 14794, 24666, 10380, 11419, 14465, 11912, 10939, 169, 12356, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "were", "gut", "##ted", "and", "there", "was", "now", "##here", "to", "hide", ",", "they", "just", "kept", "coming", "at", "you", ",", "'", "'", "he", "said", "." ], "ids": [ 12865, 10309, 23639, 11912, 10111, 11155, 10134, 11858, 57204, 10114, 96935, 117, 10689, 12820, 26546, 23959, 10160, 13028, 117, 112, 112, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "was", "gone", "in", "the", "first", "20", "minutes", ",", "completely", "ex", "##haus", "##ted", ",", "but", "you", "had", "no", "choice", "." ], "ids": [ 146, 10134, 45041, 10106, 10105, 10422, 10197, 15304, 117, 27185, 11419, 14465, 11912, 117, 10473, 13028, 10374, 10192, 30865, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "just", "so", "much", "riding", "on", "it", "." ], "ids": [ 11723, 10134, 12820, 10380, 13172, 56629, 10135, 10271, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "ama", "##zing", "just", "how", "big", "this", "ground", "was", "ye", "##ster", "##day", ".", "'" ], "ids": [ 10377, 112, 187, 28149, 19308, 12820, 14796, 22185, 10531, 16912, 10134, 11023, 12765, 24558, 119, 112 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "'" ], "ids": [ 112 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Two", "-", "try", "wing", "##er", "Jeff", "Wilson", "said", "he", "was", "so", "tire", "##d", "that", "he", "kept", "asking", "Bu", "##nce", "where", "he", "should", "be", "while", "defending", "." ], "ids": [ 13214, 118, 31638, 22571, 10165, 17218, 13083, 12415, 10261, 10134, 10380, 71841, 10162, 10189, 10261, 26546, 72082, 11916, 12150, 10940, 10261, 14819, 10347, 11371, 53730, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "told", "me", "I", "'", "m", "bug", "##gere", "##d", "too", "so", "just", "hang", "in", "there", "'", ",", "'", "'", "Wilson", "recalled", "." ], "ids": [ 10357, 21937, 10911, 146, 112, 181, 14460, 22976, 10162, 16683, 10380, 12820, 60083, 10106, 11155, 112, 117, 112, 112, 13083, 68117, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "About", "4000", "New", "Zealand", "##er", "supporters", "were", "party", "##ing", "into", "the", "early", "hours", "of", "today", "in", "the", "South", "African", "capital", "." ], "ids": [ 16260, 21655, 10287, 14451, 10165, 42957, 10309, 14039, 10230, 10708, 10105, 11732, 19573, 10108, 18745, 10106, 10105, 11056, 13839, 12185, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Message", "##s", "of", "good", "##wil", "##l", "continued", "to", "roll", "into", "the", "team", "hotel", "." ], "ids": [ 71014, 10107, 10108, 15198, 70185, 10161, 14278, 10114, 25520, 10708, 10105, 11121, 19157, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "Blacks", "coach", "John", "Hart", "said", "Prime", "Minister", "Jim", "Bol", "##ger", "rang", "him", "today", "to", "offer", "his", "con", "##grat", "##ulations", "." ], "ids": [ 11101, 107375, 15701, 10421, 22346, 12415, 19924, 14355, 14178, 45598, 11446, 25696, 10957, 18745, 10114, 24443, 10226, 10173, 84558, 74874, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "than", "##ked", "us", "on", "behalf", "of", "the", "country", ",", "which", "is", "really", "nic", "##e", "for", "the", "team", ",", "and", "I", "understand", "we", "had", "tre", "##mend", "##ous", "support", "at", "home", ".", "'" ], "ids": [ 10357, 11084, 30511, 19626, 10135, 50683, 10108, 10105, 12723, 117, 10319, 10124, 30181, 46267, 10112, 10142, 10105, 11121, 117, 10111, 146, 49151, 11951, 10374, 11617, 101480, 13499, 13145, 10160, 11816, 119, 112 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "'" ], "ids": [ 112 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Australian", "Rules", "-", "AFL", "results", "and", "standing", "##s", "." ], "ids": [ 12829, 37759, 118, 61984, 17466, 10111, 32173, 10107, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##L", "##B", "##O", "##UR", "##NE", "1996", "-", "08", "-", "26" ], "ids": [ 47430, 11369, 11274, 11403, 98348, 93280, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Australian", "Rules", "matches", "played", "at", "the", "weekend", "." ], "ids": [ 33036, 10108, 12829, 37759, 18258, 11553, 10160, 10105, 43440, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "Sunday", ":" ], "ids": [ 17712, 10336, 19731, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Adelaide", "14", ".", "12", "(", "96", ")", "Coll", "##ing", "##wood", "24", "." ], "ids": [ 27228, 10247, 119, 10186, 113, 12308, 114, 65689, 10230, 14759, 10233, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "9", "(", "153", ")" ], "ids": [ 130, 113, 19032, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "West", "Coast", "24", "." ], "ids": [ 11164, 17498, 10233, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9 ] }, { "tokens": [ "7", "(", "151", ")", "Melbourne", "11", ".", "12", "(", "78", ")" ], "ids": [ 128, 113, 20330, 114, 17784, 10193, 119, 10186, 113, 12492, 114 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Richmond", "28", ".", "19", "(", "187", ")", "Fi", "##tz", "##roy", "5", "." ], "ids": [ 25451, 10348, 119, 10270, 113, 23228, 114, 36448, 13695, 29099, 126, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "6", "(", "36", ")" ], "ids": [ 127, 113, 11055, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "Saturday", ":" ], "ids": [ 17712, 10336, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Carlton", "13", ".", "18", "(", "96", ")", "Foot", "##sc", "##ray", "9", ".", "12", "(", "66", ")" ], "ids": [ 61678, 10249, 119, 10218, 113, 12308, 114, 47239, 31505, 23432, 130, 119, 10186, 113, 12215, 114 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essen", "##don", "14", ".", "16", "(", "100", ")", "Sydney", "12", ".", "10", "(", "82", ")" ], "ids": [ 34803, 15081, 10247, 119, 10250, 113, 10407, 114, 14470, 10186, 119, 10150, 113, 12180, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Ki", "##lda", "9", "." ], "ids": [ 10838, 28941, 23388, 130, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9 ] }, { "tokens": [ "9", "(", "63", ")", "Ha", "##w", "##th", "##orn", "12", "." ], "ids": [ 130, 113, 12256, 114, 13740, 10874, 11143, 26302, 10186, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "8", "(", "80", ")" ], "ids": [ 129, 113, 10832, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Brisbane", "10", ".", "11", "(", "71", ")", "Fr", "##eman", "##tle", "10", ".", "10", "(", "70", ")" ], "ids": [ 29493, 10150, 119, 10193, 113, 12513, 114, 33884, 31087, 16406, 10150, 119, 10150, 113, 10923, 114 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "Friday", ":" ], "ids": [ 17712, 10336, 30767, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "North", "Melbourne", "14", ".", "12", "(", "96", ")", "G", "##eel", "##ong", "16", ".", "13", "(", "109", ")" ], "ids": [ 11225, 17784, 10247, 119, 10186, 113, 12308, 114, 144, 22618, 13891, 10250, 119, 10249, 113, 16296, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "points", "for", ",", "against", ",", "percentage", ",", "total", "points", ")", ":" ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 12789, 10142, 117, 11327, 117, 46971, 117, 11339, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brisbane", "21", "15", "1", "5", "212", "##3", "1631", "130", ".", "2", "62" ], "ids": [ 29493, 10296, 10208, 122, 126, 22023, 10884, 46342, 13389, 119, 123, 12066 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "21", "15", "1", "5", "206", "##7", "1687", "122", ".", "5", "62" ], "ids": [ 14470, 10296, 10208, 122, 126, 21717, 11305, 43047, 17484, 119, 126, 12066 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "West", "Coast", "21", "15", "0", "6", "215", "##1", "1673", "128", ".", "6", "60" ], "ids": [ 11164, 17498, 10296, 10208, 121, 127, 22050, 10759, 45292, 16196, 119, 127, 10709 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "North", "Melbourne", "21", "15", "0", "6", "238", "##5", "1873", "127", ".", "3", "60" ], "ids": [ 11225, 17784, 10296, 10208, 121, 127, 24388, 11166, 13789, 17592, 119, 124, 10709 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Carlton", "21", "14", "0", "7", "2009", "1844", "108", ".", "9", "56" ], "ids": [ 61678, 10296, 10247, 121, 128, 10195, 16047, 15845, 119, 130, 11628 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##eel", "##ong", "21", "13", "1", "7", "228", "##8", "1940", "117", ".", "9", "54" ], "ids": [ 144, 22618, 13891, 10296, 10249, 122, 128, 25646, 11396, 10888, 16628, 119, 130, 11653 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essen", "##don", "21", "13", "1", "7", "213", "##0", "1947", "109", ".", "4", "54" ], "ids": [ 34803, 15081, 10296, 10249, 122, 128, 22066, 10929, 11113, 16296, 119, 125, 11653 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Richmond", "21", "11", "0", "10", "217", "##3", "1803", "120", ".", "5", "44" ], "ids": [ 25451, 10296, 10193, 121, 10150, 21651, 10884, 18988, 12048, 119, 126, 11126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ha", "##w", "##th", "##orn", "21", "10", "1", "10", "1791", "1820", "98", ".", "4", "42" ], "ids": [ 13740, 10874, 11143, 26302, 10296, 10150, 122, 10150, 20361, 16776, 12327, 119, 125, 11276 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Ki", "##lda", "21", "9", "0", "12", "1909", "1958", "97", ".", "5", "36" ], "ids": [ 10838, 28941, 23388, 10296, 130, 121, 10186, 11944, 10947, 12328, 119, 126, 11055 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Coll", "##ing", "##wood", "21", "8", "0", "13", "210", "##3", "209", "##1", "100", ".", "6", "32" ], "ids": [ 65689, 10230, 14759, 10296, 129, 121, 10249, 17131, 10884, 23404, 10759, 10407, 119, 127, 10842 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Adelaide", "21", "8", "0", "13", "215", "##8", "218", "##3", "98", ".", "9", "32" ], "ids": [ 27228, 10296, 129, 121, 10249, 22050, 11396, 24599, 10884, 12327, 119, 130, 10842 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Melbourne", "21", "7", "0", "14", "1642", "236", "##1", "69", ".", "5", "28" ], "ids": [ 17784, 10296, 128, 121, 10247, 37248, 26318, 10759, 12573, 119, 126, 10348 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fr", "##eman", "##tle", "21", "6", "0", "15", "1673", "1912", "87", ".", "5", "24" ], "ids": [ 33884, 31087, 16406, 10296, 127, 121, 10208, 45292, 11507, 12581, 119, 126, 10233 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Foot", "##sc", "##ray", "21", "5", "1", "15", "1578", "206", "##0", "76", ".", "6", "22" ], "ids": [ 47239, 31505, 23432, 10296, 126, 122, 10208, 46261, 21717, 10929, 12428, 119, 127, 10306 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fi", "##tz", "##roy", "21", "1", "0", "20", "1381", "277", "##8", "49", ".", "7", "4" ], "ids": [ 36448, 13695, 29099, 10296, 122, 121, 10197, 89276, 28884, 11396, 11580, 119, 128, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rugby", "league", "-", "Australian", "rugby", "league", "results", "." ], "ids": [ 21803, 15616, 118, 12829, 19812, 15616, 17466, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "26" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Australian", "rugby", "league", "matches", "played", "at", "the", "weekend", "." ], "ids": [ 33036, 10108, 12829, 19812, 15616, 18258, 11553, 10160, 10105, 43440, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "Sunday", ":" ], "ids": [ 17712, 10336, 19731, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Sydney", "Bulldogs", "17", "South", "Queensland", "16", "Brisbane", "38", "Gold", "Coast", "10" ], "ids": [ 14470, 108221, 10273, 11056, 20008, 10250, 29493, 11171, 14363, 17498, 10150 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 3, 9, 3, 7, 9 ] }, { "tokens": [ "North", "Sydney", "46", "South", "Sydney", "4" ], "ids": [ 11225, 14470, 11528, 11056, 14470, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Illa", "##war", "##ra", "42", "Pen", "##rit", "##h", "2" ], "ids": [ 76697, 29445, 10288, 11276, 52559, 16598, 10237, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "St", "George", "20", "North", "Queensland", "24" ], "ids": [ 10838, 10955, 10197, 11225, 20008, 10233 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Man", "##ly", "42", "Western", "Sub", "##ur", "##bs", "12" ], "ids": [ 11343, 10454, 11276, 13163, 24358, 10546, 19528, 10186 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Play", "##ed", "Saturday", ":" ], "ids": [ 17712, 10336, 24848, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Parra", "##matta", "14", "Sydney", "Tigers", "26" ], "ids": [ 95966, 93263, 10247, 14470, 38640, 10314 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Newcastle", "24", "Western", "Reds", "20" ], "ids": [ 28060, 10233, 13163, 74652, 10197 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Play", "##ed", "Friday", ":" ], "ids": [ 17712, 10336, 30767, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Canberra", "30", "Auckland", "6" ], "ids": [ 46452, 10244, 33920, 127 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Africa", "yet", "to", "hear", "from", "apartheid", "en", "##forcer", "##s", "." ], "ids": [ 11056, 12880, 21833, 10114, 62064, 10188, 84330, 10110, 108064, 10107, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anton", "Ferreira" ], "ids": [ 16242, 39227 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "CA", "##P", "##E", "TO", "##WN", "1996", "-", "08", "-", "25" ], "ids": [ 24707, 11127, 11259, 58573, 105844, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Africa", "'", "s", "truth", "commission", "begins", "issu", "##ing", "sub", "##po", "##enas", "this", "week", "in", "a", "bid", "to", "dig", "beneath", "the", "political", "ratio", "##nale", "##s", "and", "find", "the", "sini", "##ster", "figures", "who", "have", "the", "blood", "of", "the", "country", "'", "s", "race", "war", "on", "their", "hands", "." ], "ids": [ 11056, 12880, 112, 187, 47226, 26568, 26462, 28815, 10230, 13987, 13520, 48123, 10531, 16118, 10106, 169, 50385, 10114, 80592, 82501, 10105, 13736, 26755, 38612, 10107, 10111, 17860, 10105, 78656, 12765, 21068, 10479, 10529, 10105, 24911, 10108, 10105, 12723, 112, 187, 14025, 10338, 10135, 10455, 27925, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leader", "##s", "of", "the", "major", "parties", "involved", ",", "from", "right", "-", "wing", "white", "##s", "to", "radical", "black", "##s", ",", "appeared", "before", "Archbishop", "Desmond", "Tu", "##tu", "'", "s", "Truth", "and", "Rec", "##on", "##ciliation", "Commission", "last", "week", "to", "paint", "the", "broad", "picture", "of", "their", "actions", "for", "or", "against", "apartheid", "." ], "ids": [ 37122, 10107, 10108, 10105, 11922, 18708, 16247, 117, 10188, 13448, 118, 22571, 15263, 10107, 10114, 31991, 15045, 10107, 117, 14565, 11360, 49823, 54033, 20108, 10991, 112, 187, 31925, 10111, 97200, 10263, 98956, 14941, 12469, 16118, 10114, 72700, 10105, 41848, 36761, 10108, 10455, 22115, 10142, 10345, 11327, 84330, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Most", ",", "including", "former", "president", "F", ".", "W", ".", "de", "K", "##ler", "##k", "and", "African", "National", "Congress", "Deputy", "President", "Tha", "##bo", "M", "##bek", "##i", ",", "offered", "apo", "##logie", "##s", "for", "any", "mis", "##take", "##s", "they", "had", "made", "and", "accepted", "broad", "responsibility", "for", "the", "actions", "of", "their", "foot", "soldiers", "." ], "ids": [ 14361, 117, 11198, 11775, 12931, 143, 119, 160, 119, 10104, 148, 10815, 10174, 10111, 13839, 10655, 15984, 32389, 12811, 107034, 11790, 150, 25047, 10116, 117, 20841, 34768, 17060, 10107, 10142, 11178, 12606, 47529, 10107, 10689, 10374, 11019, 10111, 24926, 41848, 39450, 10142, 10105, 22115, 10108, 10455, 24963, 23324, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "none", "named", "those", "guilty", "of", "order", "##ing", "or", "carrying", "out", "any", "of", "the", "gross", "violation", "##s", "of", "human", "rights", "which", "Tu", "##tu", "is", "in", "##vesti", "##gating", "." ], "ids": [ 16976, 46638, 12038, 12676, 56044, 10108, 12990, 10230, 10345, 39157, 10950, 11178, 10108, 10105, 92746, 88993, 10107, 10108, 14179, 16691, 10319, 20108, 10991, 10124, 10106, 63996, 91045, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Human", "rights", "lawyer", "Brian", "Cu", "##rri", "##n", "said", "the", "hearing", "##s", "last", "week", "were", "not", "intended", "as", "a", "form", "of", "con", "##fession", "##al", "and", "that", "those", "who", "personally", "committed", "crimes", "during", "apartheid", "would", "testi", "##fy", "only", "before", "a", "separate", "arm", "of", "the", "commission", ",", "the", "am", "##nes", "##ty", "committee", "." ], "ids": [ 15426, 16691, 38055, 13977, 34387, 24874, 10115, 12415, 10105, 51191, 10107, 12469, 16118, 10309, 10472, 24071, 10146, 169, 12188, 10108, 10173, 66903, 10415, 10111, 10189, 12676, 10479, 79151, 38184, 36951, 10939, 84330, 10894, 41319, 24203, 10893, 11360, 169, 19361, 31251, 10108, 10105, 26568, 117, 10105, 10392, 11496, 11195, 27634, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "n", "'", "t", "think", "one", "should", "have", "expected", "more", "than", "what", "one", "got", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 146, 10149, 182, 112, 188, 27874, 10464, 14819, 10529, 25973, 10798, 11084, 12976, 10464, 19556, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "was", "not", "the", "am", "##nes", "##ty", "committee", "where", "per", "##pet", "##rators", "are", "expected", "to", "open", "their", "heart", "##s", "and", "soul", "##s", "and", "to", "tell", "it", "all", ".", "\"" ], "ids": [ 13646, 10134, 10472, 10105, 10392, 11496, 11195, 27634, 10940, 10178, 19094, 94721, 10301, 25973, 10114, 14087, 10455, 21736, 10107, 10111, 33068, 10107, 10111, 10114, 41549, 10271, 10435, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "commission", ",", "which", "has", "the", "power", "to", "grant", "am", "##nes", "##ty", "to", "those", "who", "con", "##fes", "##s", "to", "abuse", "##s", ",", "has", "begun", "hearing", "the", "testi", "##mony", "from", "people", "already", "in", "jail", "for", "their", "deed", "##s", "." ], "ids": [ 10117, 26568, 117, 10319, 10393, 10105, 13183, 10114, 41100, 10392, 11496, 11195, 10114, 12676, 10479, 10173, 58058, 10107, 10114, 51401, 10107, 117, 10393, 49510, 51191, 10105, 41319, 91481, 10188, 11426, 19034, 10106, 75934, 10142, 10455, 37246, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "others", ",", "such", "as", "self", "-", "con", "##fes", "##sed", "secret", "police", "hit", "-", "squad", "leader", "Dirk", "Co", "##etz", "##ee", ",", "have", "yet", "to", "testi", "##fy", "." ], "ids": [ 16976, 14633, 117, 11049, 10146, 16567, 118, 10173, 58058, 16219, 23658, 15034, 14946, 118, 30580, 15014, 38535, 13098, 75065, 13321, 117, 10529, 21833, 10114, 41319, 24203, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tu", "##tu", "'", "s", "deputy", "chairman", ",", "Alex", "Bora", "##ine", ",", "told", "reporter", "##s", "the", "commission", "would", "begin", "issu", "##ing", "sub", "##po", "##enas", "to", "suspect", "##s", "who", "refused", "to", "appear", "vol", "##unta", "##rily", "some", "time", "this", "week", "." ], "ids": [ 20108, 10991, 112, 187, 45404, 27627, 117, 14728, 98164, 11088, 117, 21937, 41408, 10107, 10105, 26568, 10894, 16135, 28815, 10230, 13987, 13520, 48123, 10114, 97881, 10107, 10479, 29622, 10114, 22641, 12714, 27682, 103866, 11152, 10635, 10531, 16118, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "added", "that", "former", "hard", "##line", "apartheid", "president", "P", ".", "W", ".", "Both", "##a", "could", "be", "among", "those", "called", "." ], "ids": [ 10357, 16288, 10189, 11775, 19118, 12953, 84330, 12931, 153, 119, 160, 119, 20973, 10113, 12174, 10347, 13328, 12676, 11552, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Cu", "##rri", "##n", ",", "who", "is", "ad", "##visi", "##ng", "several", "people", "regarded", "as", "per", "##pet", "##rators", ",", "said", "this", "was", "not", "the", "best", "way", "to", "achieve", "the", "commission", "'", "s", "aims", "." ], "ids": [ 16976, 34387, 24874, 10115, 117, 10479, 10124, 10840, 45145, 10376, 11736, 11426, 34937, 10146, 10178, 19094, 94721, 117, 12415, 10531, 10134, 10472, 10105, 12504, 13170, 10114, 43250, 10105, 26568, 112, 187, 67789, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "A", "person", "can", "be", "forced", "to", "appear", ",", "but", "the", "only", "way", "one", "is", "going", "to", "get", "to", "the", "truth", "in", "its", "total", "##ity", "is", "if", "people", "feel", "it", "is", "a", "good", "idea", "to", "go", "to", "the", "am", "##nes", "##ty", "committee", "." ], "ids": [ 107, 138, 15042, 10944, 10347, 20054, 10114, 22641, 117, 10473, 10105, 10893, 13170, 10464, 10124, 19090, 10114, 15329, 10114, 10105, 47226, 10106, 10474, 11339, 11949, 10124, 12277, 11426, 38008, 10271, 10124, 169, 15198, 14932, 10114, 11783, 10114, 10105, 10392, 11496, 11195, 27634, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "the", "moment", "this", "is", "not", "the", "case", ".", "\"" ], "ids": [ 11699, 10105, 14316, 10531, 10124, 10472, 10105, 13474, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "cited", "Co", "##etz", "##ee", ",", "who", "was", "charged", "with", "murder", "after", "con", "##fes", "##sing", "in", "media", "interviews", "to", "dir", "##ty", "trick", "##s", "." ], "ids": [ 10357, 41164, 13098, 75065, 13321, 117, 10479, 10134, 38253, 10169, 29448, 10662, 10173, 58058, 16357, 10106, 12518, 47619, 10114, 15895, 11195, 71662, 10107, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "trial", "is", "due", "to", "start", "in", "December", "but", "the", "truth", "commission", "inte", "##nds", "to", "decide", "on", "his", "am", "##nes", "##ty", "application", "before", "that", "." ], "ids": [ 11597, 23626, 10124, 10850, 10114, 15148, 10106, 11288, 10473, 10105, 47226, 26568, 14168, 27090, 10114, 19068, 10135, 10226, 10392, 11496, 11195, 19800, 11360, 10189, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cu", "##rri", "##n", "said", "the", "law", "had", "to", "be", "changed", "so", "all", "judicial", "prose", "##cution", "##s", "were", "automatically", "suspended", "for", "those", "who", "approached", "the", "truth", "commission", "." ], "ids": [ 34387, 24874, 10115, 12415, 10105, 13255, 10374, 10114, 10347, 17695, 10380, 10435, 41809, 84145, 64195, 10107, 10309, 64585, 49799, 10142, 12676, 10479, 63548, 10105, 47226, 26568, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "week", "'", "s", "sub", "##mission", "##s", "to", "the", "commission", "by", "the", "ANC", ",", "de", "K", "##ler", "##k", "'", "s", "National", "Party", "and", "the", "right", "-", "wing", "Freedom", "Front", "of", "General", "Con", "##stand", "Vi", "##lj", "##oen", "left", "many", "South", "African", "##s", "uns", "##ati", "##s", "##fied", "." ], "ids": [ 14812, 16118, 112, 187, 13987, 27551, 10107, 10114, 10105, 26568, 10155, 10105, 90561, 117, 10104, 148, 10815, 10174, 112, 187, 10655, 12529, 10111, 10105, 13448, 118, 22571, 22326, 19241, 10108, 11220, 12845, 15418, 31826, 58254, 30017, 12153, 11299, 11056, 13839, 10107, 15826, 13259, 10107, 19907, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 8, 8, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bora", "##ine", "said", "the", "picture", "was", "in", "##com", "##plete", "because", "officers", "of", "the", "apartheid", "-", "era", "security", "forces", "had", "yet", "to", "make", "their", "scheduled", ",", "separate", "sub", "##mission", ",", "but", "one", "black", "calle", "##r", "to", "a", "radio", "talk", "show", "declared", ":" ], "ids": [ 98164, 11088, 12415, 10105, 36761, 10134, 10106, 22530, 97598, 12373, 23579, 10108, 10105, 84330, 118, 10411, 21849, 13729, 10374, 21833, 10114, 13086, 10455, 34081, 117, 19361, 13987, 27551, 117, 10473, 10464, 15045, 27823, 10129, 10114, 169, 12429, 31311, 11897, 25019, 131 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "whole", "thing", "is", "ut", "##ter", "##ly", "use", "##less", ",", "it", "does", "n", "'", "t", "help", "us", "at", "all", "." ], "ids": [ 107, 10747, 21047, 40414, 10124, 11735, 10877, 10454, 11760, 14985, 117, 10271, 15107, 182, 112, 188, 15217, 19626, 10160, 10435, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "What", "the", "people", "ex", "##pect", "is", "to", "have", "houses", ",", "to", "have", "jobs", ".", "\"" ], "ids": [ 12489, 10105, 11426, 11419, 51511, 10124, 10114, 10529, 21174, 117, 10114, 10529, 45083, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Political", "scientist", "Jan", "##nie", "Ga", "##giano", "said", "he", "doubt", "##ed", "that", "the", "National", "Party", ",", "which", "implemented", "apartheid", "in", "1948", "and", "began", "dis", "##mant", "##ling", "it", "in", "1990", ",", "felt", "it", "carried", "a", "bu", "##rden", "of", "gu", "##ilt", "and", "needed", "to", "be", "ex", "##cul", "##pate", "##d", "through", "the", "commission", "." ], "ids": [ 18907, 59248, 11806, 11297, 69699, 95734, 12415, 10261, 86697, 10336, 10189, 10105, 10655, 12529, 117, 10319, 54648, 84330, 10106, 11004, 10111, 11941, 27920, 38837, 11945, 10271, 10106, 10420, 117, 24666, 10271, 21086, 169, 11499, 26505, 10108, 75980, 51777, 10111, 23794, 10114, 10347, 11419, 42838, 86891, 10162, 11222, 10105, 26568, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Therefore", "I", "have", "some", "doubt", "##s", "about", "achieving", "some", "form", "of", "re", "##con", "##ciliation", "." ], "ids": [ 107, 54844, 146, 10529, 11152, 86697, 10107, 10978, 102863, 11152, 12188, 10108, 11639, 23486, 98956, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "has", "to", "feel", "a", "bit", "guilty", "to", "feel", "the", "need", "for", "re", "##con", "##cili", "##ng", "your", "##self", "to", "a", "historical", "ad", "##versa", "##ry", ",", "\"", "he", "said", "." ], "ids": [ 11340, 10393, 10114, 38008, 169, 17684, 56044, 10114, 38008, 10105, 17367, 10142, 11639, 23486, 55262, 10376, 20442, 43310, 10114, 169, 19871, 10840, 40756, 10908, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Professor", "Tom", "Lodge", "of", "the", "University", "of", "the", "Wit", "##water", "##sr", "##and", "dem", "##urre", "##d", ",", "saying", ":" ], "ids": [ 14389, 12275, 47493, 10108, 10105, 10404, 10108, 10105, 83735, 21099, 106986, 14752, 10268, 97235, 10162, 117, 22807, 131 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "In", "the", "ir", "##rita", "##tion", ",", "in", "the", "jo", "##kes", ",", "in", "the", "anger", "that", "white", "South", "African", "##s", "express", "about", "the", "commission", ",", "I", "think", "there", "'", "s", "a", "moral", "une", "##asi", "##ness", ",", "and", "I", "think", "that", "'", "s", "healthy", "." ], "ids": [ 107, 10167, 10105, 10478, 27821, 10822, 117, 10106, 10105, 12541, 21885, 117, 10106, 10105, 46464, 10189, 15263, 11056, 13839, 10107, 47620, 10978, 10105, 26568, 117, 146, 27874, 11155, 112, 187, 169, 23680, 10231, 15525, 14010, 117, 10111, 146, 27874, 10189, 112, 187, 89601, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##pon", "##si", "##bility", "is", "per", "##cola", "##ting", "down", "##wards", ".", "\"" ], "ids": [ 32070, 27119, 10449, 20838, 10124, 10178, 32735, 12141, 12935, 30086, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mo", "##sle", "##m", "refugees", "seek", "to", "vote", "in", "Ser", "##b", "-", "held", "town", "." ], "ids": [ 34987, 42176, 10147, 71797, 48394, 10114, 18926, 10106, 39759, 10457, 118, 11991, 12221, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "Sami", "##r", "Ar", "##naut" ], "ids": [ 49324, 10129, 18484, 93032 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "MA", "##T", "##U", "##Z", "##IC", "##I", ",", "Bosnia", "1996", "-", "08", "-", "25" ], "ids": [ 27277, 11090, 12022, 13966, 30889, 11281, 117, 29634, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thousand", "##s", "of", "Mo", "##sle", "##m", "refugees", "den", "##oun", "##ced", "Bosnia", "'", "s", "elections", "as", "a", "far", "##ce", "on", "Sunday", "because", "Ser", "##b", "income", "##rs", "would", "be", "able", "to", "vote", "in", "their", "old", "home", "town", ",", "ce", "##menti", "##ng", "partition", "of", "the", "country", "." ], "ids": [ 61795, 10107, 10108, 34987, 42176, 10147, 71797, 10140, 43971, 38039, 29634, 112, 187, 22054, 10146, 169, 13301, 10419, 10135, 19731, 12373, 39759, 10457, 18245, 10943, 10894, 10347, 16197, 10114, 18926, 10106, 10455, 12898, 11816, 12221, 117, 10794, 15719, 10376, 96787, 10108, 10105, 12723, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "they", "were", "ready", "to", "force", "their", "way", "back", "across", "post", "-", "war", "ethnic", "lines", "to", "Ser", "##b", "-", "held", "Do", "##boj", ",", "one", "of", "several", "towns", "where", "NATO", "troops", "fear", "violence", "involving", "refugees", "determined", "to", "vote", "where", "they", "once", "lived", "." ], "ids": [ 11696, 12415, 10689, 10309, 42374, 10114, 15031, 10455, 13170, 12014, 15130, 11841, 118, 10338, 34216, 19515, 10114, 39759, 10457, 118, 11991, 11791, 52125, 117, 10464, 10108, 11736, 26656, 10940, 21662, 20836, 44929, 26342, 40368, 71797, 30706, 10114, 18926, 10940, 10689, 14907, 17603, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 1, 5, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "refugees", ",", "rally", "##ing", "in", "Mat", "##uzi", "##ci", "on", "government", "territory", "two", "km", "from", "Do", "##boj", "in", "northeast", "Bosnia", ",", "wave", "##d", "banner", "##s", "calling", "the", "poll", "##s", "a", "far", "##ce", "staged", "by", "the", "United", "Nations", "and", "the", "European", "Union", ".", "\"" ], "ids": [ 10117, 71797, 117, 58575, 10230, 10106, 57471, 55485, 10598, 10135, 12047, 24399, 10551, 10204, 10188, 11791, 52125, 10106, 33002, 29634, 117, 32981, 10162, 85907, 10107, 37023, 10105, 70156, 10107, 169, 13301, 10419, 84310, 10155, 10105, 10609, 15145, 10111, 10105, 11914, 11457, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "We", "demand", "to", "vote", "in", "Do", "##boj", ",", "\"", "other", "banner", "##s", "said", "." ], "ids": [ 12865, 34394, 10114, 18926, 10106, 11791, 52125, 117, 107, 10684, 85907, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bosnia", "'", "s", "Mo", "##sle", "##m", "-", "led", "central", "government", "and", "many", "dis", "##placed", "Mo", "##sle", "##ms", "are", "anger", "##ed", "by", "a", "key", "provision", "of", "the", "Western", "-", "organised", "September", "14", "elections", "allowing", "people", "to", "vote", "in", "post", "-", "war", "\"", "new", "places", "of", "residence", ".", "\"" ], "ids": [ 29634, 112, 187, 34987, 42176, 10147, 118, 12857, 12397, 12047, 10111, 11299, 27920, 93570, 34987, 42176, 12387, 10301, 46464, 10336, 10155, 169, 18444, 76386, 10108, 10105, 13163, 118, 54200, 10596, 10247, 22054, 28357, 11426, 10114, 18926, 10106, 11841, 118, 10338, 107, 10751, 19261, 10108, 33879, 119, 107 ], "entity": [ "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "a", "result", ",", "separat", "##ist", "Ser", "##b", "authorities", "have", "pack", "##ed", "former", "Mo", "##sle", "##m", "majority", "towns", "with", "refugees", "of", "their", "own", "or", "registered", "other", "Ser", "##bs", "to", "vote", "there", "." ], "ids": [ 10882, 169, 14493, 117, 81806, 11293, 39759, 10457, 28308, 10529, 78978, 10336, 11775, 34987, 42176, 10147, 19471, 26656, 10169, 71797, 10108, 10455, 12542, 10345, 33712, 10684, 39759, 19528, 10114, 18926, 11155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Critics", "say", "that", "what", "was", "bill", "##ed", "as", "an", "electoral", "process", "to", "rein", "##teg", "##rate", "Bosnia", "as", "a", "single", ",", "multi", "-", "ethnic", "state", "is", "sh", "##api", "##ng", "up", "as", "a", "referendum", "on", "partition", ",", "de", "facto", "or", "de", "jure", "." ], "ids": [ 33120, 23763, 10189, 12976, 10134, 34497, 10336, 10146, 10151, 29125, 15138, 10114, 74720, 102318, 19779, 29634, 10146, 169, 11376, 117, 21247, 118, 34216, 11388, 10124, 48201, 85550, 10376, 10741, 10146, 169, 39697, 10135, 96787, 117, 10104, 26431, 10345, 10104, 103738, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Only", "our", "physical", "presence", "in", "Do", "##boj", "will", "mean", "that", "the", "Dayton", "peace", "treaty", "has", "truly", "been", "implemented", ",", "\"", "Ed", "##hem", "E", "##fend", "##ija", "Cam", "##dzi", "##c", ",", "Do", "##boj", "'", "s", "Islamic", "imam", "-", "in", "-", "exile", ",", "told", "the", "refugees", "." ], "ids": [ 107, 18740, 17446, 22899, 25599, 10106, 11791, 52125, 11337, 36110, 10189, 10105, 74767, 28101, 56353, 10393, 92755, 10590, 54648, 117, 107, 13114, 25947, 142, 86790, 12823, 68820, 45637, 10350, 117, 11791, 52125, 112, 187, 22150, 77591, 118, 10106, 118, 67696, 117, 21937, 10105, 71797, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 1, 5, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "main", "point", "of", "this", "rally", "is", "to", "high", "##light", "to", "the", "world", "powers", "what", "mis", "##fort", "##une", "they", "brought", "upon", "us", ",", "\"", "said", "Re", "##uf", "Me", "##hem", "##dagi", "##c", ",", "head", "of", "Do", "##boj", "municipality", "-", "in", "-", "exile", "." ], "ids": [ 107, 10117, 12126, 12331, 10108, 10531, 58575, 10124, 10114, 11846, 24310, 10114, 10105, 11356, 32043, 12976, 12606, 23044, 19659, 10689, 17327, 15378, 19626, 117, 107, 12415, 20304, 21598, 11589, 25947, 34350, 10350, 117, 13578, 10108, 11791, 52125, 17288, 118, 10106, 118, 67696, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Eleven", "thousand", "Ser", "##bs", "who", "came", "from", "elsewhere", "to", "Do", "##boj", "will", "vote", "there", "." ], "ids": [ 107, 69527, 46634, 39759, 19528, 10479, 13383, 10188, 60249, 10114, 11791, 52125, 11337, 18926, 11155, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "How", "can", "we", "then", "ex", "##pect", "the", "rein", "##teg", "##ration", "of", "Bosnia", "?" ], "ids": [ 14962, 10944, 11951, 11059, 11419, 51511, 10105, 74720, 102318, 19466, 10108, 29634, 136 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "But", "no", "one", "will", "stop", "us", "from", "returning", "to", "our", "homes", ".", "\"" ], "ids": [ 16976, 10192, 10464, 11337, 20517, 19626, 10188, 30052, 10114, 17446, 14154, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mir", "##hun", "##isa", "Kom", "##ari", "##ca", ",", "a", "government", "refuge", "##e", "official", ",", "said", ":", "\"", "We", "want", "to", "vote", "where", "we", "were", "thrown", "out", "from", "." ], "ids": [ 43209, 35931, 19403, 106306, 12476, 10425, 117, 169, 12047, 63655, 10112, 14731, 117, 12415, 131, 107, 12865, 21528, 10114, 18926, 10940, 11951, 10309, 88590, 10950, 10188, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "is", "a", "protest", "of", "warning", "and", "the", "next", "step", "is", "entering", "our", "town", "using", "all", "means", "possible", ",", "so", "let", "them", "shoot", ".", "\"" ], "ids": [ 10747, 10124, 169, 36627, 10108, 70990, 10111, 10105, 13451, 31877, 10124, 44824, 17446, 12221, 13382, 10435, 17574, 14128, 117, 10380, 13595, 11345, 53839, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bosnia", "##n", "Vice", "President", "E", "##ju", "##p", "Gan", "##ic", ",", "a", "Mo", "##sle", "##m", ",", "told", "the", "refugees", ":", "\"", "We", "have", "a", "message", "for", "the", "Ser", "##bs", "who", "are", "now", "in", "our", "homes", "not", "to", "plan", "the", "future", "of", "their", "children", "there", "because", "there", "will", "be", "no", "good", "fortune", "in", "that", ".", "\"" ], "ids": [ 29634, 10115, 19214, 12811, 142, 10761, 10410, 90792, 11130, 117, 169, 34987, 42176, 10147, 117, 21937, 10105, 71797, 131, 107, 12865, 10529, 169, 30514, 10142, 10105, 39759, 19528, 10479, 10301, 11858, 10106, 17446, 14154, 10472, 10114, 13065, 10105, 16711, 10108, 10455, 12694, 11155, 12373, 11155, 11337, 10347, 10192, 15198, 55458, 10106, 10189, 119, 107 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 4, 8, 8, 8, 8, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "lo", "##ud", "app", "##laus", "##e", ",", "he", "added", ":", "\"", "We", "will", "enter", "Do", "##boj", ",", "un", "##tie", "the", "Do", "##boj", "kn", "##ot", "and", "ensure", "free", "movement", "for", "all", "." ], "ids": [ 11469, 10406, 11679, 72894, 50220, 10112, 117, 10261, 16288, 131, 107, 12865, 11337, 31006, 11791, 52125, 117, 10119, 14859, 10105, 11791, 52125, 96820, 11290, 10111, 40781, 13961, 17123, 10142, 10435, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "have", "to", "enter", "Do", "##boj", "to", "free", "the", "Ser", "##bs", "from", "their", "own", "(", "separat", "##ist", ")", "politics", ".", "\"" ], "ids": [ 12865, 10529, 10114, 31006, 11791, 52125, 10114, 13961, 10105, 39759, 19528, 10188, 10455, 12542, 113, 81806, 11293, 114, 25674, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Dayton", "peace", "accord", "##s", "gu", "##aran", "##teed", "refugees", "the", "right", "to", "return", "to", "their", "homes", "and", "ensure", "##d", "freedom", "of", "movement", "across", "ethnic", "lines", "." ], "ids": [ 10117, 74767, 28101, 35233, 10107, 75980, 24367, 100308, 71797, 10105, 13448, 10114, 15079, 10114, 10455, 14154, 10111, 40781, 10162, 33700, 10108, 17123, 15130, 34216, 19515, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "local", "police", ",", "controlled", "by", "nationalist", "parties", "in", "Mo", "##sle", "##m", ",", "Ser", "##b", "and", "C", "##roat", "sectors", "of", "Bosnia", ",", "and", "civilian", "mo", "##bs", "have", "turned", "cea", "##sef", "##ire", "lines", "into", "virtually", "im", "##pass", "##able", "borders", "." ], "ids": [ 16976, 11436, 15034, 117, 29050, 10155, 99451, 18708, 10106, 34987, 42176, 10147, 117, 39759, 10457, 10111, 140, 64825, 69714, 10108, 29634, 117, 10111, 53653, 46912, 19528, 10529, 21031, 25578, 107749, 11627, 19515, 10708, 83659, 10211, 36388, 13096, 47360, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 2, 6, 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "majority", "of", "refugees", "from", "Bosnia", "'", "s", "1992", "-", "95", "war", "are", "Mo", "##sle", "##ms", "from", "the", "Ser", "##b", "-", "controlled", "north", "and", "east", "." ], "ids": [ 10117, 19471, 10108, 71797, 10188, 29634, 112, 187, 10450, 118, 11978, 10338, 10301, 34987, 42176, 12387, 10188, 10105, 39759, 10457, 118, 29050, 12756, 10111, 13827, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "NATO", "-", "led", "peace", "troops", "be", "##efe", "##d", "up", "their", "presence", "in", "the", "Do", "##boj", "area", "on", "Sunday", "to", "det", "##er", "any", "sudden", "emotional", "attempt", "by", "the", "refugees", "to", "cross", "the", "Inter", "-", "Ent", "##ity", "Bound", "##ary", "Line", "into", "Do", "##boj", "." ], "ids": [ 21662, 118, 12857, 28101, 20836, 10347, 85033, 10162, 10741, 10455, 25599, 10106, 10105, 11791, 52125, 11168, 10135, 19731, 10114, 10349, 10165, 11178, 94994, 59995, 21395, 10155, 10105, 71797, 10114, 19630, 10105, 24362, 118, 63412, 11949, 108994, 14926, 14357, 10708, 11791, 52125, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 5, 9, 1, 5, 9 ] }, { "tokens": [ "But", "the", "crowd", "dis", "##pers", "##ed", "without", "incident", "." ], "ids": [ 16976, 10105, 50059, 27920, 24193, 10336, 13663, 28005, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mo", "##sle", "##ms", "and", "Ser", "##bs", "have", "s", "##cu", "##ffle", "##d", "several", "times", "along", "the", "line", "in", "the", "past", "when", "Mo", "##sle", "##m", "refugees", "tried", "to", "surge", "into", "the", "town", "." ], "ids": [ 34987, 42176, 12387, 10111, 39759, 19528, 10529, 187, 12352, 66267, 10162, 11736, 13465, 12400, 10105, 12117, 10106, 10105, 17781, 10841, 34987, 42176, 10147, 71797, 27156, 10114, 69824, 10708, 10105, 12221, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eight", "killed", "in", "Moscow", "casino", "bl", "##aze", "." ], "ids": [ 43788, 15875, 10106, 18744, 88378, 21484, 85744, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "25" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eight", "people", "died", "on", "Sunday", "in", "a", "bl", "##aze", "at", "a", "Moscow", "casino", "which", "the", "fire", "service", "said", "might", "have", "been", "started", "del", "##ibe", "##rate", "##ly", ",", "Inter", "##fa", "##x", "news", "agency", "said", "." ], "ids": [ 43788, 11426, 12482, 10135, 19731, 10106, 169, 21484, 85744, 10160, 169, 18744, 88378, 10319, 10105, 13559, 11989, 12415, 20970, 10529, 10590, 13457, 10127, 43954, 19779, 10454, 117, 24362, 13369, 10686, 14424, 34649, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "number", "of", "casino", "##s", "has", "soa", "##red", "in", "Moscow", "since", "the", "collapse", "of", "communis", "##m", "." ], "ids": [ 10117, 11487, 10108, 88378, 10107, 10393, 56108, 15711, 10106, 18744, 11764, 10105, 64306, 10108, 75095, 10147, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "mayor", "has", "said", "he", "wants", "to", "cut", "their", "number", "to", "five", "as", "part", "of", "a", "war", "against", "organised", "crime", "." ], "ids": [ 10117, 12747, 10393, 12415, 10261, 45769, 10114, 21610, 10455, 11487, 10114, 12403, 10146, 10668, 10108, 169, 10338, 11327, 54200, 22564, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Boris", "Ye", "##lts", "##in", "signed", "a", "decree", "on", "fighting", "crime", "in", "July", "and", "handed", "wide", "-", "ranging", "powers", "to", "security", "chief", "Alexander", "Le", "##bed", ",", "currently", "engaged", "in", "making", "peace", "in", "break", "##away", "Che", "##chny", "##a", "." ], "ids": [ 12811, 21463, 20567, 72847, 10245, 14775, 169, 109157, 10135, 27535, 22564, 10106, 11112, 10111, 44040, 18064, 118, 55432, 32043, 10114, 21849, 19421, 12063, 10281, 33627, 117, 15313, 34377, 10106, 14293, 28101, 10106, 24194, 38249, 44131, 95063, 10113, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Russian", "troops", "start", "pull", "##out", ",", "but", "not", "in", "G", "##ro", "##zny", "." ], "ids": [ 13463, 20836, 15148, 80870, 17514, 117, 10473, 10472, 10106, 144, 10567, 25424, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "SH", "##AT", "##O", "##I", ",", "Russia", "1996", "-", "08", "-", "25" ], "ids": [ 38702, 32071, 11403, 11281, 117, 14664, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "troops", "began", "to", "pull", "out", "from", "southern", "Che", "##chny", "##a", "on", "Sunday", "under", "a", "cea", "##sef", "##ire", "agreement", "between", "Russian", "security", "chief", "Alexander", "Le", "##bed", "and", "rebel", "leaders", "." ], "ids": [ 13463, 20836, 11941, 10114, 80870, 10950, 10188, 17156, 44131, 95063, 10113, 10135, 19731, 10571, 169, 25578, 107749, 11627, 25432, 10948, 13463, 21849, 19421, 12063, 10281, 33627, 10111, 56696, 24155, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "But", "in", "the", "capital", "G", "##ro", "##zny", ",", "the", "commander", "of", "Russian", "Interior", "Ministry", "forces", "in", "Che", "##chny", "##a", ",", "General", "Ana", "##tol", "##y", "S", "##h", "##kir", "##ko", ",", "told", "Inter", "##fa", "##x", "news", "agency", "he", "was", "delay", "##ing", "a", "pull", "##out", "of", "troops", "there", "after", "a", "group", "of", "Che", "##chen", "##s", "disa", "##rmed", "an", "arm", "##oured", "column", "." ], "ids": [ 16976, 10106, 10105, 12185, 144, 10567, 25424, 117, 10105, 27703, 10108, 13463, 33667, 19170, 13729, 10106, 44131, 95063, 10113, 117, 11220, 16377, 48530, 10157, 156, 10237, 46994, 10440, 117, 21937, 24362, 13369, 10686, 14424, 34649, 10261, 10134, 76497, 10230, 169, 80870, 17514, 10108, 20836, 11155, 10662, 169, 11795, 10108, 44131, 11909, 10107, 36474, 98119, 10151, 31251, 73499, 41278, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 5, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "camera", "##man", "Liu", "##tau", "##ras", "St", "##rema", "##itis", "said", "a", "column", "of", "around", "40", "vehicles", ",", "including", "tanks", ",", "arm", "##oured", "personnel", "carriers", ",", "artillery", "can", "##non", "##s", "and", "lor", "##ries", ",", "escort", "##ed", "by", "Che", "##chen", "rebels", ",", "pulled", "out", "of", "the", "village", "of", "Sha", "##toi", "towards", "the", "border", ",", "around", "50", "km", "(", "31", "miles", ")", "to", "the", "north", "." ], "ids": [ 46617, 26665, 10589, 23456, 68330, 12783, 10838, 56318, 36967, 12415, 169, 41278, 10108, 12166, 10533, 27237, 117, 11198, 46731, 117, 31251, 73499, 23889, 105468, 117, 46524, 10944, 17518, 10107, 10111, 21916, 15388, 117, 100883, 10336, 10155, 44131, 11909, 57545, 117, 65884, 10950, 10108, 10105, 11607, 10108, 106583, 40331, 18095, 10105, 20949, 117, 12166, 10462, 10204, 113, 10413, 14148, 114, 10114, 10105, 12756, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "G", "##ro", "##zny", ",", "S", "##h", "##kir", "##ko", "told", "Inter", "##fa", "##x", "he", "was", "sus", "##pend", "##ing", "the", "pull", "##out", "of", "troops", "from", "the", "capital", "until", "weapons", "seized", "by", "the", "Che", "##chen", "##s", "were", "returned", "." ], "ids": [ 10167, 144, 10567, 25424, 117, 156, 10237, 46994, 10440, 21937, 24362, 13369, 10686, 10261, 10134, 10846, 63592, 10230, 10105, 80870, 17514, 10108, 20836, 10188, 10105, 12185, 11444, 31881, 80176, 10155, 10105, 44131, 11909, 10107, 10309, 14030, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Che", "##chen", "rebel", "spoke", "##sman", "Mo", "##v", "##ladi", "U", "##du", "##go", "##v", "confirmed", "the", "weapons", "had", "been", "seized", "but", "that", "it", "was", "a", "ma", "##veri", "##ck", "group", "of", "Che", "##chen", "##s", "." ], "ids": [ 44131, 11909, 56696, 50005, 24305, 34987, 10477, 28645, 158, 11460, 10797, 10477, 27347, 10105, 31881, 10374, 10590, 80176, 10473, 10189, 10271, 10134, 169, 10824, 52019, 11263, 11795, 10108, 44131, 11909, 10107, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "He", "said", "later", "that", "the", "rebels", "had", "handed", "them", "over", "." ], "ids": [ 10357, 12415, 10873, 10189, 10105, 57545, 10374, 44040, 11345, 10491, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "pull", "##out", "of", "the", "Russian", "troops", "is", "a", "key", "element", "of", "the", "peace", "plan", "broke", "##red", "by", "Le", "##bed", ",", "which", "aims", "to", "end", "the", "20", "-", "month", "Che", "##chny", "##a", "conflict", "." ], "ids": [ 10117, 80870, 17514, 10108, 10105, 13463, 20836, 10124, 169, 18444, 19527, 10108, 10105, 28101, 13065, 30500, 15711, 10155, 10281, 33627, 117, 10319, 67789, 10114, 11572, 10105, 10197, 118, 14064, 44131, 95063, 10113, 24620, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "Left", "##ist", "Mexican", "armed", "group", "says", "troops", "in", "capital", "." ], "ids": [ 35343, 11293, 15323, 34174, 11795, 22153, 20836, 10106, 12185, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##X", "##IC", "##O", "C", "##IT", "##Y", "1996", "-", "08", "-", "25" ], "ids": [ 47430, 12674, 30889, 11403, 140, 37611, 14703, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "left", "##ist", "Popular", "Revolutionary", "Army", "(", "EP", "##R", ")", "in", "a", "published", "report", "on", "Sunday", "said", "it", "operated", "throughout", "Mexico", ",", "including", "the", "capital", ",", "and", "denied", "government", "ass", "##ertion", "##s", "it", "was", "isolated", "to", "one", "state", "." ], "ids": [ 10117, 12153, 11293, 18710, 52514, 12762, 113, 14111, 11273, 114, 10106, 169, 12304, 17553, 10135, 19731, 12415, 10271, 19301, 15916, 10490, 117, 11198, 10105, 12185, 117, 10111, 47467, 12047, 13935, 107373, 10107, 10271, 10134, 54622, 10114, 10464, 11388, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Commander", "##s", "\"", "Vicente", "\"", "and", "\"", "Oscar", "\"", ",", "guard", "##ed", "by", "a", "dozen", "EP", "##R", "gun", "##men", ",", "said", "in", "an", "interview", "with", "La", "Jo", "##rna", "##da", "outside", "Mexico", "City", "that", "the", "armed", "group", "was", "committed", "to", "over", "##th", "##rowing", "the", "government", "." ], "ids": [ 25783, 10107, 107, 21089, 107, 10111, 107, 14036, 107, 117, 42842, 10336, 10155, 169, 84956, 14111, 11273, 23103, 11418, 117, 12415, 10106, 10151, 21213, 10169, 10159, 20977, 13471, 10229, 17555, 10490, 10773, 10189, 10105, 34174, 11795, 10134, 38184, 10114, 10491, 11143, 77449, 10105, 12047, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "(", "government", "officials", ")", "want", "to", "present", "us", "before", "public", "opinion", "as", "a", "local", "problem", ",", "as", "just", "being", "from", "Guerrero", "and", "as", "ir", "##ration", "##al", "radical", "##s", ",", "\"", "Commander", "Oscar", "told", "La", "Jo", "##rna", "##da", "." ], "ids": [ 107, 11696, 113, 12047, 27730, 114, 21528, 10114, 12254, 19626, 11360, 11683, 32282, 10146, 169, 11436, 18077, 117, 10146, 12820, 11223, 10188, 32639, 10111, 10146, 10478, 19466, 10415, 31991, 10107, 117, 107, 25783, 14036, 21937, 10159, 20977, 13471, 10229, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "They", "said", "the", "ER", "##P", ",", "whose", "fighters", "first", "appeared", "wearing", "military", "fat", "##igues", "and", "brand", "##ishing", "assault", "rifle", "##s", "in", "the", "southwestern", "state", "of", "Guerrero", "on", "June", "28", ",", "had", "a", "23", ",", "000", "-", "strong", "membership", ",", "but", "this", "could", "not", "be", "confirmed", "independently", "." ], "ids": [ 11696, 12415, 10105, 67820, 11127, 117, 16879, 62450, 10422, 14565, 56157, 14041, 67952, 107532, 10111, 23467, 103760, 50150, 59116, 10107, 10106, 10105, 84505, 11388, 10108, 32639, 10135, 11120, 10348, 117, 10374, 169, 10328, 117, 10259, 118, 18093, 39689, 117, 10473, 10531, 12174, 10472, 10347, 27347, 74480, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "La", "Jo", "##rna", "##da", "also", "reported", "on", "Sunday", "that", "the", "Mexican", "Army", "has", "discovered", "a", "37", "-", "page", ",", "EP", "##R", "manual", "detail", "##ing", "guerrilla", "tactics", "and", "strategies", "." ], "ids": [ 10159, 20977, 13471, 10229, 10379, 15943, 10135, 19731, 10189, 10105, 15323, 12762, 10393, 21756, 169, 11204, 118, 15975, 117, 14111, 11273, 33595, 45485, 10230, 106552, 101785, 10111, 86985, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "quoted", "the", "manual", "as", "saying", ":", "\"", "The", "objective", "of", "the", "Basic", "Course", "on", "War", "is", "to", "provide", "for", "combat", "##ants", "of", "the", "EP", "##R", "basic", "military", "knowledge", "for", "the", "armed", "conflict", "against", "the", "police", "and", "military", "app", "##arat", "##us", "of", "the", "bourg", "##eois", "##ie", ".", "\"" ], "ids": [ 10377, 70676, 10105, 33595, 10146, 22807, 131, 107, 10117, 59598, 10108, 10105, 34454, 16516, 10135, 11277, 10124, 10114, 16871, 10142, 18159, 22595, 10108, 10105, 14111, 11273, 25090, 14041, 22975, 10142, 10105, 34174, 24620, 11327, 10105, 15034, 10111, 14041, 72894, 49651, 10251, 10108, 10105, 55427, 46542, 10400, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "the", "second", "time", "armed", "\"", "commander", "##s", "\"", "of", "the", "EP", "##R", "have", "granted", "interviews", "outside", "Guerrero", "state", ",", "an", "extremely", "poor", "and", "vol", "##atile", "region", "where", "left", "##ist", "protest", "##ers", "often", "have", "c", "##lash", "##ed", "violent", "##ly", "with", "authorities", "." ], "ids": [ 10377, 10134, 10105, 11132, 10635, 34174, 107, 27703, 10107, 107, 10108, 10105, 14111, 11273, 10529, 26964, 47619, 17555, 32639, 11388, 117, 10151, 38136, 23247, 10111, 12714, 107290, 12220, 10940, 12153, 11293, 36627, 10901, 12899, 10529, 171, 25297, 10336, 43934, 10454, 10169, 28308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Unlike", "the", "better", "known", "and", "un", "##rela", "##ted", "Za", "##pati", "##sta", "rebels", "in", "southeastern", "Chiapas", "state", ",", "the", "EP", "##R", "has", "never", "taken", "on", "the", "army", "in", "direct", "combat", ",", "according", "to", "official", "reports", "." ], "ids": [ 45227, 10105, 18322, 11053, 10111, 10119, 50619, 11912, 14074, 33399, 10972, 57545, 10106, 78721, 44029, 11388, 117, 10105, 14111, 11273, 10393, 14794, 15109, 10135, 10105, 17977, 10106, 16934, 18159, 117, 18071, 10114, 14731, 26610, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 1, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "have", "only", "been", "a", "few", "ski", "##rmi", "##she", "##s", "in", "Guerrero", "in", "which", "a", "hand", "##ful", "of", "police", ",", "soldiers", "and", "civilians", "have", "been", "killed", "or", "injured", "." ], "ids": [ 11723, 10529, 10893, 10590, 169, 13824, 40122, 76936, 70098, 10107, 10106, 32639, 10106, 10319, 169, 15230, 14446, 10108, 15034, 117, 23324, 10111, 77485, 10529, 10590, 15875, 10345, 36081, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ten", "people", "gun", "##ned", "down", "in", "northwest", "Colombia", "." ], "ids": [ 16411, 11426, 23103, 17021, 12935, 10106, 35078, 15223, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "B", "##O", "##GO", "##TA", ",", "Colombia", "1996", "-", "08", "-", "25" ], "ids": [ 139, 11403, 83821, 24951, 117, 15223, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Uni", "##dent", "##ified", "gun", "##men", "drag", "##ged", "10", "men", "out", "ot", "their", "homes", "in", "a", "rural", "area", "of", "Colombia", "'", "s", "northwest", "province", "of", "Antioquia", "and", "shot", "them", "to", "death", ",", "authorities", "said", "on", "Sunday", "." ], "ids": [ 22966, 21029, 31825, 23103, 11418, 71840, 18832, 10150, 10588, 10950, 60818, 10455, 14154, 10106, 169, 18380, 11168, 10108, 15223, 112, 187, 35078, 14342, 10108, 65616, 10111, 19508, 11345, 10114, 12557, 117, 28308, 12415, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "the", "killing", "##s", "occurred", "on", "Saturday", "morning", "in", "the", "municipality", "of", "An", "##za", "but", "news", "of", "the", "massacre", "only", "reached", "the", "provincial", "capital", "of", "Med", "##elli", "##n", "early", "on", "Sunday", "." ], "ids": [ 18051, 12415, 10105, 34248, 10107, 25738, 10135, 24848, 28757, 10106, 10105, 17288, 10108, 10313, 10637, 10473, 14424, 10108, 10105, 53810, 10893, 17087, 10105, 24900, 12185, 10108, 16245, 25636, 10115, 11732, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "An", "##za", "is", "only", "20", "miles", "(", "30", "km", ")", "west", "of", "Med", "##elli", "##n", ",", "but", "there", "are", "no", "roads", "linking", "it", "directly", "to", "the", "city", "." ], "ids": [ 10313, 10637, 10124, 10893, 10197, 14148, 113, 10244, 10204, 114, 13735, 10108, 16245, 25636, 10115, 117, 10473, 11155, 10301, 10192, 36970, 109784, 10271, 22062, 10114, 10105, 11584, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "initially", "said", "left", "##ist", "Revolutionary", "Armed", "Forces", "of", "Colombia", "(", "FA", "##RC", ")", "rebels", "were", "prime", "suspect", "##s", "in", "the", "killing", "##s", "." ], "ids": [ 18051, 20465, 12415, 12153, 11293, 52514, 51383, 22319, 10108, 15223, 113, 20794, 52932, 114, 57545, 10309, 19287, 97881, 10107, 10106, 10105, 34248, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "gun", "##men", "of", "the", "left", "and", "right", "have", "killed", "with", "im", "##pun", "##ity", "across", "Antioquia", "for", "years", ",", "and", "there", "were", "un", "##con", "##fir", "##med", "reports", "that", "the", "latest", "blood", "##shed", "was", "the", "work", "of", "a", "right", "-", "wing", "para", "##mil", "##itar", "##y", "group", "." ], "ids": [ 16976, 23103, 11418, 10108, 10105, 12153, 10111, 13448, 10529, 15875, 10169, 10211, 19554, 11949, 15130, 65616, 10142, 10855, 117, 10111, 11155, 10309, 10119, 23486, 61644, 21986, 26610, 10189, 10105, 50908, 24911, 42253, 10134, 10105, 11424, 10108, 169, 13448, 118, 22571, 10220, 55177, 36111, 10157, 11795, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Port", "of", "Tau", "##rana", "##ga", "year", "profit", "climb", "##s", "." ], "ids": [ 14734, 10108, 88233, 20906, 10483, 10924, 25081, 93274, 10107, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "to", "June", "30", "." ], "ids": [ 13567, 10114, 11120, 10244, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "million", "NZ", "$", "unless", "stated", ")" ], "ids": [ 113, 12473, 105920, 109, 60015, 17067, 114 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Net", "profit", "9", ".", "050", "vs", "6", ".", "03" ], "ids": [ 32577, 25081, 130, 119, 60801, 14987, 127, 119, 10907 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "Thai", "border", "police", "wounded", "by", "Burma", "gun", "##men", "." ], "ids": [ 13214, 26207, 20949, 15034, 39127, 10155, 35396, 23103, 11418, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "MA", "##E", "SO", "##T", ",", "Thailand", "1996", "-", "08", "-", "25" ], "ids": [ 27277, 11259, 71020, 11090, 117, 19621, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "Thai", "border", "police", "##men", "were", "seriously", "wounded", "on", "Sunday", "when", "members", "of", "a", "Burmese", "rebel", "sp", "##lin", "##ter", "faction", "amb", "##ush", "##ed", "their", "patrol", "in", "northwest", "Thailand", ",", "security", "officers", "said", "." ], "ids": [ 13214, 26207, 20949, 15034, 11418, 10309, 75543, 39127, 10135, 19731, 10841, 12464, 10108, 169, 106296, 56696, 32650, 13020, 10877, 84395, 10559, 37026, 10336, 10455, 62976, 10106, 35078, 19621, 117, 21849, 23579, 12415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "two", "were", "wounded", "in", "the", "early", "hours", "of", "Sunday", "when", "some", "30", "members", "of", "the", "Democratic", "Karen", "Buddhist", "Army", "(", "DK", "##BA", ")", "amb", "##ush", "##ed", "their", "patrol", "on", "the", "Thai", "side", "of", "the", "border", "with", "Burma", ",", "to", "the", "north", "of", "the", "town", "of", "Mae", "So", "##t", "." ], "ids": [ 10117, 10551, 10309, 39127, 10106, 10105, 11732, 19573, 10108, 19731, 10841, 11152, 10244, 12464, 10108, 10105, 19281, 24560, 41388, 12762, 113, 102170, 35999, 114, 10559, 37026, 10336, 10455, 62976, 10135, 10105, 26207, 12250, 10108, 10105, 20949, 10169, 35396, 117, 10114, 10105, 12756, 10108, 10105, 12221, 10108, 13240, 12882, 10123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "Thai", "army", "commander", "in", "the", "area", ",", "Col", "Su", "##vit", "Mae", "##n", "##muan", ",", "told", "reporter", "##s", "the", "DK", "##BA", ",", "which", "is", "allied", "with", "the", "Rang", "##oon", "military", "government", "and", "based", "in", "southeast", "Burma", ",", "had", "recently", "stepped", "up", "cross", "-", "border", "in", "##fil", "##tration", "." ], "ids": [ 10117, 26207, 17977, 27703, 10106, 10105, 11168, 117, 24927, 12271, 18522, 13240, 10115, 37302, 117, 21937, 41408, 10107, 10105, 102170, 35999, 117, 10319, 10124, 91649, 10169, 10105, 28221, 15938, 14041, 12047, 10111, 11610, 10106, 36798, 35396, 117, 10374, 23746, 99116, 10741, 19630, 118, 20949, 10106, 41784, 54525, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##vit", "said", "the", "motive", "for", "their", "int", "##rus", "##ions", "was", "not", "clear", "but", "he", "had", "ordered", "rein", "##forcement", "##s", "to", "be", "##ef", "up", "security", "along", "the", "por", "##ous", "front", "##ier", "." ], "ids": [ 12271, 18522, 12415, 10105, 101101, 10142, 10455, 26391, 13923, 15880, 10134, 10472, 24866, 10473, 10261, 10374, 23782, 74720, 90202, 10107, 10114, 10347, 16822, 10741, 21849, 12400, 10105, 10183, 13499, 14589, 11709, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "DK", "##BA", "was", "formed", "in", "late", "1994", "by", "hundreds", "of", "guerrilla", "##s", "who", "split", "from", "the", "anti", "-", "Rang", "##oon", "Karen", "National", "Union", "(", "K", "##N", "##U", ")", "and", "allied", "themselves", "with", "Burmese", "government", "army", ",", "their", "former", "enemies", "." ], "ids": [ 10117, 102170, 35999, 10134, 14629, 10106, 13002, 10444, 10155, 48329, 10108, 106552, 10107, 10479, 24137, 10188, 10105, 14249, 118, 28221, 15938, 24560, 10655, 11457, 113, 148, 11537, 12022, 114, 10111, 91649, 20182, 10169, 106296, 12047, 17977, 117, 10455, 11775, 63011, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DK", "##BA", "members", "have", "since", "launched", "inter", "##mitt", "##ent", "cross", "-", "border", "attacks", "on", "Karen", "refuge", "##e", "camps", "in", "Thailand", ",", "where", "the", "majority", "of", "inhabitants", "are", "K", "##N", "##U", "supporters", ",", "and", "on", "Thai", "villages", "and", "police", "posts", "near", "the", "border", "." ], "ids": [ 102170, 35999, 12464, 10529, 11764, 18850, 22021, 103780, 11405, 19630, 118, 20949, 26483, 10135, 24560, 63655, 10112, 33978, 10106, 19621, 117, 10940, 10105, 19471, 10108, 28348, 10301, 148, 11537, 12022, 42957, 117, 10111, 10135, 26207, 19303, 10111, 15034, 68699, 12883, 10105, 20949, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bangkok", "has", "com", "##plained", "to", "Rang", "##oon", "about", "the", "raids", "but", "Burmese", "military", "authorities", "say", "they", "have", "no", "conto", "##l", "over", "the", "faction", "." ], "ids": [ 34793, 10393, 10212, 103154, 10114, 28221, 15938, 10978, 10105, 77939, 10473, 106296, 14041, 28308, 23763, 10689, 10529, 10192, 38885, 10161, 10491, 10105, 84395, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thai", "army", "commander", "##s", "re", "##ject", "the", "explanation", ",", "saying", "they", "have", "evidence", "the", "Burmese", "army", "supplies", "and", "direct", "##s", "the", "ren", "##ega", "##de", "ethnic", "minority", "sp", "##lin", "##ter", "faction", "." ], "ids": [ 26207, 17977, 27703, 10107, 11639, 56617, 10105, 88840, 117, 22807, 10689, 10529, 18713, 10105, 106296, 17977, 49963, 10111, 16934, 10107, 10105, 63256, 19172, 10253, 34216, 54147, 32650, 13020, 10877, 84395, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "F", "-", "14", "catch", "##es", "fire", "while", "landing", "in", "Israel", "." ], "ids": [ 158, 119, 156, 119, 143, 118, 10247, 61093, 10171, 13559, 11371, 37798, 10106, 12991, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "25" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "U", ".", "S", ".", "fighter", "plane", "ble", "##w", "a", "tyre", "and", "caught", "fire", "while", "landing", "on", "Sunday", "at", "Israel", "'", "s", "Ben", "G", "##urion", "airport", ",", "an", "airport", "spoke", "##sman", "said", "." ], "ids": [ 138, 158, 119, 156, 119, 49422, 35007, 10718, 10874, 169, 29475, 10111, 39797, 13559, 11371, 37798, 10135, 19731, 10160, 12991, 112, 187, 13304, 144, 102888, 28460, 117, 10151, 28460, 50005, 24305, 12415, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "A", "U", ".", "S", ".", "F", "-", "14", "military", "plane", "while", "landing", "at", "Ben", "G", "##urion", "airport", "ble", "##w", "a", "wheel", "and", "a", "fire", "broke", "out", ",", "\"", "said", "spoke", "##sman", "Ye", "##hie", "##l", "Ami", "##tai", ",", "adding", "that", "the", "two", "pilots", "on", "board", "were", "not", "injured", "." ], "ids": [ 107, 138, 158, 119, 156, 119, 143, 118, 10247, 14041, 35007, 11371, 37798, 10160, 13304, 144, 102888, 28460, 10718, 10874, 169, 46812, 10111, 169, 13559, 30500, 10950, 117, 107, 12415, 50005, 24305, 20567, 72287, 10161, 80157, 26812, 117, 44841, 10189, 10105, 10551, 57452, 10135, 17936, 10309, 10472, 36081, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 2, 6, 6, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Airport", "officials", "declared", "an", "emergency", "situation", "at", "the", "highest", "level", "and", "the", "fire", "brigade", "put", "out", "the", "fl", "##ames", "while", "the", "plane", "was", "landing", ",", "\"", "he", "said", "." ], "ids": [ 107, 13962, 27730, 25019, 10151, 44461, 18586, 10160, 10105, 18134, 13277, 10111, 10105, 13559, 26928, 14499, 10950, 10105, 58768, 55497, 11371, 10105, 35007, 10134, 37798, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egypt", "hopes", "ja", "##rs", "will", "reveal", "secrets", "of", "mu", "##mmi", "##es", "." ], "ids": [ 20440, 82467, 10201, 10943, 11337, 75790, 76101, 10108, 12361, 80808, 10171, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##IR", "##O", "1996", "-", "08", "-", "25" ], "ids": [ 24707, 73522, 11403, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arch", "##ae", "##ologists", "in", "Egypt", "have", "found", "pot", "##s", "used", "by", "ancient", "Egyptian", "##s", "in", "burial", "rit", "##es", "that", "they", "say", "may", "reveal", "the", "secrets", "of", "mu", "##mmi", "##fication", "." ], "ids": [ 54770, 14193, 97603, 10106, 20440, 10529, 11823, 15050, 10107, 11031, 10155, 21226, 34624, 10107, 10106, 82052, 80140, 10171, 10189, 10689, 23763, 11387, 75790, 10105, 76101, 10108, 12361, 80808, 22060, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mohammed", "Sale", "##h", ",", "director", "of", "the", "Egyptian", "Museum", ",", "told", "Reuters", "television", "a", "U", ".", "S", ".", "team", "found", "the", "pot", "##s", ",", "some", "of", "which", "contain", "human", "inte", "##stin", "##es", ",", "in", "a", "tomb", "built", "into", "the", "rocks", "while", "dig", "##ging", "in", "Da", "##hs", "##hou", "##r", ",", "a", "village", "40", "km", "(", "25", "miles", ")", "south", "of", "Cairo", "." ], "ids": [ 32415, 66272, 10237, 117, 12461, 10108, 10105, 34624, 11325, 117, 21937, 46617, 14162, 169, 158, 119, 156, 119, 11121, 11823, 10105, 15050, 10107, 117, 11152, 10108, 10319, 36003, 14179, 14168, 49529, 10171, 117, 10106, 169, 78532, 12183, 10708, 10105, 58864, 11371, 80592, 13808, 10106, 11818, 22394, 25611, 10129, 117, 169, 11607, 10533, 10204, 113, 10258, 14148, 114, 13144, 10108, 37580, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 2, 9, 9, 9, 3, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Da", "##hs", "##hou", "##r", "is", "the", "site", "of", "Egypt", "'", "s", "second", "largest", "p", "##yramid", ",", "built", "for", "the", "ph", "##ara", "##oh", "Sen", "##efer", "##u", "more", "than", "4", ",", "500", "years", "ago", "." ], "ids": [ 11818, 22394, 25611, 10129, 10124, 10105, 11920, 10108, 20440, 112, 187, 11132, 15363, 184, 80196, 117, 12183, 10142, 10105, 99142, 12677, 25686, 18082, 66478, 10138, 10798, 11084, 125, 117, 10757, 10855, 36390, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sale", "##h", "said", "the", "team", "-", "-", "from", "New", "York", "'", "s", "Metropolitan", "Museum", "-", "-", "found", "four", "Can", "##op", "##ic", "ja", "##rs", "and", "two", "ung", "##uent", "ja", "##rs", "in", "the", "tomb", ",", "which", "belongs", "to", "an", "uni", "##dent", "##ife", "##d", "person", "who", "lived", "during", "the", "12th", "Dynasty", "(", "1991", "-", "1786", "BC", ")", "in", "the", "Middle", "Kingdom", "." ], "ids": [ 66272, 10237, 12415, 10105, 11121, 118, 118, 10188, 10287, 10482, 112, 187, 22075, 11325, 118, 118, 11823, 11598, 14820, 13362, 11130, 10201, 10943, 10111, 10551, 48973, 85110, 10201, 10943, 10106, 10105, 78532, 117, 10319, 61437, 10114, 10151, 69191, 21029, 46072, 10162, 15042, 10479, 17603, 10939, 10105, 34505, 46213, 113, 10442, 118, 23465, 19376, 114, 10106, 10105, 15441, 14648, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "This", "finding", "is", "important", "because", "one", "of", "the", "ja", "##rs", "still", "contains", "substances", "and", "materials", "used", "in", "the", "conservation", "of", "mu", "##mmi", "##es", "and", "the", "conservation", "of", "the", "inte", "##stin", "##es", "and", "all", "the", "things", "which", "were", "in", "the", "ca", "##vity", "of", "a", "person", "we", "have", "not", "identified", "yet", ",", "\"", "Sale", "##h", "said", "." ], "ids": [ 107, 10747, 43977, 10124, 12452, 12373, 10464, 10108, 10105, 10201, 10943, 12647, 18286, 97855, 10111, 23193, 11031, 10106, 10105, 36378, 10108, 12361, 80808, 10171, 10111, 10105, 36378, 10108, 10105, 14168, 49529, 10171, 10111, 10435, 10105, 24682, 10319, 10309, 10106, 10105, 11135, 45545, 10108, 169, 15042, 11951, 10529, 10472, 26121, 21833, 117, 107, 66272, 10237, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "We", "hope", "that", "the", "analysis", "of", "such", "substances", "and", "liquid", "##s", "will", "reveal", "some", "secrets", "of", "the", "mu", "##mmi", "##fication", "process", "and", "materials", "used", "in", "this", "process", ",", "\"", "he", "added", "." ], "ids": [ 107, 12865, 50725, 10189, 10105, 19129, 10108, 11049, 97855, 10111, 58538, 10107, 11337, 75790, 11152, 76101, 10108, 10105, 12361, 80808, 22060, 15138, 10111, 23193, 11031, 10106, 10531, 15138, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Saudi", "Arabia", "ex", "##ecu", "##tes", "Pakistani", "man", "." ], "ids": [ 26598, 27860, 11419, 97038, 11197, 66797, 10817, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "D", "##UB", "##A", "##I", "1996", "-", "08", "-", "25" ], "ids": [ 141, 82439, 10738, 11281, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Saudi", "Arabia", "executed", "on", "Sunday", "a", "Pakistani", "man", "accused", "of", "belonging", "to", "an", "armed", "gang", "of", "ro", "##bber", "##s", ",", "Saudi", "television", "reported", "." ], "ids": [ 26598, 27860, 45955, 10135, 19731, 169, 66797, 10817, 37303, 10108, 54188, 10114, 10151, 34174, 16330, 10108, 25470, 60805, 10107, 117, 26598, 14162, 15943, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "It", "quoted", "an", "Interior", "Ministry", "statement", "as", "saying", "Sha", "##bir", "Ahmad", "Muhammad", "Ja", "##lil", "was", "executed", "in", "Me", "##cca", "." ], "ids": [ 10377, 70676, 10151, 33667, 19170, 33311, 10146, 22807, 106583, 29241, 24717, 17573, 28248, 42967, 10134, 45955, 10106, 11589, 20057, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "He", "was", "the", "26", "##th", "person", "executed", "this", "year", "in", "the", "kingdom", "." ], "ids": [ 10357, 10134, 10105, 10314, 11143, 15042, 45955, 10531, 10924, 10106, 10105, 12293, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Saudi", "Arabia", "be", "##head", "##s", "convicted", "drug", "sm", "##ug", "##gler", "##s", ",", "rap", "##ists", ",", "murder", "##ers", "and", "other", "criminal", "##s", "." ], "ids": [ 26598, 27860, 10347, 20391, 10107, 61487, 20998, 39709, 19951, 32617, 10107, 117, 35562, 18206, 117, 29448, 10901, 10111, 10684, 30931, 10107, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Jordan", "-", "Aug", "25", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 16366, 118, 53012, 10258, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##MA", "##N", "1996", "-", "08", "-", "25" ], "ids": [ 24339, 30696, 11537, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "some", "of", "the", "leading", "stories", "in", "the", "Jordan", "##ian", "press", "on", "Sunday", "." ], "ids": [ 13252, 10301, 11152, 10108, 10105, 16018, 21158, 10106, 10105, 16366, 11630, 21040, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OR", "##DA", "##N", "TIME", "##S" ], "ids": [ 147, 42622, 36382, 11537, 89275, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "King", ":", "Jordan", "is", "entering", "a", "new", "era", "." ], "ids": [ 118, 11515, 131, 16366, 10124, 44824, 169, 10751, 10411, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "going", "back", "on", "democracy", ";", "attempts", "to", "tam", "##per", "with", "security", "and", "stability", "will", "not", "be", "tol", "##erated", "." ], "ids": [ 10657, 19090, 12014, 10135, 67519, 132, 30406, 10114, 14918, 12713, 10169, 21849, 10111, 69884, 11337, 10472, 10347, 53183, 79903, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Information", "Minister", "Mar", "##wan", "Mu", "##ash", "##er", "says", "there", "is", "evidence", "that", "\"", "some", "official", "parties", "in", "Iraq", "\"", "were", "behind", "the", "dis", "##tur", "##ban", "##ces", "in", "the", "south", "." ], "ids": [ 12145, 14355, 15734, 14394, 49056, 73491, 10165, 22153, 11155, 10124, 18713, 10189, 107, 11152, 14731, 18708, 10106, 21455, 107, 10309, 17155, 10105, 27920, 15698, 10927, 14585, 10106, 10105, 13144, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "King", "to", "visit", "Bahrain", "soon", "." ], "ids": [ 118, 11515, 10114, 27541, 56769, 17864, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "-", "Government", "asks", "senior", "Iraqi", "\"", "diplomat", "\"", "to", "leave", ",", "reviews", "status", "of", "others", "." ], "ids": [ 118, 14581, 54031, 17843, 57806, 107, 45652, 107, 10114, 21964, 117, 24860, 14042, 10108, 14633, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Japanese", "foreign", "minister", "arrives", "for", "talks", "on", "peace", "process", ",", "bila", "##teral", "ties", "." ], "ids": [ 118, 13847, 20796, 16930, 69631, 10142, 56672, 10135, 28101, 15138, 117, 12517, 98161, 45169, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AL", "RAI" ], "ids": [ 47271, 91194 ], "entity": [ "B-ORG", "I-ORG" ], "entity_ids": [ 3, 7 ] }, { "tokens": [ "-", "Prime", "Minister", "Abdul", "-", "Karim", "al", "-", "Ka", "##bari", "##ti", "says", "government", "com", "##mite", "##d", "to", "lift", "##ing", "ceiling", "of", "democracy", "." ], "ids": [ 118, 19924, 14355, 23642, 118, 71139, 10164, 118, 25444, 73840, 10325, 22153, 12047, 10212, 34095, 10162, 10114, 63376, 10230, 87076, 10108, 67519, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Saudi", "Prince", "Sultan", "telephone", "##s", "prime", "minister", "." ], "ids": [ 118, 26598, 14185, 17529, 69009, 10107, 19287, 16930, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Jordan", "releases", "32", "from", "southern", "town", "of", "Kara", "##k", "." ], "ids": [ 118, 16366, 45906, 10842, 10188, 17156, 12221, 10108, 34635, 10174, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "-", "Jordan", "express", "##es", "anger", "at", "conduct", "of", "some", "Iraqi", "diplomat", "##s", "in", "Amman", "which", "are", "in", "##com", "##pati", "##ble", "with", "diplomatic", "traditions", "." ], "ids": [ 118, 16366, 47620, 10171, 46464, 10160, 45541, 10108, 11152, 57806, 45652, 10107, 10106, 107098, 10319, 10301, 10106, 22530, 33399, 11203, 10169, 64838, 41048, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AD", "D", "##US", "##TO", "##UR" ], "ids": [ 22992, 141, 32612, 60493, 98348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Ka", "##bari", "##ti", "and", "parliament", "speaker", "meet", "to", "discuss", "ways", "to", "re", "##act", "##ivat", "##e", "parliament", "'", "s", "legislative", "role", "." ], "ids": [ 118, 25444, 73840, 10325, 10111, 40519, 57738, 23267, 10114, 71695, 30360, 10114, 11639, 98974, 34620, 10112, 40519, 112, 187, 53374, 12971, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AL", "AS", "##WA", "##Q" ], "ids": [ 47271, 17421, 42196, 19282 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "State", "security", "court", "starts", "in", "##vesti", "##gating", "suspect", "##s", "in", "un", "##rest", "." ], "ids": [ 118, 11104, 21849, 14866, 33039, 10106, 63996, 91045, 97881, 10107, 10106, 10119, 34189, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "##anya", "##hu", ",", "Wei", "##zma", "##n", "consul", "##t", "on", "Ara", "##fat", "invitation", "." ], "ids": [ 32577, 36027, 13723, 117, 37343, 32022, 10115, 53704, 10123, 10135, 54789, 25616, 77674, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "25" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israeli", "President", "Ez", "##er", "Wei", "##zma", "##n", ",", "wei", "##ghing", "a", "possible", "meeting", "with", "Ya", "##sser", "Ara", "##fat", ",", "consul", "##ted", "on", "Sunday", "with", "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", ",", "a", "spoke", "##sman", "said", "." ], "ids": [ 28446, 12811, 17599, 10165, 37343, 32022, 10115, 117, 86981, 90427, 169, 14128, 19822, 10169, 25148, 33519, 54789, 25616, 117, 53704, 11912, 10135, 19731, 10169, 19924, 14355, 16810, 32577, 36027, 13723, 117, 169, 50005, 24305, 12415, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wei", "##zma", "##n", "and", "Net", "##anya", "##hu", "met", "at", "the", "president", "'", "s", "official", "Jerusalem", "residence", "and", "planned", "to", "speak", "to", "the", "media", "at", "the", "end", "of", "their", "talks", ",", "the", "prime", "minister", "'", "s", "spoke", "##sman", "said", "." ], "ids": [ 37343, 32022, 10115, 10111, 32577, 36027, 13723, 10428, 10160, 10105, 12931, 112, 187, 14731, 20599, 33879, 10111, 24292, 10114, 41541, 10114, 10105, 12518, 10160, 10105, 11572, 10108, 10455, 56672, 117, 10105, 19287, 16930, 112, 187, 50005, 24305, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Earl", "##ier", ",", "the", "director", "of", "the", "president", "'", "s", "office", "denied", "a", "report", "in", "Israel", "'", "s", "Ye", "##dio", "##th", "Ah", "##rono", "##th", "newspaper", "that", "Wei", "##zma", "##n", "had", "already", "invited", "Ara", "##fat", "to", "his", "private", "home", "for", "talks", "in", "the", "coming", "week", "on", "the", "future", "of", "the", "Israel", "-", "PL", "##O", "peace", "process", "." ], "ids": [ 18877, 11709, 117, 10105, 12461, 10108, 10105, 12931, 112, 187, 14301, 47467, 169, 17553, 10106, 12991, 112, 187, 20567, 16994, 11143, 56695, 14718, 11143, 22047, 10189, 37343, 32022, 10115, 10374, 19034, 33392, 54789, 25616, 10114, 10226, 14591, 11816, 10142, 56672, 10106, 10105, 23959, 16118, 10135, 10105, 16711, 10108, 10105, 12991, 118, 71341, 11403, 28101, 15138, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "But", "the", "official", ",", "Ar", "##ye", "##h", "Shu", "##mer", ",", "said", "it", "was", "only", "fit", "##ting", "that", "Wei", "##zma", "##n", "and", "Ara", "##fat", "should", "talk", "after", "the", "Palestinian", "leader", "sent", "the", "Israeli", "president", "a", "letter", "which", "Ye", "##dio", "##th", "Ah", "##rono", "##th", "reported", "contained", "an", "emotional", "appeal", "to", "save", "the", "peace", "proces", "." ], "ids": [ 16976, 10105, 14731, 117, 18484, 12871, 10237, 56448, 12371, 117, 12415, 10271, 10134, 10893, 21635, 12141, 10189, 37343, 32022, 10115, 10111, 54789, 25616, 14819, 31311, 10662, 10105, 56119, 15014, 14541, 10105, 28446, 12931, 169, 19310, 10319, 20567, 16994, 11143, 56695, 14718, 11143, 15943, 31763, 10151, 59995, 44861, 10114, 32635, 10105, 28101, 25553, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 9, 9, 9, 9, 2, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "newspaper", "said", "Net", "##anya", "##hu", ",", "who", "is", "cool", "to", "meeting", "Ara", "##fat", "himself", ",", "opposed", "talks", "between", "Wei", "##zma", "##n", "and", "the", "Palestinian", "president", "." ], "ids": [ 10117, 22047, 12415, 32577, 36027, 13723, 117, 10479, 10124, 67420, 10114, 19822, 54789, 25616, 14764, 117, 30488, 56672, 10948, 37343, 32022, 10115, 10111, 10105, 56119, 12931, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 2, 9, 9 ] }, { "tokens": [ "After", "Mo", "##sle", "##m", "suicide", "bombers", "killed", "59", "people", "in", "Israel", "in", "February", "and", "March", ",", "Wei", "##zma", "##n", "called", "for", "peace", "efforts", "with", "the", "PL", "##O", "to", "be", "suspended", "." ], "ids": [ 11301, 34987, 42176, 10147, 35656, 109594, 15875, 11867, 11426, 10106, 12991, 10106, 11508, 10111, 11144, 117, 37343, 32022, 10115, 11552, 10142, 28101, 22116, 10169, 10105, 71341, 11403, 10114, 10347, 49799, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Shu", "##mer", "said", "his", "current", "position", "was", "that", "the", "peace", "process", "must", "continue", "." ], "ids": [ 56448, 12371, 12415, 10226, 14978, 12956, 10134, 10189, 10105, 28101, 15138, 14982, 17734, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Israel", "-", "Aug", "25", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 12991, 118, 53012, 10258, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "25" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "some", "of", "the", "leading", "stories", "in", "Israeli", "newspapers", "on", "Sunday", "." ], "ids": [ 13252, 10301, 11152, 10108, 10105, 16018, 21158, 10106, 28446, 48473, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##AA", "##RE", "##T", "##Z" ], "ids": [ 145, 62281, 66014, 11090, 13966 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Palestinian", "President", "Ara", "##fat", "opens", "civilian", "struggle", "against", "Israel", ",", "calls", "on", "Palestinian", "##s", "to", "build", "in", "self", "-", "rule", "areas", "." ], "ids": [ 118, 56119, 12811, 54789, 25616, 70702, 53653, 48919, 11327, 12991, 117, 31886, 10135, 56119, 10107, 10114, 23332, 10106, 16567, 118, 21983, 14544, 119 ], "entity": [ "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 4, 8, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Seven", "ministers", "and", "governor", "of", "Bank", "of", "Israel", "will", "visit", "the", "United", "States", "at", "the", "end", "of", "September", "and", "in", "October", "." ], "ids": [ 118, 21077, 66281, 10111, 28795, 10108, 13533, 10108, 12991, 11337, 27541, 10105, 10609, 10859, 10160, 10105, 11572, 10108, 10596, 10111, 10106, 11212, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Israel", "ban", "##s", "plane", "donated", "by", "the", "Netherlands", "to", "Ara", "##fat", "to", "land", "at", "Gaza", "airport", "." ], "ids": [ 118, 12991, 11915, 10107, 35007, 49305, 10155, 10105, 22043, 10114, 54789, 25616, 10114, 11773, 10160, 42434, 28460, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "-", "Former", "prime", "minister", "Pere", "##s", "to", "Morocco", "today", "." ], "ids": [ 118, 42355, 19287, 16930, 33511, 10107, 10114, 57295, 18745, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "Y", "##ED", "##IO", "##TH", "AH", "##RO", "##NO", "##TH" ], "ids": [ 162, 33809, 37174, 109166, 71613, 35066, 67292, 109166 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Israeli", "President", "Wei", "##zma", "##n", "invited", "Palestinian", "President", "Ara", "##fat", "to", "meet", "him", "at", "his", "private", "residence", "." ], "ids": [ 118, 28446, 12811, 37343, 32022, 10115, 33392, 56119, 12811, 54789, 25616, 10114, 23267, 10957, 10160, 10226, 14591, 33879, 119 ], "entity": [ "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 4, 8, 8, 9, 2, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Net", "##anya", "##hu", "oppose", "##s", "transit", "camps", "for", "foreign", "workers", "facing", "ex", "##pulsion", "." ], "ids": [ 118, 32577, 36027, 13723, 53037, 10107, 60486, 33978, 10142, 20796, 23829, 48237, 11419, 52883, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Foreign", "Minister", "Levy", "to", "visit", "Egypt", "soon", "." ], "ids": [ 118, 20277, 14355, 16608, 10114, 27541, 20440, 17864, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 1, 9, 9 ] }, { "tokens": [ "MA", "##AR", "##IV" ], "ids": [ 27277, 52188, 91238 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "-", "Palestinian", "Authority", "has", "taken", "over", "education", "in", "East", "Jerusalem", "." ], "ids": [ 118, 56119, 26553, 10393, 15109, 10491, 14943, 10106, 11830, 20599, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "-", "Syrian", "arm", "##oured", "columns", "on", "the", "move", "in", "Lebanon", "." ], "ids": [ 118, 44152, 31251, 73499, 59050, 10135, 10105, 18577, 10106, 40037, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "-", "Shi", "##mon", "Pere", "##s", "to", "Morocco", ",", "will", "stay", "at", "king", "'", "s", "private", "residence", "." ], "ids": [ 118, 44795, 16278, 33511, 10107, 10114, 57295, 117, 11337, 29597, 10160, 20636, 112, 187, 14591, 33879, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "P", "##OS", "##T" ], "ids": [ 147, 24093, 32612, 32002, 67753, 153, 21793, 11090 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Palestinian", "Minister", "Er", "##eka", "##t", "says", "Israel", "-", "PL", "##O", "talks", "will", "begin", "by", "September", "2", "." ], "ids": [ 118, 56119, 14355, 10915, 31519, 10123, 22153, 12991, 118, 71341, 11403, 56672, 11337, 16135, 10155, 10596, 123, 119 ], "entity": [ "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 4, 8, 8, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Prime", "minister", "names", "former", "general", "Av", "##rah", "##am", "Tam", "##ir", "to", "staff", "after", "failing", "to", "establish", "national", "security", "council", "." ], "ids": [ 118, 19924, 16930, 17978, 11775, 11389, 33799, 23497, 11008, 27324, 10835, 10114, 18927, 10662, 72103, 10114, 33623, 11844, 21849, 23503, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Cabinet", "puts", "off", "decision", "on", "foreign", "workers", "." ], "ids": [ 118, 49855, 94910, 11898, 19231, 10135, 20796, 23829, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Internal", "Security", "Minister", "Ka", "##hala", "##ni", "war", "##ns", "cabinet", "of", "increase", "in", "organised", "crime", "." ], "ids": [ 118, 72919, 20924, 14355, 25444, 47668, 10342, 10338, 10891, 33801, 10108, 20299, 10106, 54200, 22564, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vo", "##ting", "begins", "in", "second", "round", "of", "Lebanese", "election", "." ], "ids": [ 59482, 12141, 26462, 10106, 11132, 13569, 10108, 101257, 13685, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "TR", "##IP", "##OL", "##I", ",", "Lebanon", "1996", "-", "08", "-", "25" ], "ids": [ 80047, 30331, 39272, 11281, 117, 40037, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vo", "##ting", "began", "on", "Sunday", "in", "north", "Lebanon", "in", "the", "second", "round", "of", "parliamentary", "elections", "with", "580", ",", "000", "voters", "eligible", "to", "choose", "28", "members", "of", "the", "128", "-", "member", "parliament", "." ], "ids": [ 59482, 12141, 11941, 10135, 19731, 10106, 12756, 40037, 10106, 10105, 11132, 13569, 10108, 50485, 22054, 10169, 33283, 117, 10259, 55450, 58970, 10114, 48089, 10348, 12464, 10108, 10105, 16196, 118, 12008, 40519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "thin", "trick", "##le", "of", "voters", "began", "casting", "their", "ballot", "##s", "in", "this", "northern", "port", "city", "for", "the", "five", "rival", "lists", "of", "candidates", "as", "poll", "##ing", "stations", "opened", "at", "7", "a", ".", "m", ".", "(", "040", "##0", "g", "##mt", ")", "." ], "ids": [ 138, 61470, 71662, 10284, 10108, 55450, 11941, 61690, 10455, 93339, 10107, 10106, 10531, 17335, 16874, 11584, 10142, 10105, 12403, 24792, 44644, 10108, 33439, 10146, 70156, 10230, 18592, 14377, 10160, 128, 169, 119, 181, 119, 113, 82738, 10929, 175, 18193, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israeli", "president", "in", "##vite", "##s", "Ara", "##fat", "to", "home", "-", "paper", "." ], "ids": [ 28446, 12931, 10106, 33848, 10107, 54789, 25616, 10114, 11816, 118, 17895, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "25" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israeli", "President", "Ez", "##er", "Wei", "##zma", "##n", "has", "invited", "Ya", "##sser", "Ara", "##fat", "to", "meet", "him", "at", "his", "private", "home", ",", "Israel", "'", "s", "biggest", "newspaper", "said", "on", "Sunday", "." ], "ids": [ 28446, 12811, 17599, 10165, 37343, 32022, 10115, 10393, 33392, 25148, 33519, 54789, 25616, 10114, 23267, 10957, 10160, 10226, 14591, 11816, 117, 12991, 112, 187, 36304, 22047, 12415, 10135, 19731, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Ye", "##dio", "##th", "Ah", "##rono", "##th", "daily", "reported", "that", "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", ",", "who", "has", "said", "he", "has", "no", "desire", "to", "hold", "talks", "with", "the", "Palestinian", "president", ",", "oppose", "##s", "the", "meeting", "due", "to", "be", "held", "this", "coming", "week", "." ], "ids": [ 10117, 20567, 16994, 11143, 56695, 14718, 11143, 27636, 15943, 10189, 19924, 14355, 16810, 32577, 36027, 13723, 117, 10479, 10393, 12415, 10261, 10393, 10192, 52253, 10114, 18500, 56672, 10169, 10105, 56119, 12931, 117, 53037, 10107, 10105, 19822, 10850, 10114, 10347, 11991, 10531, 23959, 16118, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "newspaper", "said", "Wei", "##zma", "##n", "scheduled", "the", "meeting", "at", "his", "private", "residence", "in", "the", "central", "Israeli", "village", "of", "Caesar", "##ea", "after", "Ara", "##fat", "sent", "him", "an", "emotional", "appeal", "\"", "to", "save", "the", "peace", "process", "\"", "." ], "ids": [ 10117, 22047, 12415, 37343, 32022, 10115, 34081, 10105, 19822, 10160, 10226, 14591, 33879, 10106, 10105, 12397, 28446, 11607, 10108, 30159, 11233, 10662, 54789, 25616, 14541, 10957, 10151, 59995, 44861, 107, 10114, 32635, 10105, 28101, 15138, 107, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "##anya", "##hu", "met", "Wei", "##zma", "##n", "last", "Tuesday", "and", "voiced", "his", "opposition", ",", "Ye", "##dio", "##th", "said", "." ], "ids": [ 32577, 36027, 13723, 10428, 37343, 32022, 10115, 12469, 70245, 10111, 59900, 10226, 21227, 117, 20567, 16994, 11143, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "\"", "I", "am", "prepared", "to", "post", "##pone", "the", "meeting", "under", "one", "condition", "-", "-", "that", "you", "give", "me", "a", "commitment", "right", "now", "to", "meet", "Ara", "##fat", "your", "##self", "within", "10", "days", ",", "\"", "the", "paper", "quoted", "Wei", "##zma", "##n", "as", "telling", "Net", "##anya", "##hu", "." ], "ids": [ 107, 146, 10392, 39837, 10114, 11841, 35741, 10105, 19822, 10571, 10464, 24713, 118, 118, 10189, 13028, 18090, 10911, 169, 75010, 13448, 11858, 10114, 23267, 54789, 25616, 20442, 43310, 12381, 10150, 13990, 117, 107, 10105, 17895, 70676, 37343, 32022, 10115, 10146, 61758, 32577, 36027, 13723, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "It", "said", "Net", "##anya", "##hu", "had", "yet", "to", "give", "Wei", "##zma", "##n", "an", "answer", "." ], "ids": [ 10377, 12415, 32577, 36027, 13723, 10374, 21833, 10114, 18090, 37343, 32022, 10115, 10151, 57085, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "The", "office", "of", "Israeli", "president", "is", "largely", "ceremonial", "." ], "ids": [ 10117, 14301, 10108, 28446, 12931, 10124, 25340, 110652, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Wei", "##zma", "##n", ",", "a", "former", "defence", "minister", "and", "an", "architect", "of", "Israel", "'", "s", "peace", "treaty", "with", "Egypt", ",", "has", "spoken", "out", "frequently", "on", "the", "peace", "process", "with", "the", "Palestinian", "##s", "-", "-", "at", "times", "ur", "##ging", "the", "former", "Labour", "government", "to", "slow", "it", "down", "." ], "ids": [ 16976, 37343, 32022, 10115, 117, 169, 11775, 47245, 16930, 10111, 10151, 26370, 10108, 12991, 112, 187, 28101, 56353, 10169, 20440, 117, 10393, 41384, 10950, 28846, 10135, 10105, 28101, 15138, 10169, 10105, 56119, 10107, 118, 118, 10160, 13465, 10399, 13808, 10105, 11775, 25606, 12047, 10114, 41573, 10271, 12935, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Corporate", "America", "taking", "new", "view", "on", "compensation", "." ], "ids": [ 70168, 11440, 18084, 10751, 17904, 10135, 71576, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anne", "Murray" ], "ids": [ 13490, 17917 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10328 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Corporate", "America", "is", "planning", "major", "changes", "in", "employee", "compensation", "in", "the", "next", "few", "years", ",", "according", "to", "a", "recent", "study", "." ], "ids": [ 70168, 11440, 10124, 30240, 11922, 19010, 10106, 69312, 71576, 10106, 10105, 13451, 13824, 10855, 117, 18071, 10114, 169, 19037, 14687, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "What", "it", "comes", "down", "to", "is", "this", ":", "If", "you", "'", "re", "highly", "skill", "##ed", ",", "you", "'", "ll", "benefit", "nic", "##ely", "." ], "ids": [ 12489, 10271, 21405, 12935, 10114, 10124, 10531, 131, 14535, 13028, 112, 11639, 22625, 76917, 10336, 117, 13028, 112, 22469, 43074, 46267, 44096, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "if", "you", "'", "re", "not", "and", "cannot", "contribute", "to", "your", "employer", "'", "s", "goals", ",", "you", "'", "ll", "be", "paid", "less", "." ], "ids": [ 16976, 12277, 13028, 112, 11639, 10472, 10111, 25259, 72484, 10114, 20442, 94526, 112, 187, 18173, 117, 13028, 112, 22469, 10347, 25938, 15306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "survey", ",", "conducted", "in", "late", "1995", "and", "the", "early", "part", "of", "this", "year", "by", "management", "consul", "##ting", "firm", "Towers", "Perrin", ",", "showed", "that", "the", "focus", "will", "be", "on", "an", "employee", "'", "s", "overall", "value", "to", "the", "company", "'", "s", "bottom", "line", "-", "-", "rather", "than", "how", "well", "an", "employee", "performs", "a", "specific", "task", "." ], "ids": [ 10117, 35035, 117, 23736, 10106, 13002, 10436, 10111, 10105, 11732, 10668, 10108, 10531, 10924, 10155, 17150, 53704, 12141, 23410, 80133, 81068, 117, 27463, 10189, 10105, 23195, 11337, 10347, 10135, 10151, 69312, 112, 187, 20947, 19211, 10114, 10105, 12100, 112, 187, 34787, 12117, 118, 118, 16863, 11084, 14796, 11206, 10151, 69312, 89603, 169, 19182, 37758, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Present", "##ly", ",", "for", "example", ",", "if", "an", "account", "##ant", "'", "s", "job", "involves", "doing", "five", "specific", "tasks", ",", "he", "or", "she", "can", "ex", "##pect", "a", "certain", "salary", ",", "said", "Sandra", "O", "'", "Neal", ",", "a", "Towers", "Perrin", "principal", "." ], "ids": [ 31911, 10454, 117, 10142, 14351, 117, 12277, 10151, 23200, 11236, 112, 187, 23627, 53963, 30918, 12403, 19182, 72068, 117, 10261, 10345, 10833, 10944, 11419, 51511, 169, 16620, 96108, 117, 12415, 31433, 152, 112, 29147, 117, 169, 80133, 81068, 11652, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "In", "the", "future", ",", "the", "account", "##ant", "will", "be", "eva", "##luat", "##ed", "solely", "on", "\"", "knowledge", ",", "skill", "and", "abilities", ",", "\"", "she", "said", "." ], "ids": [ 10167, 10105, 16711, 117, 10105, 23200, 11236, 11337, 10347, 103730, 107114, 10336, 86159, 10135, 107, 22975, 117, 76917, 10111, 72873, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "addition", "to", "using", "accounting", "skills", ",", "the", "account", "##ant", "will", "also", "have", "to", "be", "creative", ",", "work", "well", "in", "a", "team", ",", "be", "sensitive", "to", "customer", "needs", "and", "set", "product", "##ivity", "goals", "." ], "ids": [ 10167, 14763, 10114, 13382, 106010, 34302, 117, 10105, 23200, 11236, 11337, 10379, 10529, 10114, 10347, 46966, 117, 11424, 11206, 10106, 169, 11121, 117, 10347, 73330, 10114, 72378, 28615, 10111, 11847, 21535, 29087, 18173, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "good", "news", "is", ",", "if", "you", "'", "re", "highly", "skill", "##ed", "and", "have", "many", "abilities", ",", "you", "'", "ll", "be", "paid", "more", ",", "\"", "said", "O", "'", "Neal", "." ], "ids": [ 107, 10117, 15198, 14424, 10124, 117, 12277, 13028, 112, 11639, 22625, 76917, 10336, 10111, 10529, 11299, 72873, 117, 13028, 112, 22469, 10347, 25938, 10798, 117, 107, 12415, 152, 112, 29147, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "\"", "The", "bad", "news", "is", ",", "if", "you", "'", "re", "not", "skill", "##ed", "and", "ca", "n", "'", "t", "contribute", "to", "a", "team", ",", "to", "customer", "service", "and", "the", "organisation", "'", "s", "goals", ",", "you", "'", "ll", "be", "paid", "less", ".", "\"" ], "ids": [ 107, 10117, 15838, 14424, 10124, 117, 12277, 13028, 112, 11639, 10472, 76917, 10336, 10111, 11135, 182, 112, 188, 72484, 10114, 169, 11121, 117, 10114, 72378, 11989, 10111, 10105, 19688, 112, 187, 18173, 117, 13028, 112, 22469, 10347, 25938, 15306, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Of", "the", "750", "mid", "-", "to", "-", "large", "size", "corporations", "survey", "##ed", ",", "81", "percent", "had", "under", "##gone", "a", "major", "rest", "##ru", "##ct", "##uring", "in", "the", "last", "three", "years", ",", "and", "more", "than", "two", "-", "third", "##s", "reported", "that", "product", "##ivity", "and", "profits", "were", "up", "as", "result", "." ], "ids": [ 12610, 10105, 17052, 15607, 118, 10114, 118, 12077, 15851, 109358, 35035, 10336, 117, 12324, 22362, 10374, 10571, 56893, 169, 11922, 17333, 11680, 14526, 31653, 10106, 10105, 12469, 11003, 10855, 117, 10111, 10798, 11084, 10551, 118, 12628, 10107, 15943, 10189, 21535, 29087, 10111, 100106, 10309, 10741, 10146, 14493, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Next", "on", "the", "agenda", "for", "these", "firms", "is", "developing", "a", "new", "compensation", "structure", ",", "and", "78", "percent", "report", "that", "they", "are", "considering", "a", "new", ",", "skills", "-", "based", "plan", "for", "both", "management", "and", "non", "-", "management", "employees", "." ], "ids": [ 24721, 10135, 10105, 70231, 10142, 11762, 84459, 10124, 30879, 169, 10751, 71576, 13926, 117, 10111, 12492, 22362, 17553, 10189, 10689, 10301, 81243, 169, 10751, 117, 34302, 118, 11610, 13065, 10142, 11408, 17150, 10111, 10446, 118, 17150, 35056, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "coming", "shift", ",", "O", "'", "Neal", "said", ",", "\"", "is", "not", "just", "isolated", "or", "a", "fa", "##d", "." ], "ids": [ 10747, 23959, 51467, 117, 152, 112, 29147, 12415, 117, 107, 10124, 10472, 12820, 54622, 10345, 169, 12211, 10162, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "an", "in", "##ex", "##ora", "##ble", "change", ".", "\"" ], "ids": [ 10377, 112, 187, 10151, 10106, 28580, 14945, 11203, 15453, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "World", "War", "II", ",", "corporations", "adopted", "a", "\"", "military", "model", "\"", "creating", "hier", "##arch", "##ical", "organisations", "where", "\"", "the", "concept", "of", "defined", "tasks", "worked", "great", ",", "\"", "she", "said", "." ], "ids": [ 11301, 10315, 11277, 10335, 117, 109358, 24726, 169, 107, 14041, 13192, 107, 29132, 13329, 96355, 17616, 41536, 10940, 107, 10105, 19228, 10108, 23908, 72068, 13858, 14772, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "as", "the", "economy", "became", "global", ",", "customers", "were", "more", "demand", "##ing", "and", "problems", "became", "more", "complex", "." ], "ids": [ 16976, 10146, 10105, 27570, 11179, 18331, 117, 49260, 10309, 10798, 34394, 10230, 10111, 20390, 11179, 10798, 17217, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Multi", "-", "layers", "kept", "management", "at", "a", "distance", "from", "its", "customers", ",", "\"", "O", "'", "Neal", "said", "." ], "ids": [ 107, 60929, 118, 84480, 26546, 17150, 10160, 169, 18527, 10188, 10474, 49260, 117, 107, 152, 112, 29147, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Now", "organisations", "must", "change", "to", "stay", "competitive", "." ], "ids": [ 17121, 41536, 14982, 15453, 10114, 29597, 49836, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "'", "Neal", "says", "firms", "will", "place", "a", "greater", "emphasis", "on", "teams", "and", "team", "performance", "in", "giving", "raise", "##s", "." ], "ids": [ 152, 112, 29147, 22153, 84459, 11337, 11192, 169, 25722, 60848, 10135, 14404, 10111, 11121, 14432, 10106, 24426, 42439, 10107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "your", "team", "does", "well", ",", "you", "'", "ll", "do", "well", "." ], "ids": [ 14535, 20442, 11121, 15107, 11206, 117, 13028, 112, 22469, 10149, 11206, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "it", "does", "n", "'", "t", "do", "well", ",", "do", "n", "'", "t", "ex", "##pect", "a", "raise", "." ], "ids": [ 14535, 10271, 15107, 182, 112, 188, 10149, 11206, 117, 10149, 182, 112, 188, 11419, 51511, 169, 42439, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Is", "this", "fair", "to", "an", "employee", "who", "can", "go", "the", "distance", "but", "is", "on", "a", "team", "that", "ca", "n", "'", "t", "keep", "up", "?" ], "ids": [ 12034, 10531, 45122, 10114, 10151, 69312, 10479, 10944, 11783, 10105, 18527, 10473, 10124, 10135, 169, 11121, 10189, 11135, 182, 112, 188, 23819, 10741, 136 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "That", "'", "s", "an", "important", "question", "we", "used", "to", "ask", "a", "lot", ",", "\"", "said", "O", "'", "Neal", ".", "\"" ], "ids": [ 107, 13646, 112, 187, 10151, 12452, 20210, 11951, 11031, 10114, 63001, 169, 19826, 117, 107, 12415, 152, 112, 29147, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "It", "'", "s", "not", "a", "question", "we", "ask", "any", "more", "." ], "ids": [ 10377, 112, 187, 10472, 169, 20210, 11951, 63001, 11178, 10798, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "more", "important", "question", "is", "-", "-", "'", "Do", "we", "have", "results", "?", "'" ], "ids": [ 10117, 10798, 12452, 20210, 10124, 118, 118, 112, 11791, 11951, 10529, 17466, 136, 112 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"" ], "ids": [ 107 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "To", "get", "those", "results", ",", "27", "percent", "of", "the", "companies", "survey", "##ed", "plan", "to", "eliminate", "base", "pay", "increases", "in", "favour", "of", "cash", "bonus", "##es", "and", "in", "##cent", "##ives", ",", "such", "as", "employee", "and", "team", "award", "programmes", "and", "education", "." ], "ids": [ 11469, 15329, 12676, 17466, 117, 10365, 22362, 10108, 10105, 18866, 35035, 10336, 13065, 10114, 92109, 11404, 16868, 53306, 10106, 61264, 10108, 52828, 28215, 10171, 10111, 10106, 25907, 24407, 117, 11049, 10146, 69312, 10111, 11121, 17725, 37364, 10111, 14943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Companies", "that", "can", "change", "their", "culture", "and", "view", "employees", "as", "business", "partners", "will", "do", "well", ",", "O", "'", "Neal", "said", "." ], "ids": [ 84364, 10189, 10944, 15453, 10455, 15162, 10111, 17904, 35056, 10146, 14155, 48125, 11337, 10149, 11206, 117, 152, 112, 29147, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "For", "example", ",", "the", "survey", "rated", "some", "participants", "in", "the", "survey", "as", "\"", "high", "-", "performing", "\"", "companies", ",", "based", "on", "their", "return", "on", "equity", "above", "16", "percent", "." ], "ids": [ 11399, 14351, 117, 10105, 35035, 48069, 11152, 35675, 10106, 10105, 35035, 10146, 107, 11846, 118, 29933, 107, 18866, 117, 11610, 10135, 10455, 15079, 10135, 102686, 16038, 10250, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Those", "companies", "also", "said", "they", "already", "offer", "employees", "variable", "pay", "and", "business", "education", ",", "give", "their", "managers", "more", "control", "over", "pay", "decisions", "and", "celebrate", "employee", "and", "team", "success", "." ], "ids": [ 43027, 18866, 10379, 12415, 10689, 19034, 24443, 35056, 25844, 16868, 10111, 14155, 14943, 117, 18090, 10455, 98514, 10798, 12608, 10491, 16868, 48126, 10111, 72951, 69312, 10111, 11121, 17001, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "respect", "employees", "more", ",", "they", "trust", "employees", "more", "and", "they", "value", "their", "employees", "more", ",", "\"", "O", "'", "Neal", "said", "." ], "ids": [ 107, 11696, 28944, 35056, 10798, 117, 10689, 54399, 35056, 10798, 10111, 10689, 19211, 10455, 35056, 10798, 117, 107, 152, 112, 29147, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "The", "key", "to", "success", "at", "high", "-", "performance", "companies", "is", "eng", "##aging", "employees", "in", "a", "business", "partnership", "." ], "ids": [ 107, 10117, 18444, 10114, 17001, 10160, 11846, 118, 14432, 18866, 10124, 14716, 43569, 35056, 10106, 169, 14155, 36944, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "will", "improve", "a", "company", "'", "s", "bottom", "line", ".", "\"" ], "ids": [ 10377, 11337, 33992, 169, 12100, 112, 187, 34787, 12117, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgian", "police", "arrest", "detective", "in", "Du", "##tro", "##ux", "affair", "." ], "ids": [ 36652, 15034, 45165, 57127, 10106, 14925, 14239, 11855, 63879, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "G", "##eert", "de", "Cl", "##er", "##cq" ], "ids": [ 144, 55423, 10104, 101989, 10165, 57462 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "NE", "##UF", "##CH", "##AT", "##EA", "##U", ",", "Belgium", "1996", "-", "08", "-", "25" ], "ids": [ 86607, 103104, 86448, 32071, 36789, 12022, 117, 26519, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##vesti", "##gator", "##s", "arrested", "a", "senior", "police", "detective", "on", "Sunday", "in", "connection", "with", "their", "in", "##qui", "##ries", "into", "Belgium", "'", "s", "child", "sex", "scandal", ",", "Public", "Pro", "##se", "##cutor", "Michel", "Bou", "##rle", "##t", "said", "." ], "ids": [ 10167, 63996, 75791, 10107, 29479, 169, 17843, 15034, 57127, 10135, 19731, 10106, 31671, 10169, 10455, 10106, 39639, 15388, 10708, 26519, 112, 187, 18048, 18549, 83458, 117, 14647, 14021, 10341, 98957, 13273, 62583, 43539, 10123, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "Georges", "Zi", "##cot", "was", "arrested", "and", "will", "be", "charged", "with", "truck", "the", "##ft", ",", "insurance", "fraud", "and", "document", "for", "##ger", "##y", ",", "\"", "Bou", "##rle", "##t", "told", "a", "news", "conference", "." ], "ids": [ 107, 14952, 99890, 41746, 10134, 29479, 10111, 11337, 10347, 38253, 10169, 58907, 10105, 12961, 117, 49756, 93070, 10111, 25166, 10142, 11446, 10157, 117, 107, 62583, 43539, 10123, 21937, 169, 14424, 25029, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "there", "had", "been", "search", "##es", "at", "three", "sites", "on", "Sunday", ",", "including", "one", "at", "the", "Charleroi", "judicial", "police", "headquarters", "where", "Zi", "##cot", "worked", "." ], "ids": [ 10357, 12415, 11155, 10374, 10590, 22419, 10171, 10160, 11003, 16055, 10135, 19731, 117, 11198, 10464, 10160, 10105, 88011, 41809, 15034, 28245, 10940, 99890, 41746, 13858, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Zi", "##cot", ",", "45", ",", "is", "a", "specialist", "in", "ta", "##ck", "##ling", "vehicle", "the", "##ft", "." ], "ids": [ 99890, 41746, 117, 10827, 117, 10124, 169, 64956, 10106, 11057, 11263, 11945, 27404, 10105, 12961, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgian", "media", "reported", "that", "he", "had", "been", "questioned", "twice", "in", "the", "past", "two", "years", "about", "the", "##fts", "but", "released", "both", "times", "." ], "ids": [ 36652, 12518, 15943, 10189, 10261, 10374, 10590, 101173, 26261, 10106, 10105, 17781, 10551, 10855, 10978, 10105, 105475, 10473, 11539, 11408, 13465, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "promoted", "to", "chief", "detective", "earlier", "this", "year", "." ], "ids": [ 10357, 10134, 22312, 10114, 19421, 57127, 18905, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bou", "##rle", "##t", "said", "two", "other", "people", "had", "also", "been", "arrested", "." ], "ids": [ 62583, 43539, 10123, 12415, 10551, 10684, 11426, 10374, 10379, 10590, 29479, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "was", "Gerard", "Pig", "##non", ",", "the", "owner", "of", "a", "ware", "##house", "where", "stolen", "vehicles", "were", "allegedly", "stored", "." ], "ids": [ 11340, 10134, 31882, 109138, 17518, 117, 10105, 24414, 10108, 169, 88902, 15562, 10940, 78173, 27237, 10309, 78210, 70809, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "other", "was", "ins", "##urer", "Thierry", "De", "##haa", "##n", "." ], "ids": [ 10117, 10684, 10134, 15498, 100613, 35754, 10190, 55200, 10115, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Bou", "##rle", "##t", "said", "the", "investigation", "into", "the", "vehicle", "the", "##ft", "ring", "would", "be", "added", "to", "the", "in", "##quiry", "into", "the", "pa", "##edo", "##phile", "sex", "scandal", "in", "which", "five", "other", "people", "have", "already", "been", "arrested", "." ], "ids": [ 62583, 43539, 10123, 12415, 10105, 32719, 10708, 10105, 27404, 10105, 12961, 21550, 10894, 10347, 16288, 10114, 10105, 10106, 56914, 10708, 10105, 10931, 32435, 86247, 18549, 83458, 10106, 10319, 12403, 10684, 11426, 10529, 19034, 10590, 29479, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "connection", "was", "through", "Bernard", "Wein", "##stein", ",", "an", "ac", "##com", "##plice", "of", "convicted", "child", "rap", "##ist", "Marc", "Du", "##tro", "##ux", "-", "-", "the", "central", "figure", "in", "the", "pa", "##edo", "##phile", "scandal", "that", "has", "sent", "shock", "##wave", "##s", "across", "Europe", "." ], "ids": [ 10357, 12415, 10105, 31671, 10134, 11222, 14450, 90462, 16206, 117, 10151, 13621, 22530, 62631, 10108, 61487, 18048, 35562, 11293, 15254, 14925, 14239, 11855, 118, 118, 10105, 12397, 17527, 10106, 10105, 10931, 32435, 86247, 83458, 10189, 10393, 14541, 62868, 85164, 10107, 15130, 11767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Wein", "##stein", "was", "found", "dead", "last", "weekend", "alongside", "the", "bodies", "of", "eight", "-", "year", "-", "old", "##s", "Julie", "Le", "##je", "##une", "and", "Melissa", "Russo", "in", "a", "house", "belonging", "to", "Det", "##roux", ",", "who", "said", "they", "star", "##ved", "to", "death", "earlier", "this", "year", ",", "nine", "months", "after", "being", "ab", "##duct", "##ed", "in", "June", "1995", "." ], "ids": [ 90462, 16206, 10134, 11823, 23457, 12469, 43440, 25117, 10105, 34106, 10108, 16222, 118, 10924, 118, 12898, 10107, 18152, 10281, 10381, 19659, 10111, 42409, 48183, 10106, 169, 13215, 54188, 10114, 10666, 65971, 117, 10479, 12415, 10689, 16624, 20709, 10114, 12557, 18905, 10531, 10924, 117, 19964, 15555, 10662, 11223, 11357, 54489, 10336, 10106, 11120, 10436, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "other", "girls", "have", "been", "rescued", "and", "police", "are", "hunting", "for", "at", "least", "two", "more", "who", "Du", "##tro", "##ux", "has", "admitted", "ki", "##dna", "##pping", "a", "year", "ago", "." ], "ids": [ 13214, 10684, 27833, 10529, 10590, 106435, 10111, 15034, 10301, 57232, 10142, 10160, 16298, 10551, 10798, 10479, 14925, 14239, 11855, 10393, 40345, 10879, 35630, 53570, 169, 10924, 36390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Du", "##tro", "##ux", "has", "admitted", "killing", "Wein", "##stein", "after", "a", "disa", "##gree", "##ment", "between", "the", "ac", "##com", "##plice", "##s", "in", "an", "affair", "of", "truck", "the", "##ft", ",", "\"", "Bou", "##rle", "##t", "said", "." ], "ids": [ 107, 14925, 14239, 11855, 10393, 40345, 34248, 90462, 16206, 10662, 169, 36474, 91479, 10426, 10948, 10105, 13621, 22530, 62631, 10107, 10106, 10151, 63879, 10108, 58907, 10105, 12961, 117, 107, 62583, 43539, 10123, 12415, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Another", "four", "people", "were", "also", "questioned", "at", "the", "weekend", "but", "had", "not", "been", "det", "##ained", ",", "Bou", "##rle", "##t", "added", "." ], "ids": [ 17101, 11598, 11426, 10309, 10379, 101173, 10160, 10105, 43440, 10473, 10374, 10472, 10590, 10349, 65804, 117, 62583, 43539, 10123, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Anne", "Th", "##ily", ",", "public", "prose", "##cutor", "in", "the", "eastern", "city", "of", "Lie", "##ge", "where", "Julie", "and", "Melissa", "lived", ",", "said", "this", "was", "a", "major", "case", "involving", "some", "50", "in", "##vesti", "##gator", "##s", "-", "-", "including", "two", "from", "the", "U", ".", "S", ".", "Federal", "Bureau", "of", "Investigation", "." ], "ids": [ 13490, 51635, 32464, 117, 11683, 84145, 98957, 10106, 10105, 18677, 11584, 10108, 39710, 10525, 10940, 18152, 10111, 42409, 17603, 117, 12415, 10531, 10134, 169, 11922, 13474, 40368, 11152, 10462, 10106, 63996, 75791, 10107, 118, 118, 11198, 10551, 10188, 10105, 158, 119, 156, 119, 14492, 12344, 10108, 61421, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 4, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 3, 7, 7, 7, 9 ] }, { "tokens": [ "French", "1997", "budget", "due", "around", "September", "10", "-", "Ju", "##ppe", "." ], "ids": [ 11894, 10391, 25293, 10850, 12166, 10596, 10150, 118, 45031, 21092, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "BR", "##EG", "##AN", "##CO", "##N", ",", "France", "1996", "-", "08", "-", "25" ], "ids": [ 49351, 104036, 41275, 82272, 11537, 117, 10688, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Prime", "Minister", "Alain", "Ju", "##ppe", "said", "on", "Sunday", "the", "draft", "1997", "budget", "and", "plans", "for", "funding", "the", "social", "security", "system", "would", "be", "pub", "##ished", "around", "September", "10", "." ], "ids": [ 19924, 14355, 20444, 45031, 21092, 12415, 10135, 19731, 10105, 28447, 10391, 25293, 10111, 18195, 10142, 30446, 10105, 12142, 21849, 11787, 10894, 10347, 67742, 54438, 12166, 10596, 10150, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "texts", "are", "practical", "##ly", "ready", ",", "\"", "he", "told", "reporter", "##s", "after", "a", "weekend", "of", "talks", "with", "President", "Jacques", "Chi", "##rac", "in", "a", "Riviera", "fortress", "." ], "ids": [ 107, 10117, 44707, 10301, 52940, 10454, 42374, 117, 107, 10261, 21937, 41408, 10107, 10662, 169, 43440, 10108, 56672, 10169, 12811, 12745, 21946, 44208, 10106, 169, 97092, 87208, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 1, 9, 9 ] }, { "tokens": [ "The", "budget", "had", "been", "widely", "expected", "a", "week", "or", "so", "later", "." ], "ids": [ 10117, 25293, 10374, 10590, 24300, 25973, 169, 16118, 10345, 10380, 10873, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Paris", "news", "##room", "+", "331", "422", "##1", "545", "##2" ], "ids": [ 118, 118, 10728, 14424, 25525, 116, 30690, 38735, 10759, 49589, 10729 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "19", "die", "as", "bus", "falls", "in", "river", "in", "Pakistani", "Kashmir", "." ], "ids": [ 10270, 10128, 10146, 19369, 35017, 10106, 16965, 10106, 66797, 56335, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "M", "##U", "##ZA", "##FF", "##AR", "##A", "##BA", "##D", ",", "Pakistan", "1996", "-", "08", "-", "25" ], "ids": [ 150, 12022, 105512, 82678, 52188, 10738, 35999, 11490, 117, 15437, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "bus", "fell", "from", "a", "mountain", "road", "into", "a", "river", "in", "Pakistan", "-", "ruled", "Az", "##ad", "(", "free", ")", "Kashmir", "on", "Sunday", ",", "killing", "at", "least", "19", "people", "and", "in", "##jur", "##ing", "11", ",", "police", "said", "." ], "ids": [ 138, 19369, 25194, 10188, 169, 25233, 15485, 10708, 169, 16965, 10106, 15437, 118, 34920, 11122, 11488, 113, 13961, 114, 56335, 10135, 19731, 117, 34248, 10160, 16298, 10270, 11426, 10111, 10106, 56671, 10230, 10193, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "dead", "included", "five", "refugees", "from", "the", "Indian", "-", "ruled", "part", "of", "Kashmir", ",", "where", "Mo", "##sle", "##m", "militants", "have", "wa", "##ged", "a", "separat", "##ist", "revolt", "since", "early", "1990", "." ], "ids": [ 11696, 12415, 23457, 12742, 12403, 71797, 10188, 10105, 12544, 118, 34920, 10668, 10108, 56335, 117, 10940, 34987, 42176, 10147, 73829, 10529, 11471, 18832, 169, 81806, 11293, 99737, 11764, 11732, 10420, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 1, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "police", "said", "14", "of", "the", "45", "passengers", "on", "the", "bus", "died", "instant", "##ly", "when", "the", "vehicle", "fell", "into", "Kuna", "##r", "river", "from", "a", "narrow", "road", "leading", "from", "the", "state", "capital", "Mu", "##za", "##ffa", "##raba", "##d", "to", "the", "nearby", "Pakistani", "town", "of", "Ga", "##r", "##hi", "Habib", "##ulla", "##h", "northwest", "." ], "ids": [ 10117, 15034, 12415, 10247, 10108, 10105, 10827, 37008, 10135, 10105, 19369, 12482, 73312, 10454, 10841, 10105, 27404, 25194, 10708, 63710, 10129, 16965, 10188, 169, 41444, 15485, 16018, 10188, 10105, 11388, 12185, 49056, 10637, 43311, 69020, 10162, 10114, 10105, 22301, 66797, 12221, 10108, 69699, 10129, 11924, 99223, 63486, 10237, 35078, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 2, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9 ] }, { "tokens": [ "Five", "people", "died", "later", "in", "hospital", "." ], "ids": [ 19268, 11426, 12482, 10873, 10106, 18141, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "North", "Afghan", "highway", "opening", "put", "off", ",", "radio", "says", "." ], "ids": [ 11225, 82228, 31729, 17975, 14499, 11898, 117, 12429, 22153, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IS", "##LA", "##MA", "##BA", "##D", "1996", "-", "08", "-", "25" ], "ids": [ 40214, 44376, 30696, 35999, 11490, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "planned", "re", "##open", "##ing", "of", "Afghanistan", "'", "s", "main", "northern", "Sala", "##ng", "highway", "as", "a", "result", "of", "peace", "talks", "with", "an", "opposition", "alliance", "has", "been", "put", "off", "until", "Wednesday", ",", "official", "Kabul", "Radio", "said", "on", "Sunday", "." ], "ids": [ 10117, 24292, 11639, 47656, 10230, 10108, 18776, 112, 187, 12126, 17335, 27162, 10376, 31729, 10146, 169, 14493, 10108, 28101, 56672, 10169, 10151, 21227, 36758, 10393, 10590, 14499, 11898, 11444, 57611, 117, 14731, 33716, 12083, 12415, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "em", "##bat", "##tle", "##d", "Afghan", "government", "said", "last", "week", "that", "the", "Kabul", "-", "Sala", "##ng", "highway", "would", "be", "opened", "on", "Monday", "or", "Tuesday", "following", "talks", "with", "the", "Supreme", "Co", "##ordination", "Council", "alliance", "led", "by", "Ju", "##mbi", "##sh", "-", "i", "-", "Milli", "movement", "of", "powerful", "opposition", "war", "##lord", "General", "Abdul", "Rashid", "Dos", "##tum", "." ], "ids": [ 10117, 10266, 18234, 16406, 10162, 82228, 12047, 12415, 12469, 16118, 10189, 10105, 33716, 118, 27162, 10376, 31729, 10894, 10347, 14377, 10135, 40714, 10345, 70245, 11901, 56672, 10169, 10105, 22872, 13098, 106553, 12821, 36758, 12857, 10155, 45031, 59208, 13264, 118, 177, 118, 32932, 17123, 10108, 29481, 21227, 10338, 69564, 11220, 23642, 93828, 23846, 15673, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "The", "radio", "said", "on", "Sunday", "the", "post", "##pone", "##ment", "of", "the", "opening", "had", "been", "made", "due", "to", "\"", "pre", "##ca", "##ution", "##s", "\"", "." ], "ids": [ 10117, 12429, 12415, 10135, 19731, 10105, 11841, 35741, 10426, 10108, 10105, 17975, 10374, 10590, 11019, 10850, 10114, 107, 12229, 10425, 30861, 10107, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "did", "not", "elaborate", "." ], "ids": [ 10377, 12172, 10472, 90052, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Sala", "##ng", "highway", ",", "Afghanistan", "'", "s", "main", "route", "to", "Central", "Asia", ",", "has", "been", "controlled", "by", "Dos", "##tum", "since", "he", "began", "fighting", "President", "Bu", "##r", "##han", "##uddin", "Ra", "##bban", "##i", "'", "s", "government", "in", "Kabul", "in", "January", "1994", "in", "alliance", "with", "He", "##z", "##b", "-", "i", "-", "Islam", "##i", "party", "leader", "G", "##ul", "##bud", "##din", "He", "##km", "##aty", "##ar", ",", "then", "prime", "minister", "but", "rival", "to", "the", "president", "." ], "ids": [ 10117, 27162, 10376, 31729, 117, 18776, 112, 187, 12126, 13933, 10114, 11885, 12782, 117, 10393, 10590, 29050, 10155, 23846, 15673, 11764, 10261, 11941, 27535, 12811, 11916, 10129, 11781, 76170, 38571, 88901, 10116, 112, 187, 12047, 10106, 33716, 10106, 11238, 10444, 10106, 36758, 10169, 10357, 10305, 10457, 118, 177, 118, 14727, 10116, 14039, 15014, 144, 10604, 41276, 15612, 10357, 23440, 55241, 10354, 117, 11059, 19287, 16930, 10473, 24792, 10114, 10105, 12931, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "##km", "##aty", "##ar", "re", "##jo", "##ined", "the", "government", "as", "prime", "minister", "last", "June", "under", "a", "peace", "pa", "##ct", "with", "Ra", "##bban", "##i", "and", "has", "since", "been", "trying", "to", "pers", "##ua", "##de", "other", "opposition", "faction", "##s", "to", "follow", "suit", "." ], "ids": [ 10357, 23440, 55241, 10354, 11639, 11039, 28751, 10105, 12047, 10146, 19287, 16930, 12469, 11120, 10571, 169, 28101, 10931, 14526, 10169, 38571, 88901, 10116, 10111, 10393, 11764, 10590, 32862, 10114, 108839, 11908, 10253, 10684, 21227, 84395, 10107, 10114, 28086, 26315, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Earl", "##ier", "this", "month", ",", "Ju", "##mbi", "##sh", "denied", "a", "Kabul", "government", "statement", "that", "the", "two", "sides", "had", "agreed", "to", "a", "cea", "##sef", "##ire", "in", "the", "north", "." ], "ids": [ 18877, 11709, 10531, 14064, 117, 45031, 59208, 13264, 47467, 169, 33716, 12047, 33311, 10189, 10105, 10551, 27263, 10374, 25577, 10114, 169, 25578, 107749, 11627, 10106, 10105, 12756, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Students", "bu", "##rn", "Has", "##ina", "ef", "##fig", "##y", ",", "battle", "police", "." ], "ids": [ 30356, 11499, 13061, 45896, 11067, 56331, 74115, 10157, 117, 18758, 15034, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ani", "##s", "Ahmed" ], "ids": [ 90796, 10107, 25530 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "DH", "##A", "##KA", "1996", "-", "08", "-", "25" ], "ids": [ 83164, 10738, 67813, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Students", "backed", "by", "opposition", "parties", "battle", "##d", "police", "and", "burned", "an", "ef", "##fig", "##y", "of", "Prime", "Minister", "Sheikh", "Has", "##ina", "during", "a", "strike", "in", "the", "north", "Bangladesh", "##i", "town", "of", "Bog", "##ra", "on", "Sunday", "." ], "ids": [ 30356, 61010, 10155, 21227, 18708, 18758, 10162, 15034, 10111, 63838, 10151, 56331, 74115, 10157, 10108, 19924, 14355, 58837, 45896, 11067, 10939, 169, 37456, 10106, 10105, 12756, 24080, 10116, 12221, 10108, 97033, 10288, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "The", "striker", "##s", "barri", "##cade", "##d", "streets", ",", "attacked", "the", "local", "office", "of", "the", "ruling", "A", "##wami", "League", ",", "fought", "running", "battles", "with", "police", "and", "set", "ali", "##ght", "hundreds", "of", "copies", "of", "the", "popular", "\"", "Jana", "##kant", "##ha", "\"", "newspaper", ",", "alle", "##ging", "it", "was", "pro", "-", "government", "." ], "ids": [ 10117, 103325, 10107, 72057, 55039, 10162, 41969, 117, 30272, 10105, 11436, 14301, 10108, 10105, 50788, 138, 105097, 11074, 117, 29766, 18020, 63963, 10169, 15034, 10111, 11847, 12134, 20687, 48329, 10108, 26102, 10108, 10105, 12600, 107, 18909, 24704, 10921, 107, 22047, 117, 10968, 13808, 10271, 10134, 11284, 118, 12047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "used", "bat", "##ons", "and", "tea", "##rga", "##s", "to", "try", "to", "dis", "##pers", "##e", "students", "who", "were", "throwing", "stones", "and", "home", "-", "made", "bombs", ",", "witnesses", "said", "." ], "ids": [ 18051, 11031, 11519, 13326, 10111, 57675, 31486, 10107, 10114, 31638, 10114, 27920, 24193, 10112, 13501, 10479, 10309, 110039, 77650, 10111, 11816, 118, 11019, 94510, 117, 109898, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "strike", ",", "called", "by", "the", "main", "opposition", "Bangladesh", "National", "##ist", "Party", "(", "B", "##NP", ")", ",", "to", "den", "##oun", "##ce", "the", "deaths", "of", "four", "students", "killed", "by", "police", "over", "the", "last", "few", "days", ",", "coincide", "##d", "with", "a", "visit", "to", "the", "area", "by", "Has", "##ina", "." ], "ids": [ 10117, 37456, 117, 11552, 10155, 10105, 12126, 21227, 24080, 10655, 11293, 12529, 113, 139, 59654, 114, 117, 10114, 10140, 43971, 10419, 10105, 50438, 10108, 11598, 13501, 15875, 10155, 15034, 10491, 10105, 12469, 13824, 13990, 117, 81860, 10162, 10169, 169, 27541, 10114, 10105, 11168, 10155, 45896, 11067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Local", "officials", "said", "one", "police", "##man", "was", "killed", "by", "guns", "##hot", "##s", "during", "c", "##lash", "##es", "with", "pro", "-", "opposition", "students", "on", "Thursday", "." ], "ids": [ 22693, 27730, 12415, 10464, 15034, 10589, 10134, 15875, 10155, 31199, 55788, 10107, 10939, 171, 25297, 10171, 10169, 11284, 118, 21227, 13501, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Has", "##ina", "told", "a", "cross", "section", "of", "people", "at", "the", "Bog", "##ra", "police", "headquarters", "on", "Sunday", "that", "the", "government", "had", "already", "suspended", "three", "police", "officers", "and", "ordered", "a", "judicial", "probe", "into", "the", "violent", "incidents", "." ], "ids": [ 45896, 11067, 21937, 169, 19630, 14893, 10108, 11426, 10160, 10105, 97033, 10288, 15034, 28245, 10135, 19731, 10189, 10105, 12047, 10374, 19034, 49799, 11003, 15034, 23579, 10111, 23782, 169, 41809, 110239, 10708, 10105, 43934, 73451, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "prime", "minister", "offered", "financial", "grants", "to", "the", "families", "of", "those", "killed", ",", "ordered", "the", "best", "possible", "medical", "care", "for", "the", "injured", "and", "ur", "##ged", "Bog", "##ra", "residents", "to", "call", "off", "the", "strike", "." ], "ids": [ 10117, 19287, 16930, 20841, 20570, 73931, 10114, 10105, 15300, 10108, 12676, 15875, 117, 23782, 10105, 12504, 14128, 19436, 11131, 10142, 10105, 36081, 10111, 10399, 18832, 97033, 10288, 22058, 10114, 20575, 11898, 10105, 37456, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Opposition", "legi", "##sla", "##tors", "walk", "##ed", "out", "of", "parliament", "in", "Dhaka", "on", "Sunday", "den", "##oun", "##cing", "\"", "un", "##pre", "##cedent", "##ed", "police", "bar", "##bari", "##ty", "\"", "against", "opposition", "students", "and", "supporters", "." ], "ids": [ 69053, 78198, 61432, 24324, 33734, 10336, 10950, 10108, 40519, 10106, 75710, 10135, 19731, 10140, 43971, 19113, 107, 10119, 30619, 104101, 10336, 15034, 18121, 73840, 11195, 107, 11327, 21227, 13501, 10111, 42957, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "renewed", "their", "call", "for", "the", "resignation", "of", "Home", "(", "Interior", ")", "Minister", "Ra", "##fiq", "##ul", "Islam", "." ], "ids": [ 11696, 81783, 10455, 20575, 10142, 10105, 66129, 10108, 13898, 113, 33667, 114, 14355, 38571, 65106, 10604, 14727, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Hundred", "##s", "of", "police", "raid", "##ed", "the", "Dhaka", "university", "on", "Sunday", ",", "arrest", "##ing", "nearly", "30", "outside", "##rs", "who", "had", "been", "living", "in", "student", "dor", "##mit", "##orie", "##s", "and", "sei", "##zing", "weapons", ",", "university", "officials", "said", "." ], "ids": [ 73415, 10107, 10108, 15034, 52152, 10336, 10105, 75710, 19756, 10135, 19731, 117, 45165, 10230, 21377, 10244, 17555, 10943, 10479, 10374, 10590, 14625, 10106, 16470, 33518, 15772, 51690, 10107, 10111, 13868, 19308, 31881, 117, 19756, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "storm", "##ed", "ten", "residence", "hall", "##s", "on", "the", "campus", ",", "fl", "##ush", "##ed", "out", "people", "at", "gun", "##point", "and", "search", "##ed", "their", "bag", "##gage", "." ], "ids": [ 18051, 31642, 10336, 11769, 33879, 21007, 10107, 10135, 10105, 20113, 117, 58768, 37026, 10336, 10950, 11426, 10160, 23103, 45676, 10111, 22419, 10336, 10455, 56332, 93794, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "seized", "rev", "##olver", "##s", ",", "saw", "##n", "-", "off", "rifle", "##s", ",", "shot", "##gun", "##s", "and", "kn", "##ives", "." ], "ids": [ 11696, 80176, 86095, 66403, 10107, 117, 17112, 10115, 118, 11898, 59116, 10107, 117, 19508, 32657, 10107, 10111, 96820, 24407, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "students", "were", "later", "allowed", "to", "return", "." ], "ids": [ 10117, 13501, 10309, 10873, 18162, 10114, 15079, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "s", "##wo", "##op", "followed", "the", "resignation", "of", "the", "university", "'", "s", "Vice", "-", "Chancellor", "Dr", ".", "Em", "##aju", "##ddin", "Ahmed", "on", "Saturday", "over", "the", "det", "##eri", "##orat", "##ing", "law", "and", "order", "situation", "on", "the", "campus", "." ], "ids": [ 10117, 187, 16828, 13362, 15689, 10105, 66129, 10108, 10105, 19756, 112, 187, 19214, 118, 59109, 11612, 119, 11289, 66359, 51256, 25530, 10135, 24848, 10491, 10105, 10349, 13227, 99124, 10230, 13255, 10111, 12990, 18586, 10135, 10105, 20113, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Author", "##ities", "closed", "down", "the", "28", ",", "000", "-", "student", "university", "on", "We", "##dne", "##ds", "##ay", "following", "gun", "##bat", "##tles", "between", "students", "and", "police", "." ], "ids": [ 57043, 17285, 18440, 12935, 10105, 10348, 117, 10259, 118, 16470, 19756, 10135, 12865, 20714, 13268, 13998, 11901, 23103, 18234, 37627, 10948, 13501, 10111, 15034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "they", "fought", "armed", "activists", "from", "the", "B", "##NP", ",", "headed", "by", "former", "prime", "minister", "Be", "##gum", "K", "##hale", "##da", "Zi", "##a", "." ], "ids": [ 18051, 12415, 10689, 29766, 34174, 84024, 10188, 10105, 139, 59654, 117, 33336, 10155, 11775, 19287, 16930, 14321, 55792, 148, 39149, 10229, 99890, 10113, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Has", "##ina", "told", "police", "the", "home", "ministry", "had", "already", "given", "a", "\"", "bl", "##anke", "##t", "order", "\"", "to", "arrest", "terrorist", "##s", "and", "possesso", "##rs", "of", "illegal", "fire", "##arm", "##s", "ir", "##res", "##pect", "##ive", "of", "their", "political", "ide", "##nti", "##ties", "." ], "ids": [ 45896, 11067, 21937, 15034, 10105, 11816, 65338, 10374, 19034, 13507, 169, 107, 21484, 62428, 10123, 12990, 107, 10114, 45165, 76482, 10107, 10111, 75688, 10943, 10108, 39806, 13559, 76171, 10107, 10478, 11234, 51511, 11942, 10108, 10455, 13736, 38938, 12752, 14197, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Near", "##ly", "100", "students", "have", "been", "injured", "in", "the", "c", "##lash", "##es", "in", "Dhaka", "and", "Bog", "##ra", ",", "police", "told", "reporter", "##s", "." ], "ids": [ 16140, 10454, 10407, 13501, 10529, 10590, 36081, 10106, 10105, 171, 25297, 10171, 10106, 75710, 10111, 97033, 10288, 117, 15034, 21937, 41408, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "16", "die", "as", "bus", "crash", "##es", "in", "Pakistani", "Kashmir", "." ], "ids": [ 10250, 10128, 10146, 19369, 42774, 10171, 10106, 66797, 56335, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "M", "##U", "##ZA", "##FF", "##AR", "##A", "##BA", "##D", ",", "Pakistan", "1996", "-", "08", "-", "25" ], "ids": [ 150, 12022, 105512, 82678, 52188, 10738, 35999, 11490, 117, 15437, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "16", "people", "were", "killed", "and", "several", "injured", "on", "Sunday", "when", "a", "bus", "fell", "from", "a", "mountain", "road", "into", "a", "ra", "##vine", "on", "a", "river", "bank", "in", "Pakistan", "-", "ruled", "Az", "##ad", "(", "free", ")", "Kashmir", ",", "police", "said", "." ], "ids": [ 11699, 16298, 10250, 11426, 10309, 15875, 10111, 11736, 36081, 10135, 19731, 10841, 169, 19369, 25194, 10188, 169, 25233, 15485, 10708, 169, 11859, 30396, 10135, 169, 16965, 19423, 10106, 15437, 118, 34920, 11122, 11488, 113, 13961, 114, 56335, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "14", "out", "of", "45", "passengers", "on", "the", "bus", "died", "instant", "##ly", "when", "the", "vehicle", "fell", "from", "the", "narrow", "road", "while", "on", "its", "way", "from", "the", "state", "capital", "Mu", "##za", "##ffa", "##raba", "##d", "to", "the", "nearby", "Pakistani", "town", "of", "Ga", "##r", "##hi", "Habib", "##ulla", "##h", "in", "the", "northwest", "." ], "ids": [ 11696, 12415, 10247, 10950, 10108, 10827, 37008, 10135, 10105, 19369, 12482, 73312, 10454, 10841, 10105, 27404, 25194, 10188, 10105, 41444, 15485, 11371, 10135, 10474, 13170, 10188, 10105, 11388, 12185, 49056, 10637, 43311, 69020, 10162, 10114, 10105, 22301, 66797, 12221, 10108, 69699, 10129, 11924, 99223, 63486, 10237, 10106, 10105, 35078, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 2, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "died", "later", "in", "hospital", "." ], "ids": [ 13214, 12482, 10873, 10106, 18141, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##EA", "##T", "##UR", "##E", "-", "Fe", "##rti", "##le", "Ukraine", "faces", "dro", "##ught", "of", "cash", "and", "rain", "." ], "ids": [ 143, 36789, 11090, 98348, 11259, 118, 20187, 28304, 10284, 19883, 48343, 33741, 53206, 10108, 52828, 10111, 50939, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Irene", "Mar", "##ush", "##ko" ], "ids": [ 31906, 15734, 37026, 10440 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "BA", "##T", "##KI", "##V", "##SH", "##CH", "##Y", "##NA", "CO", "##LL", "##EC", "##TI", "##VE", "FA", "##R", "##M", ",", "Ukraine", "1996", "-", "08", "-", "26" ], "ids": [ 39999, 11090, 59879, 11779, 64091, 86448, 14703, 36742, 32992, 82834, 35826, 72286, 68560, 20794, 11273, 11517, 117, 19883, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Four", "shi", "##ny", "new", "green", "-", "and", "-", "yellow", "John", "Deer", "##e", "combine", "##s", "park", "##ed", "at", "this", "1", ",", "750", "-", "hectare", "(", "4", ",", "325", "-", "acre", ")", "farm", "in", "the", "grain", "-", "growing", "regions", "south", "of", "Kiev", "do", "n", "'", "t", "fill", "its", "chief", "ag", "##rono", "##mist", "with", "ent", "##hus", "##ias", "##m", "." ], "ids": [ 16773, 57667, 10756, 10751, 23320, 118, 10111, 118, 29815, 10421, 82853, 10112, 96961, 10107, 14900, 10336, 10160, 10531, 122, 117, 17052, 118, 69129, 113, 125, 117, 25843, 118, 54290, 114, 30568, 10106, 10105, 69132, 118, 25566, 21721, 13144, 10108, 30903, 10149, 182, 112, 188, 20241, 10474, 19421, 16942, 14718, 24987, 10169, 61047, 15471, 15465, 10147, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "did", "a", "good", "job", "this", "year", ",", "but", "they", "need", "good", "diesel", "and", "good", "engine", "oil", ",", "\"", "said", "Ivan", "Od", "##nos", "##um", ".", "\"" ], "ids": [ 107, 11696, 12172, 169, 15198, 23627, 10531, 10924, 117, 10473, 10689, 17367, 15198, 40233, 10111, 15198, 18240, 21073, 117, 107, 12415, 15631, 11936, 14386, 10465, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "God", "help", "us", "if", "there", "is", "a", "break", "##down", ",", "\"", "he", "said", "of", "the", "machinery", ",", "loan", "##ed", "to", "the", "farm", "after", "the", "Ukrainian", "government", "bought", "it", "earlier", "this", "year", "." ], "ids": [ 14015, 15217, 19626, 12277, 11155, 10124, 169, 24194, 27160, 117, 107, 10261, 12415, 10108, 10105, 110714, 117, 33390, 10336, 10114, 10105, 30568, 10662, 10105, 30718, 12047, 28870, 10271, 18905, 10531, 10924, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "country", "'", "s", "grain", "har", "##vest", "this", "year", "is", "for", "##eca", "##st", "to", "fall", "by", "more", "than", "23", "percent", "to", "only", "28", "million", "tonnes", "and", "two", "har", "##sh", "factors", "are", "to", "bl", "##ame", "." ], "ids": [ 10117, 12723, 112, 187, 69132, 10453, 34592, 10531, 10924, 10124, 10142, 33588, 10562, 10114, 18042, 10155, 10798, 11084, 10328, 22362, 10114, 10893, 10348, 12473, 39435, 10111, 10551, 10453, 13264, 31075, 10301, 10114, 21484, 18969, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "dro", "##ught", "s", "##cou", "##red", "the", "step", "##pes", "in", "May", "and", "June", ",", "st", "##unti", "##ng", "the", "growing", "wheat", "." ], "ids": [ 138, 33741, 53206, 187, 30656, 15711, 10105, 31877, 16354, 10106, 10725, 10111, 11120, 117, 28780, 64165, 10376, 10105, 25566, 109653, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "the", "farming", "sector", ",", "making", "the", "pain", "##ful", "transition", "from", "Soviet", "central", "planning", "to", "a", "market", "economy", "simply", "has", "no", "money", "." ], "ids": [ 12689, 10105, 61295, 17417, 117, 14293, 10105, 38576, 14446, 35959, 10188, 15277, 12397, 30240, 10114, 169, 17313, 27570, 26097, 10393, 10192, 17920, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ukraine", "'", "s", "black", "soil", "is", "so", "fertile", "that", "a", "diplomat", "described", "it", "as", "\"", "rich", "enough", "to", "grow", "rubber", "boot", "##s", "\"", "." ], "ids": [ 19883, 112, 187, 15045, 41080, 10124, 10380, 105126, 10189, 169, 45652, 13010, 10271, 10146, 107, 33250, 21408, 10114, 42254, 92724, 63815, 10107, 107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "recently", "Ukraine", "has", "been", "losing", "its", "reputation", "as", "a", "br", "##ead", "##bas", "##ket", "of", "Europe", ",", "earned", "in", "the", "years", "before", "brutal", "forced", "collect", "##ivi", "##sation", "under", "Soviet", "di", "##ctat", "##or", "Josef", "Stalin", "." ], "ids": [ 16976, 23746, 19883, 10393, 10590, 27817, 10474, 44214, 10146, 169, 33989, 30297, 21322, 13650, 10108, 11767, 117, 21293, 10106, 10105, 10855, 11360, 81088, 20054, 80739, 22317, 21603, 10571, 15277, 10120, 95400, 10667, 15749, 26059, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "\"", "The", "wheat", "will", "not", "be", "of", "a", "good", "quality", "this", "year", ",", "\"", "said", "Hr", "##y", "##hor", "##y", "Bo", "##rs", "##uk", ",", "a", "scientist", "at", "the", "Mir", "##oni", "##vka", "W", "##hea", "##t", "Institute", ",", "run", "by", "the", "Ukrainian", "Academy", "of", "A", "##gra", "##rian", "Sciences", "." ], "ids": [ 107, 10117, 109653, 11337, 10472, 10347, 10108, 169, 15198, 21905, 10531, 10924, 117, 107, 12415, 74968, 10157, 39854, 10157, 27622, 10943, 13013, 117, 169, 59248, 10160, 10105, 43209, 14639, 38299, 160, 45546, 10123, 12031, 117, 14095, 10155, 10105, 30718, 12578, 10108, 138, 25635, 20764, 12982, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "\"", "The", "temperature", "on", "the", "ground", "reached", "62", "decree", "##s", "Celsius", "(", "143", ".", "60", "Fa", "##hren", "##heit", ")", "this", "summer", "." ], "ids": [ 107, 10117, 23509, 10135, 10105, 16912, 17087, 12066, 109157, 10107, 102972, 113, 19510, 119, 10709, 44271, 31203, 15543, 114, 10531, 17995, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "ve", "never", "seen", "anything", "so", "bad", ",", "\"", "he", "said", "in", "an", "interview", "in", "his", "office", ",", "un", "##lit", "since", "the", "government", "cut", "off", "electricity", "because", "of", "un", "##pai", "##d", "power", "bill", "##s", "." ], "ids": [ 12865, 112, 10323, 14794, 15652, 42819, 10380, 15838, 117, 107, 10261, 12415, 10106, 10151, 21213, 10106, 10226, 14301, 117, 10119, 21511, 11764, 10105, 12047, 21610, 11898, 55955, 12373, 10108, 10119, 48778, 10162, 13183, 34497, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "har", "##vest", "is", "gathered", "in", "the", "dry", "areas", ",", "but", "rainfall", "in", "Western", "Ukraine", "has", "delayed", "har", "##vesti", "##ng", "there", "." ], "ids": [ 10117, 10453, 34592, 10124, 69918, 10106, 10105, 36796, 14544, 117, 10473, 91549, 10106, 13163, 19883, 10393, 67058, 10453, 63996, 10376, 11155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "Mir", "##oni", "##vka", "'", "s", "scientists", ",", "some", "un", "##pai", "##d", "for", "months", ",", "carry", "on", "developing", "new", "strain", "##s", "of", "wheat", "res", "##istant", "to", "Ukraine", "'", "s", "extreme", "continental", "climate", ",", "Bo", "##rs", "##uk", "said", "the", "lack", "of", "cash", "in", "Ukraine", "'", "s", "agricultural", "sector", "is", "as", "bad", "as", "the", "dro", "##ught", "." ], "ids": [ 14600, 43209, 14639, 38299, 112, 187, 49871, 117, 11152, 10119, 48778, 10162, 10142, 15555, 117, 31626, 10135, 30879, 10751, 110158, 10107, 10108, 109653, 39429, 90986, 10114, 19883, 112, 187, 42331, 33217, 15648, 117, 27622, 10943, 13013, 12415, 10105, 23582, 10108, 52828, 10106, 19883, 112, 187, 35365, 17417, 10124, 10146, 15838, 10146, 10105, 33741, 53206, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Collective", "farms", "and", "Ukraine", "'", "s", "nasce", "##nt", "private", "farming", "sector", "have", "no", "money", "for", "fer", "##tili", "##ser", ",", "no", "money", "for", "herb", "##ici", "##des", "and", "pes", "##tici", "##des", ",", "no", "money", "to", "repair", "old", "or", "buy", "new", "machinery", ",", "no", "money", "for", "fuel", ",", "and", "none", "to", "buy", "good", "seed", "." ], "ids": [ 102928, 83951, 10111, 19883, 112, 187, 54004, 10368, 14591, 61295, 17417, 10529, 10192, 17920, 10142, 13658, 47372, 12754, 117, 10192, 17920, 10142, 108016, 13439, 10920, 10111, 59411, 37455, 10920, 117, 10192, 17920, 10114, 55583, 12898, 10345, 47715, 10751, 110714, 117, 10192, 17920, 10142, 30550, 117, 10111, 46638, 10114, 47715, 15198, 49282, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "year", "'", "s", "har", "##vest", "is", "down", "from", "last", "year", "'", "s", "36", ".", "5", "million", "ton", "##ne", "har", "##vest", ",", "which", "in", "turn", "compare", "##s", "with", "50", "million", "tonnes", "in", "1990", ",", "the", "year", "before", "independence", "." ], "ids": [ 10747, 10924, 112, 187, 10453, 34592, 10124, 12935, 10188, 12469, 10924, 112, 187, 11055, 119, 126, 12473, 22464, 10238, 10453, 34592, 117, 10319, 10106, 18923, 52860, 10107, 10169, 10462, 12473, 39435, 10106, 10420, 117, 10105, 10924, 11360, 31412, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "decline", "is", "all", "the", "worse", "for", "people", "who", "reca", "##ll", "waste", "##ful", "Soviet", "times", ",", "when", "the", "Kr", "##emlin", "imported", "grain", "but", "price", "##d", "br", "##ead", "so", "che", "##ap", "##ly", "that", "people", "bought", "it", "to", "feed", "their", "pi", "##gs", "." ], "ids": [ 10117, 46695, 10124, 10435, 10105, 110353, 10142, 11426, 10479, 103778, 11231, 59158, 14446, 15277, 13465, 117, 10841, 10105, 17640, 110169, 100591, 69132, 10473, 30839, 10162, 33989, 30297, 10380, 10262, 16070, 10454, 10189, 11426, 28870, 10271, 10114, 44988, 10455, 24109, 15703, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Agriculture", "is", "very", "expensive", ",", "and", "there", "are", "no", "solutions", "to", "our", "problems", "on", "the", "hori", "##zon", ",", "\"", "said", "Od", "##nos", "##um", "." ], "ids": [ 107, 30954, 10124, 12558, 58069, 117, 10111, 11155, 10301, 10192, 44901, 10114, 17446, 20390, 10135, 10105, 56191, 22742, 117, 107, 12415, 11936, 14386, 10465, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "He", "said", "his", "farm", ",", "its", "260", "workers", "now", "ready", "##ing", "the", "fields", "for", "winter", "wheat", "so", "##wing", ",", "expected", "the", "land", "to", "yield", "5", ".", "2", "tonnes", "per", "hectare", "(", "2", ".", "5", "acres", ")", "but", "ended", "up", "with", "3", ".", "9", "tonnes", "-", "-", "still", "better", "than", "the", "national", "average", "of", "2", ".", "11", "tonnes", "per", "hectare", "this", "year", "." ], "ids": [ 10357, 12415, 10226, 30568, 117, 10474, 17948, 23829, 11858, 42374, 10230, 10105, 28455, 10142, 25977, 109653, 10380, 25649, 117, 25973, 10105, 11773, 10114, 95757, 126, 119, 123, 39435, 10178, 69129, 113, 123, 119, 126, 26043, 114, 10473, 18428, 10741, 10169, 124, 119, 130, 39435, 118, 118, 12647, 18322, 11084, 10105, 11844, 13551, 10108, 123, 119, 10193, 39435, 10178, 69129, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "did", "not", "have", "money", "for", "fer", "##tili", "##ser", ",", "we", "'", "re", "in", "debt", "for", "fuel", ",", "and", "we", "'", "re", "bor", "##rowing", "diesel", ",", "\"", "Od", "##nos", "##um", "said", "." ], "ids": [ 107, 12865, 12172, 10472, 10529, 17920, 10142, 13658, 47372, 12754, 117, 11951, 112, 11639, 10106, 55869, 10142, 30550, 117, 10111, 11951, 112, 11639, 27728, 77449, 40233, 117, 107, 11936, 14386, 10465, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "A", "few", "kilometres", "(", "miles", ")", "down", "the", "two", "-", "lane", "road", "which", "passes", "Od", "##nos", "##um", "'", "s", "farm", ",", "where", "the", "occasional", "horse", "-", "drawn", "bug", "##gy", "passes", "by", ",", "is", "the", "1", ",", "700", "-", "hectare", "(", "4", ",", "200", "-", "acre", ")", "She", "##v", "##chenko", "collective", "farm", ",", "built", "next", "to", "a", "village", "still", "ne", "##at", "and", "tid", "##y", "despite", "post", "-", "Soviet", "de", "##cay", "." ], "ids": [ 138, 13824, 20127, 113, 14148, 114, 12935, 10105, 10551, 118, 23636, 15485, 10319, 28393, 11936, 14386, 10465, 112, 187, 30568, 117, 10940, 10105, 83522, 30491, 118, 34788, 14460, 17113, 28393, 10155, 117, 10124, 10105, 122, 117, 12367, 118, 69129, 113, 125, 117, 10777, 118, 54290, 114, 11149, 10477, 87665, 49417, 30568, 117, 12183, 13451, 10114, 169, 11607, 12647, 10554, 10526, 10111, 15201, 10157, 22087, 11841, 118, 15277, 10104, 69218, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Chief", "Account", "##ant", "Natal", "##ya", "Sy", "##pron", "said", "the", "collective", "is", "str", "##app", "##ed", "for", "cash", ",", "earlier", "this", "year", "bar", "##tering", "220", "tonnes", "of", "grain", "for", "diesel", "to", "fuel", "six", "ri", "##cket", "##y", "grain", "combine", "##s", "and", "tra", "##ctors", "badly", "in", "need", "of", "repairs", "and", "basic", "maintenance", "." ], "ids": [ 16730, 94619, 11236, 36024, 10679, 32879, 103516, 12415, 10105, 49417, 10124, 17791, 102295, 10336, 10142, 52828, 117, 18905, 10531, 10924, 18121, 85353, 15817, 39435, 10108, 69132, 10142, 40233, 10114, 30550, 12449, 29956, 28721, 10157, 69132, 96961, 10107, 10111, 11264, 72933, 91810, 10106, 17367, 10108, 98543, 10111, 25090, 40347, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "average", "family", "earn", "##s", "160", "-", "200", "million", "kar", "##bov", "##ane", "##ts", "a", "year", "(", "$", "800", "-", "$", "1", ",", "000", ")", "-", "-", "but", "many", "have", "not", "been", "paid", "in", "months", ",", "So", "##pr", "##un", "said", ".", "\"" ], "ids": [ 10117, 13551, 11365, 65065, 10107, 13849, 118, 10777, 12473, 25085, 96970, 12822, 10806, 169, 10924, 113, 109, 11900, 118, 109, 122, 117, 10259, 114, 118, 118, 10473, 11299, 10529, 10472, 10590, 25938, 10106, 15555, 117, 12882, 52302, 11107, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "People", "are", "working", "out", "of", "their", "own", "dedicat", "##ion", ".", "\"" ], "ids": [ 14235, 10301, 14616, 10950, 10108, 10455, 12542, 98718, 11046, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bo", "##rs", "##uk", "said", "the", "farm", "sector", "has", "two", "options", ":", "\"", "We", "can", "sit", "down", "and", "c", "##ry", ",", "or", "we", "can", "do", "something", ".", "\"" ], "ids": [ 27622, 10943, 13013, 12415, 10105, 30568, 17417, 10393, 10551, 53121, 131, 107, 12865, 10944, 19285, 12935, 10111, 171, 10908, 117, 10345, 11951, 10944, 10149, 26133, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "government", "plans", "to", "increase", "the", "so", "##wing", "of", "the", "winter", "wheat", "which", "will", "be", "har", "##vested", "next", "year", "." ], "ids": [ 10357, 12415, 10105, 12047, 18195, 10114, 20299, 10105, 10380, 25649, 10108, 10105, 25977, 109653, 10319, 11337, 10347, 10453, 83099, 13451, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Plant", "##ed", "in", "late", "summer", "and", "early", "autumn", ",", "the", "grain", "is", "Ukraine", "'", "s", "largest", "export", "item", "and", "traditionally", "grows", "better", "than", "summer", "wheat", "in", "Ukraine", "'", "s", "soil", "." ], "ids": [ 15112, 10336, 10106, 13002, 17995, 10111, 11732, 82240, 117, 10105, 69132, 10124, 19883, 112, 187, 15363, 59220, 48438, 10111, 58217, 60394, 18322, 11084, 17995, 109653, 10106, 19883, 112, 187, 41080, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Further", "plans", ",", "he", "said", ",", "called", "for", "full", "provision", "of", "resources", "like", "fer", "##tili", "##ser", "and", "herb", "##ici", "##des", "for", "25", "percent", "of", "Ukraine", "'", "s", "arab", "##le", "land", "next", "year", ",", "for", "50", "percent", "in", "1998", "and", "100", "percent", "of", "the", "land", "in", "1999", "." ], "ids": [ 43248, 18195, 117, 10261, 12415, 117, 11552, 10142, 13375, 76386, 10108, 25744, 11850, 13658, 47372, 12754, 10111, 108016, 13439, 10920, 10142, 10258, 22362, 10108, 19883, 112, 187, 45131, 10284, 11773, 13451, 10924, 117, 10142, 10462, 22362, 10106, 10363, 10111, 10407, 22362, 10108, 10105, 11773, 10106, 10324, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "we", "follow", "this", "we", "'", "ll", "be", "able", "to", "sell", "10", "million", "tonnes", "of", "grain", "by", "the", "year", "2000", ",", "\"", "Bo", "##rku", "##s", "said", "." ], "ids": [ 107, 14535, 11951, 28086, 10531, 11951, 112, 22469, 10347, 16197, 10114, 36300, 10150, 12473, 39435, 10108, 69132, 10155, 10105, 10924, 10180, 117, 107, 27622, 96315, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "The", "government", "has", "been", "trying", "to", "phase", "out", "huge", "sub", "##sid", "##ies", "to", "the", "farm", "sector", ",", "and", "in", "a", "move", "back", "to", "pre", "-", "Soviet", "days", "has", "given", "up", "to", "50", "hectares", "(", "124", "acres", ")", "of", "land", "to", "some", "36", ",", "000", "private", "farmers", "willing", "to", "go", "it", "alone", "." ], "ids": [ 10117, 12047, 10393, 10590, 32862, 10114, 20394, 10950, 42126, 13987, 34396, 11624, 10114, 10105, 30568, 17417, 117, 10111, 10106, 169, 18577, 12014, 10114, 12229, 118, 15277, 13990, 10393, 13507, 10741, 10114, 10462, 33130, 113, 17944, 26043, 114, 10108, 11773, 10114, 11152, 11055, 117, 10259, 14591, 55543, 87615, 10114, 11783, 10271, 24087, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Collective", "farms", "will", "last", "for", "the", "next", "few", "years", ",", "because", "most", "private", "farms", "now", "only", "produce", "enough", "to", "feed", "themselves", "with", "may", "##be", "a", "little", "extra", "to", "sell", ",", "said", "one", "private", "farmer", ":", "\"", "In", "the", "future", ",", "may", "##be", ",", "but", "it", "'", "s", "better", "not", "to", "hur", "##ry", "." ], "ids": [ 102928, 83951, 11337, 12469, 10142, 10105, 13451, 13824, 10855, 117, 12373, 10992, 14591, 83951, 11858, 10893, 17368, 21408, 10114, 44988, 20182, 10169, 11387, 11044, 169, 16745, 19868, 10114, 36300, 117, 12415, 10464, 14591, 83540, 131, 107, 10167, 10105, 16711, 117, 11387, 11044, 117, 10473, 10271, 112, 187, 18322, 10472, 10114, 52824, 10908, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Colle", "##cti", "##visa", "##tion", "brought", "us", "a", "lot", "of", "pain", "." ], "ids": [ 107, 97461, 76344, 48367, 10822, 17327, 19626, 169, 19826, 10108, 38576, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "it", "went", "too", "fast", "." ], "ids": [ 12689, 10271, 13446, 16683, 15040, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pri", "##vati", "##sing", "too", "quickly", "can", "also", "have", "a", "negative", "outcome", ".", "\"" ], "ids": [ 30797, 27691, 16357, 16683, 23590, 10944, 10379, 10529, 169, 25785, 89097, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gen", "##cor", "s", "##well", "##s", "profit", "despite", "set", "##backs", "." ], "ids": [ 32560, 49167, 187, 15862, 10107, 25081, 22087, 11847, 68694, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Melanie", "Che", "##ary" ], "ids": [ 59970, 44131, 14926 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "26" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gen", "##cor", "Ltd", "on", "Monday", "said", "it", "had", "s", "##well", "##ed", "its", "year", "att", "##rib", "##uta", "##ble", "profit", "and", "stream", "##lined", "operations", "to", "strength", "##en", "it", "for", "the", "current", "financial", "year", "despite", "a", "variety", "of", "division", "##al", "set", "##backs", "." ], "ids": [ 32560, 49167, 15129, 10135, 40714, 12415, 10271, 10374, 187, 15862, 10336, 10474, 10924, 10788, 47116, 14118, 11203, 25081, 10111, 41878, 75066, 18356, 10114, 33318, 10136, 10271, 10142, 10105, 14978, 20570, 10924, 22087, 169, 20311, 10108, 13751, 10415, 11847, 68694, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anno", "##un", "##cing", "the", "group", "'", "s", "results", "for", "the", "year", "ended", "June", "30", ",", "chairman", "Brian", "Gilbert", "##son", "said", ":", "\"", "Ha", "##ppi", "##ly", "the", "strong", "improvement", "in", "financial", "performance", "is", "not", "an", "ill", "##usion", "ari", "##sing", "from", "the", "recent", "weak", "##ness", "of", "the", "rand", "relative", "to", "the", "dollar", ".", "\"" ], "ids": [ 26473, 11107, 19113, 10105, 11795, 112, 187, 17466, 10142, 10105, 10924, 18428, 11120, 10244, 117, 27627, 13977, 18608, 11599, 12415, 131, 107, 13740, 36651, 10454, 10105, 18093, 70010, 10106, 20570, 14432, 10124, 10472, 10151, 32941, 41942, 57173, 16357, 10188, 10105, 19037, 61285, 14010, 10108, 10105, 89823, 25315, 10114, 10105, 34807, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gen", "##cor", "raised", "att", "##rib", "##uta", "##ble", "earning", "##s", "to", "1", ",", "803", "million", "rand", "from", "1", ",", "003", "million", "rand", "previously", "-", "in", "dollar", "terms", "an", "increase", "to", "$", "469", "million", "from", "$", "279", "million", "-", "and", "won", "despite", "the", "group", "'", "s", "Im", "##pala", "Platinum", "Holdings", "Ltd", "posti", "##ng", "dis", "##mal", "results", "." ], "ids": [ 32560, 49167, 20526, 10788, 47116, 14118, 11203, 56981, 10107, 10114, 122, 117, 77215, 12473, 89823, 10188, 122, 117, 26861, 12473, 89823, 17477, 118, 10106, 34807, 18873, 10151, 20299, 10114, 109, 39731, 12473, 10188, 109, 30463, 12473, 118, 10111, 11367, 22087, 10105, 11795, 112, 187, 10796, 70272, 57478, 57727, 15129, 45020, 10376, 27920, 16120, 17466, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Not", "everything", "has", "gone", "well", "." ], "ids": [ 107, 16040, 42536, 10393, 45041, 11206, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "ve", "had", "substantial", "production", "difficulties", "at", "a", "number", "of", "our", "operations", "." ], "ids": [ 12865, 112, 10323, 10374, 50608, 12116, 64557, 10160, 169, 11487, 10108, 17446, 18356, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "most", "obvious", "one", "with", "the", "greatest", "effect", "on", "the", "corporation", "was", "at", "Im", "##pala", "where", "we", "had", "the", "fur", "##nac", "##e", "failure", ",", "\"", "Gilbert", "##son", "said", "." ], "ids": [ 10117, 10992, 94452, 10464, 10169, 10105, 31434, 18514, 10135, 10105, 73063, 10134, 10160, 10796, 70272, 10940, 11951, 10374, 10105, 61001, 61804, 10112, 31562, 117, 107, 18608, 11599, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Im", "##plats", "posted", "year", "att", "##rib", "##uta", "##ble", "profit", "of", "176", "million", "rand", "from", "281", "million", "previously", "." ], "ids": [ 10796, 59702, 51232, 10924, 10788, 47116, 14118, 11203, 25081, 10108, 21613, 12473, 89823, 10188, 29215, 12473, 17477, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Not", "only", "did", "the", "company", "lock", "in", "3", ".", "92", "rand", "per", "dollar", "in", "February", "/", "March", ",", "but", "it", "suffered", "output", "losses", "due", "to", "a", "fur", "##nac", "##e", "shut", "##down", "last", "August", "." ], "ids": [ 16040, 10893, 12172, 10105, 12100, 79601, 10106, 124, 119, 12458, 89823, 10178, 34807, 10106, 11508, 120, 11144, 117, 10473, 10271, 26090, 37131, 45353, 10850, 10114, 169, 61001, 61804, 10112, 70323, 27160, 12469, 10735, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rand", "was", "last", "bid", "at", "4", ".", "535", "##0", "against", "the", "dollar", "." ], "ids": [ 10117, 89823, 10134, 12469, 50385, 10160, 125, 119, 45269, 10929, 11327, 10105, 34807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nor", "was", "Im", "##plats", "the", "only", "operation", "to", "fail", "output", "targets", "." ], "ids": [ 98837, 10134, 10796, 59702, 10105, 10893, 20080, 10114, 84891, 37131, 56996, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ing", "##we", "Coal", "Corporation", "Ltd", "was", "hit", "hard", "by", "heavy", "rain", "##s", "." ], "ids": [ 29263, 12577, 82587, 14456, 15129, 10134, 14946, 19118, 10155, 18296, 50939, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "for", "##fe", "##ited", "nearly", "one", "million", "tonnes", "of", "production", "to", "flooding", "at", "its", "mines", "in", "M", "##pu", "##mula", "##nga", "province", "." ], "ids": [ 10377, 10142, 14601, 77815, 21377, 10464, 12473, 39435, 10108, 12116, 10114, 91565, 10160, 10474, 33601, 10106, 150, 17490, 73949, 18161, 14342, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "But", "Gilbert", "##son", "said", "the", "greatest", "g", "##lo", "##om", "in", "the", "year", "came", "from", "the", "European", "Commission", "'", "s", "block", "##ing", "of", "Im", "##plats", "'", "proposed", "merger", "with", "Lo", "##n", "##r", "##ho", "Pl", "##c", "'", "s", "platinum", "interests", "." ], "ids": [ 16976, 18608, 11599, 12415, 10105, 31434, 175, 10715, 10692, 10106, 10105, 10924, 13383, 10188, 10105, 11914, 14941, 112, 187, 27242, 10230, 10108, 10796, 59702, 112, 21622, 53860, 10169, 13069, 10115, 10129, 10758, 48932, 10350, 112, 187, 91978, 36026, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "big", "disa", "##ppo", "##int", "##ment", "for", "the", "year", "was", "the", "failure", "of", "the", "platinum", "merger", "." ], "ids": [ 107, 10117, 22185, 36474, 45565, 16261, 10426, 10142, 10105, 10924, 10134, 10105, 31562, 10108, 10105, 91978, 53860, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "From", "Gen", "##cor", "'", "s", "perspective", "we", "are", "taking", "the", "position", "that", "it", "is", "not", "on", ",", "\"", "Gilbert", "##son", "said", "." ], "ids": [ 12222, 32560, 49167, 112, 187, 39836, 11951, 10301, 18084, 10105, 12956, 10189, 10271, 10124, 10472, 10135, 117, 107, 18608, 11599, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Looking", "ahead", "to", "the", "current", "financial", "year", ",", "he", "said", "that", "Gen", "##cor", "would", "bo", "##ost", "earning", "##s", "further", "." ], "ids": [ 57451, 35629, 10114, 10105, 14978, 20570, 10924, 117, 10261, 12415, 10189, 32560, 49167, 10894, 20506, 18239, 56981, 10107, 14586, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Gen", "##cor", "is", "well", "placed", "to", "take", "up", "the", "challenges", "of", "the", "future", "." ], "ids": [ 107, 32560, 49167, 10124, 11206, 16906, 10114, 13574, 10741, 10105, 60378, 10108, 10105, 16711, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "group", "is", "sound", "##ly", "structure", "##d", "and", "pr", "##uden", "##tly", "finance", "##d", "and", "is", "ble", "##ssed", "with", "an", "excellent", "portfolio", "of", "world", "-", "class", "businesses", "." ], "ids": [ 10117, 11795, 10124, 19302, 10454, 13926, 10162, 10111, 20157, 23280, 69253, 48053, 10162, 10111, 10124, 10718, 50987, 10169, 10151, 50337, 101816, 10108, 11356, 118, 13596, 37766, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "think", "we", "can", "look", "forward", "to", "further", "growth", "\"", "." ], "ids": [ 146, 27874, 11951, 10944, 25157, 23307, 10114, 14586, 14609, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ci", "##ting", "the", "dis", "##posal", "of", "Gen", "##cor", "'", "s", "stake", "in", "industrial", "holding", "##s", "group", "Mal", "##bak", "Ltd", "for", "one", "billion", "rand", "among", "other", "smaller", "dis", "##posal", "##s", ",", "Gilbert", "##son", "said", "Gen", "##cor", "had", "pr", "##une", "##d", "its", "portfolio", "to", "con", "##centra", "##te", "on", "core", "assets", "." ], "ids": [ 51457, 12141, 10105, 27920, 101177, 10108, 32560, 49167, 112, 187, 90081, 10106, 18138, 29008, 10107, 11795, 18076, 41519, 15129, 10142, 10464, 25848, 89823, 13328, 10684, 23309, 27920, 101177, 10107, 117, 18608, 11599, 12415, 32560, 49167, 10374, 20157, 19659, 10162, 10474, 101816, 10114, 10173, 97368, 10216, 10135, 27362, 51701, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "'", "ve", "tried", "to", "clean", "up", "our", "overall", "portfolio", "by", "dis", "##posing", "of", "non", "-", "core", "assets", "." ], "ids": [ 107, 12865, 112, 10323, 27156, 10114, 55911, 10741, 17446, 20947, 101816, 10155, 27920, 66735, 10108, 10446, 118, 27362, 51701, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "biggest", "of", "those", "was", "Mal", "##bak", "." ], "ids": [ 10117, 36304, 10108, 12676, 10134, 18076, 41519, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Overall", "a", "very", "substantial", "pr", "##uni", "##ng", ".", ".", "." ], "ids": [ 58877, 169, 12558, 50608, 20157, 23124, 10376, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "leaving", "Gen", "##cor", "clearly", "structure", "##d", "along", "com", "##mo", "##dity", "lines", ",", "\"", "Gilbert", "##son", "said", "." ], "ids": [ 21005, 32560, 49167, 52340, 13926, 10162, 12400, 10212, 11033, 100060, 19515, 117, 107, 18608, 11599, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "He", "added", "that", "the", "group", "still", "had", "about", "85", "million", "rand", "after", "tax", "in", "##vested", "in", "various", "shares", ",", "which", "were", "market", "for", "dis", "##posal", "when", "required", "." ], "ids": [ 10357, 16288, 10189, 10105, 11795, 12647, 10374, 10978, 12017, 12473, 89823, 10662, 25468, 10106, 83099, 10106, 13547, 45751, 117, 10319, 10309, 17313, 10142, 27920, 101177, 10841, 17468, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Re", "##fer", "##ring", "to", "Gen", "##cor", "'", "s", "increased", "41", ".", "5", "percent", "stake", "in", "Ing", "##we", ",", "Gilbert", "##son", "said", "the", "group", "would", "wait", "for", "coal", "shares", "to", "be", "che", "##aper", "before", "considering", "sna", "##pping", "up", "more", "." ], "ids": [ 20304, 14854, 13135, 10114, 32560, 49167, 112, 187, 19299, 11349, 119, 126, 22362, 90081, 10106, 29263, 12577, 117, 18608, 11599, 12415, 10105, 11795, 10894, 83279, 10142, 39145, 45751, 10114, 10347, 10262, 59445, 11360, 81243, 62541, 53570, 10741, 10798, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "think", "we", "would", "have", "like", "##d", "to", "have", "more", "of", "Ing", "##we", "but", "it", "'", "s", "the", "question", "of", "adding", "value", "." ], "ids": [ 107, 146, 27874, 11951, 10894, 10529, 11850, 10162, 10114, 10529, 10798, 10108, 29263, 12577, 10473, 10271, 112, 187, 10105, 20210, 10108, 44841, 19211, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "we", "bought", "the", "shares", "we", "bought", ".", ".", "." ], "ids": [ 12242, 11951, 28870, 10105, 45751, 11951, 28870, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "at", "quite", "a", "bit", "lower", "than", "the", "price", "is", "now", ".", ".", "." ], "ids": [ 10160, 31324, 169, 17684, 18165, 11084, 10105, 30839, 10124, 11858, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "may", "##be", "if", "we", "just", "wait", "another", "few", "years", "for", "the", "next", "down", "##tur", "##n", "in", "coal", ".", "\"" ], "ids": [ 11387, 11044, 12277, 11951, 12820, 83279, 12864, 13824, 10855, 10142, 10105, 13451, 12935, 15698, 10115, 10106, 39145, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finally", ",", "Gilbert", "##son", "said", "a", "growing", "proportion", "of", "Gen", "##cor", "'", "s", "income", "was", "coming", "from", "offshore", "and", "un", "##liste", "##d", "investment", "##s", "." ], "ids": [ 51857, 117, 18608, 11599, 12415, 169, 25566, 66410, 10108, 32560, 49167, 112, 187, 18245, 10134, 23959, 10188, 99806, 10111, 10119, 26719, 10162, 37933, 10107, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Johannesburg", "news", "##room", "+", "27", "11", "482", "-", "100", "##3" ], "ids": [ 118, 118, 42392, 14424, 25525, 116, 10365, 10193, 46810, 118, 10407, 10884 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Advanced", "Medical", "buy", "##ing", "IV", "##AC", "Medical", "." ], "ids": [ 26745, 18363, 47715, 10230, 11094, 30340, 18363, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Advanced", "Medical", "Inc", ".", "said", "Monday", "it", "will", "buy", "IV", "##AC", "Medical", "Systems", "Inc", ".", ",", "a", "former", "Eli", "Lilly", "&", "Co", "." ], "ids": [ 26745, 18363, 13604, 119, 12415, 40714, 10271, 11337, 47715, 11094, 30340, 18363, 18953, 13604, 119, 117, 169, 11775, 51243, 83861, 111, 13098, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "unit", ",", "for", "about", "$", "400", "million", "in", "cash", ",", "creating", "one", "of", "the", "world", "'", "s", "largest", "makers", "of", "intra", "##veno", "##us", "in", "##fus", "##ion", "therapy", "products", "." ], "ids": [ 16511, 117, 10142, 10978, 109, 11176, 12473, 10106, 52828, 117, 29132, 10464, 10108, 10105, 11356, 112, 187, 15363, 104213, 10108, 69617, 59226, 10251, 10106, 55729, 11046, 49619, 20895, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Under", "the", "agreement", ",", "IV", "##AC", "and", "Advanced", "Medical", "'", "s", "who", "##lly", "owned", "subsidiary", ",", "IM", "##ED", "Corp", ".", ",", "will", "merge", "to", "form", "a", "new", "company", "that", "will", "develop", "and", "manufacture", "in", "##fus", "##ion", "pump", "##s", "that", "re", "##gula", "##te", "the", "amount", "of", "intra", "##veno", "##us", "fluid", "being", "administered", "to", "a", "patient", ",", "as", "well", "as", "proprie", "##tary", "dis", "##posa", "##ble", "products", "." ], "ids": [ 12594, 10105, 25432, 117, 11094, 30340, 10111, 26745, 18363, 112, 187, 10479, 17903, 17012, 53898, 117, 97126, 33809, 44687, 119, 117, 11337, 104564, 10114, 12188, 169, 10751, 12100, 10189, 11337, 26800, 10111, 72022, 10106, 55729, 11046, 106392, 10107, 10189, 11639, 56901, 10216, 10105, 24074, 10108, 69617, 59226, 10251, 59848, 11223, 68491, 10114, 169, 38607, 117, 10146, 11206, 10146, 47212, 65597, 27920, 40268, 11203, 20895, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "combined", "company", "will", "have", "estimated", "revenue", "##s", "of", "$", "353", "million", "." ], "ids": [ 10117, 25302, 12100, 11337, 10529, 25267, 51557, 10107, 10108, 109, 35373, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Advanced", "Medical", ",", "through", "IM", "##ED", ",", "is", "already", "one", "of", "the", "nation", "'", "s", "largest", "developers", "and", "manufacturers", "of", "intra", "##veno", "##us", "in", "##fus", "##ion", "pump", "##s", "and", "proprie", "##tary", "dis", "##posa", "##ble", "products", "." ], "ids": [ 26745, 18363, 117, 11222, 97126, 33809, 117, 10124, 19034, 10464, 10108, 10105, 22274, 112, 187, 15363, 87346, 10111, 77256, 10108, 69617, 59226, 10251, 10106, 55729, 11046, 106392, 10107, 10111, 47212, 65597, 27920, 40268, 11203, 20895, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "has", "sales", "in", "38", "foreign", "countries", "." ], "ids": [ 10377, 10393, 23857, 10106, 11171, 20796, 15911, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "San", "Diego", "-", "based", "IV", "##AC", "is", "a", "major", "provider", "of", "in", "##fus", "##ion", "systems", "and", "related", "technologies", "to", "the", "health", "-", "care", "industry", "." ], "ids": [ 10469, 14665, 118, 11610, 11094, 30340, 10124, 169, 11922, 94439, 10108, 10106, 55729, 11046, 16768, 10111, 16382, 43214, 10114, 10105, 17004, 118, 11131, 17425, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "has", "manufacturing", "plants", "in", "San", "Diego", ";", "Creed", "##moor", ",", "N", ".", "C", ".", ";", "Hampshire", ",", "England", ";", "and", "Ti", "##juana", ",", "Mexico", ",", "and", "dis", "##tri", "##but", "##es", "its", "pro", "##d", "##cut", "##s", "in", "more", "than", "120", "countries", "." ], "ids": [ 10377, 10393, 43615, 21422, 10106, 10469, 14665, 132, 69526, 81031, 117, 151, 119, 140, 119, 132, 26036, 117, 11701, 132, 10111, 29033, 69454, 117, 10490, 117, 10111, 27920, 21570, 23170, 10171, 10474, 11284, 10162, 29738, 10107, 10106, 10798, 11084, 12048, 15911, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 1, 5, 5, 5, 9, 1, 9, 1, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eli", "Lilly", "sold", "IV", "##AC", "on", "Dec", ".", "31", ",", "1994", "to", "DL", "##J", "Merchant", "Bank", "##ing", "Partners", "LP", ",", "River", "Medical", "Inc", ".", "and", "other", "investors", "." ], "ids": [ 51243, 83861, 15337, 11094, 30340, 10135, 46147, 119, 10413, 117, 10444, 10114, 27956, 15417, 91101, 13533, 10230, 51257, 17521, 117, 11575, 18363, 13604, 119, 10111, 10684, 83795, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Advanced", "Medical", "said", "it", "ex", "##pects", "to", "take", "an", "uns", "##pec", "##ified", "one", "-", "time", "charge", "to", "pay", "for", "the", "merger", "." ], "ids": [ 26745, 18363, 12415, 10271, 11419, 92385, 10114, 13574, 10151, 15826, 53625, 31825, 10464, 118, 10635, 18163, 10114, 16868, 10142, 10105, 53860, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "did", "not", "say", "when", "the", "charge", "would", "be", "taken", "." ], "ids": [ 10377, 12172, 10472, 23763, 10841, 10105, 18163, 10894, 10347, 15109, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "addition", "of", "IV", "##AC", "is", "expected", "to", "contribute", "to", "financial", "results", "in", "the", "full", "second", "quarter", "of", "1997", ",", "\"", "the", "companies", "said", "." ], "ids": [ 107, 10117, 14763, 10108, 11094, 30340, 10124, 25973, 10114, 72484, 10114, 20570, 17466, 10106, 10105, 13375, 11132, 28330, 10108, 10391, 117, 107, 10105, 18866, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "merger", "will", "add", "to", "both", "companies", "'", "historical", "leadership", "in", "in", "##fus", "##ion", "therapy", "and", "technology", "-", "based", "drug", "delivery", "devices", ",", "they", "said", "." ], "ids": [ 10117, 53860, 11337, 42852, 10114, 11408, 18866, 112, 19871, 25121, 10106, 10106, 55729, 11046, 49619, 10111, 19765, 118, 11610, 20998, 55626, 38120, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "1968", ",", "IV", "##AC", "introduced", "the", "world", "'", "s", "first", "in", "##fus", "##ion", "therapy", "monitoring", "device", "." ], "ids": [ 10167, 10698, 117, 11094, 30340, 17037, 10105, 11356, 112, 187, 10422, 10106, 55729, 11046, 49619, 74265, 33091, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "year", "later", "IV", "##AC", "improved", "its", "system", "with", "the", "addition", "of", "an", "IV", "pump", "that", "regulated", "the", "flow", "of", "liquid", "##s", "through", "positive", "pressure", "." ], "ids": [ 138, 10924, 10873, 11094, 30340, 34605, 10474, 11787, 10169, 10105, 14763, 10108, 10151, 11094, 106392, 10189, 106125, 10105, 30676, 10108, 58538, 10107, 11222, 19737, 23460, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IM", "##ED", "introduced", "the", "world", "'", "s", "first", "volume", "##tric", "in", "##fus", "##ion", "pump", "in", "1974", "." ], "ids": [ 97126, 33809, 17037, 10105, 11356, 112, 187, 10422, 15901, 45463, 10106, 55729, 11046, 106392, 10106, 10723, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IM", "##ED", "had", "profits", "of", "$", "1", ".", "7", "million", ",", "or", "6", "cents", "per", "fully", "dil", "##uted", "common", "share", ",", "on", "$", "53", ".", "9", "million", "in", "revenue", "##s", "in", "the", "first", "half", "of", "1996", "." ], "ids": [ 97126, 33809, 10374, 100106, 10108, 109, 122, 119, 128, 12473, 117, 10345, 127, 63487, 10178, 27217, 36031, 106554, 14624, 23867, 117, 10135, 109, 11756, 119, 130, 12473, 10106, 51557, 10107, 10106, 10105, 10422, 13877, 10108, 10389, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##clu", "##ding", "the", "effect", "of", "a", "one", "-", "time", "rest", "##ru", "##ct", "##uring", "charge", "of", "$", "17", ".", "4", "million", ",", "IV", "##AC", "had", "net", "income", "of", "$", "4", ".", "2", "million", "on", "net", "sales", "of", "$", "112", ".", "8", "million", "for", "the", "1996", "first", "half", "." ], "ids": [ 27746, 78225, 13971, 10105, 18514, 10108, 169, 10464, 118, 10635, 17333, 11680, 14526, 31653, 18163, 10108, 109, 10273, 119, 125, 12473, 117, 11094, 30340, 10374, 11988, 18245, 10108, 109, 125, 119, 123, 12473, 10135, 11988, 23857, 10108, 109, 16129, 119, 129, 12473, 10142, 10105, 10389, 10422, 13877, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Advanced", "Medical", "reported", "profits", "of", "$", "8", ".", "4", "million", "on", "sales", "of", "$", "29", ".", "2", "million", "in", "the", "quarter", "ended", "June", "30", "." ], "ids": [ 26745, 18363, 15943, 100106, 10108, 109, 129, 119, 125, 12473, 10135, 23857, 10108, 109, 10386, 119, 123, 12473, 10106, 10105, 28330, 18428, 11120, 10244, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "William", "J", ".", "Mercer", ",", "IV", "##AC", "president", "and", "chief", "executive", "officer", ",", "will", "become", "the", "president", "and", "CEO", "of", "Advanced", "Medical", "." ], "ids": [ 10694, 147, 119, 65470, 117, 11094, 30340, 12931, 10111, 19421, 22676, 19288, 117, 11337, 13461, 10105, 12931, 10111, 24556, 10108, 26745, 18363, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "He", "led", "the", "transition", "of", "IV", "##AC", "to", "a", "privately", "held", "company", "and", "was", "previously", "senior", "vice", "president", "at", "Mall", "##inck", "##rod", "##t", "Group", "Inc", "." ], "ids": [ 10357, 12857, 10105, 35959, 10108, 11094, 30340, 10114, 169, 81411, 11991, 12100, 10111, 10134, 17477, 17843, 16543, 12931, 10160, 48719, 106344, 46114, 10123, 12054, 13604, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Joseph", "Kuhn", ",", "Advanced", "Medical", "and", "IM", "##ED", "president", ",", "will", "become", "the", "new", "company", "'", "s", "executive", "vice", "president", "and", "chief", "financial", "officer", "." ], "ids": [ 11379, 82567, 117, 26745, 18363, 10111, 97126, 33809, 12931, 117, 11337, 13461, 10105, 10751, 12100, 112, 187, 22676, 16543, 12931, 10111, 19421, 20570, 19288, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "deal", "is", "expected", "to", "close", "by", "the", "first", "quarter", "of", "1997", ",", "subject", "to", "regulatory", "approval", "." ], "ids": [ 10117, 19918, 10124, 25973, 10114, 16065, 10155, 10105, 10422, 28330, 10108, 10391, 117, 20036, 10114, 102026, 48531, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "has", "already", "been", "approved", "by", "both", "companies", "'", "boards", "." ], "ids": [ 10377, 10393, 19034, 10590, 29855, 10155, 11408, 18866, 112, 74419, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dow", "rises", "on", "Philip", "Morris", ",", "other", "stock", "##s", "lower", "." ], "ids": [ 106035, 91144, 10135, 13324, 17161, 117, 10684, 20511, 10107, 18165, 119 ], "entity": [ "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "26" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Dow", "Jones", "industrial", "average", "opened", "slightly", "higher", "on", "Monday", ",", "bo", "##oste", "##d", "by", "Philip", "Morris", ",", "which", "gained", "four", "to", "92", "." ], "ids": [ 10117, 106035, 12298, 18138, 13551, 14377, 31603, 17981, 10135, 40714, 117, 20506, 45722, 10162, 10155, 13324, 17161, 117, 10319, 25222, 11598, 10114, 12458, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Other", "shares", "were", "slightly", "lower", ",", "mirror", "##ing", "bonds", "." ], "ids": [ 14490, 45751, 10309, 31603, 18165, 117, 96881, 10230, 93163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Dow", "was", "up", "eight", "to", "5", ",", "731", ",", "while", "the", "NA", "##SD", "##A", "##Q", "Index", "was", "off", "fraction", "##ally", "to", "1", ",", "143", "and", "the", "S", "&", "P", "Index", "down", "one", "to", "666", "." ], "ids": [ 10117, 106035, 10134, 10741, 16222, 10114, 126, 117, 62353, 117, 11371, 10105, 56586, 83452, 10738, 19282, 12135, 10134, 11898, 107433, 19777, 10114, 122, 117, 19510, 10111, 10105, 156, 111, 153, 12135, 12935, 10464, 10114, 38593, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "York", "Stock", "Exchange", "advances", "lag", "##ged", "decline", "##s", "by", "476", "/", "698", "while", "NA", "##SD", "##A", "##Q", "advances", "led", "decline", "##s", "837", "/", "763", "." ], "ids": [ 10287, 10482, 31916, 32424, 105689, 14587, 18832, 46695, 10107, 10155, 36019, 120, 69429, 11371, 56586, 83452, 10738, 19282, 105689, 12857, 46695, 10107, 82750, 120, 68492, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "30", "-", "year", "U", ".", "S", ".", "Treasury", "bond", "was", "off", "2", "/", "32", "to", "yield", "6", ".", "96", "percent", "." ], "ids": [ 10117, 10244, 118, 10924, 158, 119, 156, 119, 77201, 55185, 10134, 11898, 123, 120, 10842, 10114, 95757, 127, 119, 12308, 22362, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "LE", "##AG", "##UE", "-", "ST", "H", "##EL", "##EN", "##S", "CL", "##IN", "##CH", "SU", "##PER", "LE", "##AG", "##UE", "T", "##IT", "##LE", "." ], "ids": [ 155, 12022, 32469, 14703, 84977, 109865, 62674, 118, 53317, 145, 68999, 50655, 10731, 75151, 27128, 86448, 86643, 108408, 84977, 109865, 62674, 157, 37611, 51036, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "H", "##EL", "##EN", "##S", ",", "England", "1996", "-", "08", "-", "26" ], "ids": [ 53317, 145, 68999, 50655, 10731, 117, 11701, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "completed", "their", "first", "league", "and", "Challenge", "Cup", "double", "in", "30", "years", "on", "Monday", "when", "they", "thrash", "##ed", "War", "##rington", "66", "-", "14", "to", "c", "##lin", "##ch", "the", "inaugural", "Super", "League", "title", "." ], "ids": [ 10838, 21338, 10107, 15782, 10455, 10422, 15616, 10111, 22193, 11544, 15790, 10106, 10244, 10855, 10135, 40714, 10841, 10689, 87897, 10336, 11277, 82194, 12215, 118, 10247, 10114, 171, 13020, 10269, 10105, 44138, 12786, 11074, 12887, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "secured", "the", "two", "points", "they", "needed", "in", "the", "last", "game", "of", "the", "season", "at", "Knows", "##ley", "Road", "to", "win", "their", "first", "championship", "since", "1975", "and", "their", "first", "double", "since", "1966", "." ], "ids": [ 10838, 21338, 10107, 57202, 10105, 10551, 12789, 10689, 23794, 10106, 10105, 12469, 11661, 10108, 10105, 11226, 10160, 105582, 12105, 12648, 10114, 14125, 10455, 10422, 20755, 11764, 10665, 10111, 10455, 10422, 15790, 11764, 10857, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "rain", "-", "soa", "##ked", "conditions", ",", "centre", "Alan", "Hunt", "##e", "gra", "##bbed", "a", "hat", "-", "trick", "of", "tries", ",", "while", "Tommy", "Marty", "##n", ",", "Anthony", "Sullivan", "and", "Paul", "New", "##love", "each", "scored", "two", "." ], "ids": [ 10167, 50939, 118, 56108, 30511, 17315, 117, 12672, 14309, 25414, 10112, 63706, 98091, 169, 11250, 118, 71662, 10108, 38106, 117, 11371, 20136, 47730, 10115, 117, 14751, 23476, 10111, 10772, 10287, 73477, 11948, 17233, 10551, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Captain", "and", "goal", "##ki", "##cker", "Bob", "##bie", "Gould", "##ing", "scored", "18", "points", "." ], "ids": [ 17448, 10111, 16586, 10506, 19153, 13583, 18545, 42037, 10230, 17233, 10218, 12789, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "'", "s", "tri", "##ump", "##h", "marked", "the", "end", "of", "Wigan", "'", "s", "seven", "-", "year", "reign", "as", "British", "champions", "." ], "ids": [ 10838, 21338, 10107, 112, 187, 15633, 67299, 10237, 26981, 10105, 11572, 10108, 85593, 112, 187, 15767, 118, 10924, 38587, 10146, 11160, 27745, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "needed", "to", "win", "on", "Monday", "to", "take", "the", "title", "-", "-", "a", "defeat", "or", "draw", "would", "have", "allowed", "Wigan", "their", "eighth", "consecutive", "championship", "." ], "ids": [ 10838, 21338, 10107, 23794, 10114, 14125, 10135, 40714, 10114, 13574, 10105, 12887, 118, 118, 169, 24800, 10345, 25974, 10894, 10529, 18162, 85593, 10455, 46758, 29864, 20755, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "were", "also", "the", "toa", "##st", "of", "London", "Broncos", ",", "who", "managed", "to", "s", "##cra", "##pe", "into", "the", "top", "four", "ahead", "of", "War", "##rington", "and", "qualify", "for", "the", "end", "-", "of", "-", "season", "play", "-", "offs", "." ], "ids": [ 11696, 10309, 10379, 10105, 64782, 10562, 10108, 10829, 87078, 117, 10479, 22391, 10114, 187, 40333, 11355, 10708, 10105, 12364, 11598, 35629, 10108, 11277, 82194, 10111, 55235, 10142, 10105, 11572, 118, 10108, 118, 11226, 12253, 118, 51851, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bradford", "finished", "third", "." ], "ids": [ 40141, 15972, 12628, 119 ], "entity": [ "B-ORG", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "have", "now", "set", "their", "sight", "##s", "on", "taking", "the", "tre", "##ble", "by", "winning", "the", "end", "-", "of", "-", "season", "premiers", "##hip", "which", "begins", "with", "next", "Sunday", "'", "s", "semifinal", "against", "London", "." ], "ids": [ 10838, 21338, 10107, 10529, 11858, 11847, 10455, 78327, 10107, 10135, 18084, 10105, 11617, 11203, 10155, 16542, 10105, 11572, 118, 10108, 118, 11226, 18682, 17883, 10319, 26462, 10169, 13451, 19731, 112, 187, 65085, 11327, 10829, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "RA", "##LL", "##Y", "##ING", "-", "1", ",", "000", "LA", "##K", "##ES", "RA", "##LL", "##Y", "RE", "##SU", "##L", "##T", "/", "WORLD", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 64007, 82834, 14703, 50183, 118, 122, 117, 10259, 29079, 11733, 25054, 64007, 82834, 14703, 71033, 88592, 11369, 11090, 120, 67376, 39774, 36535, 11127, 52980, 64091, 30331, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##Y", "##VA", "##S", "##K", "##L", "##Y", "##A", ",", "Finland", "1996", "-", "08", "-", "26" ], "ids": [ 147, 14703, 47172, 10731, 11733, 11369, 14703, 10738, 117, 15497, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "the", "1", ",", "000" ], "ids": [ 32070, 16203, 10108, 10105, 122, 117, 10259 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6 ] }, { "tokens": [ "Lakes", "Rally", "which", "ended", "on", "Monday", ":" ], "ids": [ 42052, 42161, 10319, 18428, 10135, 40714, 131 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Tom", "##mi", "Ma", "##kinen", "(", "Finland", ")", "Mitsubishi", "Lance", "##r", "4", "hours", "4", "minutes" ], "ids": [ 122, 119, 12275, 10500, 13744, 108088, 113, 15497, 114, 44296, 45013, 10129, 125, 19573, 125, 15304 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "13", "seconds" ], "ids": [ 10249, 34290 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "2", ".", "Juha", "Kan", "##kku", "##nen", "(", "Finland", ")", "Toyota", "Cel", "##ica", "46", "seconds", "behind" ], "ids": [ 123, 119, 99441, 57528, 70691, 11216, 113, 15497, 114, 28995, 82804, 11043, 11528, 34290, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Jar", "##mo", "Ky", "##tol", "##eht", "##o", "(", "Finland", ")", "Ford", "Es", "##cor", "##t", "2", ":", "37" ], "ids": [ 124, 119, 91531, 11033, 60082, 48530, 92533, 10133, 113, 15497, 114, 14255, 10912, 49167, 10123, 123, 131, 11204 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Marcus", "G", "##ron", "##holm", "(", "Finland", ")", "Toyota", "Cel", "##ica", "2", ":", "42" ], "ids": [ 125, 119, 15818, 144, 11620, 35673, 113, 15497, 114, 28995, 82804, 11043, 123, 131, 11276 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Kenneth", "Eriksson", "(", "Sweden", ")", "Subaru", "Im", "##pre", "##za", "3", ":", "22" ], "ids": [ 126, 119, 22369, 70145, 113, 20937, 114, 100668, 10796, 30619, 10637, 124, 131, 10306 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Thomas", "Rad", "##strom", "(", "Sweden", ")", "Toyota", "Cel", "##ica", "4", ".", "09" ], "ids": [ 127, 119, 11096, 71204, 83474, 113, 20937, 114, 28995, 82804, 11043, 125, 119, 11035 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Sebastian", "Lin", "##dh", "##ol", "##m", "(", "Finland", ")", "Ford", "Es", "##cor", "##t", "5", ":", "17" ], "ids": [ 128, 119, 19740, 35207, 20193, 11481, 10147, 113, 15497, 114, 14255, 10912, 49167, 10123, 126, 131, 10273 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Lasse", "Lam", "##pi", "(", "Finland", ")", "Mitsubishi", "Lance", "##r", "12", ":", "01" ], "ids": [ 129, 119, 77034, 44068, 12675, 113, 15497, 114, 44296, 45013, 10129, 10186, 131, 10669 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Rui", "Madeira", "(", "Portugal", ")", "Toyota", "Cel", "##ica", "16", ":", "34" ], "ids": [ 130, 119, 86230, 54367, 113, 12939, 114, 28995, 82804, 11043, 10250, 131, 11069 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Angelo", "Med", "##eg", "##hini", "(", "Italy", ")", "Subaru", "Im", "##pre", "##za", "18", ":", "28" ], "ids": [ 10150, 119, 22969, 16245, 13476, 89399, 113, 11619, 114, 100668, 10796, 30619, 10637, 10218, 131, 10348 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "RA", "##LL", "##Y", "##ING", "-", "MA", "##KI", "##NE", "##N", "ST", "##EP", "##S", "UP", "T", "##IT", "##LE", "B", "##ID", "W", "##IT", "##H", "LA", "##K", "##ES", "W", "##IN", "." ], "ids": [ 64007, 82834, 14703, 50183, 118, 27277, 59879, 93280, 11537, 53317, 59742, 10731, 53197, 157, 37611, 51036, 139, 28895, 160, 37611, 12396, 29079, 11733, 25054, 160, 27128, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "J", "##Y", "##VA", "##S", "##K", "##Y", "##LA", ",", "Finland", "1996", "-", "08", "-", "26" ], "ids": [ 147, 14703, 47172, 10731, 11733, 14703, 44376, 117, 15497, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tom", "##mi", "Ma", "##kinen", "took", "a", "significant", "step", "towards", "becoming", "world", "rally", "champion", "with", "a", "br", "##ill", "##iant", "victory", "in", "the", "1000", "Lakes", "Rally", "on", "Monday", "." ], "ids": [ 12275, 10500, 13744, 108088, 12149, 169, 17912, 31877, 18095, 19881, 11356, 58575, 17689, 10169, 169, 33989, 19503, 24096, 19735, 10106, 10105, 12186, 42052, 42161, 10135, 40714, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Mitsubishi", "driver", "Ma", "##kinen", "stopped", "experienced", "fellow", "Finn", "Juha", "Kan", "##kku", "##nen", "in", "his", "tracks", "on", "the", "final", "day", "of", "the", "1", ",", "452", "-", "km", "rally", ",", "do", "##ub", "##ling", "his", "lead", "on", "the", "first", "two", "de", "##cisive", "stages", "." ], "ids": [ 44296, 25926, 13744, 108088, 40949, 40727, 24619, 37051, 99441, 57528, 70691, 11216, 10106, 10226, 17965, 10135, 10105, 11070, 11940, 10108, 10105, 122, 117, 42167, 118, 10204, 58575, 117, 10149, 20664, 11945, 10226, 14107, 10135, 10105, 10422, 10551, 10104, 79533, 35023, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "was", "the", "most", "difficult", "win", "-", "three", "days", "at", "125", "percent", "effort", ",", "\"", "said", "Ma", "##kinen", ",", "whose", "success", "completed", "his", "1", ",", "000", "Lakes", "hat", "-", "trick", "." ], "ids": [ 107, 10747, 10134, 10105, 10992, 25232, 14125, 118, 11003, 13990, 10160, 14048, 22362, 24912, 117, 107, 12415, 13744, 108088, 117, 16879, 17001, 15782, 10226, 122, 117, 10259, 42052, 11250, 118, 71662, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Kan", "##kku", "##nen", "was", "runner", "-", "up", "in", "his", "Toyota", "as", "Finland", "'", "s", "Jar", "##mo", "Ky", "##tol", "##eht", "##o", "produced", "a", "remarkable", "drive", "to", "finish", "third", "in", "his", "Ford", "." ], "ids": [ 57528, 70691, 11216, 10134, 43037, 118, 10741, 10106, 10226, 28995, 10146, 15497, 112, 187, 91531, 11033, 60082, 48530, 92533, 10133, 13433, 169, 88916, 23806, 10114, 26282, 12628, 10106, 10226, 14255, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "S", "##wed", "##e", "Kenneth", "Eriksson", "kept", "Subaru", "in", "the", "hun", "##t", "for", "the", "manufacturers", "'", "title", "with", "fifth", "place", "in", "spite", "of", "a", "gear", "##box", "problem", "that", "nearly", "forced", "him", "off", "the", "road", "close", "to", "the", "end", "of", "the", "event", "." ], "ids": [ 156, 48854, 10112, 22369, 70145, 26546, 100668, 10106, 10105, 12041, 10123, 10142, 10105, 77256, 112, 12887, 10169, 22237, 11192, 10106, 102845, 10108, 169, 62559, 34078, 18077, 10189, 21377, 20054, 10957, 11898, 10105, 15485, 16065, 10114, 10105, 11572, 10108, 10105, 14416, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 4, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Maa", "##kinen", "'", "s", "and", "Mitsubishi", "'", "s", "positions", "were", "strength", "##ened", "by", "the", "late", "retirement", "of", "Spain", "'", "s", "Carlos", "Sai", "##nz", "when", "his", "Ford", "gear", "##box", "failed", "." ], "ids": [ 95057, 108088, 112, 187, 10111, 44296, 112, 187, 23188, 10309, 33318, 27867, 10155, 10105, 13002, 32185, 10108, 16149, 112, 187, 12050, 77710, 20259, 10841, 10226, 14255, 62559, 34078, 20775, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Ma", "##kinen", ",", "with", "95", "points", ",", "now", "leads", "his", "nearest", "championship", "rival", ",", "Sai", "##nz", ",", "by", "32", "points", "." ], "ids": [ 13744, 108088, 117, 10169, 11978, 12789, 117, 11858, 34868, 10226, 73536, 20755, 24792, 117, 77710, 20259, 117, 10155, 10842, 12789, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RA", "##LL", "##Y", "##ING", "-", "MA", "##KI", "##NE", "##N", "W", "##IN", "##S", "1", ",", "000", "LA", "##K", "##ES", "RA", "##LL", "##Y", "." ], "ids": [ 64007, 82834, 14703, 50183, 118, 27277, 59879, 93280, 11537, 160, 27128, 10731, 122, 117, 10259, 29079, 11733, 25054, 64007, 82834, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "J", "##Y", "##VA", "##S", "##K", "##Y", "##LA", ",", "Finland", "1996", "-", "08", "-", "26" ], "ids": [ 147, 14703, 47172, 10731, 11733, 14703, 44376, 117, 15497, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tom", "##mi", "Ma", "##kinen", "of", "Finland", ",", "driving", "a", "Mitsubishi", ",", "on", "Monday", "won", "the", "1", ",", "000", "Lakes", "Rally", ",", "sixth", "round", "of", "the", "world", "championship", "." ], "ids": [ 12275, 10500, 13744, 108088, 10108, 15497, 117, 37897, 169, 44296, 117, 10135, 40714, 11367, 10105, 122, 117, 10259, 42052, 42161, 117, 28913, 13569, 10108, 10105, 11356, 20755, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 3, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SH", "##AR", "##P", "##E", "H", "##IT", "##S", "W", "##IN", "##NE", "##R", "TO", "EA", "##SE", "PR", "##ESS", "##UR", "##E", "ON", "LE", "##ED", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 38702, 52188, 11127, 11259, 145, 37611, 10731, 160, 27128, 93280, 11273, 58573, 38478, 39039, 23837, 76505, 98348, 11259, 49339, 84977, 33809, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "LE", "##ED", "##S", ",", "England", "1996", "-", "08", "-", "26" ], "ids": [ 84977, 33809, 10731, 117, 11701, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wing", "##er", "Lee", "Sharpe", "hit", "a", "super", "##b", "strike", "from", "the", "edge", "of", "the", "penalty", "area", "to", "give", "Leeds", "their", "first", "win", "of", "the", "season", "on", "Monday", "and", "leave", "ha", "##ples", "##s", "Wimbledon", "anchor", "##ed", "at", "the", "bottom", "of", "the", "England", "premier", "league", "." ], "ids": [ 25613, 10165, 12006, 72920, 14946, 169, 25212, 10457, 37456, 10188, 10105, 30599, 10108, 10105, 40924, 11168, 10114, 18090, 28654, 10455, 10422, 14125, 10108, 10105, 11226, 10135, 40714, 10111, 21964, 10228, 90467, 10107, 37932, 72027, 10336, 10160, 10105, 34787, 10108, 10105, 11701, 11913, 15616, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Sharpe", "rep", "##aid", "a", "huge", "sl", "##ice", "of", "the", "4", ".", "5", "million", "pound", "(", "$", "6", ".", "98", "million", ")", "fee", "Leeds", "handed", "Manchester", "United", "for", "his", "services", "with", "a", "top", "-", "draw", "second", "-", "half", "goal", "to", "hand", "Wimbledon", "their", "third", "successive", "defeat", "." ], "ids": [ 72920, 76456, 39522, 169, 42126, 38523, 11918, 10108, 10105, 125, 119, 126, 12473, 99233, 113, 109, 127, 119, 12327, 12473, 114, 54524, 28654, 44040, 15349, 10609, 10142, 10226, 12639, 10169, 169, 12364, 118, 25974, 11132, 118, 13877, 16586, 10114, 15230, 37932, 10455, 12628, 47525, 24800, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ian", "Rush", ",", "the", "Welsh", "striker", "signed", "from", "Liverpool", "in", "the", "close", "season", ",", "set", "up", "the", "goal", ",", "feeding", "Sharpe", "as", "he", "gallo", "##ped", "forward", "and", "the", "former", "England", "wing", "##er", "cut", "inside", "onto", "his", "un", "##fa", "##vour", "##ed", "right", "foot", "to", "arc", "a", "shot", "into", "the", "right", "-", "hand", "corner", "of", "the", "net", "." ], "ids": [ 16582, 33436, 117, 10105, 27474, 103325, 14775, 10188, 18376, 10106, 10105, 16065, 11226, 117, 11847, 10741, 10105, 16586, 117, 87713, 72920, 10146, 10261, 64390, 16898, 23307, 10111, 10105, 11775, 11701, 22571, 10165, 21610, 22978, 31095, 10226, 10119, 13369, 92713, 10336, 13448, 24963, 10114, 27068, 169, 19508, 10708, 10105, 13448, 118, 15230, 33625, 10108, 10105, 11988, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "only", "goal", "of", "the", "match", "also", "brought", "some", "relief", "for", "under", "-", "fire", "Leeds", "manager", "Howard", "Wilkinson", "following", "the", "team", "'", "s", "poor", "start", "to", "the", "season", "." ], "ids": [ 10117, 10893, 16586, 10108, 10105, 12356, 10379, 17327, 11152, 31276, 10142, 10571, 118, 13559, 28654, 16935, 15084, 59558, 11901, 10105, 11121, 112, 187, 23247, 15148, 10114, 10105, 11226, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Home", "fans", "frequently", "bo", "##oed", "their", "own", "side", "until", "Sharpe", "turned", "the", "je", "##ers", "to", "che", "##ers", "." ], "ids": [ 13898, 20950, 28846, 20506, 70190, 10455, 12542, 12250, 11444, 72920, 21031, 10105, 10144, 10901, 10114, 10262, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "PR", "##EM", "##IE", "##R", "LE", "##AG", "##UE", "SU", "##MM", "##AR", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 23837, 67753, 71655, 11273, 84977, 109865, 62674, 86643, 93252, 52188, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "Monday", "'", "s", "English" ], "ids": [ 42027, 10108, 40714, 112, 187, 11616 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "premier", "league", "soccer", "match", ":" ], "ids": [ 11913, 15616, 41356, 12356, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leeds", "1", "(", "Sharpe", "58", "##th", "minute", ")", "Wimbledon", "0", "." ], "ids": [ 28654, 122, 113, 72920, 11824, 11143, 21760, 114, 37932, 121, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "0", "." ], "ids": [ 33100, 18086, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "25", ",", "860", "." ], "ids": [ 46080, 10258, 117, 46768, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "PR", "##EM", "##IE", "##R", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##T", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 23837, 67753, 71655, 11273, 84977, 109865, 62674, 71033, 88592, 11369, 11090, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "an", "English", "premier" ], "ids": [ 32070, 16203, 10108, 10151, 11616, 11913 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "league", "soccer", "match", "on", "Monday", ":" ], "ids": [ 15616, 41356, 12356, 10135, 40714, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leeds", "1", "Wimbledon", "0" ], "ids": [ 28654, 122, 37932, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", "Wednesday", "3", "3", "0", "0", "6", "2", "9" ], "ids": [ 31695, 57611, 124, 124, 121, 121, 127, 123, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chelsea", "3", "2", "1", "0", "3", "0", "7" ], "ids": [ 21450, 124, 123, 122, 121, 124, 121, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arsenal", "3", "2", "0", "1", "4", "2", "6" ], "ids": [ 25587, 124, 123, 121, 122, 125, 123, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aston", "Villa", "3", "2", "0", "1", "4", "2", "6" ], "ids": [ 40757, 13875, 124, 123, 121, 122, 125, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Manchester", "United", "3", "1", "2", "0", "7", "4", "5" ], "ids": [ 15349, 10609, 124, 122, 123, 121, 128, 125, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sunderland", "3", "1", "2", "0", "4", "1", "5" ], "ids": [ 60269, 124, 122, 123, 121, 125, 122, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Liverpool", "3", "1", "2", "0", "5", "3", "5" ], "ids": [ 18376, 124, 122, 123, 121, 126, 124, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Everton", "3", "1", "2", "0", "4", "2", "5" ], "ids": [ 57936, 124, 122, 123, 121, 125, 123, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tottenham", "3", "1", "2", "0", "3", "1", "5" ], "ids": [ 53092, 124, 122, 123, 121, 124, 122, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nottingham", "Forest", "3", "1", "1", "1", "5", "5", "4" ], "ids": [ 43396, 17666, 124, 122, 122, 122, 126, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leeds", "3", "1", "1", "1", "4", "5", "4" ], "ids": [ 28654, 124, 122, 122, 122, 125, 126, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "West", "Ham", "3", "1", "1", "1", "3", "4", "4" ], "ids": [ 11164, 39135, 124, 122, 122, 122, 124, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leicester", "3", "1", "1", "1", "2", "3", "4" ], "ids": [ 38789, 124, 122, 122, 122, 123, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Newcastle", "3", "1", "0", "2", "3", "4", "3" ], "ids": [ 28060, 124, 122, 121, 123, 124, 125, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Middlesbrough", "3", "0", "2", "1", "4", "5", "2" ], "ids": [ 105141, 124, 121, 123, 122, 125, 126, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Derby", "3", "0", "2", "1", "4", "6", "2" ], "ids": [ 24703, 124, 121, 123, 122, 125, 127, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Southampton", "3", "0", "1", "2", "2", "4", "1" ], "ids": [ 45113, 124, 121, 122, 123, 123, 125, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Blackburn", "3", "0", "1", "2", "2", "5", "1" ], "ids": [ 46006, 124, 121, 122, 123, 123, 126, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Coventry", "3", "0", "1", "2", "1", "6", "1" ], "ids": [ 58183, 124, 121, 122, 123, 122, 127, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wimbledon", "3", "0", "0", "3", "0", "6", "0" ], "ids": [ 37932, 124, 121, 121, 124, 121, 127, 121 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "PA", "##KI", "##ST", "##AN", "'", "S", "W", "##AS", "##IM", "AK", "##RA", "##M", "J", "##O", "##IN", "##S", "300", "CL", "##UB", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 32349, 59879, 32995, 41275, 112, 156, 160, 38025, 42031, 36723, 29990, 11517, 147, 11403, 27128, 10731, 11093, 75151, 82439, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Was", "##im", "Ak", "##ram", "'", "s", "three", "-", "wi", "##cket", "hau", "##l" ], "ids": [ 22034, 11759, 71275, 13845, 112, 187, 11003, 118, 23040, 28721, 20091, 10161 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", "Pakistan", "in", "England", "'", "s", "second", "innings", "at", "The", "Oval", "on", "Monday" ], "ids": [ 10142, 15437, 10106, 11701, 112, 187, 11132, 48974, 10160, 10117, 98765, 10135, 40714 ], "entity": [ "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 1, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "gave", "him", "his", "300", "##th", "test", "match", "wi", "##cket", "." ], "ids": [ 15362, 10957, 10226, 11093, 11143, 15839, 12356, 23040, 28721, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Was", "##im", "becomes", "the", "11th", "player", "to", "join", "the", "300", "-", "club", "of" ], "ids": [ 22034, 11759, 23785, 10105, 34062, 12928, 10114, 23707, 10105, 11093, 118, 11111, 10108 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "bowl", "##ers", "and", "the", "second", "Pakistani", ",", "after", "Im", "##ran", "Khan", ",", "to", "achieve" ], "ids": [ 99380, 10901, 10111, 10105, 11132, 66797, 117, 10662, 10796, 12111, 16324, 117, 10114, 43250 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "the", "feat", "." ], "ids": [ 10105, 17537, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Other", "cricketer", "##s", "who", "have", "taken", "over", "300", "Test", "wickets", ":" ], "ids": [ 14490, 77192, 10107, 10479, 10529, 15109, 10491, 11093, 22495, 83839, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kap", "##il", "Dev", "(", "India", ")", "434", "wickets", ",", "131", "Tests" ], "ids": [ 68634, 11030, 89586, 113, 11098, 114, 44726, 83839, 117, 18372, 96505 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Richard", "Had", "##lee", "(", "New", "Zealand", ")", "431", ",", "86" ], "ids": [ 11118, 66434, 30188, 113, 10287, 14451, 114, 36191, 117, 12224 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Ian", "Both", "##am", "(", "England", ")", "383", ",", "102" ], "ids": [ 16582, 20973, 11008, 113, 11701, 114, 35663, 117, 14818 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Malcolm", "Marshall", "(", "West", "Indies", ")", "376", ",", "81" ], "ids": [ 26572, 17705, 113, 11164, 44823, 114, 36906, 117, 12324 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Im", "##ran", "Khan", "(", "Pakistan", ")", "362", ",", "88" ], "ids": [ 10796, 12111, 16324, 113, 15437, 114, 37257, 117, 12074 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Dennis", "Lille", "##e", "(", "Australia", ")", "355", ",", "70" ], "ids": [ 19874, 28372, 10112, 113, 11729, 114, 33195, 117, 10923 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Bob", "Willis", "(", "England", ")", "325", ",", "90" ], "ids": [ 13583, 37227, 113, 11701, 114, 25843, 117, 10919 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Lance", "Gibbs", "(", "West", "Indies", ")", "309", ",", "79" ], "ids": [ 45013, 57119, 113, 11164, 44823, 114, 30667, 117, 12791 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Fred", "True", "##man", "(", "England", ")", "307", ",", "67" ], "ids": [ 16887, 24079, 10589, 113, 11701, 114, 26790, 117, 12316 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Courtney", "Walsh", "(", "West", "Indies", ")", "309", ",", "82" ], "ids": [ 72979, 34779, 113, 11164, 44823, 114, 30667, 117, 12180 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Was", "##im", "Ak", "##ram", "(", "Pakistan", ")", "300", ",", "70" ], "ids": [ 22034, 11759, 71275, 13845, 113, 15437, 114, 11093, 117, 10923 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##IS", "##H", "CO", "##UN", "##T", "##Y", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 19088, 12396, 32992, 69849, 11090, 14703, 39774, 36535, 11127, 52980, 64091, 30331, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "County", "Championship" ], "ids": [ 11616, 10886, 12341 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "cricket", "standing", "##s", "after", "Monday", "'", "s", "matches", "(", "tab", "##ulated", "under" ], "ids": [ 32289, 32173, 10107, 10662, 40714, 112, 187, 18258, 113, 100781, 37725, 10571 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "played", ",", "won", ",", "lost", ",", "drawn", ",", "batting", "bonus", "points", ",", "bowling", "bonus" ], "ids": [ 11553, 117, 11367, 117, 14172, 117, 34788, 117, 86152, 28215, 12789, 117, 97228, 28215 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "points", ",", "total", "points", ")", ":" ], "ids": [ 12789, 117, 11339, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essex", "13", "7", "2", "4", "45", "43", "212" ], "ids": [ 33634, 10249, 128, 123, 125, 10827, 11370, 22023 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kent", "14", "7", "1", "6", "42", "40", "212" ], "ids": [ 19393, 10247, 128, 122, 127, 11276, 10533, 22023 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Derbyshire", "13", "7", "2", "4", "41", "43", "208" ], "ids": [ 87260, 10249, 128, 123, 125, 11349, 11370, 21881 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leicester", "##shire", "13", "6", "1", "6", "43", "45", "202" ], "ids": [ 38789, 19684, 10249, 127, 122, 127, 11370, 10827, 22171 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Surrey", "13", "6", "1", "6", "37", "48", "199" ], "ids": [ 42858, 10249, 127, 122, 127, 11204, 11300, 23366 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yorkshire", "14", "6", "5", "3", "41", "46", "192" ], "ids": [ 27577, 10247, 127, 126, 124, 11349, 11528, 19206 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Warwick", "##shire", "13", "6", "4", "3", "32", "43", "180" ], "ids": [ 48234, 19684, 10249, 127, 125, 124, 10842, 11370, 13912 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Middlesex", "13", "5", "5", "3", "26", "45", "160" ], "ids": [ 74972, 10249, 126, 126, 124, 10314, 10827, 13849 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sussex", "13", "5", "6", "2", "27", "43", "156" ], "ids": [ 38426, 10249, 126, 127, 123, 10365, 11370, 20410 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Somerset", "13", "4", "5", "4", "27", "49", "152" ], "ids": [ 35434, 10249, 125, 126, 125, 10365, 11580, 18591 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Worcester", "##shire", "13", "3", "3", "7", "33", "48", "150" ], "ids": [ 55518, 19684, 10249, 124, 124, 128, 11000, 11300, 11766 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##lam", "##organ", "13", "4", "5", "4", "36", "32", "144" ], "ids": [ 144, 21114, 100807, 10249, 125, 126, 125, 11055, 10842, 18393 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hampshire", "13", "3", "5", "5", "28", "46", "137" ], "ids": [ 26036, 10249, 124, 126, 126, 10348, 11528, 18948 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gloucestershire", "14", "3", "6", "5", "19", "47", "129" ], "ids": [ 91183, 10247, 124, 127, 126, 10270, 11413, 18336 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Northampton", "##shire", "13", "2", "6", "5", "30", "43", "120" ], "ids": [ 79445, 19684, 10249, 123, 127, 126, 10244, 11370, 12048 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lancashire", "13", "1", "4", "8", "38", "37", "115" ], "ids": [ 48487, 10249, 122, 125, 129, 11171, 11204, 15680 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nottingham", "##shire", "13", "1", "6", "6", "34", "40", "108" ], "ids": [ 43396, 19684, 10249, 122, 127, 127, 11069, 10533, 15845 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Durham", "14", "0", "9", "5", "22", "50", "87" ], "ids": [ 37499, 10247, 121, 130, 126, 10306, 10462, 12581 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##IS", "##H", "CO", "##UN", "##T", "##Y", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 19088, 12396, 32992, 69849, 11090, 14703, 39774, 36535, 11127, 52980, 64091, 30331, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "on", "the", "final", "day", "of" ], "ids": [ 33036, 10135, 10105, 11070, 11940, 10108 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "four", "-", "day", "English", "County", "Championship", "cricket", "matches", "on", "Monday", ":" ], "ids": [ 11598, 118, 11940, 11616, 10886, 12341, 32289, 18258, 10135, 40714, 131 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Col", "##chester", ":", "Essex", "beat", "Gloucestershire", "by", "an", "innings", "and" ], "ids": [ 11699, 24927, 38540, 131, 33634, 27868, 91183, 10155, 10151, 48974, 10111 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-ORG", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 3, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "64", "runs", "." ], "ids": [ 11295, 17913, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Gloucestershire", "280", "and", "188", "(", "J", ".", "Russell", "57", ",", "M", ".", "Lynch", "50", ";" ], "ids": [ 91183, 17859, 10111, 22345, 113, 147, 119, 13481, 11817, 117, 150, 119, 32703, 10462, 132 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "N", ".", "Williams", "5", "-", "43", ")", "." ], "ids": [ 151, 119, 12494, 126, 118, 11370, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essex", "532", "-", "8", "declared", "(", "G", ".", "Go", "##och", "111", ",", "R", ".", "Iran", "##i", "91", "," ], "ids": [ 33634, 50446, 118, 129, 25019, 113, 144, 119, 14439, 16908, 15821, 117, 155, 119, 12901, 10116, 12519, 117 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "P", ".", "Pri", "##chard", "88", ",", "D", ".", "Robinson", "72", ";", "M", ".", "Alley", "##ne", "4", "-", "80", ")", "." ], "ids": [ 153, 119, 30797, 43013, 12074, 117, 141, 119, 13895, 12120, 132, 150, 119, 90847, 10238, 125, 118, 10832, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essex", "24", "points", "," ], "ids": [ 33634, 10233, 12789, 117 ], "entity": [ "B-ORG", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9 ] }, { "tokens": [ "Gloucestershire", "3", "." ], "ids": [ 91183, 124, 119 ], "entity": [ "B-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9 ] }, { "tokens": [ "At", "Cardiff", ":", "Match", "drawn", "." ], "ids": [ 11699, 39136, 131, 26151, 34788, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Kent", "323", "-", "5", "declared", "(", "C", ".", "Hooper", "77", "," ], "ids": [ 19393, 28550, 118, 126, 25019, 113, 140, 119, 40899, 12527, 117 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "D", ".", "Fulton", "64", ",", "N", ".", "L", "##long", "63", ",", "M", ".", "Walker", "59", ")", "and", "second", "innings" ], "ids": [ 141, 119, 80454, 11295, 117, 151, 119, 149, 31508, 12256, 117, 150, 119, 15432, 11867, 114, 10111, 11132, 48974 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", "##fe", "##ited", "." ], "ids": [ 10142, 14601, 77815, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "G", "##lam", "##organ", "first", "innings", "for", "##fe", "##ited", "and", "273", "-", "5", "(", "H", ".", "Morris" ], "ids": [ 144, 21114, 100807, 10422, 48974, 10142, 14601, 77815, 10111, 28414, 118, 126, 113, 145, 119, 17161 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "118", ",", "A", ".", "Co", "##tte", "##y", "70", ")", "." ], "ids": [ 17515, 117, 138, 119, 13098, 12131, 10157, 10923, 114, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "G", "##lam", "##organ", "5", "points", ",", "Kent", "6", "." ], "ids": [ 144, 21114, 100807, 126, 12789, 117, 19393, 127, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "At", "Northampton", ":", "Northampton", "##shire", "beat", "Sussex", "by", "6", "wickets", "." ], "ids": [ 11699, 79445, 131, 79445, 19684, 27868, 38426, 10155, 127, 83839, 119 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 7, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Sussex", "389", "and", "112", "." ], "ids": [ 38426, 40064, 10111, 16129, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9 ] }, { "tokens": [ "Northampton", "##shire", "361", "and", "142", "-", "4", "." ], "ids": [ 79445, 19684, 35737, 10111, 19893, 118, 125, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Northampton", "##shire", "24", "points", ",", "Sussex", "8", "." ], "ids": [ 79445, 19684, 10233, 12789, 117, 38426, 129, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "At", "Trent", "Bridge", ":", "Match", "abandoned", "as", "a", "draw", "-", "rain", "." ], "ids": [ 11699, 47528, 17426, 131, 26151, 32296, 10146, 169, 25974, 118, 50939, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nottingham", "##shire", "446", "-", "9", "declared", "and", "53", "-", "0", "." ], "ids": [ 43396, 19684, 40709, 118, 130, 25019, 10111, 11756, 118, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Surrey", "128", "-", "4", "declared" ], "ids": [ 42858, 16196, 118, 125, 25019 ], "entity": [ "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9 ] }, { "tokens": [ "(", "A", ".", "Brown", "56", "not", "out", ")", "." ], "ids": [ 113, 138, 119, 12623, 11628, 10472, 10950, 114, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nottingham", "##shire", "8", "points", ",", "Surrey", "7", "." ], "ids": [ 43396, 19684, 129, 12789, 117, 42858, 128, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "At", "Worcester", ":", "Match", "drawn", "." ], "ids": [ 11699, 55518, 131, 26151, 34788, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Warwick", "##shire", "310", "and", "162", "-", "4" ], "ids": [ 48234, 19684, 23993, 10111, 21638, 118, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "declared", "." ], "ids": [ 25019, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Worcester", "##shire", "205", "-", "9", "declared", "(", "K", ".", "Sp", "##irin", "##g", "52", ";", "A", ".", "Giles" ], "ids": [ 55518, 19684, 20862, 118, 130, 25019, 113, 148, 119, 46361, 89080, 10240, 11525, 132, 138, 119, 49355 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8 ] }, { "tokens": [ "3", "-", "12", ")", "and", "164", "-", "4", "(", "P", ".", "Weston", "52", ")", "." ], "ids": [ 124, 118, 10186, 114, 10111, 21575, 118, 125, 113, 153, 119, 62676, 11525, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Worcester", "##shire", "8", "points", "," ], "ids": [ 55518, 19684, 129, 12789, 117 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9 ] }, { "tokens": [ "Warwick", "##shire", "10", "." ], "ids": [ 48234, 19684, 10150, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9 ] }, { "tokens": [ "At", "Head", "##ing", "##ley", ":", "Match", "drawn", "." ], "ids": [ 11699, 16830, 10230, 12105, 131, 26151, 34788, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Yorkshire", "529", "-", "8", "declared" ], "ids": [ 27577, 49102, 118, 129, 25019 ], "entity": [ "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9 ] }, { "tokens": [ "(", "C", ".", "White", "181", ",", "R", ".", "Blake", "##y", "109", "not", "out", ",", "M", ".", "Mo", "##xon", "66", ",", "M", ".", "Vaughan", "57", ")", "." ], "ids": [ 113, 140, 119, 12136, 22534, 117, 155, 119, 24321, 10157, 16296, 10472, 10950, 117, 150, 119, 34987, 55251, 12215, 117, 150, 119, 54864, 11817, 114, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Lancashire", "323", "(", "N", ".", "Fair", "##bro", "##ther", "86", ",", "M", ".", "Watkins", "##on", "64", ";", "D", ".", "Go", "##ugh", "4", "-", "53", ")" ], "ids": [ 48487, 28550, 113, 151, 119, 25697, 20923, 22623, 12224, 117, 150, 119, 74430, 10263, 11295, 132, 141, 119, 14439, 25905, 125, 118, 11756, 114 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "and", "231", "-", "7", "(", "N", ".", "Speak", "77", ",", "N", ".", "Fair", "##bro", "##ther", "55", ";", "D", ".", "Go", "##ugh", "4", "-", "48", ")", "." ], "ids": [ 10111, 25034, 118, 128, 113, 151, 119, 104326, 12527, 117, 151, 119, 25697, 20923, 22623, 11358, 132, 141, 119, 14439, 25905, 125, 118, 11300, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yorkshire", "11", "points", ",", "Lancashire", "8", "." ], "ids": [ 27577, 10193, 12789, 117, 48487, 129, 119 ], "entity": [ "B-ORG", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "At", "Leicester", ":", "Match", "drawn", "." ], "ids": [ 11699, 38789, 131, 26151, 34788, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Leicester", "##shire", "353", "." ], "ids": [ 38789, 19684, 35373, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9 ] }, { "tokens": [ "Hampshire", "137" ], "ids": [ 26036, 18948 ], "entity": [ "B-ORG", "O" ], "entity_ids": [ 3, 9 ] }, { "tokens": [ "(", "G", ".", "Parsons", "4", "-", "36", ")", "and", "135", "-", "9", "." ], "ids": [ 113, 144, 119, 45737, 125, 118, 11055, 114, 10111, 16364, 118, 130, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leicester", "##shire", "11", "points", ",", "Hampshire" ], "ids": [ 38789, 19684, 10193, 12789, 117, 26036 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-ORG" ], "entity_ids": [ 3, 7, 9, 9, 9, 3 ] }, { "tokens": [ "7", "." ], "ids": [ 128, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "PA", "##KI", "##ST", "##AN", "BE", "##AT", "EN", "##GL", "##AN", "##D", "BY", "N", "##INE", "W", "##IC", "##K", "##ET", "##S", "IN", "T", "##HI", "##RD", "T", "##ES", "##T", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 32349, 59879, 32995, 41275, 46291, 32071, 31278, 104780, 41275, 11490, 66710, 151, 83198, 160, 30889, 11733, 52338, 10731, 36351, 157, 108880, 84444, 157, 25054, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "beat", "England", "by", "nine", "wickets", "on", "the", "fifth", "day", "of", "the", "third", "and", "final", "test", "at", "The", "Oval", "on", "Monday", "to", "win", "the", "series", "2", "-", "0", "." ], "ids": [ 15437, 27868, 11701, 10155, 19964, 83839, 10135, 10105, 22237, 11940, 10108, 10105, 12628, 10111, 11070, 15839, 10160, 10117, 98765, 10135, 40714, 10114, 14125, 10105, 11366, 123, 118, 121, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", ":", "England", "326", "and", "242", ";", "Pakistan", "521", "-", "8", "declared", "and", "48", "-", "1", "." ], "ids": [ 66875, 10107, 131, 11701, 32558, 10111, 27297, 132, 15437, 21022, 118, 129, 25019, 10111, 11300, 118, 122, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "V", "PA", "##KI", "##ST", "##AN", "F", "##IN", "##AL", "T", "##ES", "##T", "SC", "##OR", "##EB", "##O", "##AR", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 159, 32349, 59879, 32995, 41275, 143, 27128, 32002, 157, 25054, 11090, 18137, 42622, 89922, 11403, 52188, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##board", "on", "the", "last", "day", "of", "the" ], "ids": [ 66875, 25690, 10135, 10105, 12469, 11940, 10108, 10105 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "third", "and", "final", "test", "between", "England", "and", "Pakistan", "at", "the", "Oval", "on" ], "ids": [ 12628, 10111, 11070, 15839, 10948, 11701, 10111, 15437, 10160, 10105, 98765, 10135 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 9 ] }, { "tokens": [ "Monday", ":" ], "ids": [ 40714, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "England", "first", "innings", "326", "(", "J", ".", "C", "##ra", "##wley", "106", ",", "G", ".", "Thorpe", "54", ";", "W", "##aq", "##ar" ], "ids": [ 11701, 10422, 48974, 32558, 113, 147, 119, 140, 10288, 62381, 16084, 117, 144, 119, 84855, 11653, 132, 160, 49277, 10354 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8 ] }, { "tokens": [ "You", "##nis", "4", "-", "95", ")" ], "ids": [ 11065, 12597, 125, 118, 11978, 114 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "first", "innings", "521", "-", "8", "declared", "(", "Sa", "##eed", "Anwar", "176", "," ], "ids": [ 15437, 10422, 48974, 21022, 118, 129, 25019, 113, 12404, 40154, 92168, 21613, 117 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Salim", "Malik", "100", "not", "out", ",", "I", "##ja", "##z", "Ahmed", "61", ")" ], "ids": [ 98284, 45783, 10407, 10472, 10950, 117, 146, 10320, 10305, 25530, 12314, 114 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "England", "second", "innings", "(", "over", "##night", "74", "-", "0", ")" ], "ids": [ 11701, 11132, 48974, 113, 10491, 45217, 12535, 118, 121, 114 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M", ".", "At", "##hert", "##on", "c", "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", "b", "Mus", "##hta", "##q", "Ahmed", "43" ], "ids": [ 150, 119, 11699, 102855, 10263, 171, 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 170, 31013, 32493, 11703, 25530, 11370 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "A", ".", "Stewart", "c", "As", "##if", "Mu", "##jta", "##ba", "b", "Mus", "##hta", "##q", "Ahmed", "54" ], "ids": [ 138, 119, 17493, 171, 10882, 13918, 49056, 51465, 10537, 170, 31013, 32493, 11703, 25530, 11653 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "N", ".", "Hus", "##sain", "lb", "##w", "b", "Mus", "##hta", "##q", "Ahmed", "51" ], "ids": [ 151, 119, 109022, 82083, 23989, 10874, 170, 31013, 32493, 11703, 25530, 11524 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "G", ".", "Thorpe", "c", "Was", "##im", "Ak", "##ram", "b", "Mus", "##hta", "##q", "Ahmed", "9" ], "ids": [ 144, 119, 84855, 171, 22034, 11759, 71275, 13845, 170, 31013, 32493, 11703, 25530, 130 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "J", ".", "C", "##ra", "##wley", "c", "Aa", "##mir", "So", "##hai", "##l", "b", "Was", "##im", "Ak", "##ram", "19" ], "ids": [ 147, 119, 140, 10288, 62381, 171, 80131, 20825, 12882, 37821, 10161, 170, 22034, 11759, 71275, 13845, 10270 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "N", ".", "Knight", "c", "and", "b", "Mus", "##hta", "##q", "Ahmed", "8" ], "ids": [ 151, 119, 19848, 171, 10111, 170, 31013, 32493, 11703, 25530, 129 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "C", ".", "Lewis", "lb", "##w", "b", "W", "##aq", "##ar", "You", "##nis", "4" ], "ids": [ 140, 119, 13759, 23989, 10874, 170, 160, 49277, 10354, 11065, 12597, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "D", ".", "Cork", "b", "Mus", "##hta", "##q", "Ahmed", "26" ], "ids": [ 141, 119, 42049, 170, 31013, 32493, 11703, 25530, 10314 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "R", ".", "C", "##roft", "c", "I", "##ja", "##z", "Ahmed", "b", "Was", "##im", "Ak", "##ram", "6" ], "ids": [ 155, 119, 140, 101860, 171, 146, 10320, 10305, 25530, 170, 22034, 11759, 71275, 13845, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "I", ".", "Salisbury", "not", "out", "0" ], "ids": [ 146, 119, 55933, 10472, 10950, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "A", ".", "Mu", "##lla", "##lly", "b", "Was", "##im", "Ak", "##ram", "0" ], "ids": [ 138, 119, 49056, 11083, 17903, 170, 22034, 11759, 71275, 13845, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Extra", "##s", "(", "b", "-", "6", "lb", "-", "2", "w", "-", "1", "n", "##b", "-", "13", ")", "22" ], "ids": [ 50821, 10107, 113, 170, 118, 127, 23989, 118, 123, 191, 118, 122, 182, 10457, 118, 10249, 114, 10306 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "242" ], "ids": [ 25220, 27297 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "96", "2", "-", "136", "3", "-", "166", "4", "-", "179", "5", "-", "187", "6", "-", "205", "7", "-", "220" ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 12308, 123, 118, 18820, 124, 118, 21505, 125, 118, 22399, 126, 118, 23228, 127, 118, 20862, 128, 118, 15817 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", "-", "238", "9", "-", "242" ], "ids": [ 129, 118, 24388, 130, 118, 27297 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bowling", ":", "Was", "##im", "Ak", "##ram", "15", ".", "4", "-", "1", "-", "67", "-", "3", ",", "W", "##aq", "##ar", "You", "##nis", "18", "-", "3", "-", "55", "-", "1", "," ], "ids": [ 100017, 131, 22034, 11759, 71275, 13845, 10208, 119, 125, 118, 122, 118, 12316, 118, 124, 117, 160, 49277, 10354, 11065, 12597, 10218, 118, 124, 118, 11358, 118, 122, 117 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mus", "##hta", "##q", "Ahmed", "37", "-", "10", "-", "78", "-", "6", ",", "Aa", "##mir", "So", "##hai", "##l", "2", "-", "1", "-", "4", "-", "0", ",", "Mohammad", "Ak", "##ram" ], "ids": [ 31013, 32493, 11703, 25530, 11204, 118, 10150, 118, 12492, 118, 127, 117, 80131, 20825, 12882, 37821, 10161, 123, 118, 122, 118, 125, 118, 121, 117, 40036, 71275, 13845 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "10", "-", "3", "-", "30", "-", "0" ], "ids": [ 10150, 118, 124, 118, 10244, 118, 121 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "second", "innings" ], "ids": [ 15437, 11132, 48974 ], "entity": [ "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9 ] }, { "tokens": [ "Sa", "##eed", "Anwar", "c", "Knight", "b", "Mu", "##lla", "##lly", "1" ], "ids": [ 12404, 40154, 92168, 171, 19848, 170, 49056, 11083, 17903, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "not", "out", "29" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 10472, 10950, 10386 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "I", "##ja", "##z", "Ahmed", "not", "out", "13" ], "ids": [ 146, 10320, 10305, 25530, 10472, 10950, 10249 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "n", "##b", "-", "5", ")", "5" ], "ids": [ 50821, 10107, 113, 182, 10457, 118, 126, 114, 126 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "one", "wi", "##cket", ")", "48" ], "ids": [ 25220, 113, 10142, 10464, 23040, 28721, 114, 11300 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wi", "##cket", ":", "1", "-", "7" ], "ids": [ 15750, 10108, 23040, 28721, 131, 122, 118, 128 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bowling", ":", "Cork", "3", "-", "0", "-", "15", "-", "0", ",", "Mu", "##lla", "##lly", "3", "-", "0", "-", "24", "-", "1", ",", "C", "##roft", "0", ".", "4", "-", "0", "-", "9", "-", "0" ], "ids": [ 100017, 131, 42049, 124, 118, 121, 118, 10208, 118, 121, 117, 49056, 11083, 17903, 124, 118, 121, 118, 10233, 118, 122, 117, 140, 101860, 121, 119, 125, 118, 121, 118, 130, 118, 121 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", ":", "Pakistan", "won", "by", "9", "wickets" ], "ids": [ 32070, 16203, 131, 15437, 11367, 10155, 130, 83839 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "First", "test", ":", "Lord", "'", "s", "-", "Pakistan", "won", "by", "164", "runs" ], "ids": [ 12128, 15839, 131, 13440, 112, 187, 118, 15437, 11367, 10155, 21575, 17913 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "test", ":", "Head", "##ing", "##ley", "-", "Dr", "##awn" ], "ids": [ 14181, 15839, 131, 16830, 10230, 12105, 118, 11612, 80766 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "win", "series", "2", "-", "0" ], "ids": [ 15437, 14125, 11366, 123, 118, 121 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "PA", "##KI", "##ST", "##AN", "NE", "##ED", "48", "R", "##UN", "##S", "TO", "W", "##IN", "T", "##HI", "##RD", "AND", "F", "##IN", "##AL", "T", "##ES", "##T", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 32349, 59879, 32995, 41275, 86607, 33809, 11300, 155, 69849, 10731, 58573, 160, 27128, 157, 108880, 84444, 52428, 143, 27128, 32002, 157, 25054, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "were", "dismissed", "for", "242", "in", "their", "second", "innings", "on", "the", "fifth", "day", "of", "the", "third", "and", "final", "test", "at", "The", "Oval", "on", "Monday", "leaving", "Pakistan", "requiring", "48", "runs", "to", "win", "." ], "ids": [ 11701, 10309, 59379, 10142, 27297, 10106, 10455, 11132, 48974, 10135, 10105, 22237, 11940, 10108, 10105, 12628, 10111, 11070, 15839, 10160, 10117, 98765, 10135, 40714, 21005, 15437, 74063, 11300, 17913, 10114, 14125, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "lead", "the", "series", "1", "-", "0", "." ], "ids": [ 15437, 14107, 10105, 11366, 122, 118, 121, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "LE", "##AG", "##UE", "-", "EU", "##RO", "##P", "##EA", "##N", "SU", "##PER", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##T", "/", "F", "##IN", "##AL", "##S", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 155, 12022, 32469, 14703, 84977, 109865, 62674, 118, 17751, 35066, 11127, 36789, 11537, 86643, 108408, 84977, 109865, 62674, 71033, 88592, 11369, 11090, 120, 143, 27128, 32002, 10731, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "European", "Super", "League" ], "ids": [ 32070, 16203, 10108, 169, 11914, 12786, 11074 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6 ] }, { "tokens": [ "rugby", "league", "match", "on", "Monday", ":" ], "ids": [ 19812, 15616, 12356, 10135, 40714, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "66", "War", "##rington", "14" ], "ids": [ 10838, 21338, 10107, 12215, 11277, 82194, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Final", "standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", "," ], "ids": [ 14924, 32173, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "points", "for", ",", "against", ",", "total", "points", ")", ":" ], "ids": [ 12789, 10142, 117, 11327, 117, 11339, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Helen", "##s", "22", "20", "0", "2", "950", "455", "40", "-", "champions" ], "ids": [ 10838, 21338, 10107, 10306, 10197, 121, 123, 29997, 38767, 10533, 118, 27745 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wigan", "22", "19", "1", "2", "902", "326", "39" ], "ids": [ 85593, 10306, 10270, 122, 123, 74273, 32558, 11303 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bradford", "22", "17", "0", "5", "767", "409", "34" ], "ids": [ 40141, 10306, 10273, 121, 126, 50181, 37659, 11069 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "22", "12", "1", "9", "611", "462", "25" ], "ids": [ 10829, 10306, 10186, 122, 130, 56267, 44574, 10258 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "War", "##rington", "22", "12", "0", "10", "569", "565", "24" ], "ids": [ 11277, 82194, 10306, 10186, 121, 10150, 53670, 44522, 10233 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Halifax", "22", "10", "1", "11", "667", "576", "21" ], "ids": [ 49933, 10306, 10150, 122, 10193, 52541, 44332, 10296 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", "22", "10", "0", "12", "599", "730", "20" ], "ids": [ 31695, 10306, 10150, 121, 10186, 53296, 45177, 10197 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oldham", "22", "9", "1", "12", "473", "681", "19" ], "ids": [ 109860, 10306, 130, 122, 10186, 39130, 63632, 10270 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Castle", "##ford", "22", "9", "0", "13", "548", "599", "18" ], "ids": [ 17064, 13387, 10306, 130, 121, 10249, 48774, 53296, 10218 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leeds", "22", "6", "0", "16", "555", "745", "12" ], "ids": [ 28654, 10306, 127, 121, 10250, 44517, 66431, 10186 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "22", "3", "1", "18", "398", "795", "7" ], "ids": [ 10728, 10306, 124, 122, 10218, 43338, 71882, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Working", "##ton", "22", "2", "1", "19", "325", "1021", "5" ], "ids": [ 38194, 11183, 10306, 123, 122, 10270, 25843, 30538, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "AND", "SC", "##OT", "##TI", "##SH", "LE", "##AG", "##UE", "F", "##IX", "##T", "##UR", "##ES", "-", "AU", "##G", "30", "-", "SE", "##P", "##T", "1", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 52428, 18137, 62146, 72286, 64091, 84977, 109865, 62674, 143, 67403, 11090, 98348, 25054, 118, 29088, 11447, 10244, 118, 23056, 11127, 11090, 122, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "and", "Scottish", "league", "soccer" ], "ids": [ 11616, 10111, 18879, 15616, 41356 ], "entity": [ "B-MISC", "O", "B-MISC", "O", "O" ], "entity_ids": [ 2, 9, 2, 9, 9 ] }, { "tokens": [ "fi", "##xt", "##ures", "for", "August", "30", "to", "September", "1", ":" ], "ids": [ 14045, 28883, 18367, 10142, 10735, 10244, 10114, 10596, 122, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Friday", ",", "August", "30", ":" ], "ids": [ 30767, 117, 10735, 10244, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "division", "one", "-", "West", "Bro", "##m", "##wich", "v", "Sheffield", "United", "." ], "ids": [ 11616, 13751, 10464, 118, 11164, 32470, 10147, 33544, 190, 31695, 10609, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "English", "division", "three", "-", "Swansea", "v", "Lincoln", "." ], "ids": [ 11616, 13751, 11003, 118, 73425, 190, 16944, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 9, 3, 9 ] }, { "tokens": [ "Saturday", ",", "August", "31", ":" ], "ids": [ 24848, 117, 10735, 10413, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "division", "one", "-", "Birmingham", "v", "Barn", "##sley", ",", "Bradford", "v" ], "ids": [ 11616, 13751, 10464, 118, 22712, 190, 61802, 28428, 117, 40141, 190 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 9, 3, 7, 9, 3, 9 ] }, { "tokens": [ "Tra", "##n", "##mere", ",", "G", "##rim", "##sby", "v", "Portsmouth", ",", "Hu", "##dder", "##sfield", "v", "Crystal", "Palace", "," ], "ids": [ 21469, 10115, 32732, 117, 144, 23760, 38243, 190, 46933, 117, 43707, 42113, 53495, 190, 28459, 22015, 117 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9, 3, 9, 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Manchester", "City", "v", "Charlton", ",", "Norwich", "v", "Wolverhampton", ",", "Oldham", "v" ], "ids": [ 15349, 10773, 190, 68730, 117, 51816, 190, 98739, 117, 109860, 190 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "O", "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9, 3, 9, 3, 9, 3, 9 ] }, { "tokens": [ "Ipswich", ",", "Port", "Vale", "v", "Oxford", ",", "Reading", "v", "Stoke", ",", "South", "##end", "v" ], "ids": [ 86146, 117, 14734, 32286, 190, 11109, 117, 10629, 190, 60824, 117, 11056, 19342, 190 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9, 3, 9, 3, 9, 3, 9, 3, 7, 9 ] }, { "tokens": [ "S", "##wind", "##on", "." ], "ids": [ 156, 47673, 10263, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9 ] }, { "tokens": [ "English", "division", "two", "-", "Blackpool", "v", "W", "##y", "##combe", ",", "Bourne", "##mouth", "v" ], "ids": [ 11616, 13751, 10551, 118, 102917, 190, 160, 10157, 87041, 117, 80776, 56873, 190 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 9, 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Peterborough", ",", "Bristol", "Rovers", "v", "Stock", "##port", ",", "Bury", "v", "Bristol", "City", "," ], "ids": [ 104232, 117, 24732, 44311, 190, 31916, 15520, 117, 84780, 190, 24732, 10773, 117 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9, 3, 7, 9, 3, 9, 3, 7, 9 ] }, { "tokens": [ "Crew", "##e", "v", "Wat", "##ford", ",", "Gill", "##ingham", "v", "Chester", "##field", ",", "Lu", "##ton", "v", "Roth", "##er", "##ham", "," ], "ids": [ 45170, 10112, 190, 51082, 13387, 117, 33787, 57076, 190, 32729, 13408, 117, 23859, 11183, 190, 32925, 10165, 13196, 117 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 3, 7, 9, 3, 7, 9, 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Mill", "##wall", "v", "Burn", "##ley", ",", "Not", "##ts", "County", "v", "York", ",", "Plymouth", "v", "Preston", "," ], "ids": [ 28639, 33743, 190, 49331, 12105, 117, 16040, 10806, 10886, 190, 10482, 117, 40814, 190, 35119, 117 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 3, 7, 7, 9, 3, 9, 3, 9, 3, 9 ] }, { "tokens": [ "Shrewsbury", "v", "Brent", "##ford", ",", "W", "##als", "##all", "v", "W", "##re", "##x", "##ham", "." ], "ids": [ 109224, 190, 56333, 13387, 117, 160, 20162, 18995, 190, 160, 10246, 10686, 13196, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9, 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "English", "division", "three", "-", "Brighton", "v", "Sc", "##unt", "##hor", "##pe", ",", "Cambridge", "v" ], "ids": [ 11616, 13751, 11003, 118, 44142, 190, 55260, 20631, 39854, 11355, 117, 11697, 190 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 9, 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Cardiff", ",", "Col", "##chester", "v", "Here", "##ford", ",", "Don", "##caster", "v", "Darling", "##ton", ",", "Fulham", "v" ], "ids": [ 39136, 117, 24927, 38540, 190, 18249, 13387, 117, 11740, 74934, 190, 59597, 11183, 117, 84725, 190 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9, 3, 7, 9, 3, 7, 9, 3, 7, 9, 3, 9 ] }, { "tokens": [ "Carlisle", ",", "Hull", "v", "Barn", "##et", ",", "Ley", "##ton", "Orient", "v", "Hart", "##le", "##pool", ",", "Mansfield", "v" ], "ids": [ 65204, 117, 37465, 190, 61802, 10308, 117, 34121, 11183, 26743, 190, 22346, 10284, 61571, 117, 73416, 190 ], "entity": [ "B-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9, 3, 7, 9, 3, 7, 7, 9, 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Roc", "##hda", "##le", ",", "Sc", "##ar", "##borough", "v", "Northampton", ",", "Tor", "##qua", "##y", "v", "Exeter", ",", "Wigan", "v" ], "ids": [ 90273, 109788, 10284, 117, 55260, 10354, 33057, 190, 79445, 117, 24446, 32973, 10157, 190, 61436, 117, 85593, 190 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9, 3, 9, 3, 7, 7, 9, 3, 9, 3, 9 ] }, { "tokens": [ "Chester", "." ], "ids": [ 32729, 119 ], "entity": [ "B-ORG", "O" ], "entity_ids": [ 3, 9 ] }, { "tokens": [ "Scottish", "division", "one", "-", "East", "Fi", "##fe", "v", "Clyde", "##bank", ",", "Green", "##ock" ], "ids": [ 18879, 13751, 10464, 118, 11830, 36448, 14601, 190, 45826, 20583, 117, 13068, 21863 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 2, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 3, 7 ] }, { "tokens": [ "Morton", "v", "Falk", "##ir", ",", "Parti", "##ck", "v", "St", "Mir", "##ren", ",", "St", "Johnston", "##e", "v" ], "ids": [ 38429, 190, 88285, 10835, 117, 19644, 11263, 190, 10838, 43209, 10969, 117, 10838, 31844, 10112, 190 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9, 3, 7, 9, 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Air", "##dri", "##eon", "##ians", ",", "Stirling", "v", "Dundee", "." ], "ids": [ 11704, 40230, 27572, 34615, 117, 60442, 190, 60426, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9, 3, 9 ] }, { "tokens": [ "Scottish", "division", "two", "-", "Ay", "##r", "v", "Be", "##r", "##wick", ",", "Clyde", "v", "Queen", "of", "the" ], "ids": [ 18879, 13751, 10551, 118, 77603, 10129, 190, 14321, 10129, 24820, 117, 45826, 190, 13704, 10108, 10105 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 2, 9, 9, 9, 3, 7, 9, 3, 7, 7, 9, 3, 9, 3, 7, 7 ] }, { "tokens": [ "South", ",", "Dum", "##bart", "##on", "v", "Br", "##ech", "##in", ",", "Livingston", "v", "Hamilton", ",", "Sten", "##house", "##mui", "##r" ], "ids": [ 11056, 117, 94566, 35758, 10263, 190, 38508, 16200, 10245, 117, 59827, 190, 15846, 117, 98777, 15562, 102406, 10129 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 9, 3, 7, 7, 9, 3, 7, 7, 9, 3, 9, 3, 9, 3, 7, 7, 7 ] }, { "tokens": [ "v", "St", "##ran", "##rae", "##r", "." ], "ids": [ 190, 10838, 12111, 73803, 10129, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Scottish", "division", "three", "-", "Albion", "v", "Co", "##wde", "##n", "##beat", "##h", ",", "Ar", "##bro", "##ath", "v" ], "ids": [ 18879, 13751, 11003, 118, 56878, 190, 13098, 87977, 10115, 68939, 10237, 117, 18484, 20923, 44196, 190 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "East", "Stirling", ",", "In", "##vern", "##ess", "v", "All", "##oa", ",", "Mont", "##rose", "v", "Ross", "County", "," ], "ids": [ 11830, 60442, 117, 10167, 38937, 22094, 190, 11101, 14783, 117, 19472, 35329, 190, 16690, 10886, 117 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9, 3, 7, 9, 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Queen", "'", "s", "Park", "v", "For", "##far", "." ], "ids": [ 13704, 112, 187, 11239, 190, 11399, 29731, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Sunday", ",", "September", "1", ":" ], "ids": [ 19731, 117, 10596, 122, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "division", "one", "-", "Queens", "Park", "Rangers", "v", "Bolton", "." ], "ids": [ 11616, 13751, 10464, 118, 34140, 11239, 23042, 190, 34462, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "CO", "##ST", "##A", "RI", "##CA", "AND", "CH", "##IL", "##E", "DR", "##A", "##W", "1", "-", "1", "IN", "FR", "##IE", "##ND", "##L", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 32992, 32995, 10738, 56658, 46900, 52428, 39774, 38850, 11259, 45457, 10738, 13034, 122, 118, 122, 36351, 64655, 71655, 58521, 11369, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IB", "##ER", "##IA", ",", "Costa", "Rica", "1996", "-", "08", "-", "26" ], "ids": [ 149, 72918, 24093, 35976, 117, 13902, 20834, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Costa", "Rica", "and", "Chile" ], "ids": [ 13902, 20834, 10111, 13218 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC" ], "entity_ids": [ 1, 5, 9, 1 ] }, { "tokens": [ "drew", "1", "-", "1", "(", "half", "##time", "1", "-", "0", ")", "in", "a", "friendly", "soccer", "international", "on" ], "ids": [ 49098, 122, 118, 122, 113, 13877, 18086, 122, 118, 121, 114, 10106, 169, 43941, 41356, 12533, 10135 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sunday", "." ], "ids": [ 19731, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Costa", "Rica", "-", "Ronaldo", "Gonzalez", "(", "10th", "minute", ",", "penalty" ], "ids": [ 13902, 20834, 118, 56937, 72460, 113, 31004, 21760, 117, 40924 ], "entity": [ "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chile", "-", "Marcelo", "Salas", "(", "80", "##th", ")" ], "ids": [ 13218, 118, 38165, 84528, 113, 10832, 11143, 114 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "8", ",", "000" ], "ids": [ 46080, 131, 129, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SE", "##Y", "##CH", "##EL", "##LE", "##S", "FA", "##IL", "IN", "B", "##ID", "FOR", "H", "##IS", "##TO", "##RI", "##C", "VI", "##CT", "##OR", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 23056, 14703, 86448, 68999, 51036, 10731, 20794, 38850, 36351, 139, 28895, 109544, 145, 19088, 60493, 46876, 10858, 12262, 91995, 42622, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Glee", "##son" ], "ids": [ 11997, 84351, 11599 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "26" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tin", "##y", "islands", "of", "the", "Seychelles", "failed", "to", "make", "soccer", "history", "at", "the", "weekend", "when", "they", "bow", "##ed", "out", "of", "the", "preliminary", "rounds", "of", "the", "African", "Nations", "Cup", "." ], "ids": [ 10117, 21629, 10157, 33294, 10108, 10105, 102843, 20775, 10114, 13086, 41356, 11486, 10160, 10105, 43440, 10841, 10689, 98073, 10336, 10950, 10108, 10105, 68097, 44759, 10108, 10105, 13839, 15145, 11544, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "Trail", "##ing", "fellow", "Indian", "Ocean", "island", "##ers", "Mauritius", "1", "-", "0", "from", "the", "first", "leg", ",", "they", "were", "held", "to", "a", "1", "-", "1", "draw", "at", "home", "on", "Saturday", "despite", "playing", "against", "10", "men", "for", "most", "of", "the", "match", "." ], "ids": [ 29890, 10230, 24619, 12544, 20500, 17354, 10901, 57036, 122, 118, 121, 10188, 10105, 10422, 33810, 117, 10689, 10309, 11991, 10114, 169, 122, 118, 122, 25974, 10160, 11816, 10135, 24848, 22087, 14879, 11327, 10150, 10588, 10142, 10992, 10108, 10105, 12356, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "2", "-", "1", "aggregate", "took", "Mauritius", "into", "the", "group", "phase", "of", "the", "qualifier", "##s", "for", "the", "1998", "finals", ",", "and", "kept", "up", "the", "Seychelles", "'", "record", "of", "never", "having", "won", "an", "official", "match", "in", "their", "10", "years", "of", "FIFA", "membership", "." ], "ids": [ 10117, 123, 118, 122, 75063, 12149, 57036, 10708, 10105, 11795, 20394, 10108, 10105, 96076, 10107, 10142, 10105, 10363, 21758, 117, 10111, 26546, 10741, 10105, 102843, 112, 12410, 10108, 14794, 13677, 11367, 10151, 14731, 12356, 10106, 10455, 10150, 10855, 10108, 13707, 39689, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "The", "Seychelles", "must", "have", "thought", "they", "were", "on", "course", "for", "a", "historic", "break", "##through", "when", "Mau", "##riti", "##an", "midfielder", "Andre", "Cabo", "##che", "was", "sent", "off", "for", "a", "c", "##rude", "tackle", "in", "the", "19th", "minute", "." ], "ids": [ 10117, 102843, 14982, 10529, 18957, 10689, 10309, 10135, 15348, 10142, 169, 23704, 24194, 90300, 10841, 103722, 45867, 10206, 68049, 25188, 39021, 11119, 10134, 14541, 11898, 10142, 169, 171, 97417, 82524, 10106, 10105, 19794, 21760, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "visitors", "responded", "to", "the", "set", "##back", "immediately", "-", "-", "veteran", "striker", "Ashley", "Mo", "##cud", "##e", "scoring", "a", "minute", "later", "to", "give", "them", "a", "two", "-", "goal", "aggregate", "lead", "." ], "ids": [ 16976, 10105, 44291, 58040, 10114, 10105, 11847, 18666, 24029, 118, 118, 55669, 103325, 32924, 34987, 95177, 10112, 27346, 169, 21760, 10873, 10114, 18090, 11345, 169, 10551, 118, 16586, 75063, 14107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Although", "Danny", "Rose", "'", "s", "50th", "-", "minute", "equal", "##iser", "gave", "the", "Se", "##ych", "##ello", "##is", "renewed", "hope", "they", "could", "not", "find", "the", "net", "again", "and", "were", "eliminated", "." ], "ids": [ 15785, 20340, 14873, 112, 187, 98105, 118, 21760, 32943, 25004, 15362, 10105, 11045, 14950, 24829, 10291, 81783, 50725, 10689, 12174, 10472, 17860, 10105, 11988, 13123, 10111, 10309, 44407, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mauritius", "now", "play", "in", "group", "seven", "of", "the", "qualifier", "##s", "against", "Malawi", ",", "Mozambique", "and", "favourite", "##s", "Zambia", "." ], "ids": [ 57036, 11858, 12253, 10106, 11795, 15767, 10108, 10105, 96076, 10107, 11327, 51020, 117, 61380, 10111, 80494, 10107, 53937, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Namibia", ",", "who", "drew", "0", "-", "0", "with", "Botswana", "in", "their", "first", "leg", ",", "won", "the", "second", "leg", "in", "Wind", "##hoek", "6", "-", "0", "to", "stretch", "their", "un", "##beat", "##en", "run", "to", "eight", "matches", "and", "continue", "their", "remarkable", "progress", "on", "the", "African", "soccer", "stage", "." ], "ids": [ 46670, 117, 10479, 49098, 121, 118, 121, 10169, 41424, 10106, 10455, 10422, 33810, 117, 11367, 10105, 11132, 33810, 10106, 22830, 71495, 127, 118, 121, 10114, 85690, 10455, 10119, 68939, 10136, 14095, 10114, 16222, 18258, 10111, 17734, 10455, 88916, 40316, 10135, 10105, 13839, 41356, 15365, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "They", "now", "play", "in", "group", "five", "with", "Cameroon", ",", "Gabon", "and", "Kenya", "." ], "ids": [ 11696, 11858, 12253, 10106, 11795, 12403, 10169, 77812, 117, 54573, 10111, 19686, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 9 ] }, { "tokens": [ "German", "-", "based", "striker", "Bach", "##iro", "##u", "Sal", "##ou", "returned", "home", "to", "Togo", "to", "score", "the", "de", "##cisive", "only", "goal", "of", "their", "tie", "against", "Congo", "." ], "ids": [ 12026, 118, 11610, 103325, 18965, 14213, 10138, 64831, 11010, 14030, 11816, 10114, 56492, 10114, 17704, 10105, 10104, 79533, 10893, 16586, 10108, 10455, 27916, 11327, 20633, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Sal", "##ou", ",", "who", "plays", "for", "MS", "##V", "Duisburg", "in", "the", "Bundesliga", ",", "scored", "in", "the", "53", "##rd", "minute", "of", "Sunday", "'", "s", "match", "in", "Lo", "##me", "for", "a", "1", "-", "0", "aggregate", "win", "which", "takes", "his", "side", "into", "group", "six", ",", "where", "they", "will", "meet", "Liberia", ",", "Tanzania", "and", "Za", "##ire", "." ], "ids": [ 64831, 11010, 117, 10479, 17724, 10142, 21018, 11779, 65064, 10106, 10105, 21436, 117, 17233, 10106, 10105, 11756, 12023, 21760, 10108, 19731, 112, 187, 12356, 10106, 13069, 10627, 10142, 169, 122, 118, 121, 75063, 14125, 10319, 19135, 10226, 12250, 10708, 11795, 12449, 117, 10940, 10689, 11337, 23267, 59169, 117, 22580, 10111, 14074, 11627, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 3, 7, 7, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 5, 9 ] }, { "tokens": [ "Ethiopia", "needed", "a", "penalty", "shoot", "-", "out", "in", "Addis", "Ab", "##aba", "to", "overcome", "Uganda", "after", "a", "2", "-", "2", "aggregate", "score", "##line", "." ], "ids": [ 49281, 23794, 169, 40924, 53839, 118, 10950, 10106, 83077, 15595, 18696, 10114, 105445, 29675, 10662, 169, 123, 118, 123, 75063, 17704, 12953, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "legs", "ended", "1", "-", "1", "before", "Ethiopia", "won", "the", "spot", "kick", "decide", "##r", "4", "-", "2", "." ], "ids": [ 20973, 51863, 18428, 122, 118, 122, 11360, 49281, 11367, 10105, 28504, 55321, 19068, 10129, 125, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Uganda", "'", "s", "elimination", "follows", "their", "hu", "##mil", "##iati", "##ng", "5", "-", "1", "aggregate", "defeat", "by", "Angola", "in", "June", "'", "s", "World", "Cup", "qualifying", "pre", "##limi", "##nari", "##es", "." ], "ids": [ 29675, 112, 187, 86698, 23698, 10455, 26506, 55177, 70791, 10376, 126, 118, 122, 75063, 24800, 10155, 21149, 10106, 11120, 112, 187, 10315, 11544, 43631, 12229, 89337, 60304, 10171, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "other", "preliminary", "round", "second", "leg", "match", ",", "between", "Mau", "##rita", "##nia", "and", "Benin", "in", "Nou", "##ak", "##cho", "##tt", ",", "was", "post", "##pone", "##d", "until", "Friday", "." ], "ids": [ 10117, 10684, 68097, 13569, 11132, 33810, 12356, 117, 10948, 103722, 27821, 11335, 10111, 64027, 10106, 49767, 10710, 16575, 11527, 117, 10134, 11841, 35741, 10162, 11444, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Benin", "won", "the", "first", "leg", "4", "-", "1", "." ], "ids": [ 64027, 11367, 10105, 10422, 33810, 125, 118, 122, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "AF", "##RI", "##CA", "##N", "NA", "##TION", "##S", "C", "##UP", "CO", "##LL", "##AT", "##ED", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 55640, 46876, 46900, 11537, 56586, 98207, 10731, 140, 57487, 32992, 82834, 32071, 33809, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "26" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Coll", "##ated", "results", "of", "African", "Nations", "Cup", "preliminary", "round", ",", "second", "leg", "matches", "played", "at", "the", "weekend", ":" ], "ids": [ 65689, 22525, 17466, 10108, 13839, 15145, 11544, 68097, 13569, 117, 11132, 33810, 18258, 11553, 10160, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ethiopia", "1", "Uganda", "1" ], "ids": [ 49281, 122, 29675, 122 ], "entity": [ "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 1, 9 ] }, { "tokens": [ "2", "-", "2", "on", "aggregate", "." ], "ids": [ 123, 118, 123, 10135, 75063, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ethiopia", "win", "4", "-", "2", "on", "penal", "##ties" ], "ids": [ 49281, 14125, 125, 118, 123, 10135, 69270, 14197 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mau", "##rita", "##nia", "v", "Benin", "post", "##pone", "##d", "to", "Friday" ], "ids": [ 103722, 27821, 11335, 190, 64027, 11841, 35741, 10162, 10114, 30767 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Benin", "lead", "4", "-", "1", "from", "the", "first", "leg" ], "ids": [ 64027, 14107, 125, 118, 122, 10188, 10105, 10422, 33810 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Namibia", "6", "Botswana", "0" ], "ids": [ 46670, 127, 41424, 121 ], "entity": [ "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 1, 9 ] }, { "tokens": [ "Namibia", "win", "6", "-", "0", "on", "aggregate" ], "ids": [ 46670, 14125, 127, 118, 121, 10135, 75063 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Seychelles", "1", "Mauritius", "1" ], "ids": [ 102843, 122, 57036, 122 ], "entity": [ "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 1, 9 ] }, { "tokens": [ "Mauritius", "win", "2", "-", "1", "on", "aggregate" ], "ids": [ 57036, 14125, 123, 118, 122, 10135, 75063 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Togo", "1", "Congo", "0" ], "ids": [ 56492, 122, 20633, 121 ], "entity": [ "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 1, 9 ] }, { "tokens": [ "Togo", "win", "1", "-", "0", "on", "ag", "##gre", "##gae", "##te" ], "ids": [ 56492, 14125, 122, 118, 121, 10135, 16942, 26095, 51727, 10216 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Central", "African", "Republic", "walk", "##over", "v", "Burundi" ], "ids": [ 11885, 13839, 13681, 33734, 16666, 190, 57824 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 1 ] }, { "tokens": [ "Winners", "progress", "to", "qualifying", "groups", "to", "start", "in", "October", "." ], "ids": [ 34686, 40316, 10114, 43631, 15647, 10114, 15148, 10106, 11212, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "UK", "##RA", "##IN", "##IA", "##N", "PR", "##EM", "##IE", "##R", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 10523, 29990, 27128, 35976, 11537, 23837, 67753, 71655, 11273, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##IE", "##V", "1996", "-", "08", "-", "26" ], "ids": [ 148, 71655, 11779, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Ukraine", "premier", "division" ], "ids": [ 33036, 10108, 19883, 11913, 13751 ], "entity": [ "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9 ] }, { "tokens": [ "matches", "played", "at", "the", "weekend", ":" ], "ids": [ 18258, 11553, 10160, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dynamo", "Kiev", "5", "Kr", "##emi", "##n", "Kr", "##emen", "##chuk", "0" ], "ids": [ 49013, 30903, 126, 17640, 32080, 10115, 17640, 60501, 78308, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Vor", "##sk", "##la", "Pol", "##tava", "2", "Ny", "##va", "Ter", "##no", "##pil", "1" ], "ids": [ 28099, 11478, 10330, 38432, 29102, 123, 11459, 10362, 65272, 10343, 30678, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Torpedo", "Za", "##por", "##iz", "##hya", "2", "Sha", "##kh", "##tar", "Donetsk", "1" ], "ids": [ 87669, 14074, 20307, 15834, 83211, 123, 106583, 48502, 12819, 97825, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Kr", "##y", "##v", "##bas", "Kr", "##y", "##vy", "R", "##ig", "1", "Kar", "##pat", "##y", "L", "##viv", "2" ], "ids": [ 17640, 10157, 10477, 21322, 17640, 10157, 15343, 155, 11142, 122, 90233, 18115, 10157, 149, 107331, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Pr", "##yka", "##rpa", "##tty", "##a", "Ivan", "##o", "-", "Frank", "##iv", "##sk", "0", "Zi", "##rka", "-", "Ni", "##bas", "Ki", "##rov", "##ohr", "##ad", "0" ], "ids": [ 106482, 31686, 82708, 30921, 10113, 15631, 10133, 118, 11872, 13883, 11478, 121, 99890, 20266, 118, 30409, 21322, 28941, 23229, 97062, 11488, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Chor", "##nom", "##ore", "##ts", "Odessa", "2", "Metal", "##urg", "Za", "##por", "##iz", "##hya", "1" ], "ids": [ 38955, 13294, 13024, 10806, 58704, 123, 18399, 51932, 14074, 20307, 15834, 83211, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "D", "##ni", "##pro", "D", "##ni", "##pro", "##pet", "##rov", "##sk", "2", "CSKA", "Kiev", "1" ], "ids": [ 141, 10342, 73099, 141, 10342, 73099, 19094, 23229, 11478, 123, 73229, 30903, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dynamo", "6", "5", "0", "1", "16", "2", "15" ], "ids": [ 49013, 127, 126, 121, 122, 10250, 123, 10208 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vor", "##sk", "##la", "6", "4", "2", "0", "11", "3", "14" ], "ids": [ 28099, 11478, 10330, 127, 125, 123, 121, 10193, 124, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "D", "##ni", "##pro", "6", "4", "1", "1", "13", "6", "13" ], "ids": [ 141, 10342, 73099, 127, 125, 122, 122, 10249, 127, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chor", "##nom", "##ore", "##ts", "6", "4", "1", "1", "11", "7", "13" ], "ids": [ 38955, 13294, 13024, 10806, 127, 125, 122, 122, 10193, 128, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##kh", "##tar", "6", "3", "2", "1", "10", "3", "11" ], "ids": [ 106583, 48502, 12819, 127, 124, 123, 122, 10150, 124, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Metal", "##urg", "6", "3", "2", "1", "9", "6", "11" ], "ids": [ 18399, 51932, 127, 124, 123, 122, 130, 127, 10193 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kar", "##pat", "##y", "6", "3", "1", "2", "9", "5", "10" ], "ids": [ 90233, 18115, 10157, 127, 124, 122, 123, 130, 126, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zi", "##rka", "-", "Ni", "##bas", "6", "3", "1", "2", "6", "8", "10" ], "ids": [ 99890, 20266, 118, 30409, 21322, 127, 124, 122, 123, 127, 129, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Torpedo", "6", "3", "1", "2", "8", "7", "10" ], "ids": [ 87669, 127, 124, 122, 123, 129, 128, 10150 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##vr", "##ia", "5", "2", "0", "3", "3", "7", "6" ], "ids": [ 14248, 74052, 10280, 126, 123, 121, 124, 124, 128, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ny", "##va", "Ter", "##no", "##pil", "6", "2", "0", "4", "4", "11", "6" ], "ids": [ 11459, 10362, 65272, 10343, 30678, 127, 123, 121, 125, 125, 10193, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CSKA", "6", "1", "1", "4", "4", "7", "4" ], "ids": [ 73229, 127, 122, 122, 125, 125, 128, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kr", "##y", "##v", "##bas", "6", "1", "1", "4", "5", "9", "4" ], "ids": [ 17640, 10157, 10477, 21322, 127, 122, 122, 125, 126, 130, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ny", "##va", "Vi", "##nny", "##ts", "##ya", "5", "0", "2", "3", "1", "7", "2" ], "ids": [ 11459, 10362, 31826, 58916, 10806, 10679, 126, 121, 123, 124, 122, 128, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pr", "##yka", "##rpa", "##tty", "##a", "6", "0", "2", "4", "4", "13", "2" ], "ids": [ 106482, 31686, 82708, 30921, 10113, 127, 121, 123, 125, 125, 10249, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kr", "##emi", "##n", "6", "0", "1", "5", "1", "14", "1" ], "ids": [ 17640, 32080, 10115, 127, 121, 122, 126, 122, 10247, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SW", "##IM", "##MI", "##NG", "-", "POP", "##O", "##V", "IN", "[UNK]", "SE", "##RI", "##O", "##US", "CO", "##ND", "##IT", "##ION", "'", "AF", "##TER", "ST", "##A", "##BB", "##ING", "." ], "ids": [ 92438, 42031, 79443, 34065, 118, 107506, 11403, 11779, 36351, 100, 23056, 46876, 11403, 32612, 32992, 58521, 37611, 52980, 112, 55640, 99552, 53317, 10738, 79281, 50183, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "26" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "double", "Olympic", "swimming", "champion", "Alexander", "Pop", "##ov", "was", "in", "a", "serious", "condition", "on", "Monday", "after", "being", "sta", "##bbed", "on", "a", "Moscow", "street", "." ], "ids": [ 13463, 15790, 17952, 53164, 17689, 12063, 17565, 11024, 10134, 10106, 169, 32342, 24713, 10135, 40714, 10662, 11223, 16527, 98091, 10135, 169, 18744, 23840, 119 ], "entity": [ "B-MISC", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 2, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "A", "doctor", "said", "it", "was", "too", "early", "to", "say", "whether", "Pop", "##ov", ",", "the", "only", "man", "to", "retain", "the", "Olympic", "50", "and", "100", "metres", "freestyle", "titles", ",", "would", "return", "to", "top", "-", "level", "sport", "." ], "ids": [ 138, 26937, 12415, 10271, 10134, 16683, 11732, 10114, 23763, 21883, 17565, 11024, 117, 10105, 10893, 10817, 10114, 76863, 10105, 17952, 10462, 10111, 10407, 16393, 77454, 26492, 117, 10894, 15079, 10114, 12364, 118, 13277, 17925, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "His", "condition", "is", "serious", ",", "\"", "said", "Rim", "##ma", "Mas", "##lova", ",", "deputy", "chief", "doctor", "of", "Hospital", "No", "31", "in", "the", "Russian", "capital", ".", "\"" ], "ids": [ 107, 11597, 24713, 10124, 32342, 117, 107, 12415, 57620, 10369, 16423, 44674, 117, 45404, 19421, 26937, 10108, 16025, 10657, 10413, 10106, 10105, 13463, 12185, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "But", "he", "is", "con", "##sci", "##ous", "and", "is", "talking", "and", "sm", "##iling", ".", "\"" ], "ids": [ 16976, 10261, 10124, 10173, 89270, 13499, 10111, 10124, 78254, 10111, 39709, 64118, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mas", "##lova", "told", "Reuters", "she", "was", "not", "an", "expert", "in", "sports", "medicine", ",", "but", "said", "it", "was", "too", "early", "to", "judge", "Pop", "##ov", "'", "s", "chances", "of", "returning", "to", "competitive", "swimming", "." ], "ids": [ 16423, 44674, 21937, 46617, 10833, 10134, 10472, 10151, 39957, 10106, 18204, 28219, 117, 10473, 12415, 10271, 10134, 16683, 11732, 10114, 31624, 17565, 11024, 112, 187, 84632, 10108, 30052, 10114, 49836, 53164, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pop", "##ov", ",", "who", "won", "gold", "in", "the", "50", "and", "100", "metres", "freestyle", "at", "the", "recent", "Atlanta", "Olympics", ",", "was", "sta", "##bbed", "in", "the", "abdomen", "late", "on", "Saturday", "after", "an", "argument", "with", "a", "group", "of", "roads", "##ide", "water", "##mel", "##on", "selle", "##rs", "in", "south", "-", "west", "Moscow", "." ], "ids": [ 17565, 11024, 117, 10479, 11367, 18128, 10106, 10105, 10462, 10111, 10407, 16393, 77454, 10160, 10105, 19037, 19600, 19185, 117, 10134, 16527, 98091, 10106, 10105, 94614, 13002, 10135, 24848, 10662, 10151, 36847, 10169, 169, 11795, 10108, 36970, 13315, 12286, 19390, 10263, 22154, 10943, 10106, 13144, 118, 13735, 18744, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Mas", "##lova", "said", "the", "wound", "had", "affected", "a", "lung", "and", "a", "ki", "##dne", "##y", "." ], "ids": [ 16423, 44674, 12415, 10105, 109205, 10374, 36276, 169, 66041, 10111, 169, 10879, 20714, 10157, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Doctor", "##s", "operated", "on", "Pop", "##ov", ",", "24", ",", "for", "three", "hours", "." ], "ids": [ 17376, 10107, 19301, 10135, 17565, 11024, 117, 10233, 117, 10142, 11003, 19573, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pop", "##ov", "told", "NTV", "television", "on", "Sunday", "he", "was", "in", "no", "danger", "and", "promised", "he", "would", "be", "back", "in", "the", "pool", "shortly", ".", "\"" ], "ids": [ 17565, 11024, 21937, 71395, 14162, 10135, 19731, 10261, 10134, 10106, 10192, 45882, 10111, 77137, 10261, 10894, 10347, 12014, 10106, 10105, 34183, 31555, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "'", "s", "no", "need", "to", "wo", "##rry", "." ], "ids": [ 11723, 112, 187, 10192, 17367, 10114, 12796, 31862, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "re", "going", "to", "be", "walking", "soon", "-", "-", "and", "swimming", ",", "\"", "he", "insisted", "che", "##er", "##fully", "from", "his", "bed", "in", "the", "intensive", "care", "unit", "." ], "ids": [ 12865, 112, 11639, 19090, 10114, 10347, 59381, 17864, 118, 118, 10111, 53164, 117, 107, 10261, 110660, 10262, 10165, 42920, 10188, 10226, 30113, 10106, 10105, 73636, 11131, 16511, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "##fa", "##x", "news", "agency", "said", "police", "had", "det", "##ained", "one", "of", "the", "attack", "##ers", "." ], "ids": [ 24362, 13369, 10686, 14424, 34649, 12415, 15034, 10374, 10349, 65804, 10464, 10108, 10105, 16342, 10901, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "the", "row", "started", "when", "Pop", "##ov", "and", "a", "group", "of", "his", "friends", "were", "returning", "from", "a", "party", "." ], "ids": [ 10377, 12415, 10105, 45006, 13457, 10841, 17565, 11024, 10111, 169, 11795, 10108, 10226, 21997, 10309, 30052, 10188, 169, 14039, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vita", "##ly", "Sm", "##irn", "##ov", ",", "president", "of", "the", "Russian", "National", "Olympic", "Committee", ",", "said", "President", "Boris", "Ye", "##lts", "##in", "had", "given", "the", "s", "##wimmer", "Russia", "'", "s", "top", "award", "for", "his", "Olympic", "performance", ".", "\"" ], "ids": [ 29650, 10454, 41922, 88725, 11024, 117, 12931, 10108, 10105, 13463, 10655, 17952, 14481, 117, 12415, 12811, 21463, 20567, 72847, 10245, 10374, 13507, 10105, 187, 87608, 14664, 112, 187, 12364, 17725, 10142, 10226, 17952, 14432, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "I", "am", "not", "a", "doctor", "but", "I", "think", "he", "is", "doing", "all", "right", ",", "\"", "said", "Sm", "##irn", "##ov", "." ], "ids": [ 146, 10392, 10472, 169, 26937, 10473, 146, 27874, 10261, 10124, 30918, 10435, 13448, 117, 107, 12415, 41922, 88725, 11024, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Sm", "##irn", "##ov", "said", "the", "Olympic", "Committee", "might", "ask", "the", "government", "to", "take", "measures", "to", "protect", "the", "country", "'", "s", "best", "athletes", ",", "some", "of", "whom", "have", "already", "chosen", "to", "live", "abroad", "for", "fear", "of", "a", "surge", "in", "crime", "in", "post", "-", "Soviet", "Russia", "." ], "ids": [ 41922, 88725, 11024, 12415, 10105, 17952, 14481, 20970, 63001, 10105, 12047, 10114, 13574, 38606, 10114, 32949, 10105, 12723, 112, 187, 12504, 57700, 117, 11152, 10108, 18104, 10529, 19034, 27997, 10114, 12962, 50901, 10142, 44929, 10108, 169, 69824, 10106, 22564, 10106, 11841, 118, 15277, 14664, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 1, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SL", "##O", "##VA", "##K", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 52671, 11403, 47172, 11733, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##AT", "##IS", "##LA", "##VA", "1996", "-", "08", "-", "26" ], "ids": [ 49351, 32071, 19088, 44376, 47172, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Slovak", "first" ], "ids": [ 33036, 10108, 78425, 10422 ], "entity": [ "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "matches", "at", "the", "weekend", ":" ], "ids": [ 13751, 41356, 18258, 10160, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "Bratislava", "0", "Slovan", "Bratislava", "2" ], "ids": [ 24362, 27576, 121, 101484, 27576, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Chem", "##lon", "Hume", "##nne", "0", "Tatra", "##n", "Pre", "##sov", "1" ], "ids": [ 26609, 15709, 64495, 15490, 121, 86102, 10115, 35248, 109154, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Art", "##media", "Petr", "##zal", "##ka", "0", "JA", "##S", "Bar", "##dej", "##ov", "0" ], "ids": [ 11397, 72841, 40986, 32145, 10371, 121, 53399, 10731, 20698, 90062, 11024, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "DA", "##C", "Duna", "##jska", "St", "##reda", "1", "Spartak", "T", "##rna", "##va", "3" ], "ids": [ 47855, 10858, 96912, 21938, 10838, 53693, 122, 59281, 157, 13471, 10362, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Du", "##kla", "Ban", "##ska", "Bystrica", "3", "FC", "Nitra", "0" ], "ids": [ 14925, 22444, 21631, 11485, 88278, 124, 11529, 105132, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "MSK", "Zi", "##lina", "0", "FC", "Ko", "##sic", "##e", "2" ], "ids": [ 39744, 99890, 21282, 121, 11529, 30186, 90439, 10112, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Petri", "##me", "##x", "Pri", "##evi", "##dza", "2", "FC", "Rim", "##av", "##ska", "So", "##bot", "##a", "0" ], "ids": [ 53110, 10627, 10686, 30797, 44082, 29958, 123, 11529, 57620, 27561, 11485, 12882, 25022, 10113, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Lok", "##omotiv", "##a", "Ko", "##sic", "##e", "2", "Ker", "##ame", "##tal", "Dub", "##nica", "0" ], "ids": [ 63998, 106912, 10113, 30186, 90439, 10112, 123, 70653, 18969, 14191, 51536, 14134, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "games", "played", ",", "won", ",", "drawn", ",", "lost", "," ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 13332, 11553, 117, 11367, 117, 34788, 117, 14172, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "goals", "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tatra", "##n", "Pre", "##sov", "4", "3", "1", "0", "5", "0", "10" ], "ids": [ 86102, 10115, 35248, 109154, 125, 124, 122, 121, 126, 121, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Du", "##kla", "Ban", "##ska", "Bystrica", "4", "3", "0", "1", "7", "2", "9" ], "ids": [ 14925, 22444, 21631, 11485, 88278, 125, 124, 121, 122, 128, 123, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Slovan", "Bratislava", "4", "3", "0", "1", "7", "2", "9" ], "ids": [ 101484, 27576, 125, 124, 121, 122, 128, 123, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Petri", "##me", "##x", "Pri", "##evi", "##dza", "4", "3", "0", "1", "4", "2", "9" ], "ids": [ 53110, 10627, 10686, 30797, 44082, 29958, 125, 124, 121, 122, 125, 123, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spartak", "T", "##rna", "##va", "4", "2", "2", "0", "10", "5", "8" ], "ids": [ 59281, 157, 13471, 10362, 125, 123, 123, 121, 10150, 126, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Ko", "##sic", "##e", "4", "2", "2", "0", "6", "3", "8" ], "ids": [ 11529, 30186, 90439, 10112, 125, 123, 123, 121, 127, 124, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Art", "##media", "Petr", "##zal", "##ka", "4", "1", "3", "0", "1", "0", "6" ], "ids": [ 11397, 72841, 40986, 32145, 10371, 125, 122, 124, 121, 122, 121, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DA", "##C", "Duna", "##jska", "St", "##reda", "4", "2", "0", "2", "5", "6", "6" ], "ids": [ 47855, 10858, 96912, 21938, 10838, 53693, 125, 123, 121, 123, 126, 127, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Rim", "##av", "##ska", "So", "##bot", "##a", "4", "2", "0", "2", "4", "5", "6" ], "ids": [ 11529, 57620, 27561, 11485, 12882, 25022, 10113, 125, 123, 121, 123, 125, 126, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "JA", "##S", "Bar", "##dej", "##ov", "4", "1", "2", "1", "2", "2", "5" ], "ids": [ 53399, 10731, 20698, 90062, 11024, 125, 122, 123, 122, 123, 123, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chem", "##lon", "Hume", "##nne", "4", "1", "1", "2", "1", "2", "4" ], "ids": [ 26609, 15709, 64495, 15490, 125, 122, 122, 123, 122, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "Bratislava", "4", "1", "1", "2", "4", "6", "4" ], "ids": [ 24362, 27576, 125, 122, 122, 123, 125, 127, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lok", "##omotiv", "##a", "Ko", "##sic", "##e", "4", "1", "1", "2", "3", "5", "4" ], "ids": [ 63998, 106912, 10113, 30186, 90439, 10112, 125, 122, 122, 123, 124, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ker", "##ame", "##tal", "Dub", "##nica", "4", "0", "1", "3", "3", "9", "1" ], "ids": [ 70653, 18969, 14191, 51536, 14134, 125, 121, 122, 124, 124, 130, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Nitra", "4", "0", "0", "4", "1", "8", "0" ], "ids": [ 11529, 105132, 125, 121, 121, 125, 122, 129, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MSK", "Zi", "##lina", "4", "0", "0", "4", "0", "6", "0" ], "ids": [ 39744, 99890, 21282, 125, 121, 121, 125, 121, 127, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "H", "##UN", "##GA", "##R", "##Y", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 145, 69849, 39061, 11273, 14703, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UD", "##AP", "##ES", "##T", "1996", "-", "08", "-", "26" ], "ids": [ 139, 86888, 38423, 25054, 11090, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hungarian", "first", "division" ], "ids": [ 24364, 10422, 13751 ], "entity": [ "B-MISC", "O", "O" ], "entity_ids": [ 2, 9, 9 ] }, { "tokens": [ "soccer", "results", "and", "standing", "##s", "from", "weekend", "and", "bank", "holiday", ":" ], "ids": [ 41356, 17466, 10111, 32173, 10107, 10188, 43440, 10111, 19423, 71806, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stad", "##ler", "0", "Hala", "##das", "0" ], "ids": [ 36841, 10815, 121, 58892, 11205, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "MT", "##K", "3", "Ferenc", "##varo", "##s", "0" ], "ids": [ 74649, 11733, 124, 24932, 77640, 10107, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Be", "##kes", "##cs", "##aba", "0", "BV", "##SC", "1" ], "ids": [ 14321, 21885, 13331, 18696, 121, 105786, 36175, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "C", "##se", "##pel", "1", "Video", "##ton", "(", "*", ")", "1" ], "ids": [ 140, 10341, 17703, 122, 14994, 11183, 113, 115, 114, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Z", "##TE", "1", "Debrecen", "5" ], "ids": [ 163, 29833, 122, 101881, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Si", "##of", "##ok", "0", "U", "##j", "##pest", "2" ], "ids": [ 11741, 20324, 11140, 121, 158, 10418, 60737, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Va", "##c", "0", "Vasa", "##s", "1" ], "ids": [ 14723, 10350, 121, 79215, 10107, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Kis", "##pest", "3", "Pe", "##cs", "1" ], "ids": [ 82441, 60737, 124, 29005, 13331, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "U", "##j", "##pest", "T", "##E", "3", "3", "-", "-", "10", "2", "9" ], "ids": [ 122, 119, 158, 10418, 60737, 157, 11259, 124, 124, 118, 118, 10150, 123, 130 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "MT", "##K", "3", "3", "-", "-", "7", "1", "9" ], "ids": [ 123, 119, 74649, 11733, 124, 124, 118, 118, 128, 122, 130 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "BV", "##SC", "3", "2", "1", "-", "6", "2", "7" ], "ids": [ 124, 119, 105786, 36175, 124, 123, 122, 118, 127, 123, 128 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Debrecen", "3", "2", "-", "1", "10", "4", "6" ], "ids": [ 125, 119, 101881, 124, 123, 118, 122, 10150, 125, 127 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Be", "##kes", "##cs", "##aba", "3", "2", "-", "1", "6", "2", "6" ], "ids": [ 126, 119, 14321, 21885, 13331, 18696, 124, 123, 118, 122, 127, 123, 127 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "F", "##TC", "3", "2", "-", "1", "8", "7", "6" ], "ids": [ 127, 119, 143, 55671, 124, 123, 118, 122, 129, 128, 127 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Hala", "##das", "3", "1", "2", "-", "2", "1", "5" ], "ids": [ 128, 119, 58892, 11205, 124, 122, 123, 118, 123, 122, 126 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Video", "##ton", "3", "1", "1", "1", "7", "5", "4" ], "ids": [ 129, 119, 14994, 11183, 124, 122, 122, 122, 128, 126, 125 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Vasa", "##s", "3", "1", "1", "1", "3", "3", "4" ], "ids": [ 130, 119, 79215, 10107, 124, 122, 122, 122, 124, 124, 125 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Kis", "##pest", "3", "1", "1", "1", "6", "7", "4" ], "ids": [ 10150, 119, 82441, 60737, 124, 122, 122, 122, 127, 128, 125 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "11", ".", "G", "##yor", "3", "1", "1", "1", "3", "5", "4" ], "ids": [ 10193, 119, 144, 26101, 124, 122, 122, 122, 124, 126, 125 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "12", ".", "C", "##se", "##pel", "3", "-", "3", "-", "3", "3", "3" ], "ids": [ 10186, 119, 140, 10341, 17703, 124, 118, 124, 118, 124, 124, 124 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "13", ".", "Pe", "##cs", "3", "1", "-", "2", "3", "5", "3" ], "ids": [ 10249, 119, 29005, 13331, 124, 122, 118, 123, 124, 126, 124 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "14", ".", "Z", "##TE", "3", "1", "-", "2", "3", "10", "3" ], "ids": [ 10247, 119, 163, 29833, 124, 122, 118, 123, 124, 10150, 124 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", ".", "Stad", "##ler", "FC", "3", "-", "1", "2", "2", "6", "1" ], "ids": [ 10208, 119, 36841, 10815, 11529, 124, 118, 122, 123, 123, 127, 122 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "16", ".", "III", ".", "ker", ".", "TV", "##E", "3", "-", "1", "2", "2", "7", "1" ], "ids": [ 10250, 119, 10652, 119, 53628, 119, 10813, 11259, 124, 118, 122, 123, 123, 128, 122 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "17", ".", "Si", "##of", "##ok", "3", "-", "-", "3", "2", "7", "0" ], "ids": [ 10273, 119, 11741, 20324, 11140, 124, 118, 118, 124, 123, 128, 121 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "18", ".", "Va", "##c", "3", "-", "-", "3", "2", "8", "0" ], "ids": [ 10218, 119, 14723, 10350, 124, 118, 118, 124, 123, 129, 121 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Name", "of", "Parma", "##lat", "/", "Fe", "##her", "##var", "FC", "has", "been", "changed", "to", "Video", "##ton", "." ], "ids": [ 115, 15729, 10108, 29157, 16698, 120, 20187, 14206, 16648, 11529, 10393, 10590, 17695, 10114, 14994, 11183, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "-", "-", "Budapest", "news", "##room", ",", "+", "361", "266", "241", "##0" ], "ids": [ 118, 118, 14745, 14424, 25525, 117, 116, 35737, 28477, 23536, 10929 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "C", "##Z", "##EC", "##H", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 140, 13966, 35826, 12396, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##AG", "##UE", "1996", "-", "08", "-", "26" ], "ids": [ 23837, 109865, 62674, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "the", "Czech", "Republic", "'", "s" ], "ids": [ 33036, 10108, 10105, 22148, 13681, 112, 187 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "first", "division", "soccer", "matches", "at", "the", "weekend", ":" ], "ids": [ 10422, 13751, 41356, 18258, 10160, 10105, 43440, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Petra", "Dr", "##novi", "##ce", "1", "Slovan", "Liberec", "3" ], "ids": [ 27357, 11612, 55080, 10419, 122, 101484, 94042, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "SK", "Slavia", "Praha", "3", "SK", "Ces", "##ke", "Bud", "##ejo", "##vice", "0" ], "ids": [ 21275, 93454, 17410, 124, 21275, 17340, 10550, 63623, 40841, 30997, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "FK", "Ja", "##blo", "##nec", "3", "Viktoria", "Zi", "##zko", "##v", "1" ], "ids": [ 22806, 28248, 71933, 54881, 124, 79796, 99890, 28978, 10477, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Ban", "##ik", "Ostrava", "3", "FK", "Te", "##plice", "1" ], "ids": [ 21631, 10896, 80280, 124, 22806, 21452, 62631, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Bob", "##y", "Brno", "1", "Sigma", "Olomouc", "0" ], "ids": [ 13583, 10157, 33862, 122, 60548, 71226, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "FC", "Bohemia", "##ns", "0", "FC", "Kar", "##vina", "2" ], "ids": [ 11529, 53238, 10891, 121, 11529, 90233, 22179, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "SK", "Hradec", "Kral", "##ove", "0", "Ka", "##uc", "##uk", "Op", "##ava", "0" ], "ids": [ 21275, 70710, 86844, 21175, 121, 25444, 43805, 13013, 12160, 15181, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Playing", "Monday", ":", "Viktoria", "Pl", "##zen", "v", "AC", "Sparta", "Praha" ], "ids": [ 75726, 40714, 131, 79796, 48932, 11985, 190, 18132, 36354, 17410 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 3, 7, 7 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "games", "played", ",", "won", ",", "drawn", ",", "lost", "," ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 13332, 11553, 117, 11367, 117, 34788, 117, 14172, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "goals", "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 18173, 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bob", "##y", "Brno", "3", "3", "0", "0", "5", "2", "9" ], "ids": [ 13583, 10157, 33862, 124, 124, 121, 121, 126, 123, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ban", "##ik", "Ostrava", "3", "2", "0", "1", "7", "3", "6" ], "ids": [ 21631, 10896, 80280, 124, 123, 121, 122, 128, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FK", "Ja", "##blo", "##nec", "3", "2", "0", "1", "5", "2", "6" ], "ids": [ 22806, 28248, 71933, 54881, 124, 123, 121, 122, 126, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SK", "Slavia", "Praha", "3", "1", "2", "0", "6", "3", "5" ], "ids": [ 21275, 93454, 17410, 124, 122, 123, 121, 127, 124, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ka", "##uc", "##uk", "Op", "##ava", "3", "1", "2", "0", "2", "1", "5" ], "ids": [ 25444, 43805, 13013, 12160, 15181, 124, 122, 123, 121, 123, 122, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sigma", "Olomouc", "3", "1", "1", "1", "6", "3", "4" ], "ids": [ 60548, 71226, 124, 122, 122, 122, 127, 124, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Petra", "Dr", "##novi", "##ce", "3", "1", "1", "1", "7", "5", "4" ], "ids": [ 27357, 11612, 55080, 10419, 124, 122, 122, 122, 128, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Slovan", "Liberec", "3", "1", "1", "1", "5", "4", "4" ], "ids": [ 101484, 94042, 124, 122, 122, 122, 126, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FK", "Te", "##plice", "3", "1", "1", "1", "3", "4", "4" ], "ids": [ 22806, 21452, 62631, 124, 122, 122, 122, 124, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Kar", "##vina", "3", "1", "1", "1", "3", "5", "4" ], "ids": [ 11529, 90233, 22179, 124, 122, 122, 122, 124, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SK", "Ces", "##ke", "Bud", "##ejo", "##vice", "3", "1", "1", "1", "3", "5", "4" ], "ids": [ 21275, 17340, 10550, 63623, 40841, 30997, 124, 122, 122, 122, 124, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Viktoria", "Pl", "##zen", "2", "0", "2", "0", "2", "2", "2" ], "ids": [ 79796, 48932, 11985, 123, 121, 123, 121, 123, 123, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AC", "Sparta", "Praha", "2", "0", "1", "1", "3", "4", "1" ], "ids": [ 18132, 36354, 17410, 123, 121, 122, 122, 124, 125, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Bohemia", "##ns", "3", "0", "1", "2", "1", "4", "1" ], "ids": [ 11529, 53238, 10891, 124, 121, 122, 123, 122, 125, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Viktoria", "Zi", "##zko", "##v", "3", "0", "1", "2", "3", "8", "1" ], "ids": [ 79796, 99890, 28978, 10477, 124, 121, 122, 123, 124, 129, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SK", "Hradec", "Kral", "##ove", "3", "0", "1", "2", "1", "7", "1" ], "ids": [ 21275, 70710, 86844, 21175, 124, 121, 122, 123, 122, 128, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "ME", "##X", "##IC", "##AN", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 47430, 12674, 30889, 41275, 39774, 36535, 11127, 52980, 64091, 30331, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##X", "##IC", "##O", "C", "##IT", "##Y", "1996", "-", "08", "-", "26" ], "ids": [ 47430, 12674, 30889, 11403, 140, 37611, 14703, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "weekend", "matches" ], "ids": [ 33036, 10108, 43440, 18258 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "in", "the", "Mexican", "soccer", "championship", ":" ], "ids": [ 10106, 10105, 15323, 41356, 20755, 131 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "At", "##lante", "1", "Atlas", "1" ], "ids": [ 11699, 70416, 122, 12285, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Cruz", "Azul", "2", "Leon", "2" ], "ids": [ 14435, 47158, 123, 19409, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Guadalajara", "5", "America", "0" ], "ids": [ 39346, 126, 11440, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Monterrey", "2", "Veracruz", "1" ], "ids": [ 66936, 123, 35832, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Pac", "##hu", "##ca", "3", "Tol", "##uca", "0" ], "ids": [ 82376, 13723, 10425, 124, 91845, 26540, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Puebla", "2", "UNAM", "1" ], "ids": [ 38958, 123, 102272, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Santos", "2", "More", "##lia", "1" ], "ids": [ 17223, 123, 15946, 13217, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "UA", "##G", "1", "Ne", "##za", "2" ], "ids": [ 20138, 11447, 122, 19416, 10637, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")" ], "ids": [ 10142, 117, 11327, 117, 12789, 114 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Group", "1" ], "ids": [ 12054, 122 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Puebla", "3", "3", "0", "0", "7", "2", "9" ], "ids": [ 38958, 124, 124, 121, 121, 128, 123, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cruz", "Azul", "3", "2", "1", "0", "7", "3", "7" ], "ids": [ 14435, 47158, 124, 123, 122, 121, 128, 124, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##lante", "3", "2", "1", "0", "6", "2", "7" ], "ids": [ 11699, 70416, 124, 123, 122, 121, 127, 123, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ne", "##za", "3", "1", "0", "2", "2", "7", "3" ], "ids": [ 19416, 10637, 124, 122, 121, 123, 123, 128, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Veracruz", "3", "0", "1", "2", "2", "6", "1" ], "ids": [ 35832, 124, 121, 122, 123, 123, 127, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Group", "2" ], "ids": [ 12054, 123 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Ne", "##ca", "##xa", "3", "1", "1", "1", "6", "4", "4" ], "ids": [ 19416, 10425, 14220, 124, 122, 122, 122, 127, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pac", "##hu", "##ca", "3", "1", "1", "1", "6", "7", "4" ], "ids": [ 82376, 13723, 10425, 124, 122, 122, 122, 127, 128, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leon", "3", "0", "3", "0", "3", "3", "3" ], "ids": [ 19409, 124, 121, 124, 121, 124, 124, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "America", "3", "1", "0", "2", "5", "7", "3" ], "ids": [ 11440, 124, 122, 121, 123, 126, 128, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "##lia", "3", "0", "1", "2", "3", "8", "1" ], "ids": [ 15946, 13217, 124, 121, 122, 123, 124, 129, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Group", "3" ], "ids": [ 12054, 124 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Atlas", "3", "2", "1", "0", "7", "2", "7" ], "ids": [ 12285, 124, 123, 122, 121, 128, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Guadalajara", "3", "2", "1", "0", "7", "0", "7" ], "ids": [ 39346, 124, 123, 122, 121, 128, 121, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tol", "##uca", "3", "1", "0", "2", "6", "5", "3" ], "ids": [ 91845, 26540, 124, 122, 121, 123, 127, 126, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "UNAM", "3", "0", "0", "3", "2", "6", "0" ], "ids": [ 102272, 124, 121, 121, 124, 123, 127, 121 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Group", "4" ], "ids": [ 12054, 125 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Santos", "3", "3", "0", "0", "4", "1", "9" ], "ids": [ 17223, 124, 124, 121, 121, 125, 122, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Monterrey", "4", "1", "1", "2", "2", "5", "4" ], "ids": [ 66936, 125, 122, 122, 123, 123, 126, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cela", "##ya", "2", "0", "2", "0", "1", "1", "2" ], "ids": [ 42742, 10679, 123, 121, 123, 121, 122, 122, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "UA", "##G", "3", "0", "0", "3", "1", "8", "0" ], "ids": [ 20138, 11447, 124, 121, 121, 124, 122, 129, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "PL", "##A", "##Y", "##ER", "##S", "LE", "##AV", "##E", "MA", "##TC", "##H", "EA", "##R", "##L", "##Y", "TO", "CA", "##TC", "##H", "PL", "##AN", "##E", "." ], "ids": [ 71020, 65622, 24093, 118, 71341, 10738, 14703, 24093, 10731, 84977, 99903, 11259, 27277, 55671, 12396, 38478, 11273, 11369, 14703, 58573, 24707, 55671, 12396, 71341, 41275, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brian", "Home", "##wood" ], "ids": [ 13977, 13898, 14759 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "RI", "##O", "DE", "JA", "##NE", "##IR", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 56658, 11403, 25067, 53399, 93280, 73522, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "key", "players", "left", "a", "Brazilian", "championship", "match", "early", "on", "Sunday", "because", "they", "had", "to", "catch", "a", "plane", "to", "Russia", "to", "play", "with", "the", "national", "team", "." ], "ids": [ 13214, 18444, 16021, 12153, 169, 32818, 20755, 12356, 11732, 10135, 19731, 12373, 10689, 10374, 10114, 61093, 169, 35007, 10114, 14664, 10114, 12253, 10169, 10105, 11844, 11121, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sao", "Paulo", "midfielder", "Andre", "and", "Santos", "defender", "Na", "##rci", "##so", "were", "both", "substitute", "##d", "during", "their", "teams", "'", "game", ",", "taken", "to", "Sao", "Paulo", "airport", "and", "flow", "##n", "to", "Rio", "de", "Janeiro", "in", "a", "private", "jet", "charter", "##ed", "by", "the", "Brazilian", "Football", "Confederation", "(", "CB", "##F", ")", "." ], "ids": [ 51645, 13360, 68049, 25188, 10111, 17223, 36426, 10685, 43774, 11669, 10309, 11408, 58808, 10162, 10939, 10455, 14404, 112, 11661, 117, 15109, 10114, 51645, 13360, 28460, 10111, 30676, 10115, 10114, 12109, 10104, 14822, 10106, 169, 14591, 48504, 49725, 10336, 10155, 10105, 32818, 12499, 85398, 113, 59791, 11565, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 3, 7, 9, 4, 9, 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 2, 6, 9, 9 ] }, { "tokens": [ "At", "Rio", ",", "they", "joined", "up", "with", "the", "national", "team", "squad", "for", "the", "journey", "to", "Moscow", ",", "where", "Brazil", "will", "face", "Russia", "in", "a", "friendly", "international", "on", "Wednesday", "." ], "ids": [ 11699, 12109, 117, 10689, 13914, 10741, 10169, 10105, 11844, 11121, 30580, 10142, 10105, 43610, 10114, 18744, 117, 10940, 16765, 11337, 13295, 14664, 10106, 169, 43941, 12533, 10135, 57611, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "problem", "arose", "because", "the", "Sao", "Paulo", "-", "Santos", "c", "##lash", "was", "selected", "as", "the", "day", "'", "s", "tele", "##vised", "live", "match", ",", "forcing", "it", "to", "be", "put", "back", "three", "hours", "from", "the", "usual", "kick", "##off", "time", "." ], "ids": [ 10117, 18077, 99736, 12373, 10105, 51645, 13360, 118, 17223, 171, 25297, 10134, 19546, 10146, 10105, 11940, 112, 187, 56142, 46836, 12962, 12356, 117, 75098, 10271, 10114, 10347, 14499, 12014, 11003, 19573, 10188, 10105, 49176, 55321, 20584, 10635, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Santos", "suffered", "more", "from", "their", "loss", "as", "Na", "##rci", "##so", "'", "s", "replacement", "Jean", "gave", "away", "a", "penalty", "from", "which", "Sao", "Paulo", "scored", "the", "de", "##cisive", "goal", "in", "a", "2", "-", "1", "win", "." ], "ids": [ 17223, 26090, 10798, 10188, 10455, 18576, 10146, 10685, 43774, 11669, 112, 187, 41636, 10766, 15362, 14942, 169, 40924, 10188, 10319, 51645, 13360, 17233, 10105, 10104, 79533, 16586, 10106, 169, 123, 118, 122, 14125, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sao", "Paulo", "lead", "the", "first", "stage", "of", "the", "championship", "on", "goal", "difference", "from", "surprise", "package", "Juventud", "##e", ",", "who", "beat", "Internacional", "2", "-", "1", "." ], "ids": [ 51645, 13360, 14107, 10105, 10422, 15365, 10108, 10105, 20755, 10135, 16586, 30856, 10188, 48886, 62432, 99284, 10112, 117, 10479, 27868, 15111, 123, 118, 122, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Corinthians", ",", "who", "played", "in", "a", "tournament", "in", "Spain", "last", "week", ",", "also", "faced", "a", "plane", "marathon", "as", "they", "attempted", "to", "keep", "up", "with", "a", "he", "##ctic", "fi", "##xt", "##ure", "list", "." ], "ids": [ 74615, 117, 10479, 11553, 10106, 169, 17390, 10106, 16149, 12469, 16118, 117, 10379, 31952, 169, 35007, 45068, 10146, 10689, 30881, 10114, 23819, 10741, 10169, 169, 10261, 35672, 14045, 28883, 12101, 13416, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "were", "due", "to", "leave", "Spain", "Monday", "night", ",", "arrive", "in", "Sao", "Paulo", "on", "Tuesday", "morning", ",", "catch", "another", "plane", "to", "the", "southern", "city", "of", "Curitiba", "one", "hour", "later", "and", "then", "play", "away", "to", "At", "##leti", "##co", "Para", "##nae", "##nse", "in", "the", "Brazilian", "championship", "the", "same", "evening", "." ], "ids": [ 11696, 10309, 10850, 10114, 21964, 16149, 40714, 16903, 117, 27814, 10106, 51645, 13360, 10135, 70245, 28757, 117, 61093, 12864, 35007, 10114, 10105, 17156, 11584, 10108, 90241, 10464, 24730, 10873, 10111, 11059, 12253, 14942, 10114, 11699, 42136, 10812, 13497, 25589, 19051, 10106, 10105, 32818, 20755, 10105, 11561, 42135, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Botafogo", "striker", "Tu", "##lio", ",", "who", "was", "over", "##lo", "##oked", "by", "Za", "##gal", "##o", "for", "the", "tour", "which", "also", "features", "a", "game", "away", "to", "the", "Netherlands", "on", "Sunday", ",", "scored", "his", "third", "goal", "in", "three", "games", "as", "the", "defending", "champions", "beat", "Bahia", "2", "-", "1", "away", "." ], "ids": [ 99954, 103325, 20108, 14497, 117, 10479, 10134, 10491, 10715, 76792, 10155, 14074, 17026, 10133, 10142, 10105, 12842, 10319, 10379, 15374, 169, 11661, 14942, 10114, 10105, 22043, 10135, 19731, 117, 17233, 10226, 12628, 16586, 10106, 11003, 13332, 10146, 10105, 53730, 27745, 27868, 34566, 123, 118, 122, 14942, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tu", "##lio", ",", "who", "has", "been", "top", "-", "scorer", "in", "the", "competition", "for", "the", "last", "two", "seasons", ",", "has", "been", "str", "##uggling", "against", "injury", "for", "most", "of", "this", "year", "." ], "ids": [ 20108, 14497, 117, 10479, 10393, 10590, 12364, 118, 99782, 10106, 10105, 16622, 10142, 10105, 12469, 10551, 21396, 117, 10393, 10590, 17791, 85808, 11327, 27443, 10142, 10992, 10108, 10531, 10924, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "AR", "##GE", "##NT", "##INE", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 50884, 58719, 77261, 83198, 39774, 36535, 11127, 52980, 64091, 30331, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UE", "##NO", "##S", "AI", "##RE", "##S", "1996", "-", "08", "-", "26" ], "ids": [ 139, 62674, 67292, 10731, 62405, 66014, 10731, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "matches", "on", "the" ], "ids": [ 33036, 10108, 18258, 10135, 10105 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "opening", "weekend", "of", "the", "Argentine", "Apertura", "championship", ":" ], "ids": [ 17975, 43440, 10108, 10105, 31469, 54224, 20755, 131 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Estudiantes", "2", "Boca", "Juniors", "3" ], "ids": [ 87386, 123, 39527, 51756, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Ferro", "Carr", "##il", "Oeste", "0", "Independiente", "3" ], "ids": [ 49139, 45332, 11030, 36392, 121, 63937, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "G", "##im", "##nas", "##ia", "-", "Ju", "##ju", "##y", "1", "Plate", "##nse", "0" ], "ids": [ 144, 11759, 13996, 10280, 118, 45031, 10761, 10157, 122, 47872, 19051, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Hu", "##raca", "##n", "0", "Lan", "##us", "0" ], "ids": [ 43707, 59666, 10115, 121, 19670, 10251, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Hu", "##raca", "##n", "-", "Corrientes", "3", "Union", "6" ], "ids": [ 43707, 59666, 10115, 118, 110514, 124, 11457, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Newell", "'", "s", "Old", "Boys", "0", "Ve", "##lez", "Sar", "##sfield", "2" ], "ids": [ 97829, 112, 187, 13773, 16432, 121, 19561, 76969, 64696, 53495, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Racing", "Club", "0", "Rosario", "Central", "2" ], "ids": [ 18432, 11316, 121, 26489, 11885, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "River", "Plate", "0", "G", "##im", "##nas", "##ia", "-", "La", "Plata", "0" ], "ids": [ 11575, 47872, 121, 144, 11759, 13996, 10280, 118, 10159, 24550, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "San", "Lorenzo", "0", "Ban", "##field", "1" ], "ids": [ 10469, 18782, 121, 21631, 13408, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Playing", "Monday", ":", "Deportivo", "Es", "##pan", "##ol", "v", "Colo", "##n" ], "ids": [ 75726, 40714, 131, 28040, 10912, 15119, 11481, 190, 75473, 10115 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 9, 3, 7 ] }, { "tokens": [ "Note", ":", "the", "Apertura", "is", "the", "first", "of", "two", "championships", "played" ], "ids": [ 20231, 131, 10105, 54224, 10124, 10105, 10422, 10108, 10551, 47211, 11553 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "in", "the", "Argentine", "season", "." ], "ids": [ 10106, 10105, 31469, 11226, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "teams", "meet", "each", "other", "once", "in", "each" ], "ids": [ 10117, 14404, 23267, 11948, 10684, 14907, 10106, 11948 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "tournament", "." ], "ids": [ 17390, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "There", "is", "no", "overall", "champion", "." ], "ids": [ 11723, 10124, 10192, 20947, 17689, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "H", "##ON", "##D", "##UR", "##AS", "BE", "##AT", "C", "##UB", "##A", "4", "-", "0", "IN", "FR", "##IE", "##ND", "##L", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 145, 30118, 11490, 98348, 38025, 46291, 32071, 140, 82439, 10738, 125, 118, 121, 36351, 64655, 71655, 58521, 11369, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EG", "##UC", "##IG", "##AL", "##PA", "1996", "-", "08", "-", "26" ], "ids": [ 157, 104036, 93089, 89696, 32002, 52099, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Honduras", "beat", "Cuba", "4", "-", "0" ], "ids": [ 27040, 27868, 17226, 125, 118, 121 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9 ] }, { "tokens": [ "(", "half", "##time", "3", "-", "0", ")", "in", "a", "friendly", "soccer", "international", "on", "Sunday", "." ], "ids": [ 113, 13877, 18086, 124, 118, 121, 114, 10106, 169, 43941, 41356, 12533, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":", "Juan", "Castro", "(", "3rd", "minute", ")", ",", "Enrique", "Cent", "##eno", "(", "33", "##rd", "and" ], "ids": [ 66875, 10943, 131, 11686, 18759, 113, 16800, 21760, 114, 117, 14442, 52013, 16818, 113, 11000, 12023, 10111 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "84", "##th", ")", ",", "Carlos", "Pa", "##von", "(", "37", "##th", ")" ], "ids": [ 11761, 11143, 114, 117, 12050, 26907, 28201, 113, 11204, 11143, 114 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "BR", "##A", "##Z", "##IL", "##IA", "##N", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 49351, 10738, 13966, 38850, 35976, 11537, 39774, 36535, 11127, 52980, 64091, 30331, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RI", "##O", "DE", "JA", "##NE", "##IR", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 56658, 11403, 25067, 53399, 93280, 73522, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Brazilian" ], "ids": [ 33036, 10108, 32818 ], "entity": [ "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 2 ] }, { "tokens": [ "soccer", "championship", "matches", "played", "at", "the", "weekend", "." ], "ids": [ 41356, 20755, 18258, 11553, 10160, 10105, 43440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bahia", "1", "Botafogo", "2" ], "ids": [ 34566, 122, 99954, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Braga", "##ntino", "1", "Vasco", "da", "Gama", "2" ], "ids": [ 55045, 44878, 122, 31402, 10143, 55829, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "C", "##ricu", "##ma", "4", "Fluminense", "1" ], "ids": [ 140, 83696, 10369, 125, 84707, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Cruzeiro", "2", "Flamengo", "1" ], "ids": [ 89539, 123, 77383, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Go", "##ias", "0", "Palmeiras", "0" ], "ids": [ 14439, 15465, 121, 95567, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "G", "##rem", "##io", "2", "Vitoria", "2" ], "ids": [ 144, 19786, 10638, 123, 88838, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Juventud", "##e", "2", "Internacional", "1" ], "ids": [ 99284, 10112, 123, 15111, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Para", "##na", "3", "G", "##uara", "##ni", "0" ], "ids": [ 13497, 10219, 124, 144, 66567, 10342, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Portuguesa", "3", "At", "##leti", "##co", "Mineiro", "1" ], "ids": [ 52788, 124, 11699, 42136, 10812, 102945, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Sao", "Paulo", "2", "Santos", "1" ], "ids": [ 51645, 13360, 123, 17223, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Sport", "Recife", "3", "Cor", "##iti", "##ba", "0" ], "ids": [ 15062, 75526, 124, 93495, 13903, 10537, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sao", "Paulo", "4", "3", "1", "0", "10", "5", "10" ], "ids": [ 51645, 13360, 125, 124, 122, 121, 10150, 126, 10150 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Juventud", "##e", "5", "3", "1", "1", "5", "4", "10" ], "ids": [ 99284, 10112, 126, 124, 122, 122, 126, 125, 10150 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portuguesa", "4", "3", "0", "1", "8", "3", "9" ], "ids": [ 52788, 125, 124, 121, 122, 129, 124, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palmeiras", "5", "2", "3", "0", "8", "1", "9" ], "ids": [ 95567, 126, 123, 124, 121, 129, 122, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Go", "##ias", "5", "2", "2", "1", "7", "4", "8" ], "ids": [ 14439, 15465, 126, 123, 123, 122, 128, 125, 129 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##rem", "##io", "3", "2", "1", "0", "11", "4", "7" ], "ids": [ 144, 19786, 10638, 124, 123, 122, 121, 10193, 125, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cruzeiro", "3", "2", "1", "0", "4", "2", "7" ], "ids": [ 89539, 124, 123, 122, 121, 125, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sport", "Recife", "5", "2", "1", "2", "7", "6", "7" ], "ids": [ 15062, 75526, 126, 123, 122, 123, 128, 127, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Para", "##na", "4", "2", "1", "2", "5", "5", "7" ], "ids": [ 13497, 10219, 125, 123, 122, 123, 126, 126, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Flamengo", "4", "2", "0", "2", "4", "4", "6" ], "ids": [ 77383, 125, 123, 121, 123, 125, 125, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##leti", "##co", "Mineiro", "5", "2", "0", "3", "6", "7", "6" ], "ids": [ 11699, 42136, 10812, 102945, 126, 123, 121, 124, 127, 128, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vasco", "da", "Gama", "4", "2", "0", "2", "6", "7", "6" ], "ids": [ 31402, 10143, 55829, 125, 123, 121, 123, 127, 128, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cor", "##iti", "##ba", "5", "2", "0", "3", "3", "9", "6" ], "ids": [ 93495, 13903, 10537, 126, 123, 121, 124, 124, 130, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Botafogo", "3", "1", "2", "0", "4", "3", "5" ], "ids": [ 99954, 124, 122, 123, 121, 125, 124, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Internacional", "4", "1", "2", "1", "4", "3", "5" ], "ids": [ 15111, 125, 122, 123, 122, 125, 124, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##rici", "##uma", "5", "1", "2", "2", "7", "8", "5" ], "ids": [ 140, 30558, 16746, 126, 122, 123, 123, 128, 129, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vitoria", "5", "1", "2", "2", "5", "6", "5" ], "ids": [ 88838, 126, 122, 123, 123, 126, 127, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Santos", "3", "1", "1", "1", "3", "3", "4" ], "ids": [ 17223, 124, 122, 122, 122, 124, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Corinthians", "4", "1", "1", "2", "1", "3", "4" ], "ids": [ 74615, 125, 122, 122, 123, 122, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bahia", "5", "1", "1", "3", "5", "8", "4" ], "ids": [ 34566, 126, 122, 122, 124, 126, 129, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fluminense", "4", "1", "1", "2", "3", "6", "4" ], "ids": [ 84707, 125, 122, 122, 123, 124, 127, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##leti", "##co", "Para", "##nae", "##nse", "3", "1", "0", "2", "4", "6", "3" ], "ids": [ 11699, 42136, 10812, 13497, 25589, 19051, 124, 122, 121, 123, 125, 127, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##uara", "##ni", "3", "0", "1", "2", "1", "5", "1" ], "ids": [ 144, 66567, 10342, 124, 121, 122, 123, 122, 126, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Braga", "##ntino", "4", "0", "0", "4", "3", "12", "0" ], "ids": [ 55045, 44878, 125, 121, 121, 125, 124, 10186, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Note", ":", "Top", "eight", "teams", "qualify", "for", "the", "quarter", "-", "finals", "." ], "ids": [ 20231, 131, 12685, 16222, 14404, 55235, 10142, 10105, 28330, 118, 21758, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If" ], "ids": [ 14535 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "teams", "are", "level", "on", "points", ",", "positions", "are", "determined", "by", "the" ], "ids": [ 14404, 10301, 13277, 10135, 12789, 117, 23188, 10301, 30706, 10155, 10105 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "number", "of", "games", "won", "." ], "ids": [ 11487, 10108, 13332, 11367, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##S", "##K", "##ET", "##BA", "##LL", "-", "P", "##HI", "##L", "##IP", "##P", "##INE", "PR", "##O", "-", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 39999, 10731, 11733, 52338, 35999, 82834, 118, 153, 108880, 11369, 30331, 11127, 83198, 23837, 11403, 118, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##IL", "##A", "1996", "-", "08", "-", "26" ], "ids": [ 73020, 38850, 10738, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "semi", "-", "final", "round", "games", "played", "on", "late", "Sunday", "in", "the", "Philippine", "Basketball", "Association", "second", "conference", ",", "which", "includes", "American", "players", ":" ], "ids": [ 33036, 10108, 15900, 118, 11070, 13569, 13332, 11553, 10135, 13002, 19731, 10106, 10105, 28893, 25693, 11751, 11132, 25029, 117, 10319, 15433, 10536, 16021, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Formula", "Shell", "beat", "G", "##ine", "##bra", "San", "Miguel", "89", "-", "86", "(", "45", "-", "46", "half", "-", "time", ")" ], "ids": [ 21459, 47581, 27868, 144, 11088, 13581, 10469, 13905, 12642, 118, 12224, 113, 10827, 118, 11528, 13877, 118, 10635, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "RE", "##SU", "##L", "##TS", "OF", "SO", "##UT", "##H", "KO", "##RE", "##AN", "PR", "##O", "-", "SO", "##CC", "##ER", "GA", "##ME", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 71033, 88592, 11369, 36545, 23240, 71020, 65729, 12396, 67422, 66014, 41275, 23837, 11403, 118, 71020, 65622, 24093, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "26" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "South", "Korean", "pro", "-", "soccer" ], "ids": [ 33036, 10108, 11056, 20501, 11284, 118, 41356 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "games", "played", "on", "Sunday", "." ], "ids": [ 13332, 11553, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##uch", "##on", "3", "Cho", "##nan", "0", "(", "half", "##time", "1", "-", "0", ")" ], "ids": [ 153, 20591, 10263, 124, 50690, 13470, 121, 113, 13877, 18086, 122, 118, 121, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Po", "##hang", "3", "Cho", "##n", "##buk", "2", "(", "half", "##time", "0", "-", "0", ")" ], "ids": [ 11255, 30222, 124, 50690, 10115, 58074, 123, 113, 13877, 18086, 121, 118, 121, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "after", "games", "played", "on", "Sunday", "(", "tab", "##ulate", "under", "-" ], "ids": [ 58592, 10107, 10662, 13332, 11553, 10135, 19731, 113, 100781, 70863, 10571, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "won", ",", "drawn", ",", "lost", ",", "goals", "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 11367, 117, 34788, 117, 14172, 117, 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "D", "L", "G", "/", "F", "G", "/", "A", "P" ], "ids": [ 160, 141, 149, 144, 120, 143, 144, 120, 138, 153 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##uch", "##on", "2", "1", "0", "4", "0", "7" ], "ids": [ 153, 20591, 10263, 123, 122, 121, 125, 121, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##nan", "2", "0", "1", "9", "9", "6" ], "ids": [ 50690, 13470, 123, 121, 122, 130, 130, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Po", "##hang", "1", "1", "1", "8", "8", "4" ], "ids": [ 11255, 30222, 122, 122, 122, 129, 129, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", "##ls", "##an", "1", "0", "1", "6", "6", "3" ], "ids": [ 158, 11747, 10206, 122, 121, 122, 127, 127, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Any", "##ang", "0", "3", "0", "5", "5", "3" ], "ids": [ 47336, 11889, 121, 124, 121, 126, 126, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##won", "0", "3", "0", "3", "3", "3" ], "ids": [ 12271, 36816, 121, 124, 121, 124, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##usan", "0", "2", "0", "3", "3", "2" ], "ids": [ 153, 29885, 121, 123, 121, 124, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##nna", "##m", "0", "2", "1", "4", "5", "2" ], "ids": [ 50690, 16441, 10147, 121, 123, 122, 125, 126, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##n", "##buk", "0", "0", "2", "2", "5", "0" ], "ids": [ 50690, 10115, 58074, 121, 121, 123, 123, 126, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "RE", "##SU", "##L", "##TS", "OF", "S", ".", "KO", "##RE", "##AN", "PR", "##O", "-", "BA", "##SE", "##BA", "##LL", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 71033, 88592, 11369, 36545, 23240, 156, 119, 67422, 66014, 41275, 23837, 11403, 118, 39999, 39039, 35999, 82834, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "26" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "South", "Korean" ], "ids": [ 33036, 10108, 11056, 20501 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "pro", "-", "baseball", "games", "played", "on", "Sunday", "." ], "ids": [ 11284, 118, 22450, 13332, 11553, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##B", "2", "Lotte", "1" ], "ids": [ 152, 11274, 123, 102530, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Han", "##w", "##ha", "3", "Hai", "##tai", "2" ], "ids": [ 10818, 10874, 10921, 124, 26329, 26812, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Hyundai", "8", "Samsung", "1" ], "ids": [ 72344, 129, 37077, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "S", "##sang", "##bang", "##wo", "##ol", "3", "LG", "1" ], "ids": [ 156, 45952, 26337, 16828, 11481, 124, 49780, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Standing", "##s", "after", "games", "played", "on", "Sunday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 58592, 10107, 10662, 13332, 11553, 10135, 19731, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "drawn", ",", "lost", ",", "winning", "percentage", ",", "games", "behind", "first", "place", ")" ], "ids": [ 34788, 117, 14172, 117, 16542, 46971, 117, 13332, 17155, 10422, 11192, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "D", "L", "PC", "##T", "GB" ], "ids": [ 160, 141, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hai", "##tai", "63", "2", "41", ".", "604", "-" ], "ids": [ 26329, 26812, 12256, 123, 11349, 119, 39695, 118 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##sang", "##bang", "##wo", "##ol", "58", "2", "47", ".", "551", "5", "1", "/", "2" ], "ids": [ 156, 45952, 26337, 16828, 11481, 11824, 123, 11413, 119, 46282, 126, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hyundai", "56", "5", "47", ".", "542", "6", "1", "/", "2" ], "ids": [ 72344, 11628, 126, 11413, 119, 51620, 127, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Han", "##w", "##ha", "56", "1", "48", ".", "538", "7" ], "ids": [ 10818, 10874, 10921, 11628, 122, 11300, 119, 45677, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Samsung", "47", "5", "55", ".", "463", "15" ], "ids": [ 37077, 11413, 126, 11358, 119, 45914, 10208 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lotte", "44", "6", "53", ".", "456", "15", "1", "/", "2" ], "ids": [ 102530, 11126, 127, 11756, 119, 36380, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LG", "44", "5", "58", ".", "435", "18" ], "ids": [ 49780, 11126, 126, 11824, 119, 36898, 10218 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##B", "41", "6", "60", ".", "411", "20", "1", "/", "2" ], "ids": [ 152, 11274, 11349, 127, 10709, 119, 34386, 10197, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "MO", "##RO", "##CC", "##AN", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 102059, 35066, 65622, 41275, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RA", "##BA", "##T", "1996", "-", "08", "-", "26" ], "ids": [ 64007, 35999, 11090, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Moro", "##cca", "##n", "first", "division" ], "ids": [ 33036, 10108, 66832, 20057, 10115, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "soccer", "matches", "played", "on", "Sunday", ":" ], "ids": [ 41356, 18258, 11553, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wi", "##dad", "Fe", "##s", "3", "Ou", "##jda", "1" ], "ids": [ 52742, 14084, 20187, 10107, 124, 47060, 95693, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Raja", "Casablanca", "4", "Te", "##tou", "##an", "0" ], "ids": [ 19452, 54971, 125, 21452, 21052, 10206, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Jeunesse", "Mass", "##ira", "0", "Wi", "##dad", "Casablanca", "2" ], "ids": [ 91532, 28957, 13007, 121, 52742, 14084, 54971, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Sporting", "Sale", "0", "Me", "##k", "##nes", "1" ], "ids": [ 31063, 66272, 121, 11589, 10174, 11496, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Set", "##tat", "1", "Mar", "##rak", "##esh", "0" ], "ids": [ 14245, 13485, 122, 15734, 15793, 38806, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "K", "##hou", "##rib", "##ga", "3", "Mohammed", "##ia", "0" ], "ids": [ 148, 25611, 47116, 10483, 124, 32415, 10280, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Sidi", "Ka", "##cem", "0", "Royal", "Armed", "Forces", "0" ], "ids": [ 56501, 25444, 20034, 121, 11596, 51383, 22319, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "El", "Ja", "##dida", "1", "Hassan", "##ia", "Aga", "##dir", "0" ], "ids": [ 10224, 28248, 42286, 122, 35004, 10280, 103721, 11957, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "Q", "##UE", "##NC", "##H", "YOU", "##R", "T", "##HI", "##RS", "##T", "-", "IF", "YOU", "CAN", "AF", "##F", "##OR", "##D", "IT", "AT", "U", ".", "S", ".", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 154, 62674, 100230, 12396, 100061, 11273, 157, 108880, 39469, 11090, 118, 25000, 100061, 98038, 55640, 11565, 42622, 11490, 26956, 30554, 158, 119, 156, 119, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "Bill", "Be", "##rk", "##rot" ], "ids": [ 13160, 14321, 16299, 28636 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "26" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "message", "on", "television", "monitor", "##s", "all", "around", "the", "National", "Tennis", "Centre", "reads", ":", "\"", "Due", "to", "hot", "weather", "pl", "##eas", "##e", "seek", "sh", "##ade", "and", "drink", "pl", "##enty", "of", "fluid", "##s", "\"", "-", "-", "sound", "advice", "until", "you", "check", "out", "the", "price", "of", "fluid", "##s", "." ], "ids": [ 138, 30514, 10135, 14162, 60774, 10107, 10435, 12166, 10105, 10655, 27380, 12838, 91160, 131, 107, 20896, 10114, 29698, 35660, 20648, 42658, 10112, 48394, 48201, 12930, 10111, 69423, 20648, 110319, 10108, 59848, 10107, 107, 118, 118, 19302, 53426, 11444, 13028, 43662, 10950, 10105, 30839, 10108, 59848, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Per", "##ha", "##ps", "the", "advisor", "##y", "was", "cut", "off", "before", "con", "##clu", "##ding", ":", "\"", ".", ".", ".", "and", "bring", "pl", "##enty", "of", "money", ".", "\"" ], "ids": [ 11982, 10921, 13221, 10105, 89568, 10157, 10134, 21610, 11898, 11360, 10173, 78225, 13971, 131, 107, 119, 119, 119, 10111, 26092, 20648, 110319, 10108, 17920, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "small", "bot", "##tle", "of", "a", "garis", "##hl", "##y", "-", "colour", "##ed", "sports", "drink", "at", "the", "sun", "-", "dre", "##nche", "##d", "U", ".", "S", ".", "Open", "is", "going", "for", "$", "3", ".", "75", ",", "while", "a", "lit", "##re", "of", "basic", ",", "life", "-", "sus", "##taining", "water", "will", "set", "you", "back", "$", "4", ".", "00", "-", "-", "for", "water", "?" ], "ids": [ 138, 12474, 41960, 16406, 10108, 169, 60337, 17054, 10157, 118, 43361, 10336, 18204, 69423, 10160, 10105, 42230, 118, 35028, 49457, 10162, 158, 119, 156, 119, 11919, 10124, 19090, 10142, 109, 124, 119, 11417, 117, 11371, 169, 27937, 10246, 10108, 25090, 117, 12103, 118, 10846, 70700, 12286, 11337, 11847, 13028, 12014, 109, 125, 119, 11025, 118, 118, 10142, 12286, 136 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "At", "the", "Olympics", "water", "was", "only", "a", "dollar", ",", "and", "that", "was", "the", "Olympics", ",", "\"", "said", "one", "in", "##cre", "##dul", "##ous", "fan", ",", "noting", "that", "the", "Atlanta", "Games", "had", "been", "noto", "##rious", "for", "price", "go", "##ugi", "##ng", "." ], "ids": [ 107, 11699, 10105, 19185, 12286, 10134, 10893, 169, 34807, 117, 10111, 10189, 10134, 10105, 19185, 117, 107, 12415, 10464, 10106, 27794, 42918, 13499, 10862, 117, 88681, 10189, 10105, 19600, 14501, 10374, 10590, 27497, 37789, 10142, 30839, 11783, 70765, 10376, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Open", "officials", "managed", "to", "ins", "##ult", "most", "of", "the", "male", "tennis", "players", "last", "week", "with", "their", "controversial", "handling", "of", "the", "seed", "##ing", "and", "draw", "." ], "ids": [ 158, 119, 156, 119, 11919, 27730, 22391, 10114, 15498, 16203, 10992, 10108, 10105, 17416, 20944, 16021, 12469, 16118, 10169, 10455, 45475, 52703, 10108, 10105, 49282, 10230, 10111, 25974, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "the", "tournament", "began", "on", "Monday", "it", "was", "the", "fans", "'", "turn", "to", "be", "offen", "##ded", "." ], "ids": [ 12242, 10105, 17390, 11941, 10135, 40714, 10271, 10134, 10105, 20950, 112, 18923, 10114, 10347, 84646, 21597, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "That", "bak", "##ed", "las", "##agna", "better", "be", "good", "for", "$", "8", ".", "50", ",", "\"", "said", "New", "Yorker", "Rebecca", "Wein", "##stein", ",", "a", "U", ".", "S", ".", "Open", "regular", "who", "was", "eating", "a", "sand", "##wich", "she", "had", "brought", "from", "home", "." ], "ids": [ 107, 13646, 36786, 10336, 10285, 87929, 18322, 10347, 15198, 10142, 109, 129, 119, 10462, 117, 107, 12415, 10287, 57218, 22613, 90462, 16206, 117, 169, 158, 119, 156, 119, 11919, 15670, 10479, 10134, 77596, 169, 45989, 33544, 10833, 10374, 17327, 10188, 11816, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "trio", "of", "hung", "##ry", "fans", "at", "the", "food", "court", "who", "had", "already", "for", "##ked", "over", "the", "las", "##agna", "money", "pronounced", "it", "good", ",", "but", "Carol", "Perry", "chim", "##ed", "in", ",", "\"", "The", "water", "is", "ri", "##dic", "##ulo", "##us", ",", "they", "want", "four", "dollars", "for", "the", "water", ",", "you", "might", "as", "well", "get", "a", "glass", "of", "wine", ".", "\"" ], "ids": [ 138, 32920, 10108, 68971, 10908, 20950, 10160, 10105, 18301, 14866, 10479, 10374, 19034, 10142, 30511, 10491, 10105, 10285, 87929, 17920, 74473, 10271, 15198, 117, 10473, 23059, 20191, 49586, 10336, 10106, 117, 107, 10117, 12286, 10124, 29956, 55170, 22540, 10251, 117, 10689, 21528, 11598, 27953, 10142, 10105, 12286, 117, 13028, 20970, 10146, 11206, 15329, 169, 32362, 10108, 43558, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inde", "##ed", ",", "a", "nic", "##e", "glass", "of", "char", "##don", "##nay", "or", "white", "zin", "##fand", "##el", "was", "going", "for", "$", "4", ".", "75", ",", "while", "an", "imported", "beer", "was", "just", "a", "bit", "more", "than", "the", "water", "at", "$", "4", ".", "50", "." ], "ids": [ 43376, 10336, 117, 169, 46267, 10112, 32362, 10108, 101328, 15081, 30771, 10345, 15263, 99830, 75897, 10570, 10134, 19090, 10142, 109, 125, 119, 11417, 117, 11371, 10151, 100591, 73768, 10134, 12820, 169, 17684, 10798, 11084, 10105, 12286, 10160, 109, 125, 119, 10462, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "What", "'", "s", "the", "message", "here", "?", "\"" ], "ids": [ 12489, 112, 187, 10105, 30514, 19353, 136, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Maybe", "they", "want", "us", "to", "be", "alcohol", "##ics", ",", "\"", "Perry", "jo", "##ked", "before", "lift", "##ing", "her", "glass", "of", "wine", "." ], "ids": [ 107561, 10689, 21528, 19626, 10114, 10347, 36067, 16981, 117, 107, 20191, 12541, 30511, 11360, 63376, 10230, 10485, 32362, 10108, 43558, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fans", "will", "be", "shell", "##ing", "out", "$", "12", ".", "50", "for", "a", "ham", "##burger", "and", "a", "large", "fr", "##en", "##ch", "fri", "##es", "." ], "ids": [ 68408, 11337, 10347, 43332, 10230, 10950, 109, 10186, 119, 10462, 10142, 169, 15128, 59692, 10111, 169, 12077, 12127, 10136, 10269, 35350, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "that", "little", "sna", "##ck", "is", "gu", "##aran", "##teed", "to", "make", "you", "thi", "##rst", "##y", "." ], "ids": [ 12689, 10189, 16745, 62541, 11263, 10124, 75980, 24367, 100308, 10114, 13086, 13028, 24106, 21328, 10157, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Make", "that", "$", "16", ".", "50", "." ], "ids": [ 26742, 10189, 109, 10250, 119, 10462, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Even", "a", "sand", "##wich", "as", "pe", "##dest", "##rian", "as", "a", "ham", "and", "s", "##wis", "##s", "che", "##ese", "is", "going", "for", "a", "who", "##pping", "$", "8", ".", "00", "." ], "ids": [ 28140, 169, 45989, 33544, 10146, 11161, 66804, 20764, 10146, 169, 15128, 10111, 187, 83648, 10107, 10262, 13565, 10124, 19090, 10142, 169, 10479, 53570, 109, 129, 119, 11025, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Of", "course", ",", "it", "is", "served", "on", "a", "tu", "##sca", "##n", "roll", "." ], "ids": [ 12610, 15348, 117, 10271, 10124, 12325, 10135, 169, 13055, 28849, 10115, 25520, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "must", "be", "the", "cost", "of", "flying", "those", "roll", "##s", "over", "from", "Tu", "##sca", "##ny", "every", "day", "that", "drives", "up", "the", "price", "of", "the", "sand", "##wich", "." ], "ids": [ 10377, 14982, 10347, 10105, 18849, 10108, 34676, 12676, 25520, 10107, 10491, 10188, 20108, 28849, 10756, 14234, 11940, 10189, 64592, 10741, 10105, 30839, 10108, 10105, 45989, 33544, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "H", "##UB", "##ER", "AND", "MA", "##LE", "##E", "##VA", "FA", "##LL", ",", "UP", "-", "AND", "-", "COM", "##ER", "##S", "AD", "##VA", "##NC", "##E", "AT", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 145, 82439, 24093, 52428, 27277, 51036, 11259, 47172, 20794, 82834, 117, 53197, 118, 52428, 118, 80645, 24093, 10731, 22992, 47172, 100230, 11259, 30554, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Larry", "Fine" ], "ids": [ 19629, 24846 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "26" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martina", "Hi", "##ngi", "##s", "led", "a", "youth", "##ful", "charge", "and", "Australian", "Open", "finalist", "An", "##ke", "Huber", "and", "Magdalena", "Male", "##eva", "were", "fallen", "seeds", "on", "Monday", "in", "a", "hot", ",", "sun", "##ny", "opening", "to", "the", "U", ".", "S", ".", "Open", "tennis", "championships", "." ], "ids": [ 35012, 20065, 31681, 10107, 12857, 169, 24215, 14446, 18163, 10111, 12829, 11919, 78096, 10313, 10550, 46398, 10111, 27166, 36172, 18085, 10309, 40055, 68488, 10135, 40714, 10106, 169, 29698, 117, 42230, 10756, 17975, 10114, 10105, 158, 119, 156, 119, 11919, 20944, 47211, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 6, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "The", "15", "-", "year", "-", "old", "Hi", "##ngi", "##s", ",", "seed", "##ed", "16th", ",", "was", "honour", "##ed", "to", "play", "the", "first", "match", "of", "the", "season", "'", "s", "last", "Grand", "Slam", "on", "Stadium", "Court", "but", "happy", "to", "hur", "##ry", "off", "with", "a", "straight", "-", "sets", "victory", "over", "the", "112", "##th", "-", "ranked", "Angeles", "Mont", "##olio", "of", "Spain", "." ], "ids": [ 10117, 10208, 118, 10924, 118, 12898, 20065, 31681, 10107, 117, 49282, 10336, 33581, 117, 10134, 46948, 10336, 10114, 12253, 10105, 10422, 12356, 10108, 10105, 11226, 112, 187, 12469, 11319, 33445, 10135, 16632, 14100, 10473, 54214, 10114, 52824, 10908, 11898, 10169, 169, 31214, 118, 23597, 19735, 10491, 10105, 16129, 11143, 118, 25250, 12233, 19472, 73783, 10108, 16149, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "\"", "It", "was", "very", "hot", "and", "I", "did", "n", "'", "t", "want", "to", "stay", "long", "on", "the", "court", ",", "\"", "said", "a", "che", "##ery", "Hi", "##ngi", "##s", ",", "who", "had", "no", "wo", "##rries", "in", "racing", "to", "a", "6", "-", "1", "6", "-", "0", "victory", "against", "the", "over", "##match", "##ed", "Spania", "##rd", "." ], "ids": [ 107, 10377, 10134, 12558, 29698, 10111, 146, 12172, 182, 112, 188, 21528, 10114, 29597, 11695, 10135, 10105, 14866, 117, 107, 12415, 169, 10262, 23131, 20065, 31681, 10107, 117, 10479, 10374, 10192, 12796, 107788, 10106, 31008, 10114, 169, 127, 118, 122, 127, 118, 121, 19735, 11327, 10105, 10491, 95974, 10336, 42751, 12023, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Hop", "##ing", "for", "a", "longer", "engagement", "on", "the", "ce", "##ment", "at", "Fl", "##ush", "##ing", "Meadows", "were", "the", "sixth", "-", "seed", "##ed", "Huber", "of", "Germany", "and", "12th", "seed", "Male", "##eva", "of", "Bulgaria", "." ], "ids": [ 35422, 10230, 10142, 169, 20165, 44569, 10135, 10105, 10794, 10426, 10160, 29981, 37026, 10230, 94508, 10309, 10105, 28913, 118, 49282, 10336, 46398, 10108, 12775, 10111, 34505, 49282, 36172, 18085, 10108, 21935, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 4, 9, 1, 9, 9, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "Huber", ",", "who", "lost", "to", "Monica", "Se", "##les", "in", "the", "Australian", "Open", "final", ",", "fell", "victim", "to", "an", "un", "##fort", "##una", "##te", "draw", "in", "bow", "##ing", "to", "dangerous", "fl", "##oat", "##er", "Amanda", "Co", "##etz", "##er", "of", "South", "Africa", "." ], "ids": [ 46398, 117, 10479, 14172, 10114, 29242, 11045, 11268, 10106, 10105, 12829, 11919, 11070, 117, 25194, 62585, 10114, 10151, 10119, 23044, 14212, 10216, 25974, 10106, 98073, 10230, 10114, 57195, 58768, 51330, 10165, 30380, 13098, 75065, 10165, 10108, 11056, 12880, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 4, 8, 8, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 9 ] }, { "tokens": [ "Co", "##etz", "##er", ",", "ranked", "17th", ",", "ave", "##nge", "##d", "her", "defeat", "to", "Huber", "in", "the", "Australian", "Open", "semifinals", "by", "winning", "6", "-", "1", "2", "-", "6", "6", "-", "2", "." ], "ids": [ 13098, 75065, 10165, 117, 25250, 32331, 117, 47145, 18180, 10162, 10485, 24800, 10114, 46398, 10106, 10105, 12829, 11919, 82726, 10155, 16542, 127, 118, 122, 123, 118, 127, 127, 118, 123, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "looked", "at", "it", "as", "not", "a", "first", "round", "match", ",", "just", "a", "great", "challenge", "for", "me", ",", "\"", "said", "Co", "##etz", "##er", ",", "24", ".", "\"" ], "ids": [ 107, 146, 59822, 10160, 10271, 10146, 10472, 169, 10422, 13569, 12356, 117, 12820, 169, 14772, 36040, 10142, 10911, 117, 107, 12415, 13098, 75065, 10165, 117, 10233, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "I", "was", "really", "con", "##centra", "##ting", "on", "keeping", "my", "own", "momentum", "and", "my", "own", "rhythm", "." ], "ids": [ 146, 10134, 30181, 10173, 97368, 12141, 10135, 51318, 15127, 12542, 89635, 10111, 15127, 12542, 51720, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "She", "is", "tou", "##gh", "to", "play", "in", "that", "way", "because", "she", "plays", "very", "up", "and", "down", "." ], "ids": [ 107, 11149, 10124, 52586, 15774, 10114, 12253, 10106, 10189, 13170, 12373, 10833, 17724, 12558, 10741, 10111, 12935, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "played", "one", "great", "game", "and", "than", "a", "few", "errors", "." ], "ids": [ 11149, 11553, 10464, 14772, 11661, 10111, 11084, 169, 13824, 76269, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "challenge", "was", "just", "for", "me", "to", "keep", "playing", "my", "own", "game", ".", "\"" ], "ids": [ 10117, 36040, 10134, 12820, 10142, 10911, 10114, 23819, 14879, 15127, 12542, 11661, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Huber", ",", "who", "reached", "the", "final", "a", "week", "ago", "at", "Manhattan", "Beach", ",", "could", "only", "mo", "##urn", "her", "lu", "##ck", "of", "the", "draw", "." ], "ids": [ 46398, 117, 10479, 17087, 10105, 11070, 169, 16118, 36390, 10160, 23115, 15602, 117, 12174, 10893, 46912, 63158, 10485, 14657, 11263, 10108, 10105, 25974, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "was", "n", "'", "t", "happy", "when", "I", "saw", "the", "draw", "." ], "ids": [ 107, 146, 10134, 182, 112, 188, 54214, 10841, 146, 17112, 10105, 25974, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "was", "the", "first", "non", "-", "seed", "##ed", "player", ",", "\"", "said", "the", "21", "-", "year", "-", "old", "German", ".", "\"" ], "ids": [ 11149, 10134, 10105, 10422, 10446, 118, 49282, 10336, 12928, 117, 107, 12415, 10105, 10296, 118, 10924, 118, 12898, 12026, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "It", "'", "s", "always", "tou", "##gh", "to", "play", "some", "##body", "like", "that", "in", "the", "first", "round", "in", "a", "Grand", "Slam", "." ], "ids": [ 10377, 112, 187, 19540, 52586, 15774, 10114, 12253, 11152, 38078, 11850, 10189, 10106, 10105, 10422, 13569, 10106, 169, 11319, 33445, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "\"", "I", "think", "I", "did", "n", "'", "t", "play", "that", "bad", "today", "." ], "ids": [ 107, 146, 27874, 146, 12172, 182, 112, 188, 12253, 10189, 15838, 18745, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "may", "##be", "my", "best", "first", "round", "match", "in", "a", "Grand", "Slam", "I", "ever", "played", ".", "\"" ], "ids": [ 10377, 10134, 11387, 11044, 15127, 12504, 10422, 13569, 12356, 10106, 169, 11319, 33445, 146, 17038, 11553, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Monday", "brought", "the", "best", "out", "in", "U", ".", "S", ".", "Open", "rookie", "Aleksandra", "Ol", "##sza", "of", "Poland", ",", "ranked", "110", "##th", "." ], "ids": [ 40714, 17327, 10105, 12504, 10950, 10106, 158, 119, 156, 119, 11919, 73747, 39537, 60160, 22555, 10108, 17879, 117, 25250, 13057, 11143, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "18", "-", "year", "-", "old", "Ol", "##sza", ",", "last", "year", "'", "s", "Wimbledon", "junior", "champion", ",", "celebrated", "her", "debut", "in", "the", "main", "draw", "of", "the", "Open", "by", "removing", "Male", "##eva", "6", "-", "4", "6", "-", "2", "." ], "ids": [ 10117, 10218, 118, 10924, 118, 12898, 60160, 22555, 117, 12469, 10924, 112, 187, 37932, 21854, 17689, 117, 42710, 10485, 13424, 10106, 10105, 12126, 25974, 10108, 10105, 11919, 10155, 100770, 36172, 18085, 127, 118, 125, 127, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "curta", "##in", "-", "raising", "victories", "by", "Hi", "##ngi", "##s", "and", "Ol", "##sza", "provided", "a", "ring", "##ing", "end", "##orse", "##ment", "for", "the", "new", "##est", "wave", "of", "women", "'", "s", "players", "coming", "up", "from", "the", "junior", "ranks", "." ], "ids": [ 10117, 51738, 10245, 118, 59252, 62664, 10155, 20065, 31681, 10107, 10111, 60160, 22555, 16491, 169, 21550, 10230, 11572, 91235, 10426, 10142, 10105, 10751, 13051, 32981, 10108, 13190, 112, 187, 16021, 23959, 10741, 10188, 10105, 21854, 52593, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Swiss", "teen", "##ager", ",", "a", "twice", "French", "Open", "junior", "champion", "and", "a", "Wimbledon", "juniors", "winner", ",", "had", "already", "proven", "her", "main", "stage", "met", "##tle", "by", "reaching", "the", "quarters", "at", "this", "year", "'", "s", "Australian", "Open", "." ], "ids": [ 10117, 22984, 33003, 37247, 117, 169, 26261, 11894, 11919, 21854, 17689, 10111, 169, 37932, 103010, 20826, 117, 10374, 19034, 101330, 10485, 12126, 15365, 10428, 16406, 10155, 34186, 10105, 79322, 10160, 10531, 10924, 112, 187, 12829, 11919, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "\"", "I", "hope", "I", "can", "get", "into", "the", "last", "16", ",", "\"", "said", "Hi", "##ngi", "##s", ",", "seed", "##ed", "to", "face", "third", "seed", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", "in", "the", "fourth", "round", "." ], "ids": [ 107, 146, 50725, 146, 10944, 15329, 10708, 10105, 12469, 10250, 117, 107, 12415, 20065, 31681, 10107, 117, 49282, 10336, 10114, 13295, 12628, 49282, 54789, 10368, 14220, 66007, 39574, 16780, 10106, 10105, 16918, 13569, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hi", "##ngi", "##s", "has", "been", "working", "hard", "on", "condition", "##ing", "and", "has", "lost", "eight", "pounds", "(", "3", ".", "5", "kilo", "##s", ")", "in", "advance", "of", "the", "championships", "." ], "ids": [ 20065, 31681, 10107, 10393, 10590, 14616, 19118, 10135, 24713, 10230, 10111, 10393, 14172, 16222, 61982, 113, 124, 119, 126, 86754, 10107, 114, 10106, 34809, 10108, 10105, 47211, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "will", "be", "tou", "##gh", "matches", "but", "I", "hope", "I", "can", "get", "there", ",", "\"", "she", "said", ".", "\"" ], "ids": [ 107, 11723, 11337, 10347, 52586, 15774, 18258, 10473, 146, 50725, 146, 10944, 15329, 11155, 117, 107, 10833, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Then", "we", "'", "ll", "see", "if", "Ara", "##nt", "##xa", "will", "be", "there", ",", "too", ".", "\"" ], "ids": [ 26467, 11951, 112, 22469, 12888, 12277, 54789, 10368, 14220, 11337, 10347, 11155, 117, 16683, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fast", "-", "moving", "Ol", "##sza", ",", "18", ",", "was", "cool", "in", "her", "opening", "match", "." ], "ids": [ 10117, 15040, 118, 23557, 60160, 22555, 117, 10218, 117, 10134, 67420, 10106, 10485, 17975, 12356, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "was", "n", "'", "t", "s", "##care", "##d", "when", "I", "heard", "that", "I", "was", "playing", "Male", "##eva", ",", "\"", "said", "Ol", "##sza", ".", "\"" ], "ids": [ 107, 146, 10134, 182, 112, 188, 187, 22277, 10162, 10841, 146, 32240, 10189, 146, 10134, 14879, 36172, 18085, 117, 107, 12415, 60160, 22555, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "I", "know", "that", "if", "I", "want", "to", "play", "professional", "tennis", "I", "have", "to", "do", "my", "best", "to", "try", "to", "beat", "her", "and", "I", "ca", "n", "'", "t", "be", "s", "##care", "##d", ".", "\"" ], "ids": [ 146, 21852, 10189, 12277, 146, 21528, 10114, 12253, 14054, 20944, 146, 10529, 10114, 10149, 15127, 12504, 10114, 31638, 10114, 27868, 10485, 10111, 146, 11135, 182, 112, 188, 10347, 187, 22277, 10162, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ol", "##sza", "is", "und", "##aun", "##ted", "by", "the", "level", "of", "competition", "in", "the", "pro", "##s", "." ], "ids": [ 60160, 22555, 10124, 10130, 104596, 11912, 10155, 10105, 13277, 10108, 16622, 10106, 10105, 11284, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "In", "terms", "of", "tennis", ",", "I", "think", "the", "junior", "players", "are", "really", "good", "now", "." ], "ids": [ 107, 10167, 18873, 10108, 20944, 117, 146, 27874, 10105, 21854, 16021, 10301, 30181, 15198, 11858, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "few", "years", ",", "it", "could", "change", "a", "lot", "among", "the", "top", "players", ".", "\"" ], "ids": [ 10167, 169, 13824, 10855, 117, 10271, 12174, 15453, 169, 19826, 13328, 10105, 12364, 16021, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "big", "-", "serving", "women", "'", "s", "players", "made", "quick", "work", "of", "Japanese", "opponents", "." ], "ids": [ 13214, 22185, 118, 20252, 13190, 112, 187, 16021, 11019, 69609, 11424, 10108, 13847, 63568, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Brenda", "Schultz", "-", "McCarthy", "of", "the", "Netherlands", ",", "the", "13th", "seed", ",", "was", "a", "6", "-", "1", "6", "-", "4", "winner", "over", "Japan", "'", "s", "Nana", "Mi", "##ya", "##ga", ",", "while", "Czech", "veteran", "Helena", "Su", "##kova", "pre", "##vai", "##led", "over", "Yon", "##e", "Kami", "##o", "6", "-", "2", "6", "-", "3", "." ], "ids": [ 61185, 61712, 118, 42816, 10108, 10105, 22043, 117, 10105, 33937, 49282, 117, 10134, 169, 127, 118, 122, 127, 118, 125, 20826, 10491, 11891, 112, 187, 60635, 19803, 10679, 10483, 117, 11371, 22148, 55669, 22295, 12271, 61653, 12229, 37557, 16376, 10491, 94712, 10112, 87966, 10133, 127, 118, 123, 127, 118, 124, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 9, 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Austrian", "Barbara", "Paulus", ",", "seed", "##ed", "14th", ",", "also", "reached", "the", "second", "round", "with", "a", "6", "-", "2", "6", "-", "1", "victory", "over", "Yi", "Jing", "-", "Qi", "##an", "of", "China", "." ], "ids": [ 32201, 16010, 33470, 117, 49282, 10336, 38399, 117, 10379, 17087, 10105, 11132, 13569, 10169, 169, 127, 118, 123, 127, 118, 122, 19735, 10491, 40512, 94154, 118, 88454, 10206, 10108, 11593, 119 ], "entity": [ "B-MISC", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 2, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "ST", "##IC", "##H", "GL", "##AD", "H", "##E", "ST", "##A", "##Y", "##ED", "AF", "##TER", "OP", "##EN", "VI", "##CT", "##OR", "##Y", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 53317, 30889, 12396, 108755, 55538, 145, 11259, 53317, 10738, 14703, 33809, 55640, 99552, 55355, 50655, 12262, 91995, 42622, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Richard", "Finn" ], "ids": [ 11118, 37051 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "26" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "St", "##ich", "nearly", "pulled", "out", "of", "the", "U", ".", "S", ".", "Open", "in", "protest", "over", "the", "men", "'", "s", "seed", "##ing", "fia", "##sco", "but", "the", "former", "Wimbledon", "champion", "was", "g", "##lad", "he", "stayed", "after", "s", "##we", "##ating", "out", "a", "four", "-", "set", "win", "on", "Monday", "over", "qualifier", "Tommy", "Haas", "." ], "ids": [ 10631, 10838, 14401, 21377, 65884, 10950, 10108, 10105, 158, 119, 156, 119, 11919, 10106, 36627, 10491, 10105, 10588, 112, 187, 49282, 10230, 26908, 22402, 10473, 10105, 11775, 37932, 17689, 10134, 175, 19505, 10261, 42296, 10662, 187, 12577, 33121, 10950, 169, 11598, 118, 11847, 14125, 10135, 40714, 10491, 96076, 20136, 54347, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "\"", "I", "still", "feel", "it", "'", "s", "em", "##barra", "##ssing", "what", "happened", "and", "I", "was", "about", "to", "pull", "out", "ye", "##ster", "##day", "and", "say", ",", "'", "That", "'", "s", "it", ",", "'", "\"", "said", "St", "##ich", ",", "one", "of", "a", "host", "of", "men", "who", "c", "##ried", "fou", "##l", "over", "seed", "##ing", "procedures", "that", "forced", "an", "un", "##pre", "##cedent", "##ed", "re", "##making", "of", "the", "men", "'", "s", "draw", "last", "week", "." ], "ids": [ 107, 146, 12647, 38008, 10271, 112, 187, 10266, 97607, 63400, 12976, 44936, 10111, 146, 10134, 10978, 10114, 80870, 10950, 11023, 12765, 24558, 10111, 23763, 117, 112, 13646, 112, 187, 10271, 117, 112, 107, 12415, 10838, 14401, 117, 10464, 10108, 169, 19317, 10108, 10588, 10479, 171, 46714, 12688, 10161, 10491, 49282, 10230, 70176, 10189, 20054, 10151, 10119, 30619, 104101, 10336, 11639, 95746, 10108, 10105, 10588, 112, 187, 25974, 12469, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "But", "there", "are", "so", "many", "reasons", "to", "play", ",", "especially", "sp", "##ecta", "##tors", "and", "the", "kids", "who", "come", "out", "here", "and", "want", "to", "enjoy", "watching", "tennis", ",", "that", "I", "decided", "to", "stay", ".", "\"" ], "ids": [ 107, 16976, 11155, 10301, 10380, 11299, 31725, 10114, 12253, 117, 17491, 32650, 78125, 24324, 10111, 10105, 82808, 10479, 10678, 10950, 19353, 10111, 21528, 10114, 84874, 84532, 20944, 117, 10189, 146, 17270, 10114, 29597, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "break", "from", "tradition", ",", "the", "Open", "did", "not", "seed", "in", "strict", "accordance", "with", "ATP", "rankings", ",", "instead", "taking", "into", "account", "other", "factors", "that", "raised", "object", "##ions", "of", "favour", "##tism", "toward", "U", ".", "S", ".", "players", "." ], "ids": [ 10167, 169, 24194, 10188, 20049, 117, 10105, 11919, 12172, 10472, 49282, 10106, 68930, 88651, 10169, 18316, 97410, 117, 17427, 18084, 10708, 23200, 10684, 31075, 10189, 20526, 29331, 15880, 10108, 61264, 106965, 32216, 158, 119, 156, 119, 16021, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "One", "prominent", "player", "that", "did", "not", "stay", "for", "the", "Open", "was", "French", "Open", "champion", "Y", "##veg", "##eny", "Ka", "##feln", "##iko", "##v", ",", "who", "after", "being", "dropped", "three", "spots", "from", "his", "ATP", "ranking", "to", "a", "seventh", "seed", "##ing", ",", "withdrew", "and", "returned", "home", "to", "Russia", "." ], "ids": [ 11340, 22861, 12928, 10189, 12172, 10472, 29597, 10142, 10105, 11919, 10134, 11894, 11919, 17689, 162, 55576, 33189, 25444, 79650, 18924, 10477, 117, 10479, 10662, 11223, 30241, 11003, 64148, 10188, 10226, 18316, 27153, 10114, 169, 37192, 49282, 10230, 117, 56226, 10111, 14030, 11816, 10114, 14664, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 2, 6, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Ka", "##feln", "##iko", "##v", "had", "pulled", "out", "of", "last", "week", "'", "s", "tournament", "with", "a", "ri", "##b", "injury", "." ], "ids": [ 25444, 79650, 18924, 10477, 10374, 65884, 10950, 10108, 12469, 16118, 112, 187, 17390, 10169, 169, 29956, 10457, 27443, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "a", "news", "conference", "attended", "by", "approximately", "50", "players", "on", "Sunday", ",", "U", ".", "S", ".", "Davis", "Cup", "player", "Todd", "Martin", "expressed", "the", "players", "'", "outra", "##ge", "at", "the", "seed", "##ings", "." ], "ids": [ 11699, 169, 14424, 25029, 17696, 10155, 17384, 10462, 16021, 10135, 19731, 117, 158, 119, 156, 119, 14281, 11544, 12928, 24708, 11235, 31685, 10105, 16021, 112, 25515, 10525, 10160, 10105, 49282, 18800, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 2, 6, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "way", "the", "U", ".", "S", ".", "Open", "has", "seed", "##ed", "here", ",", "tam", "##peri", "##ng", "with", "the", "ranking", "system", ",", "has", "tar", "##nish", "##ed", "the", "image", "and", "reputation", "of", "this", "U", ".", "S", ".", "Open", "in", "the", "players", "'", "mind", ",", "and", "we", "think", "that", "is", "dama", "##ging", "to", "our", "sport", ",", "\"", "Martin", "said", "." ], "ids": [ 107, 10117, 13170, 10105, 158, 119, 156, 119, 11919, 10393, 49282, 10336, 19353, 117, 14918, 69692, 10376, 10169, 10105, 27153, 11787, 117, 10393, 24948, 68079, 10336, 10105, 18170, 10111, 44214, 10108, 10531, 158, 119, 156, 119, 11919, 10106, 10105, 16021, 112, 21133, 117, 10111, 11951, 27874, 10189, 10124, 60990, 13808, 10114, 17446, 17925, 117, 107, 11235, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "St", "##ich", "said", "he", "felt", "the", "players", "ou", "##ght", "to", "have", "organised", "an", "active", "protest", "." ], "ids": [ 10838, 14401, 12415, 10261, 24666, 10105, 16021, 10431, 20687, 10114, 10529, 54200, 10151, 14459, 36627, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "feel", "that", "we", "made", "it", "a", "little", "easy", "for", "the", "US", "##TA", "." ], "ids": [ 107, 146, 38008, 10189, 11951, 11019, 10271, 169, 16745, 44346, 10142, 10105, 10808, 24951, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "They", "did", "n", "'", "t", "really", "get", "hur", "##t", "as", "much", "as", "I", "think", "they", "should", "have", ",", "\"", "said", "St", "##ich", ".", "\"" ], "ids": [ 11696, 12172, 182, 112, 188, 30181, 15329, 52824, 10123, 10146, 13172, 10146, 146, 27874, 10689, 14819, 10529, 117, 107, 12415, 10838, 14401, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "I", "feel", "that", "we", "should", "have", "may", "##be", "just", "cancelled", "out", "the", "Monday", ",", "not", "show", "up", "today", "and", "start", "the", "tournament", "tom", "##or", "##row", ".", "\"" ], "ids": [ 146, 38008, 10189, 11951, 14819, 10529, 11387, 11044, 12820, 60557, 10950, 10105, 40714, 117, 10472, 11897, 10741, 18745, 10111, 15148, 10105, 17390, 19132, 10667, 21454, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "once", "the", "27", "-", "year", "-", "old", "St", "##ich", "got", "on", "the", "court", ",", "he", "focused", "his", "energie", "##s", "on", "trying", "to", "win", "the", "year", "'", "s", "last", "Grand", "Slam", "." ], "ids": [ 16976, 14907, 10105, 10365, 118, 10924, 118, 12898, 10838, 14401, 19556, 10135, 10105, 14866, 117, 10261, 31293, 10226, 39092, 10107, 10135, 32862, 10114, 14125, 10105, 10924, 112, 187, 12469, 11319, 33445, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "He", "took", "a", "positive", "first", "step", "with", "his", "6", "-", "3", "1", "-", "6", "6", "-", "1", "7", "-", "5", "win", "over", "com", "##pat", "##riot", "Haas", "on", "a", "sun", "-", "bak", "##ed", "Grands", "##tand", "court", "." ], "ids": [ 10357, 12149, 169, 19737, 10422, 31877, 10169, 10226, 127, 118, 124, 122, 118, 127, 127, 118, 122, 128, 118, 126, 14125, 10491, 10212, 18115, 92113, 54347, 10135, 169, 42230, 118, 36786, 10336, 88459, 27623, 14866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Others", "ad", "##vancing", "early", "on", "Monday", "included", "11th", "-", "seed", "##ed", "American", "Mali", "##vai", "Washington", ",", "the", "Wimbledon", "runner", "-", "up", ",", "Sweden", "'", "s", "Magnus", "Gustaf", "##sson", ",", "and", "two", "-", "time", "former", "French", "Open", "champion", "Ser", "##gi", "Br", "##ugu", "##era", "of", "Spain", ",", "who", "will", "be", "St", "##ich", "'", "s", "next", "opponent", "." ], "ids": [ 64738, 10840, 104122, 11732, 10135, 40714, 12742, 34062, 118, 49282, 10336, 10536, 24427, 37557, 11586, 117, 10105, 37932, 43037, 118, 10741, 117, 20937, 112, 187, 22940, 36183, 14650, 117, 10111, 10551, 118, 10635, 11775, 11894, 11919, 17689, 39759, 11210, 38508, 47630, 12015, 10108, 16149, 117, 10479, 11337, 10347, 10838, 14401, 112, 187, 13451, 53610, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 2, 6, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "sus", "##pic", "##ion", ",", "however", ",", "li", "##nger", "##s", "in", "St", "##ich", "'", "s", "mind", "that", "U", ".", "S", ".", "Open", "officials", "did", "tam", "##per", "with", "the", "seed", "##ing", "process", "in", "order", "to", "benefit", "home", "##gro", "##wn", "players", "." ], "ids": [ 10117, 10846, 34891, 11046, 117, 13800, 117, 11614, 18904, 10107, 10106, 10838, 14401, 112, 187, 21133, 10189, 158, 119, 156, 119, 11919, 27730, 12172, 14918, 12713, 10169, 10105, 49282, 10230, 15138, 10106, 12990, 10114, 43074, 11816, 46692, 20395, 16021, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "get", "the", "feeling", "that", "everything", "is", "done", "here", "for", "the", "American", "players", "and", "they", "for", "##get", "about", "all", "the", "other", "players", ",", "\"", "said", "St", "##ich", ",", "who", "lost", "the", "1994", "Open", "final", "to", "Andre", "Aga", "##ssi", "." ], "ids": [ 107, 146, 15329, 10105, 61362, 10189, 42536, 10124, 20378, 19353, 10142, 10105, 10536, 16021, 10111, 10689, 10142, 14908, 10978, 10435, 10105, 10684, 16021, 117, 107, 12415, 10838, 14401, 117, 10479, 14172, 10105, 10444, 11919, 11070, 10114, 25188, 103721, 28377, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "It", "was", "Aga", "##ssi", "who", "was", "at", "the", "centre", "of", "the", "controversy", "that", "eng", "##ul", "##fe", "##d", "the", "tournament", "since", "the", "original", "draw", "was", "completed", "on", "Wednesday", "." ], "ids": [ 10377, 10134, 103721, 28377, 10479, 10134, 10160, 10105, 12672, 10108, 10105, 46373, 10189, 14716, 10604, 14601, 10162, 10105, 17390, 11764, 10105, 11364, 25974, 10134, 15782, 10135, 57611, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fl", "##am", "##boy", "##ant", "American", "star", "was", "bu", "##mpe", "##d", "up", "two", "spots", "from", "his", "ATP", "ranking", "of", "eight", "to", "a", "seed", "##ing", "of", "six", "." ], "ids": [ 10117, 58768, 11008, 40825, 11236, 10536, 16624, 10134, 11499, 29165, 10162, 10741, 10551, 64148, 10188, 10226, 18316, 27153, 10108, 16222, 10114, 169, 49282, 10230, 10108, 12449, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "(", "Aga", "##ssi", ")", "should", "be", "seed", "##ed", "the", "way", "he", "is", "playing", "tennis", "right", "now", ",", "\"", "said", "St", "##ich", "about", "the", "un", "##fair", "##ness", "of", "moving", "up", "Aga", "##ssi", ",", "who", "made", "early", "exit", "##s", "from", "the", "French", "Open", "and", "Wimbledon", "." ], "ids": [ 107, 10357, 113, 103721, 28377, 114, 14819, 10347, 49282, 10336, 10105, 13170, 10261, 10124, 14879, 20944, 13448, 11858, 117, 107, 12415, 10838, 14401, 10978, 10105, 10119, 82198, 14010, 10108, 23557, 10741, 103721, 28377, 117, 10479, 11019, 11732, 63827, 10107, 10188, 10105, 11894, 11919, 10111, 37932, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 2, 9 ] }, { "tokens": [ "St", "##ich", ",", "not", "seed", "##ed", "here", "for", "the", "first", "time", "since", "1990", ",", "might", "have", "benefit", "##ted", "from", "some", "fi", "##dd", "##ling", "with", "the", "seed", "##ings", "himself", "after", "Ka", "##feln", "##iko", "##v", "withdrew", "." ], "ids": [ 10838, 14401, 117, 10472, 49282, 10336, 19353, 10142, 10105, 10422, 10635, 11764, 10420, 117, 20970, 10529, 43074, 11912, 10188, 11152, 14045, 12969, 11945, 10169, 10105, 49282, 18800, 14764, 10662, 25444, 79650, 18924, 10477, 56226, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "Ra", "##nke", "##d", "18th", "in", "the", "world", ",", "St", "##ich", "might", "have", "been", "sl", "##ip", "##ped", "into", "that", "spot", "ahead", "of", "Spain", "'", "s", "Felix", "Man", "##til", "##la", ",", "who", "is", "16th", "but", "had", "never", "been", "played", "in", "the", "Open", "and", "had", "been", "left", "out", "of", "the", "seed", "##ings", "originally", "." ], "ids": [ 38571, 53770, 10162, 27669, 10106, 10105, 11356, 117, 10838, 14401, 20970, 10529, 10590, 38523, 17437, 16898, 10708, 10189, 28504, 35629, 10108, 16149, 112, 187, 21683, 11343, 19156, 10330, 117, 10479, 10124, 33581, 10473, 10374, 14794, 10590, 11553, 10106, 10105, 11919, 10111, 10374, 10590, 12153, 10950, 10108, 10105, 49282, 18800, 15556, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "St", "##ich", "did", "n", "'", "t", "want", "to", "play", "that", "game", "." ], "ids": [ 16976, 10838, 14401, 12172, 182, 112, 188, 21528, 10114, 12253, 10189, 11661, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "think", "he", "des", "##er", "##ves", "to", "be", "seed", "##ed", "as", "every", "##body", "else", "who", "is", "in", "the", "top", "16", "des", "##er", "##ves", "to", "be", "seed", "##ed", ",", "\"", "St", "##ich", "said", "." ], "ids": [ 107, 146, 27874, 10261, 10139, 10165, 13136, 10114, 10347, 49282, 10336, 10146, 14234, 38078, 40843, 10479, 10124, 10106, 10105, 12364, 10250, 10139, 10165, 13136, 10114, 10347, 49282, 10336, 117, 107, 10838, 14401, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "MO", "##ND", "##A", "##Y", "'", "S", "RE", "##SU", "##L", "##TS", "FR", "##OM", "U", ".", "S", ".", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 102059, 58521, 10738, 14703, 112, 156, 71033, 88592, 11369, 36545, 64655, 37079, 158, 119, 156, 119, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "26" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "first", "round", "matches", "on", "Monday", "in", "the", "U", ".", "S", ".", "Open", "tennis", "championships", "at", "the", "National", "Tennis", "Centre", "(", "pre", "##fix", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 33036, 10108, 10422, 13569, 18258, 10135, 40714, 10106, 10105, 158, 119, 156, 119, 11919, 20944, 47211, 10160, 10105, 10655, 27380, 12838, 113, 12229, 57014, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "16", "-", "Martina", "Hi", "##ngi", "##s", "(", "Switzerland", ")", "beat", "Angeles", "Mont", "##olio", "(", "Spain", ")", "6", "-", "1", "6", "-", "0" ], "ids": [ 10250, 118, 35012, 20065, 31681, 10107, 113, 26002, 114, 27868, 12233, 19472, 73783, 113, 16149, 114, 127, 118, 122, 127, 118, 121 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anne", "-", "Ga", "##elle", "Sid", "##ot", "(", "France", ")", "beat", "Janet", "##te", "Hus", "##aro", "##va", "(", "Slovakia", ")", "6", "-", "4", "6", "-", "4" ], "ids": [ 13490, 118, 69699, 14000, 31091, 11290, 113, 10688, 114, 27868, 32575, 10216, 109022, 24489, 10362, 113, 43031, 114, 127, 118, 125, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "13", "-", "Brenda", "Schultz", "-", "McCarthy", "(", "Netherlands", ")", "beat", "Nana", "Mi", "##ya", "##gi", "(", "Japan", ")", "6", "-", "1", "6", "-", "4" ], "ids": [ 10249, 118, 61185, 61712, 118, 42816, 113, 22043, 114, 27868, 60635, 19803, 10679, 11210, 113, 11891, 114, 127, 118, 122, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aleksandra", "Ol", "##sza", "(", "Poland", ")", "beat", "12", "-", "Magdalena", "Male", "##eva", "(", "Bulgaria", ")", "6", "-", "4", "6", "-", "2" ], "ids": [ 39537, 60160, 22555, 113, 17879, 114, 27868, 10186, 118, 27166, 36172, 18085, 113, 21935, 114, 127, 118, 125, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "St", "##ich", "(", "Germany", ")", "beat", "Tommy", "Haas", "(", "Germany", ")", "6", "-", "3", "1", "-", "6", "6", "-", "1", "7", "-", "5" ], "ids": [ 10631, 10838, 14401, 113, 12775, 114, 27868, 20136, 54347, 113, 12775, 114, 127, 118, 124, 122, 118, 127, 127, 118, 122, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ser", "##gi", "Br", "##ugu", "##era", "(", "Spain", ")", "beat", "Kris", "Go", "##ossen", "##s", "(", "Belgium", ")", "6", "-", "2", "6", "-", "0", "7", "-", "6", "(", "7", "-", "1", ")" ], "ids": [ 39759, 11210, 38508, 47630, 12015, 113, 16149, 114, 27868, 69041, 14439, 65614, 10107, 113, 26519, 114, 127, 118, 123, 127, 118, 121, 128, 118, 127, 113, 128, 118, 122, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Frederic", "Vito", "##ux", "(", "France", ")", "beat", "Ramon", "Delgado", "(", "Paraguay", ")", "6", "-", "4", "6", "-", "4", "7", "-", "6", "(", "7", "-", "3", ")" ], "ids": [ 43120, 55209, 11855, 113, 10688, 114, 27868, 33894, 52715, 113, 25118, 114, 127, 118, 125, 127, 118, 125, 128, 118, 127, 113, 128, 118, 124, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Henrietta", "Nagy", "##ova", "(", "Slovakia", ")", "beat", "Gala", "Leon", "Garcia", "(", "Spain", ")", "6", "-", "1", "4", "-", "6", "6", "-", "3" ], "ids": [ 104889, 26551, 12804, 113, 43031, 114, 27868, 60231, 19409, 26585, 113, 16149, 114, 127, 118, 122, 125, 118, 127, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Asa", "Carl", "##sson", "(", "Sweden", ")", "beat", "Gloria", "Pi", "##zzi", "##chin", "##i", "(", "Italy", ")", "3", "-", "6", "6", "-", "1", "7", "-", "5" ], "ids": [ 96536, 12225, 14650, 113, 20937, 114, 27868, 26209, 38329, 22125, 43849, 10116, 113, 11619, 114, 124, 118, 127, 127, 118, 122, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barbara", "Sc", "##het", "##t", "(", "Austria", ")", "beat", "Sabine", "App", "##elma", "##ns", "(", "Belgium", ")", "1", "-", "6", "6", "-", "4", "6", "-", "4" ], "ids": [ 16010, 55260, 13358, 10123, 113, 14479, 114, 27868, 55018, 73784, 95243, 10891, 113, 26519, 114, 122, 118, 127, 127, 118, 125, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cristina", "Torre", "##ns", "-", "Vale", "##ro", "(", "Spain", ")", "beat", "Sabine", "Ha", "##ck", "(", "Germany", ")", "2", "-", "6", "6", "-", "4", "6", "-", "2" ], "ids": [ 28286, 20630, 10891, 118, 32286, 10567, 113, 16149, 114, 27868, 55018, 13740, 11263, 113, 12775, 114, 123, 118, 127, 127, 118, 125, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Helena", "Su", "##kova", "(", "Czech", "Republic", ")", "beat", "Yon", "##e", "Kami", "##o", "(", "Japan", ")", "6", "-", "2", "6", "-", "3" ], "ids": [ 22295, 12271, 61653, 113, 22148, 13681, 114, 27868, 94712, 10112, 87966, 10133, 113, 11891, 114, 127, 118, 123, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Irina", "Sp", "##ir", "##lea", "(", "Romania", ")", "beat", "Petra", "Be", "##ger", "##ow", "(", "Germany", ")", "6", "-", "3", "6", "-", "2" ], "ids": [ 60862, 46361, 10835, 25277, 113, 13927, 114, 27868, 27357, 14321, 11446, 16602, 113, 12775, 114, 127, 118, 124, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Maria", "Jose", "Ga", "##idan", "##o", "(", "Argentina", ")", "beat", "Melanie", "Sc", "##hne", "##ll", "(", "Austria", ")", "6", "-", "4", "6", "-", "0" ], "ids": [ 11066, 23029, 69699, 52299, 10133, 113, 12853, 114, 27868, 59970, 55260, 37893, 11231, 113, 14479, 114, 127, 118, 125, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Carlos", "Mo", "##ya", "(", "Spain", ")", "beat", "Scott", "Hum", "##ph", "##ries", "(", "U", ".", "S", ".", ")", "6", "-", "1", "6", "-", "7", "(", "3", "-", "7", ")", "6", "-", "7", "(", "1", "-", "7", ")", "6", "-", "0", "6", "-", "4" ], "ids": [ 12050, 34987, 10679, 113, 16149, 114, 27868, 12812, 91636, 28088, 15388, 113, 158, 119, 156, 119, 114, 127, 118, 122, 127, 118, 128, 113, 124, 118, 128, 114, 127, 118, 128, 113, 122, 118, 128, 114, 127, 118, 121, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kenneth", "Carl", "##sen", "(", "Denmark", ")", "beat", "Patrick", "Ra", "##fter", "(", "Australia", ")", "7", "-", "6", "(", "9", "-", "7", ")", "6", "-", "3", "7", "-", "6", "(", "8", "-", "6", ")" ], "ids": [ 22369, 12225, 10917, 113, 25854, 114, 27868, 13867, 38571, 33163, 113, 11729, 114, 128, 118, 127, 113, 130, 118, 128, 114, 127, 118, 124, 128, 118, 127, 113, 129, 118, 127, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Magnus", "Gustaf", "##sson", "(", "Sweden", ")", "beat", "Carlos", "Costa", "(", "Spain", ")", "7", "-", "5", "4", "-", "6", "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "3" ], "ids": [ 22940, 36183, 14650, 113, 20937, 114, 27868, 12050, 13902, 113, 16149, 114, 128, 118, 126, 125, 118, 127, 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jeff", "Tara", "##ngo", "(", "U", ".", "S", ".", ")", "beat", "Alex", "Radu", "##les", "##cu", "(", "Romania", ")", "6", "-", "7", "(", "5", "-", "7", ")", "6", "-", "4", "6", "-", "1", "retired", ",", "heat", "ex", "##haus", "##tion" ], "ids": [ 17218, 51806, 32448, 113, 158, 119, 156, 119, 114, 27868, 14728, 75583, 11268, 12352, 113, 13927, 114, 127, 118, 128, 113, 126, 118, 128, 114, 127, 118, 125, 127, 118, 122, 18675, 117, 33955, 11419, 14465, 10822 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "11", "-", "Mali", "##V", "##ai", "Washington", "(", "U", ".", "S", ".", ")", "beat", "Karim", "Alam", "##i", "(", "Morocco", ")", "6", "-", "4", "2", "-", "6", "7", "-", "6", "(", "7", "-", "5", ")", "6", "-", "1" ], "ids": [ 10193, 118, 24427, 11779, 11542, 11586, 113, 158, 119, 156, 119, 114, 27868, 71139, 51255, 10116, 113, 57295, 114, 127, 118, 125, 123, 118, 127, 128, 118, 127, 113, 128, 118, 126, 114, 127, 118, 122 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dirk", "Die", "##r", "(", "Germany", ")", "beat", "Chuck", "Adams", "(", "U", ".", "S", ".", ")", "6", "-", "4", "2", "-", "6", "6", "-", "4", "6", "-", "4" ], "ids": [ 38535, 10236, 10129, 113, 12775, 114, 27868, 26865, 16955, 113, 158, 119, 156, 119, 114, 127, 118, 125, 123, 118, 127, 127, 118, 125, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jason", "St", "##olt", "##enberg", "(", "Australia", ")", "beat", "Stefano", "Pe", "##sco", "##sol", "##ido", "(", "Italy", ")", "7", "-", "5", "6", "-", "4", "6", "-", "1" ], "ids": [ 16796, 10838, 27667, 24304, 113, 11729, 114, 27868, 26381, 29005, 22402, 43115, 12306, 113, 11619, 114, 128, 118, 126, 127, 118, 125, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arnaud", "Bo", "##ets", "##ch", "(", "France", ")", "beat", "Nicolas", "Pereira", "(", "Venezuela", ")", "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "4", "7", "-", "5" ], "ids": [ 56856, 27622, 17137, 10269, 113, 10688, 114, 27868, 16443, 32610, 113, 15693, 114, 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 125, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "David", "Prin", "##osi", "##l", "(", "Germany", ")", "beat", "Peter", "Tra", "##ma", "##cchi", "(", "Australia", ")", "6", "-", "3", "6", "-", "2", "3", "-", "6", "6", "-", "7", "(", "5", "-", "7", ")", "6", "-", "1" ], "ids": [ 10804, 86525, 20316, 10161, 113, 12775, 114, 27868, 10979, 21469, 10369, 24555, 113, 11729, 114, 127, 118, 124, 127, 118, 123, 124, 118, 127, 127, 118, 128, 113, 126, 118, 128, 114, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Amanda", "Co", "##etz", "##er", "(", "South", "Africa", ")", "beat", "6", "-", "An", "##ke", "Huber", "(", "Germany", ")", "6", "-", "1", "2", "-", "6", "6", "-", "2" ], "ids": [ 30380, 13098, 75065, 10165, 113, 11056, 12880, 114, 27868, 127, 118, 10313, 10550, 46398, 113, 12775, 114, 127, 118, 122, 123, 118, 127, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anna", "Ko", "##urn", "##iko", "##va", "(", "Russia", ")", "beat", "Lu", "##d", "##mila", "Richter", "##ova", "(", "Czech", "Republic", ")", "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "3" ], "ids": [ 12300, 30186, 63158, 18924, 10362, 113, 14664, 114, 27868, 23859, 10162, 35634, 26888, 12804, 113, 22148, 13681, 114, 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Debbie", "Graham", "(", "U", ".", "S", ".", ")", "beat", "Stephanie", "Devil", "##le", "(", "Belarus", ")", "6", "-", "4", "6", "-", "2" ], "ids": [ 78808, 16928, 113, 158, 119, 156, 119, 114, 27868, 44741, 25410, 10284, 113, 55131, 114, 127, 118, 125, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barbara", "R", "##itt", "##ner", "(", "Germany", ")", "beat", "Katarina", "St", "##uden", "##iko", "##va", "(", "Slovakia", ")", "7", "-", "5", "7", "-", "5" ], "ids": [ 16010, 155, 25249, 11129, 113, 12775, 114, 27868, 65988, 10838, 23280, 18924, 10362, 113, 43031, 114, 128, 118, 126, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kristina", "Brand", "##i", "(", "U", ".", "S", ".", ")", "beat", "Andrea", "Glass", "(", "Germany", ")", "6", "-", "2", "6", "-", "3" ], "ids": [ 61902, 28887, 10116, 113, 158, 119, 156, 119, 114, 27868, 16101, 31988, 113, 12775, 114, 127, 118, 123, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##es", "Go", "##rro", "##chat", "##egu", "##i", "(", "Argentina", ")", "beat", "Magdalena", "G", "##rzy", "##bow", "##ska", "(", "Poland", ")", "4", "-", "6", "6", "-", "4", "6", "-", "1" ], "ids": [ 10167, 10171, 14439, 38692, 73267, 40876, 10116, 113, 12853, 114, 27868, 27166, 144, 27828, 63081, 11485, 113, 17879, 114, 125, 118, 127, 127, 118, 125, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Alberto", "Be", "##ras", "##ate", "##gui", "(", "Spain", ")", "beat", "Cecil", "Ma", "##mii", "##t", "(", "U", ".", "S", ".", ")", "6", "-", "1", "6", "-", "4", "6", "-", "0" ], "ids": [ 15796, 14321, 12783, 12436, 55818, 113, 16149, 114, 27868, 37440, 13744, 52025, 10123, 113, 158, 119, 156, 119, 114, 127, 118, 122, 127, 118, 125, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Guillaume", "Rao", "##ux", "(", "France", ")", "beat", "Filip", "De", "##wu", "##lf", "(", "Belgium", ")", "7", "-", "6", "(", "7", "-", "5", ")", "3", "-", "6", "1", "-", "6", "6", "-", "4", "7", "-", "5" ], "ids": [ 20619, 44776, 11855, 113, 10688, 114, 27868, 31445, 10190, 40054, 35173, 113, 26519, 114, 128, 118, 127, 113, 128, 118, 126, 114, 124, 118, 127, 122, 118, 127, 127, 118, 125, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alex", "O", "'", "Brien", "(", "U", ".", "S", ".", ")", "beat", "Nicolas", "La", "##pent", "##ti", "(", "Ecuador", ")", "6", "-", "4", "1", "-", "6", "6", "-", "4", "6", "-", "3" ], "ids": [ 14728, 152, 112, 33629, 113, 158, 119, 156, 119, 114, 27868, 16443, 10159, 55939, 10325, 113, 20475, 114, 127, 118, 125, 122, 118, 127, 127, 118, 125, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "Michael", "Chang", "(", "U", ".", "S", ".", ")", "beat", "Jaime", "On", "##cin", "##s", "(", "Brazil", ")", "3", "-", "6", "6", "-", "1", "6", "-", "0", "7", "-", "6", "(", "8", "-", "6", ")" ], "ids": [ 123, 118, 10631, 28545, 113, 158, 119, 156, 119, 114, 27868, 30454, 10576, 43093, 10107, 113, 16765, 114, 124, 118, 127, 127, 118, 122, 127, 118, 121, 128, 118, 127, 113, 129, 118, 127, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "14", "-", "Barbara", "Paulus", "(", "Austria", ")", "beat", "Yi", "Jing", "-", "Qi", "##an", "(", "China", ")", "6", "-", "2", "6", "-", "1" ], "ids": [ 10247, 118, 16010, 33470, 113, 14479, 114, 27868, 40512, 94154, 118, 88454, 10206, 113, 11593, 114, 127, 118, 123, 127, 118, 122 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wang", "Shi", "-", "Tin", "##g", "(", "Taiwan", ")", "beat", "Cor", "##ina", "Mora", "##riu", "(", "U", ".", "S", ".", ")", "6", "-", "4", "6", "-", "7", "(", "5", "-", "7", ")", "6", "-", "2" ], "ids": [ 17250, 44795, 118, 48800, 10240, 113, 19449, 114, 27868, 93495, 11067, 46052, 19404, 113, 158, 119, 156, 119, 114, 127, 118, 125, 127, 118, 128, 113, 126, 118, 128, 114, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Linda", "Wild", "(", "U", ".", "S", ".", ")", "beat", "Sung", "-", "Hee", "Park", "(", "South", "Korea", ")", "6", "-", "2", "6", "-", "3" ], "ids": [ 22227, 15899, 113, 158, 119, 156, 119, 114, 27868, 55646, 118, 107443, 11239, 113, 11056, 14096, 114, 127, 118, 123, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sarah", "Pit", "##kowski", "(", "France", ")", "beat", "Meg", "##han", "##n", "Sha", "##ugh", "##ness", "##y", "(", "U", ".", "S", ".", ")", "6", "-", "3", "6", "-", "3" ], "ids": [ 16548, 79321, 36567, 113, 10688, 114, 27868, 77499, 11781, 10115, 106583, 25905, 14010, 10157, 113, 158, 119, 156, 119, 114, 127, 118, 124, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dall", "##y", "Rand", "##rian", "##te", "##fy", "(", "Madagascar", ")", "beat", "Elena", "Maka", "##rova", "(", "Russia", ")", "6", "-", "3", "1", "-", "6", "7", "-", "5" ], "ids": [ 46005, 10157, 33483, 20764, 10216, 24203, 113, 25998, 114, 27868, 22342, 103960, 36657, 113, 14664, 114, 127, 118, 124, 122, 118, 127, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Laurence", "Court", "##ois", "(", "Belgium", ")", "beat", "Flora", "Per", "##fet", "##ti", "(", "Italy", ")", "6", "-", "4", "3", "-", "6", "6", "-", "2" ], "ids": [ 34946, 14100, 19636, 113, 26519, 114, 27868, 20607, 11982, 77880, 10325, 113, 11619, 114, 127, 118, 125, 124, 118, 127, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-LOC", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 1, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Lea", "##nder", "Pa", "##es", "(", "India", ")", "beat", "Marcos", "On", "##dru", "##ska", "(", "South", "Africa", ")", "7", "-", "6", "(", "7", "-", "3", ")", "6", "-", "2", "7", "-", "5" ], "ids": [ 46231, 16497, 26907, 10171, 113, 11098, 114, 27868, 24936, 10576, 57672, 11485, 113, 11056, 12880, 114, 128, 118, 127, 113, 128, 118, 124, 114, 127, 118, 123, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jan", "Sie", "##meri", "##nk", "(", "Netherlands", ")", "beat", "Carl", "-", "Uwe", "St", "##ee", "##b", "(", "Germany", ")", "4", "-", "6", "6", "-", "1", "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "4" ], "ids": [ 11806, 11583, 85137, 17761, 113, 22043, 114, 27868, 12225, 118, 62100, 10838, 13321, 10457, 113, 12775, 114, 125, 118, 127, 127, 118, 122, 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Neville", "God", "##win", "(", "South", "Africa", ")", "beat", "Tomas", "Carbon", "##ell", "(", "Spain", ")", "6", "-", "4", "6", "-", "2", "3", "-", "6", "6", "-", "1" ], "ids": [ 47924, 14015, 24748, 113, 11056, 12880, 114, 27868, 41889, 77315, 13503, 113, 16149, 114, 127, 118, 125, 127, 118, 123, 124, 118, 127, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jim", "Grab", "##b", "(", "U", ".", "S", ".", ")", "beat", "Sand", "##on", "St", "##olle", "(", "Australia", ")", "6", "-", "3", "7", "-", "5", "7", "-", "6", "(", "7", "-", "4", ")" ], "ids": [ 14178, 61020, 10457, 113, 158, 119, 156, 119, 114, 27868, 35071, 10263, 10838, 47951, 113, 11729, 114, 127, 118, 124, 128, 118, 126, 128, 118, 127, 113, 128, 118, 125, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Alexandra", "Fu", "##sai", "(", "France", ")", "beat", "Jill", "C", "##ray", "##bas", "(", "U", ".", "S", ".", ")", "6", "-", "1", "2", "-", "6", "7", "-", "5" ], "ids": [ 23438, 17056, 32912, 113, 10688, 114, 27868, 46171, 140, 23432, 21322, 113, 158, 119, 156, 119, 114, 127, 118, 122, 123, 118, 127, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Na", "##oko", "Ki", "##jim", "##uta", "(", "Japan", ")", "beat", "Tat", "##yana", "Je", "##cm", "##enic", "##a", "(", "Yugoslavia", ")", "6", "-", "3", "6", "-", "2" ], "ids": [ 10685, 20954, 28941, 60911, 14118, 113, 11891, 114, 27868, 86561, 31523, 13796, 27528, 69181, 10113, 113, 38168, 114, 127, 118, 124, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nathalie", "Dec", "##hy", "(", "France", ")", "beat", "Christina", "Singer", "(", "Germany", ")", "6", "-", "4", "6", "-", "0" ], "ids": [ 64682, 46147, 19275, 113, 10688, 114, 27868, 28539, 29842, 113, 12775, 114, 127, 118, 125, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jane", "Chi", "(", "U", ".", "S", ".", ")", "beat", "Maria", "Antonio", "Sanchez", "Lorenzo", "(", "Spain", ")", "6", "-", "4", "1", "-", "6", "6", "-", "3" ], "ids": [ 15549, 21946, 113, 158, 119, 156, 119, 114, 27868, 11066, 11873, 66007, 18782, 113, 16149, 114, 127, 118, 125, 122, 118, 127, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Els", "Calle", "##ns", "(", "Belgium", ")", "beat", "Nicole", "Brad", "##tke", "(", "Australia", ")", "7", "-", "6", "(", "7", "-", "1", ")", "7", "-", "6", "(", "9", "-", "7", ")" ], "ids": [ 13075, 57433, 10891, 113, 26519, 114, 27868, 27142, 29382, 61877, 113, 11729, 114, 128, 118, 127, 113, 128, 118, 122, 114, 128, 118, 127, 113, 130, 118, 128, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Natalia", "Bau", "##done", "(", "Italy", ")", "beat", "Jo", "##lene", "Watanabe", "(", "U", ".", "S", ".", ")", "6", "-", "4", "4", "-", "6", "7", "-", "6", "(", "8", "-", "6", ")" ], "ids": [ 51946, 18727, 99726, 113, 11619, 114, 27868, 20977, 25324, 76910, 113, 158, 119, 156, 119, 114, 127, 118, 125, 125, 118, 127, 128, 118, 127, 113, 129, 118, 127, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ai", "Su", "##gi", "##yama", "(", "Japan", ")", "beat", "Jana", "Kan", "##dar", "##r", "(", "Germany", ")", "6", "-", "2", "6", "-", "1" ], "ids": [ 19672, 12271, 11210, 32529, 113, 11891, 114, 27868, 18909, 57528, 15460, 10129, 113, 12775, 114, 127, 118, 123, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "C", "##UB", "##S", "ED", "##GE", "BR", "##AV", "##ES", "W", "##IT", "##H", "R", "##UN", "IN", "TOP", "OF", "N", "##IN", "##TH", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 140, 82439, 10731, 74053, 58719, 49351, 99903, 25054, 160, 37611, 12396, 155, 69849, 36351, 98151, 23240, 151, 27128, 109166, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "1996", "-", "08", "-", "25" ], "ids": [ 30554, 44376, 77261, 10738, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brian", "M", "##c", "##R", "##ae", "single", "##d", "in", "Tyler", "Houston", "in", "the", "top", "of", "the", "ninth", "inning", "to", "sna", "##p", "a", "tie", "as", "the", "Chicago", "Cubs", "avoid", "##ed", "a", "three", "-", "game", "s", "##we", "##ep", "with", "3", "-", "2", "victory", "over", "the", "Atlanta", "Braves", "on", "Sunday", "." ], "ids": [ 13977, 150, 10350, 11273, 14193, 11376, 10162, 10106, 25627, 18551, 10106, 10105, 12364, 10108, 10105, 54905, 110505, 10114, 62541, 10410, 169, 27916, 10146, 10105, 12317, 97605, 33253, 10336, 169, 11003, 118, 11661, 187, 12577, 19986, 10169, 124, 118, 123, 19735, 10491, 10105, 19600, 97242, 10135, 19731, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "The", "Braves", "scored", "four", "runs", "in", "the", "ninth", "for", "a", "6", "-", "5", "victory", "on", "Saturday", "." ], "ids": [ 10117, 97242, 17233, 11598, 17913, 10106, 10105, 54905, 10142, 169, 127, 118, 126, 19735, 10135, 24848, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kevin", "Foster", "(", "5", "-", "2", ")", "won", "his", "second", "straight", "start", ",", "allowing", "two", "runs", "and", "six", "hits", "with", "two", "walks", "and", "three", "strike", "##outs", "over", "eight", "innings", "." ], "ids": [ 15377, 25348, 113, 126, 118, 123, 114, 11367, 10226, 11132, 31214, 15148, 117, 28357, 10551, 17913, 10111, 12449, 27922, 10169, 10551, 106216, 10111, 11003, 37456, 72199, 10491, 16222, 48974, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "biggest", "thing", "was", "my", "fast", "##ball", ",", "I", "was", "able", "to", "rota", "##te", "it", "pretty", "good", ",", "\"", "Foster", "said", ".", "\"" ], "ids": [ 107, 10117, 36304, 40414, 10134, 15127, 15040, 19805, 117, 146, 10134, 16197, 10114, 79965, 10216, 10271, 108361, 15198, 117, 107, 25348, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "Also", ",", "I", "was", "able", "to", "keep", "my", "change", "##up", "down", ".", "\"" ], "ids": [ 20593, 117, 146, 10134, 16197, 10114, 23819, 15127, 15453, 14590, 12935, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Colorado", ",", "Vi", "##nny", "Castilla", "home", "##red", "twice", "and", "drove", "in", "four", "runs", "and", "Larry", "Walker", "went", "3", "-", "for", "-", "4", "with", "a", "home", "##r", "and", "three", "RB", "##I", "as", "the", "Colorado", "Rock", "##ies", "out", "##slu", "##gged", "the", "Pittsburgh", "Pirates", "13", "-", "9", "in", "the", "rubber", "game", "of", "a", "three", "-", "game", "series", "." ], "ids": [ 11699, 17111, 117, 31826, 58916, 25570, 11816, 15711, 26261, 10111, 72256, 10106, 11598, 17913, 10111, 19629, 15432, 13446, 124, 118, 10142, 118, 125, 10169, 169, 11816, 10129, 10111, 11003, 71201, 11281, 10146, 10105, 17111, 12158, 11624, 10950, 107992, 91518, 10105, 23812, 41839, 10249, 118, 130, 10106, 10105, 92724, 11661, 10108, 169, 11003, 118, 11661, 11366, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Castilla", "'", "s", "first", "home", "##r", "of", "the", "game", ",", "a", "solo", "shot", "in", "the", "seventh", "off", "relieve", "##r", "Marc", "Wilkins", "(", "3", "-", "1", ")", "extended", "Colorado", "'", "s", "lead", "to", "9", "-", "7", "." ], "ids": [ 25570, 112, 187, 10422, 11816, 10129, 10108, 10105, 11661, 117, 169, 11395, 19508, 10106, 10105, 37192, 11898, 85440, 10129, 15254, 63112, 113, 124, 118, 122, 114, 21777, 17111, 112, 187, 14107, 10114, 130, 118, 128, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "added", "a", "three", "-", "run", "home", "##r", "in", "the", "eighth", "off", "John", "Eric", "##ks", "to", "make", "it", "13", "-", "8", "." ], "ids": [ 10357, 16288, 169, 11003, 118, 14095, 11816, 10129, 10106, 10105, 46758, 11898, 10421, 14057, 11676, 10114, 13086, 10271, 10249, 118, 129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Florida", ",", "Edgar", "Ren", "##teria", "'", "s", "two", "-", "out", "single", "in", "the", "bottom", "of", "the", "ninth", "inning", "scored", "Jesus", "Ta", "##vare", "##z", "with", "the", "winning", "run", "as", "the", "Florida", "Mar", "##lins", "edge", "##d", "the", "Cincinnati", "Reds", "6", "-", "5", "." ], "ids": [ 11699, 13668, 117, 21002, 52712, 47675, 112, 187, 10551, 118, 10950, 11376, 10106, 10105, 34787, 10108, 10105, 54905, 110505, 17233, 15831, 14248, 38971, 10305, 10169, 10105, 16542, 14095, 10146, 10105, 13668, 15734, 68541, 30599, 10162, 10105, 31257, 74652, 127, 118, 126, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Right", "after", "Edgar", "made", "contact", ",", "I", "knew", "I", "had", "to", "score", ",", "\"", "said", "Ta", "##vare", "##z", ".", "\"" ], "ids": [ 107, 23488, 10662, 21002, 11019, 20637, 117, 146, 46000, 146, 10374, 10114, 17704, 117, 107, 12415, 14248, 38971, 10305, 119, 107 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "I", "knew", "I", "would", "score", "even", "if", "he", "field", "##ed", "it", "clean", "##ly", ",", "he", "could", "n", "'", "t", "throw", "me", "out", ".", "\"" ], "ids": [ 146, 46000, 146, 10894, 17704, 13246, 12277, 10261, 13939, 10336, 10271, 55911, 10454, 117, 10261, 12174, 182, 112, 188, 73696, 10911, 10950, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Edgar", "is", "a", "tre", "##mend", "##ous", "player", "right", "now", ",", "\"", "said", "Florida", "manager", "John", "Bol", "##es", ".", "\"" ], "ids": [ 107, 21002, 10124, 169, 11617, 101480, 13499, 12928, 13448, 11858, 117, 107, 12415, 13668, 16935, 10421, 45598, 10171, 119, 107 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "But", "I", "ca", "n", "'", "t", "wait", "to", "see", "how", "good", "he", "'", "ll", "be", "when", "he", "grows", "up", ".", "\"" ], "ids": [ 16976, 146, 11135, 182, 112, 188, 83279, 10114, 12888, 14796, 15198, 10261, 112, 22469, 10347, 10841, 10261, 60394, 10741, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "San", "Francisco", ",", "Osvaldo", "Fe", "##nan", "##dez", "fired", "a", "seven", "-", "hit", "##ter", "and", "Tre", "##nida", "##d", "Hubbard", "belt", "##ed", "a", "two", "-", "run", "home", "##r", "as", "the", "San", "Francisco", "Giants", "ended", "a", "three", "-", "game", "losing", "streak", "by", "defeating", "the", "Montreal", "Expo", "##s", ",", "7", "-", "2", "." ], "ids": [ 10167, 10469, 11798, 117, 90566, 20187, 13470, 30131, 38903, 169, 15767, 118, 14946, 10877, 10111, 30932, 94158, 10162, 73590, 62705, 10336, 169, 10551, 118, 14095, 11816, 10129, 10146, 10105, 10469, 11798, 36658, 18428, 169, 11003, 118, 11661, 27817, 88302, 10155, 42385, 10105, 20990, 52947, 10107, 117, 128, 118, 123, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fernandez", "(", "6", "-", "13", ")", "allowed", "two", "runs", ",", "walk", "##ed", "one", "and", "struck", "out", "eight", "for", "his", "second", "career", "complete", "game", ",", "both", "against", "Montreal", "." ], "ids": [ 71566, 113, 127, 118, 10249, 114, 18162, 10551, 17913, 117, 33734, 10336, 10464, 10111, 45622, 10950, 16222, 10142, 10226, 11132, 13021, 17876, 11661, 117, 11408, 11327, 20990, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "In", "Los", "Angeles", ",", "Greg", "Ga", "##gne", "had", "a", "run", "-", "scoring", "single", "and", "Chad", "Curtis", "drew", "a", "bases", "-", "loaded", "walk", "in", "the", "bottom", "of", "the", "eighth", "inning", "as", "the", "Los", "Angeles", "Dodgers", "ra", "##lli", "##ed", "for", "a", "6", "-", "5", "victory", "and", "a", "three", "-", "game", "s", "##we", "##ep", "of", "the", "New", "York", "Mets", "." ], "ids": [ 10167, 10630, 12233, 117, 22438, 69699, 17428, 10374, 169, 14095, 118, 27346, 11376, 10111, 32148, 25658, 49098, 169, 23213, 118, 103927, 33734, 10106, 10105, 34787, 10108, 10105, 46758, 110505, 10146, 10105, 10630, 12233, 82958, 11859, 14088, 10336, 10142, 169, 127, 118, 126, 19735, 10111, 169, 11003, 118, 11661, 187, 12577, 19986, 10108, 10105, 10287, 10482, 90707, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "\"", "It", "was", "one", "of", "these", "games", "where", "you", "get", "three", "straight", "pin", "##ch", "-", "hits", "and", "a", "walk", "of", "a", "pin", "##ch", "-", "hit", "##ter", ",", "that", "'", "s", "how", "you", "win", "penn", "##ants", ",", "\"", "Dodgers", "manager", "Bill", "Russell", "said", ".", "\"" ], "ids": [ 107, 10377, 10134, 10464, 10108, 11762, 13332, 10940, 13028, 15329, 11003, 31214, 59227, 10269, 118, 27922, 10111, 169, 33734, 10108, 169, 59227, 10269, 118, 14946, 10877, 117, 10189, 112, 187, 14796, 13028, 14125, 62603, 22595, 117, 107, 82958, 16935, 13160, 13481, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Mike", "Piazza" ], "ids": [ 13270, 39214 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "In", "San", "Diego", ",", "Steve", "Fin", "##ley", "and", "Jo", "##dy", "Reed", "drove", "in", "three", "runs", "apie", "##ce", "as", "the", "San", "Diego", "Padre", "##s", "built", "a", "six", "-", "run", "lead", "after", "three", "innings", "and", "cruise", "##d", "to", "an", "11", "-", "2", "victory", "over", "the", "Philadelphia", "Phil", "##lies", "." ], "ids": [ 10167, 10469, 14665, 117, 13308, 39982, 12105, 10111, 20977, 12355, 24858, 72256, 10106, 11003, 17913, 20456, 10419, 10146, 10105, 10469, 14665, 34958, 10107, 12183, 169, 12449, 118, 14095, 14107, 10662, 11003, 48974, 10111, 101148, 10162, 10114, 10151, 10193, 118, 123, 19735, 10491, 10105, 15979, 18144, 22201, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Ken", "Cam", "##ini", "##ti", "added", "two", "RB", "##I", "for", "the", "Padre", "##s", ",", "who", "have", "won", "six", "of", "their", "last", "seven", "games", "and", "remained", "one", "game", "ahead", "of", "the", "Los", "Angeles", "Dodgers", "in", "the", "National", "League", "West", "." ], "ids": [ 19355, 68820, 11778, 10325, 16288, 10551, 71201, 11281, 10142, 10105, 34958, 10107, 117, 10479, 10529, 11367, 12449, 10108, 10455, 12469, 15767, 13332, 10111, 15980, 10464, 11661, 35629, 10108, 10105, 10630, 12233, 82958, 10106, 10105, 10655, 11074, 11164, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 2, 6, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "In", "Houston", ",", "Jeff", "Ba", "##g", "##well", "home", "##red", "and", "Don", "##ne", "Wall", "allowed", "one", "run", "over", "seven", "innings", "as", "the", "Houston", "Astro", "##s", "defeated", "the", "St", ".", "Louis", "Cardinals", "4", "-", "1", "." ], "ids": [ 10167, 18551, 117, 17218, 21333, 10240, 15862, 11816, 15711, 10111, 11740, 10238, 19523, 18162, 10464, 14095, 10491, 15767, 48974, 10146, 10105, 18551, 87075, 10107, 18058, 10105, 10838, 119, 11334, 57877, 125, 118, 122, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Wall", "(", "8", "-", "4", ")", "allowed", "three", "hits", ",", "walk", "##ed", "two", "and", "struck", "out", "seven", "as", "the", "Astro", "##s", "moved", "1", "-", "1", "/", "2", "games", "ahead", "of", "the", "Cardinals", "for", "the", "lead", "in", "the", "National", "League", "Central", "." ], "ids": [ 19523, 113, 129, 118, 125, 114, 18162, 11003, 27922, 117, 33734, 10336, 10551, 10111, 45622, 10950, 15767, 10146, 10105, 87075, 10107, 13059, 122, 118, 122, 120, 123, 13332, 35629, 10108, 10105, 57877, 10142, 10105, 14107, 10106, 10105, 10655, 11074, 11885, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "He", "left", "the", "game", "with", "a", "kn", "##ot", "in", "his", "right", "shoulder", "." ], "ids": [ 10357, 12153, 10105, 11661, 10169, 169, 96820, 11290, 10106, 10226, 13448, 78681, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "AF", "##TER", "SU", "##ND", "##A", "##Y", "'", "S", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 55640, 99552, 86643, 58521, 10738, 14703, 112, 156, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "25" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "League", "Baseball" ], "ids": [ 14988, 11074, 27084 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "standing", "##s", "after", "games", "played", "on", "Sunday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 32173, 10107, 10662, 13332, 11553, 10135, 19731, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "winning", "percentage", "and", "games", "behind", ")", ":" ], "ids": [ 14172, 117, 16542, 46971, 10111, 13332, 17155, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ER", "##IC", "##AN", "LE", "##AG", "##UE" ], "ids": [ 24339, 24093, 30889, 41275, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "74", "55", ".", "574", "-" ], "ids": [ 86607, 13034, 162, 42622, 11733, 12535, 11358, 119, 57330, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "68", "61", ".", "527", "6" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 12370, 12314, 119, 43963, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "66", "65", ".", "504", "9" ], "ids": [ 139, 21793, 60493, 11537, 12215, 10843, 119, 43098, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "61", "70", ".", "466", "14" ], "ids": [ 58573, 35066, 77261, 11403, 12314, 10923, 119, 48443, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "47", "83", ".", "362", "27", "1", "/", "2" ], "ids": [ 25067, 11090, 35066, 37611, 11413, 12408, 119, 37257, 10365, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "77", "53", ".", "592", "-" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 12527, 11756, 119, 51447, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "70", "62", ".", "530", "8" ], "ids": [ 39774, 30889, 109865, 11403, 10923, 12066, 119, 31977, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "65", "65", ".", "500", "12" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 10843, 10843, 119, 10757, 10186 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "62", "69", ".", "473", "15", "1", "/", "2" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 12066, 12573, 119, 39130, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "59", "73", ".", "447", "19" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 11867, 12545, 119, 42873, 10270 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "75", "56", ".", "573", "-" ], "ids": [ 157, 11259, 12674, 38025, 11417, 11628, 119, 46491, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "66", "63", ".", "512", "8" ], "ids": [ 23056, 32071, 11090, 51036, 12215, 12256, 119, 29957, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "63", "70", ".", "474", "13" ], "ids": [ 152, 10738, 11733, 44376, 58521, 12256, 10923, 119, 46989, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "61", "69", ".", "469", "13", "1", "/", "2" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 12314, 12573, 119, 39731, 10249, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##ND", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "26", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 102059, 58521, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10314, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "AT", "DE", "##T", "##RO", "##IT" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 30554, 25067, 11090, 35066, 37611 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "AT", "BA", "##L", "##TI", "##M", "##OR", "##E" ], "ids": [ 152, 10738, 11733, 44376, 58521, 30554, 39999, 11369, 72286, 11517, 42622, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "AT", "TO", "##RO", "##NT", "##O" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 30554, 58573, 35066, 77261, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "AT", "CH", "##IC", "##AG", "##O" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 30554, 39774, 30889, 109865, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "AT", "CA", "##L", "##IF", "##OR", "##NI", "##A" ], "ids": [ 139, 21793, 60493, 11537, 30554, 24707, 11369, 53668, 42622, 52898, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "AT", "SE", "##AT", "##T", "##LE" ], "ids": [ 86607, 13034, 162, 42622, 11733, 30554, 23056, 32071, 11090, 51036 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "NA", "##TION", "##AL", "LE", "##AG", "##UE" ], "ids": [ 56586, 98207, 32002, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "81", "48", ".", "628", "-" ], "ids": [ 30554, 44376, 77261, 10738, 12324, 11300, 119, 52888, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "70", "59", ".", "543", "11" ], "ids": [ 102059, 77261, 66014, 32002, 10923, 11867, 119, 50268, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "61", "70", ".", "466", "21" ], "ids": [ 83243, 42622, 28895, 10738, 12314, 10923, 119, 48443, 10296 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "59", "72", ".", "450", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 11867, 12120, 119, 16718, 10328 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "53", "78", ".", "405", "29" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 11756, 12492, 119, 32351, 10386 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "70", "61", ".", "534", "-" ], "ids": [ 145, 11403, 32612, 60493, 11537, 10923, 12314, 119, 43177, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "68", "62", ".", "523", "1", "1", "/", "2" ], "ids": [ 53317, 149, 11403, 83259, 10731, 12370, 12066, 119, 50564, 122, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "64", "64", ".", "500", "4", "1", "/", "2" ], "ids": [ 39774, 30889, 109865, 11403, 11295, 11295, 119, 10757, 125, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "64", "65", ".", "496", "5" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 11295, 10843, 119, 42498, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "55", "75", ".", "423", "14", "1", "/", "2" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 11358, 11417, 119, 36504, 10247, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "72", "60", ".", "545", "-" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 12120, 10709, 119, 49589, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "70", "60", ".", "538", "1" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 10923, 10709, 119, 45677, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "68", "63", ".", "519", "3", "1", "/", "2" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 12370, 12256, 119, 52224, 124, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "55", "73", ".", "430", "15" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 11358, 12545, 119, 26262, 10208 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##ND", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "26", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 102059, 58521, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10314, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "AT", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 30554, 21318, 11537, 64655, 41275, 89955, 36175, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "AT", "H", "##O", "##US", "##TO", "##N" ], "ids": [ 53317, 149, 11403, 83259, 10731, 30554, 145, 11403, 32612, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "AT", "CO", "##L", "##OR", "##AD", "##O" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 30554, 32992, 11369, 42622, 55538, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "B", "##ON", "##DS", "'", "CO", "##NS", "##EC", "##UT", "##IV", "##E", "GA", "##ME", "ST", "##RE", "##A", "##K", "EN", "##DS", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 139, 30118, 33953, 112, 32992, 69196, 35826, 65729, 91238, 11259, 74212, 42424, 53317, 66014, 10738, 11733, 31278, 33953, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "1996", "-", "08", "-", "25" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "San", "Francisco", "Giants", "All", "-", "Star", "left", "field", "##er", "Barry", "Bond", "##s", "did", "not", "appear", "in", "Sunday", "'", "s", "7", "-", "2", "victory", "over", "the", "Montreal", "Expo", "##s", ",", "ending", "his", "consecutive", "games", "streak", "." ], "ids": [ 10469, 11798, 36658, 11101, 118, 11836, 12153, 13939, 10165, 18120, 22670, 10107, 12172, 10472, 22641, 10106, 19731, 112, 187, 128, 118, 123, 19735, 10491, 10105, 20990, 52947, 10107, 117, 29077, 10226, 29864, 13332, 88302, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 2, 6, 6, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "appearing", "as", "a", "pin", "##ch", "-", "hit", "##ter", "in", "the", "previous", "two", "games", ",", "Bond", "##s", ",", "who", "has", "been", "bat", "##tling", "a", "ham", "##stri", "##ng", "injury", ",", "did", "not", "see", "any", "action", "today", ",", "ending", "his", "streak", "at", "357", "consecutive", "games", "." ], "ids": [ 11301, 44349, 10146, 169, 59227, 10269, 118, 14946, 10877, 10106, 10105, 16741, 10551, 13332, 117, 22670, 10107, 117, 10479, 10393, 10590, 11519, 77828, 169, 15128, 34393, 10376, 27443, 117, 12172, 10472, 12888, 11178, 14204, 18745, 117, 29077, 10226, 88302, 10160, 33590, 29864, 13332, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "the", "second", "-", "longest", "streak", "by", "an", "active", "player", "in", "the", "the", "majors", "behind", "Baltimore", "'", "s", "Cal", "R", "##ip", "##ken", ",", "who", "appeared", "in", "his", "major", "-", "league", "record", "2", ",", "282", "##nd", "straight", "game", "today", ",", "a", "13", "-", "0", "loss", "to", "the", "California", "Angels", "." ], "ids": [ 10377, 10134, 10105, 11132, 118, 48344, 88302, 10155, 10151, 14459, 12928, 10106, 10105, 10105, 86611, 17155, 21413, 112, 187, 41280, 155, 17437, 11062, 117, 10479, 14565, 10106, 10226, 11922, 118, 15616, 12410, 123, 117, 28805, 11534, 31214, 11661, 18745, 117, 169, 10249, 118, 121, 18576, 10114, 10105, 11621, 28132, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Bond", "##s", "has", "been", "limited", "to", "a", "pin", "##ch", "-", "hitting", "role", "since", "an", "MR", "##I", "Friday", "showed", "a", "mild", "strain", "of", "his", "left", "ham", "##stri", "##ng", "." ], "ids": [ 22670, 10107, 10393, 10590, 19264, 10114, 169, 59227, 10269, 118, 88998, 12971, 11764, 10151, 52157, 11281, 30767, 27463, 169, 89176, 110158, 10108, 10226, 12153, 15128, 34393, 10376, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bond", "##s", "came", "out", "of", "Wednesday", "'", "s", "game", "against", "New", "York", "in", "the", "ninth", "inning", "after", "suffering", "a", "mild", "ham", "##stri", "##ng", "strain", "." ], "ids": [ 22670, 10107, 13383, 10950, 10108, 57611, 112, 187, 11661, 11327, 10287, 10482, 10106, 10105, 54905, 110505, 10662, 49552, 169, 89176, 15128, 34393, 10376, 110158, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "back", "in", "the", "starting", "lineup", "Thursday", "night", "and", "went", "1", "-", "for", "-", "2", "before", "exit", "##ing", "in", "the", "third", "inning", "." ], "ids": [ 10357, 10134, 12014, 10106, 10105, 21868, 90223, 67067, 16903, 10111, 13446, 122, 118, 10142, 118, 123, 11360, 63827, 10230, 10106, 10105, 12628, 110505, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "32", "-", "year", "-", "old", "Bond", "##s", "is", "hitting", ".", "307", "with", "35", "home", "##rs", "and", "107", "RB", "##I", "and", "has", "been", "one", "of", "the", "few", "bright", "spots", "for", "the", "last", "-", "place", "Giants", "." ], "ids": [ 10117, 10842, 118, 10924, 118, 12898, 22670, 10107, 10124, 88998, 119, 26790, 10169, 10803, 11816, 10943, 10111, 15844, 71201, 11281, 10111, 10393, 10590, 10464, 10108, 10105, 13824, 72041, 64148, 10142, 10105, 12469, 118, 11192, 36658, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Chicago", "Cubs", "out", "##field", "##er", "Sammy", "So", "##sa", "had", "the", "third", "-", "longest", "streak", "at", "304", "games", ",", "but", "that", "ended", "earlier", "this", "week", "when", "he", "suffered", "a", "broken", "bone", "in", "his", "right", "hand", "." ], "ids": [ 12317, 97605, 10950, 13408, 10165, 59859, 12882, 10466, 10374, 10105, 12628, 118, 48344, 88302, 10160, 26263, 13332, 117, 10473, 10189, 18428, 18905, 10531, 16118, 10841, 10261, 26090, 169, 36197, 57254, 10106, 10226, 13448, 15230, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Atlanta", "Braves", "first", "base", "##man", "Fred", "M", "##c", "##G", "##riff", "owns", "the", "second", "-", "longest", "streak", "at", "295", "games", "." ], "ids": [ 19600, 97242, 10422, 11404, 10589, 16887, 150, 10350, 11447, 40738, 76282, 10105, 11132, 118, 48344, 88302, 10160, 26089, 13332, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "J", "##ON", "##K", "RE", "##T", "##UR", "##NS", "TO", "D", "##UT", "##CH", "S", "##Q", "##U", "##AD", "FOR", "BR", "##A", "##Z", "##IL", "FR", "##IE", "##ND", "##L", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 147, 30118, 11733, 71033, 11090, 98348, 69196, 58573, 141, 65729, 86448, 156, 19282, 12022, 55538, 109544, 49351, 10738, 13966, 38850, 64655, 71655, 58521, 11369, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##OT", "##TER", "##DA", "##M", "1996", "-", "08", "-", "26" ], "ids": [ 155, 62146, 99552, 36382, 11517, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "coach", "G", "##uus", "Hi", "##ddin", "##k", "on", "Monday", "recalled", "midfielder", "Wim", "Jon", "##k", "after", "a", "14", "-", "month", "absence", "for", "a", "friendly", "against", "World", "Cup", "holder", "##s", "Brazil", "in", "Amsterdam", "on", "Sunday", "." ], "ids": [ 17693, 15701, 144, 33639, 20065, 51256, 10174, 10135, 40714, 68117, 68049, 73760, 17749, 10174, 10662, 169, 10247, 118, 14064, 28589, 10142, 169, 43941, 11327, 10315, 11544, 48938, 10107, 16765, 10106, 14017, 10135, 19731, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Feyenoord", "midfielder", "Jean", "-", "Paul", "van", "Gast", "##el", "was", "also", "named", "to", "make", "his", "debut", "in", "the", "18", "-", "man", "squad", "." ], "ids": [ 103340, 68049, 10766, 118, 10772, 10145, 99260, 10570, 10134, 10379, 12038, 10114, 13086, 10226, 13424, 10106, 10105, 10218, 118, 10817, 30580, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hi", "##ddin", "##k", "did", "not", "name", "a", "replacement", "captain", "for", "Danny", "Blind", ",", "who", "announced", "his", "retirement", "from", "international", "soccer", "on", "Sunday", "." ], "ids": [ 20065, 51256, 10174, 12172, 10472, 11324, 169, 41636, 28157, 10142, 20340, 41343, 117, 10479, 13854, 10226, 32185, 10188, 12533, 41356, 10135, 19731, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ronald", "de", "Boer", "and", "Dennis", "Berg", "##kamp", "are", "the", "likely", "conte", "##nders", "to", "lead", "the", "team", "." ], "ids": [ 21474, 10104, 80109, 10111, 19874, 17668, 31665, 10301, 10105, 22497, 26777, 72975, 10114, 14107, 10105, 11121, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "35", "-", "year", "-", "old", "Blind", ",", "who", "won", "42", "caps", "for", "the", "Netherlands", ",", "said", "he", "wanted", "to", "con", "##centra", "##te", "on", "playing", "for", "his", "Dutch", "club", "Ajax", "Amsterdam", "." ], "ids": [ 10117, 10803, 118, 10924, 118, 12898, 41343, 117, 10479, 11367, 11276, 52036, 10142, 10105, 22043, 117, 12415, 10261, 22591, 10114, 10173, 97368, 10216, 10135, 14879, 10142, 10226, 17693, 11111, 37057, 14017, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 3, 7, 9 ] }, { "tokens": [ "AC", "Milan", "midfielder", "Edgar", "David", "##s", ",", "who", "was", "sent", "home", "early", "from", "the", "European", "championship", "in", "England", "after", "a", "c", "##lash", "with", "the", "coach", ",", "was", "left", "out", "of", "the", "squad", "." ], "ids": [ 18132, 15807, 68049, 21002, 10804, 10107, 117, 10479, 10134, 14541, 11816, 11732, 10188, 10105, 11914, 20755, 10106, 11701, 10662, 169, 171, 25297, 10169, 10105, 15701, 117, 10134, 12153, 10950, 10108, 10105, 30580, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Squad", ":" ], "ids": [ 53150, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Goal", "##keeper", "##s", "-", "Edwin", "van", "der", "Sar", "(", "Ajax", ")", ",", "Ed", "de", "Go", "##ey", "(", "Feyenoord", ")", "." ], "ids": [ 72620, 98767, 10107, 118, 26259, 10145, 10118, 64696, 113, 37057, 114, 117, 13114, 10104, 14439, 13005, 113, 103340, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9 ] }, { "tokens": [ "Def", "##ender", "##s", "-", "Frank", "de", "Boer", "(", "Ajax", ")", ",", "John", "Ve", "##ld", "##man", "(", "Ajax", ")", ",", "Ja", "##ap", "St", "##am", "(", "PSV", ")", ",", "Arthur", "Nu", "##man", "(", "PSV", ")", ",", "Michael", "Rei", "##ziger", "(", "AC", "Milan", ")", ",", "Johan", "de", "Ko", "##ck", "(", "Schalke", "'", "04", ")", "." ], "ids": [ 77955, 27323, 10107, 118, 11872, 10104, 80109, 113, 37057, 114, 117, 10421, 19561, 12620, 10589, 113, 37057, 114, 117, 28248, 16070, 10838, 11008, 113, 66922, 114, 117, 13134, 28336, 10589, 113, 66922, 114, 117, 10631, 24978, 102192, 113, 18132, 15807, 114, 117, 15706, 10104, 30186, 11263, 113, 87909, 112, 10814, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 7, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Mid", "##field", "##ers", "-", "Richard", "Wit", "##sch", "##ge", "(", "Ajax", ")", ",", "Philip", "Co", "##cu", "(", "PSV", ")", ",", "Wim", "Jon", "##k", "(", "PSV", ")", ",", "Aron", "Winter", "(", "Internazionale", ")", ",", "Jean", "-", "Paul", "van", "Gast", "##el", "(", "Feyenoord", ")", ",", "Clarence", "Seed", "##orf", "(", "Real", "Madrid", ")", "." ], "ids": [ 42234, 13408, 10901, 118, 11118, 83735, 12044, 10525, 113, 37057, 114, 117, 13324, 13098, 12352, 113, 66922, 114, 117, 73760, 17749, 10174, 113, 66922, 114, 117, 101132, 16647, 113, 46399, 114, 117, 10766, 118, 10772, 10145, 99260, 10570, 113, 103340, 114, 117, 40653, 110142, 43920, 113, 12384, 11727, 114, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 9, 3, 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Strike", "##rs", "-", "Ronald", "de", "Boer", "(", "Ajax", ")", ",", "Gaston", "Tau", "##ment", "(", "Feyenoord", ")", ",", "Jordi", "C", "##ru", "##yf", "##f", "(", "Manchester", "United", ")", ",", "Dennis", "Berg", "##kamp", "(", "Arsenal", ")", "." ], "ids": [ 47256, 10943, 118, 21474, 10104, 80109, 113, 37057, 114, 117, 36369, 88233, 10426, 113, 103340, 114, 117, 40928, 140, 11680, 62026, 10575, 113, 15349, 10609, 114, 117, 19874, 17668, 31665, 113, 25587, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 9, 9, 4, 8, 8, 9, 3, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "BA", "##RC", "##EL", "##ON", "##A", "BE", "##AT", "AT", "##LE", "##TI", "##CO", "5", "-", "2", "IN", "SU", "##PER", "##C", "##UP", "." ], "ids": [ 71020, 65622, 24093, 118, 39999, 52932, 68999, 30118, 10738, 46291, 32071, 30554, 51036, 72286, 82272, 126, 118, 123, 36351, 86643, 108408, 10858, 57487, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "BA", "##RC", "##EL", "##ON", "##A", "1996", "-", "08", "-", "26" ], "ids": [ 39999, 52932, 68999, 30118, 10738, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barcelona", "beat", "At", "##leti", "##co", "Madrid", "5", "-", "2", "(", "half", "##time", "2", "-", "1", ")", "in", "the", "Spanish", "Super", "##cup", "on", "Sunday", ":" ], "ids": [ 12113, 27868, 11699, 42136, 10812, 11727, 126, 118, 123, 113, 13877, 18086, 123, 118, 122, 114, 10106, 10105, 14661, 12786, 41739, 10135, 19731, 131 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Barcelona", "-", "Ronaldo", "(", "5th", "and", "89", "##th", "minutes", ")", ",", "Giovanni", "(", "31", "##st", ")", ",", "Pi", "##zzi", "(", "73", "##rd", ")", ",", "De", "la", "Pen", "##a", "(", "75", "##th", ")" ], "ids": [ 12113, 118, 56937, 113, 23255, 10111, 12642, 11143, 15304, 114, 117, 13297, 113, 10413, 10562, 114, 117, 38329, 22125, 113, 12545, 12023, 114, 117, 10190, 10109, 52559, 10113, 113, 11417, 11143, 114 ], "entity": [ "B-ORG", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##leti", "##co", "Madrid", "-", "Es", "##nai", "##der", "(", "37", "##th", ")", ",", "Pan", "##tic", "(", "57", "##th", ",", "penalty", ")" ], "ids": [ 11699, 42136, 10812, 11727, 118, 10912, 32191, 11304, 113, 11204, 11143, 114, 117, 18661, 13275, 113, 11817, 11143, 117, 40924, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "30", ",", "000" ], "ids": [ 46080, 10244, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "AU", "##ST", "##RI", "##A", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 29088, 32995, 46876, 10738, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VI", "##EN", "##NA", "1996", "-", "08", "-", "26" ], "ids": [ 12262, 50655, 36742, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "an", "Austrian", "first" ], "ids": [ 32070, 16203, 10108, 10151, 32201, 10422 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "match", "played", "on", "Sunday", ":" ], "ids": [ 13751, 41356, 12356, 11553, 10135, 19731, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SV", "R", "##ied", "0", "SV", "Salzburg", "4" ], "ids": [ 25452, 155, 24140, 121, 25452, 29024, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Tirol", "Innsbruck", "6", "4", "2", "0", "13", "5", "14" ], "ids": [ 11529, 44104, 36184, 127, 125, 123, 121, 10249, 126, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SV", "Salzburg", "6", "4", "2", "0", "8", "1", "14" ], "ids": [ 25452, 29024, 127, 125, 123, 121, 129, 122, 10247 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Austria", "Vienna", "6", "4", "2", "0", "9", "5", "14" ], "ids": [ 14479, 20590, 127, 125, 123, 121, 130, 126, 10247 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sturm", "Graz", "6", "2", "3", "1", "8", "5", "9" ], "ids": [ 53079, 34288, 127, 123, 124, 122, 129, 126, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GA", "##K", "6", "1", "3", "2", "8", "10", "6" ], "ids": [ 74212, 11733, 127, 122, 124, 123, 129, 10150, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rapid", "Wien", "5", "0", "5", "0", "3", "3", "5" ], "ids": [ 41047, 13659, 126, 121, 126, 121, 124, 124, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SV", "R", "##ied", "6", "1", "1", "4", "6", "9", "4" ], "ids": [ 25452, 155, 24140, 127, 122, 122, 125, 127, 130, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Linz", "##er", "AS", "##K", "5", "0", "3", "2", "4", "8", "3" ], "ids": [ 45064, 10165, 17421, 11733, 126, 121, 124, 123, 125, 129, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ad", "##mira", "/", "W", "##acker", "6", "0", "3", "3", "5", "10", "3" ], "ids": [ 25474, 66807, 120, 160, 108372, 127, 121, 124, 124, 126, 10150, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FC", "Linz", "6", "0", "2", "4", "1", "9", "2" ], "ids": [ 11529, 45064, 127, 121, 123, 125, 122, 130, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "AU", "##ST", "##RA", "##L", "##IA", "BE", "##AT", "Z", "##IM", "##BA", "##B", "##W", "##E", "BY", "125", "R", "##UN", "##S", "IN", "ONE", "-", "DA", "##Y", "MA", "##TC", "##H", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 29088, 32995, 29990, 11369, 35976, 46291, 32071, 163, 42031, 35999, 11274, 13034, 11259, 66710, 14048, 155, 69849, 10731, 36351, 57929, 118, 47855, 14703, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", "beat", "Zimbabwe", "by", "125", "runs", "in", "the", "first", "match", "of", "the", "Singer", "World", "Series", "one", "-", "day", "(", "50", "over", "##s", ")", "cricket", "tournament", "on", "Monday", "." ], "ids": [ 11729, 27868, 34577, 10155, 14048, 17913, 10106, 10105, 10422, 12356, 10108, 10105, 29842, 10315, 13239, 10464, 118, 11940, 113, 10462, 10491, 10107, 114, 32289, 17390, 10135, 40714, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", ":", "Australia", "263", "-", "7", "in", "50", "over", "##s", ",", "Zimbabwe", "138", "all", "out", "in", "41", "over", "##s", "." ], "ids": [ 66875, 10107, 131, 11729, 28610, 118, 128, 10106, 10462, 10491, 10107, 117, 34577, 19462, 10435, 10950, 10106, 11349, 10491, 10107, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "SC", "##OR", "##EB", "##O", "##AR", "##D", "-", "AU", "##ST", "##RA", "##L", "##IA", "V", "Z", "##IM", "##BA", "##B", "##W", "##E", "ONE", "-", "DA", "##Y", "SC", "##OR", "##EB", "##O", "##AR", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 18137, 42622, 89922, 11403, 52188, 11490, 118, 29088, 32995, 29990, 11369, 35976, 159, 163, 42031, 35999, 11274, 13034, 11259, 57929, 118, 47855, 14703, 18137, 42622, 89922, 11403, 52188, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##board", "in", "the", "Singer", "World" ], "ids": [ 66875, 25690, 10106, 10105, 29842, 10315 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 9, 2, 6 ] }, { "tokens": [ "Series", "one", "-", "day", "(", "50", "over", "##s", ")", "cricket", "match", "between", "Australia", "and" ], "ids": [ 13239, 10464, 118, 11940, 113, 10462, 10491, 10107, 114, 32289, 12356, 10948, 11729, 10111 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Zimbabwe", "on", "Monday", ":" ], "ids": [ 34577, 10135, 40714, 131 ], "entity": [ "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9 ] }, { "tokens": [ "Australia" ], "ids": [ 11729 ], "entity": [ "B-LOC" ], "entity_ids": [ 1 ] }, { "tokens": [ "M", ".", "Slater", "c", "P", ".", "St", "##rang", "b", "W", "##hit", "##tal", "##l", "50" ], "ids": [ 150, 119, 80552, 171, 153, 119, 10838, 24141, 170, 160, 40762, 14191, 10161, 10462 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "M", ".", "W", "##au", "##gh", "b", "P", ".", "St", "##rang", "18" ], "ids": [ 150, 119, 160, 11705, 15774, 170, 153, 119, 10838, 24141, 10218 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "R", ".", "Pont", "##ing", "c", "and", "b", "W", "##hit", "##tal", "##l", "53" ], "ids": [ 155, 119, 23986, 10230, 171, 10111, 170, 160, 40762, 14191, 10161, 11756 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "S", ".", "W", "##au", "##gh", "c", "Campbell", "b", "W", "##hit", "##tal", "##l", "82" ], "ids": [ 156, 119, 160, 11705, 15774, 171, 18172, 170, 160, 40762, 14191, 10161, 12180 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "S", ".", "Law", "b", "St", "##rea", "##k", "20" ], "ids": [ 156, 119, 13216, 170, 10838, 13236, 10174, 10197 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "M", ".", "Be", "##van", "c", "Campbell", "b", "Brand", "##es", "9" ], "ids": [ 150, 119, 14321, 12955, 171, 18172, 170, 28887, 10171, 130 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 9, 4, 8, 9 ] }, { "tokens": [ "I", ".", "He", "##aly", "b", "Brand", "##es", "5" ], "ids": [ 146, 119, 10357, 55826, 170, 28887, 10171, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "B", ".", "Ho", "##gg", "not", "out", "11" ], "ids": [ 139, 119, 20220, 21127, 10472, 10950, 10193 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "b", "-", "1", "lb", "-", "8", "w", "-", "3", "n", "##b", "-", "3", ")", "15" ], "ids": [ 50821, 10107, 113, 170, 118, 122, 23989, 118, 129, 191, 118, 124, 182, 10457, 118, 124, 114, 10208 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "seven", "wickets", "-", "50", "over", "##s", ")", "263" ], "ids": [ 25220, 113, 10142, 15767, 83839, 118, 10462, 10491, 10107, 114, 28610 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "48", "2", "-", "92", "3", "-", "167", "4", "-", "230", "5", "-", "240", "6", "-", "242", "7", "-", "263" ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 11300, 123, 118, 12458, 124, 118, 20905, 125, 118, 16888, 126, 118, 16017, 127, 118, 27297, 128, 118, 28610 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Did", "not", "bat", ":", "P", ".", "Rei", "##ffel", ",", "D", ".", "Fl", "##emmin", "##g", ",", "G", ".", "M", "##c", "##G", "##rath" ], "ids": [ 50133, 10472, 11519, 131, 153, 119, 24978, 91260, 117, 141, 119, 29981, 77213, 10240, 117, 144, 119, 150, 10350, 11447, 42724 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "Bowling", ":", "St", "##rea", "##k", "10", "-", "1", "-", "50", "-", "1", "(", "2", "##w", ",", "2n", "##b", ")", ",", "Brand", "##es", "10", "-", "1", "-", "47", "-", "2", "(", "1", "##w", ")", "," ], "ids": [ 100017, 131, 10838, 13236, 10174, 10150, 118, 122, 118, 10462, 118, 122, 113, 123, 10874, 117, 54886, 10457, 114, 117, 28887, 10171, 10150, 118, 122, 118, 11413, 118, 123, 113, 122, 10874, 114, 117 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", ".", "St", "##rang", "9", "-", "0", "-", "41", "-", "1", ",", "Flower", "6", "-", "0", "-", "28", "-", "0", ",", "W", "##hit", "##tal", "##l", "10", "-", "0", "-", "53", "-", "3", "(", "1", "##n", "##b", ")", "," ], "ids": [ 153, 119, 10838, 24141, 130, 118, 121, 118, 11349, 118, 122, 117, 50300, 127, 118, 121, 118, 10348, 118, 121, 117, 160, 40762, 14191, 10161, 10150, 118, 121, 118, 11756, 118, 124, 113, 122, 10115, 10457, 114, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dec", "##ker", "3", "-", "0", "-", "17", "-", "0", ",", "Shah", "2", "-", "0", "-", "18", "-", "0" ], "ids": [ 46147, 11880, 124, 118, 121, 118, 10273, 118, 121, 117, 24496, 123, 118, 121, 118, 10218, 118, 121 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zimbabwe" ], "ids": [ 34577 ], "entity": [ "B-LOC" ], "entity_ids": [ 1 ] }, { "tokens": [ "A", ".", "Shah", "c", "M", ".", "W", "##au", "##gh", "b", "Ho", "##gg", "41" ], "ids": [ 138, 119, 24496, 171, 150, 119, 160, 11705, 15774, 170, 20220, 21127, 11349 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "G", ".", "Flower", "c", "Pont", "##ing", "b", "Fl", "##emmin", "##g", "7" ], "ids": [ 144, 119, 50300, 171, 23986, 10230, 170, 29981, 77213, 10240, 128 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "A", ".", "Flower", "lb", "##w", "b", "Fl", "##emmin", "##g", "0" ], "ids": [ 138, 119, 50300, 23989, 10874, 170, 29981, 77213, 10240, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "A", ".", "Campbell", "lb", "##w", "b", "M", "##c", "##G", "##rath", "9" ], "ids": [ 138, 119, 18172, 23989, 10874, 170, 150, 10350, 11447, 42724, 130 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "C", ".", "Wish", "##art", "c", "He", "##aly", "b", "Rei", "##ffel", "0" ], "ids": [ 140, 119, 56570, 15391, 171, 10357, 55826, 170, 24978, 91260, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 9 ] }, { "tokens": [ "G", ".", "W", "##hit", "##tal", "##l", "b", "Rei", "##ffel", "11" ], "ids": [ 144, 119, 160, 40762, 14191, 10161, 170, 24978, 91260, 10193 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "C", ".", "Evans", "c", "He", "##aly", "b", "S", ".", "W", "##au", "##gh", "15" ], "ids": [ 140, 119, 18402, 171, 10357, 55826, 170, 156, 119, 160, 11705, 15774, 10208 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "M", ".", "De", "##kker", "not", "out", "8" ], "ids": [ 150, 119, 10190, 24234, 10472, 10950, 129 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "P", ".", "St", "##rang", "b", "M", ".", "W", "##au", "##gh", "9" ], "ids": [ 153, 119, 10838, 24141, 170, 150, 119, 160, 11705, 15774, 130 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "H", ".", "St", "##rea", "##k", "b", "M", ".", "W", "##au", "##gh", "0" ], "ids": [ 145, 119, 10838, 13236, 10174, 170, 150, 119, 160, 11705, 15774, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "E", ".", "Brand", "##es", "c", "Ho", "##gg", "b", "M", ".", "W", "##au", "##gh", "17" ], "ids": [ 142, 119, 28887, 10171, 171, 20220, 21127, 170, 150, 119, 160, 11705, 15774, 10273 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Extra", "##s", "(", "lb", "-", "4", "w", "-", "10", "n", "##b", "-", "7", ")", "21" ], "ids": [ 50821, 10107, 113, 23989, 118, 125, 191, 118, 10150, 182, 10457, 118, 128, 114, 10296 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "all", "out", "-", "41", "over", "##s", ")", "138" ], "ids": [ 25220, 113, 10435, 10950, 118, 11349, 10491, 10107, 114, 19462 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "16", "2", "-", "16", "3", "-", "33", "4", "-", "35", "5", "-", "56", "6", "-", "98", "7", "-", "100", "8", "-", "120" ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 10250, 123, 118, 10250, 124, 118, 11000, 125, 118, 10803, 126, 118, 11628, 127, 118, 12327, 128, 118, 10407, 129, 118, 12048 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", "-", "120" ], "ids": [ 130, 118, 12048 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Bowling", ":", "M", "##c", "##G", "##rath", "7", "-", "2", "-", "13", "-", "1", "(", "2", "##w", ")", ",", "Fl", "##emmin", "##g", "7", "-", "0", "-", "24", "-", "2", "(", "3", "##w", ",", "3", "##n", "##b", ")", "," ], "ids": [ 100017, 131, 150, 10350, 11447, 42724, 128, 118, 123, 118, 10249, 118, 122, 113, 123, 10874, 114, 117, 29981, 77213, 10240, 128, 118, 121, 118, 10233, 118, 123, 113, 124, 10874, 117, 124, 10115, 10457, 114, 117 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rei", "##ffel", "6", "-", "1", "-", "23", "-", "2", "(", "2n", "##b", ")", ",", "S", ".", "W", "##au", "##gh", "7", "-", "2", "-", "24", "-", "1", "(", "1", "##n", "##b", ",", "2", "##w", ")", ",", "Ho", "##gg" ], "ids": [ 24978, 91260, 127, 118, 122, 118, 10328, 118, 123, 113, 54886, 10457, 114, 117, 156, 119, 160, 11705, 15774, 128, 118, 123, 118, 10233, 118, 122, 113, 122, 10115, 10457, 117, 123, 10874, 114, 117, 20220, 21127 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "9", "-", "2", "-", "26", "-", "1", "(", "1", "##n", "##b", ",", "3", "##w", ")", ",", "M", ".", "W", "##au", "##gh", "5", "-", "1", "-", "24", "-", "3" ], "ids": [ 130, 118, 123, 118, 10314, 118, 122, 113, 122, 10115, 10457, 117, 124, 10874, 114, 117, 150, 119, 160, 11705, 15774, 126, 118, 122, 118, 10233, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", ":", "Australia", "won", "by", "125", "runs", "." ], "ids": [ 32070, 16203, 131, 11729, 11367, 10155, 14048, 17913, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "AU", "##ST", "##RA", "##L", "##IA", "263", "-", "7", "IN", "50", "O", "##VE", "##RS", "V", "Z", "##IM", "##BA", "##B", "##W", "##E", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 29088, 32995, 29990, 11369, 35976, 28610, 118, 128, 36351, 10462, 152, 68560, 39469, 159, 163, 42031, 35999, 11274, 13034, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", "scored", "263", "-", "7", "in", "their", "50", "over", "##s", "against", "Zimbabwe", "in", "the", "first", "day", "-", "night", "limited", "over", "##s", "match", "of", "the", "Singer", "World", "Series", "tournament", "on", "Monday", "." ], "ids": [ 11729, 17233, 28610, 118, 128, 10106, 10455, 10462, 10491, 10107, 11327, 34577, 10106, 10105, 10422, 11940, 118, 16903, 19264, 10491, 10107, 12356, 10108, 10105, 29842, 10315, 13239, 17390, 10135, 40714, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "AU", "##ST", "##RA", "##L", "##IA", "W", "##IN", "TO", "##SS", ",", "OP", "##T", "TO", "BA", "##T", "AG", "##A", "##IN", "##ST", "Z", "##IM", "##BA", "##B", "##W", "##E", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 29088, 32995, 29990, 11369, 35976, 160, 27128, 58573, 49248, 117, 55355, 11090, 58573, 39999, 11090, 17935, 10738, 27128, 32995, 163, 42031, 35999, 11274, 13034, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", "won", "the", "tos", "##s", "and", "decided", "to", "bat", "against", "Zimbabwe", "in", "the", "first", "day", "-", "night", "limited", "over", "##s", "match", "of", "the", "Singer", "World", "Series", "tournament", "on", "Monday", "." ], "ids": [ 11729, 11367, 10105, 84686, 10107, 10111, 17270, 10114, 11519, 11327, 34577, 10106, 10105, 10422, 11940, 118, 16903, 19264, 10491, 10107, 12356, 10108, 10105, 29842, 10315, 13239, 17390, 10135, 40714, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Teams", ":" ], "ids": [ 25754, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Australia", "-", "Mark", "W", "##au", "##gh", ",", "Michael", "Slater", ",", "Ricky", "Pont", "##ing", ",", "Steve", "W", "##au", "##gh", ",", "Stuart", "Law", ",", "Michael", "Be", "##van", ",", "Ian", "He", "##aly", "(", "captain", ")", ",", "Brad", "Ho", "##gg", ",", "Paul", "Rei", "##ffel", ",", "Dame", "##in", "Fleming", ",", "Glenn", "M", "##c", "##G", "##rath", "." ], "ids": [ 11729, 118, 11997, 160, 11705, 15774, 117, 10631, 80552, 117, 40486, 23986, 10230, 117, 13308, 160, 11705, 15774, 117, 18712, 13216, 117, 10631, 14321, 12955, 117, 16582, 10357, 55826, 113, 28157, 114, 117, 29382, 20220, 21127, 117, 10772, 24978, 91260, 117, 17803, 10245, 38283, 117, 26202, 150, 10350, 11447, 42724, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Zimbabwe", "-", "Ali", "##stair", "Campbell", "(", "captain", ")", ",", "Andy", "Flower", ",", "Grant", "Flower", ",", "Guy", "W", "##hit", "##tal", "##l", ",", "Craig", "Evans", ",", "Ed", "##do", "Brand", "##es", ",", "Heath", "St", "##rea", "##k", ",", "Paul", "St", "##rang", ",", "Craig", "Wish", "##art", ",", "Ali", "Shah", ",", "Mark", "De", "##kker", "." ], "ids": [ 34577, 118, 13518, 96772, 18172, 113, 28157, 114, 117, 16802, 50300, 117, 17606, 50300, 117, 16358, 160, 40762, 14191, 10161, 117, 21703, 18402, 117, 13114, 10317, 28887, 10171, 117, 42676, 10838, 13236, 10174, 117, 10772, 10838, 24141, 117, 21703, 56570, 15391, 117, 13518, 24496, 117, 11997, 10190, 24234, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "MO", "##ZA", "##M", "##B", "##I", "##Q", "##UE", "-", "AU", "##G", "##US", "##T", "26", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 102059, 105512, 11517, 11274, 11281, 19282, 62674, 118, 29088, 11447, 32612, 11090, 10314, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MA", "##P", "##UT", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 27277, 11127, 65729, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "is", "the", "leading", "story", "in", "the", "Mo", "##zam", "##bica", "##n", "press", "on", "Monday", "." ], "ids": [ 10747, 10124, 10105, 16018, 13617, 10106, 10105, 34987, 40556, 68031, 10115, 21040, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "this", "story", "and", "does", "not", "vo", "##uch", "for", "its", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 10531, 13617, 10111, 15107, 10472, 12556, 20591, 10142, 10474, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TI", "##CI", "##AS" ], "ids": [ 49307, 72286, 89955, 38025 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "At", "least", "20", "people", "were", "killed", "when", "the", "two", "trucks", "in", "which", "they", "were", "travelling", "coll", "##ide", "##d", "at", "Nha", "##ma", "##vila", "about", "160", "km", "north", "of", "Map", "##uto", "on", "Saturday", ",", "the", "Map", "##uto", "daily", "Not", "##icias", "said", "." ], "ids": [ 118, 11699, 16298, 10197, 11426, 10309, 15875, 10841, 10105, 10551, 99669, 10106, 10319, 10689, 10309, 81353, 28552, 13315, 10162, 10160, 33369, 10369, 39035, 10978, 13849, 10204, 12756, 10108, 24847, 16248, 10135, 24848, 117, 10105, 24847, 16248, 27636, 16040, 68864, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 5, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Lam", "##ont", "##s", "App", "##are", "##l", "files", "re", "##organ", "##ization", "plan", "." ], "ids": [ 44068, 18999, 10107, 73784, 11591, 10161, 33646, 11639, 100807, 19980, 13065, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "[", "CO", "##R", "##RE", "##CT", "##ED", "18", ":", "00", "GMT", "]" ], "ids": [ 164, 32992, 11273, 66014, 91995, 33809, 10218, 131, 11025, 20362, 166 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "K", "##IR", "##K", "##LA", "##ND", ",", "Was", "##h", "." ], "ids": [ 148, 73522, 11733, 44376, 58521, 117, 22034, 10237, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "26" ], "ids": [ 10389, 118, 11052, 118, 10314 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lam", "##ont", "##s", "App", "##are", "##l", "Inc", ",", "an", "operator", "of", "42", "family", "appare", "##l", "stores", "in", "six", "northwestern", "states", ",", "said", "it", "has", "filed", "a", "re", "##organ", "##ization", "plan", "in", "bankruptcy", "court", "in", "Seattle", "." ], "ids": [ 44068, 18999, 10107, 73784, 11591, 10161, 13604, 117, 10151, 36935, 10108, 11276, 11365, 49084, 10161, 36006, 10106, 12449, 89929, 16316, 117, 12415, 10271, 10393, 45959, 169, 11639, 100807, 19980, 13065, 10106, 100019, 14866, 10106, 20902, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "(", "Cor", "##rec", "##ts", "to", "make", "clear", "a", "re", "##organ", "##ization", "plan", "has", "been", "filed", ")", "." ], "ids": [ 113, 93495, 74755, 10806, 10114, 13086, 24866, 169, 11639, 100807, 19980, 13065, 10393, 10590, 45959, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "re", "##organ", "##ization", "plan", "calls", "for", "all", "secured", "claims", "to", "be", "paid", "in", "full", "." ], "ids": [ 10117, 11639, 100807, 19980, 13065, 31886, 10142, 10435, 57202, 25880, 10114, 10347, 25938, 10106, 13375, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Un", "##se", "##cure", "##d", "claims", ",", "including", "those", "of", "company", "bond", "##holders", ",", "will", "be", "sat", "##isfied", "by", "issu", "##ing", "new", "common", "stock", "and", "war", "##rants", "." ], "ids": [ 11038, 10341, 55888, 10162, 25880, 117, 11198, 12676, 10108, 12100, 55185, 75111, 117, 11337, 10347, 20694, 108813, 10155, 28815, 10230, 10751, 14624, 20511, 10111, 10338, 55208, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Un", "##se", "##cure", "##d", "claims", "are", "estimated", "at", "about", "$", "90", "million", "." ], "ids": [ 11038, 10341, 55888, 10162, 25880, 10301, 25267, 10160, 10978, 109, 10919, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lam", "##ont", "##s", "said", "it", "plans", "to", "issue", "9", "million", "shares", "of", "new", "common", "stock", "." ], "ids": [ 44068, 18999, 10107, 12415, 10271, 18195, 10114, 15557, 130, 12473, 45751, 10108, 10751, 14624, 20511, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Of", "that", "amount", ",", "4", ".", "05", "million", "and", "5", ".", "67", "million", "shares", "will", "be", "allocated", "to", "the", "company", "'", "s", "trade", "credit", "##ors", "." ], "ids": [ 12610, 10189, 24074, 117, 125, 119, 10831, 12473, 10111, 126, 119, 12316, 12473, 45751, 11337, 10347, 99109, 10114, 10105, 12100, 112, 187, 18908, 37021, 16379, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Between", "4", ".", "75", "and", "3", ".", "13", "million", "shares", "will", "be", "allocated", "to", "bond", "##holders", "and", "other", "uns", "##ecu", "##red", "non", "-", "trade", "credit", "##ors", "and", "200", ",", "000", "will", "be", "allocated", "to", "existing", "share", "##holders", "in", "exchange", "for", "all", "existing", "stock", "of", "the", "company", "." ], "ids": [ 22036, 125, 119, 11417, 10111, 124, 119, 10249, 12473, 45751, 11337, 10347, 99109, 10114, 55185, 75111, 10111, 10684, 15826, 97038, 15711, 10446, 118, 18908, 37021, 16379, 10111, 10777, 117, 10259, 11337, 10347, 99109, 10114, 26636, 23867, 75111, 10106, 27714, 10142, 10435, 26636, 20511, 10108, 10105, 12100, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bond", "##holders", "and", "other", "uns", "##ecu", "##red", "non", "-", "trade", "credit", "##ors", "will", "receive", "war", "##rants", "four", "about", "2", ".", "2", "million", "shares", "when", "the", "company", "'", "s", "market", "capital", "##ization", "reaches", "$", "20", "million", "." ], "ids": [ 22670, 75111, 10111, 10684, 15826, 97038, 15711, 10446, 118, 18908, 37021, 16379, 11337, 26286, 10338, 55208, 11598, 10978, 123, 119, 123, 12473, 45751, 10841, 10105, 12100, 112, 187, 17313, 12185, 19980, 56663, 109, 10197, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bond", "##holders", ",", "other", "uns", "##ecu", "##red", "non", "-", "trade", "credit", "##ors", ",", "and", "existing", "share", "##holders", "also", "will", "receive", "war", "##rants", "ent", "##it", "##ling", "them", "to", "roughly", "800", ",", "000", "shares", "when", "the", "company", "'", "s", "market", "capital", "##ization", "reaches", "$", "25", "million", "." ], "ids": [ 22670, 75111, 117, 10684, 15826, 97038, 15711, 10446, 118, 18908, 37021, 16379, 117, 10111, 26636, 23867, 75111, 10379, 11337, 26286, 10338, 55208, 61047, 10486, 11945, 11345, 10114, 40540, 11900, 117, 10259, 45751, 10841, 10105, 12100, 112, 187, 17313, 12185, 19980, 56663, 109, 10258, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Management", "will", "receive", "options", "to", "purchase", "10", "percent", "of", "the", "company", "'", "s", "outstanding", "common", "stock", "with", "protection", "against", "dil", "##ution", "at", "an", "option", "exercise", "price", "of", "$", "1", "million", "." ], "ids": [ 16485, 11337, 26286, 53121, 10114, 37891, 10150, 22362, 10108, 10105, 12100, 112, 187, 53933, 14624, 20511, 10169, 20344, 11327, 36031, 30861, 10160, 10151, 32562, 56120, 30839, 10108, 109, 122, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pass", "##enger", "##s", "rescued", "from", "bl", "##azi", "##ng", "ferry", "off", "France", "." ], "ids": [ 30598, 102591, 10107, 106435, 10188, 21484, 28059, 10376, 69607, 11898, 10688, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "100", "people", "were", "safe", "##ly", "eva", "##cua", "##ted", "on", "Monday", "from", "a", "ferry", "that", "caught", "fire", "soon", "after", "leaving", "G", "##uer", "##nsey", "in", "Britain", "'", "s", "Channel", "Islands", ",", "police", "said", "." ], "ids": [ 15946, 11084, 10407, 11426, 10309, 43966, 10454, 103730, 75545, 11912, 10135, 40714, 10188, 169, 69607, 10189, 39797, 13559, 17864, 10662, 21005, 144, 19047, 78919, 10106, 16032, 112, 187, 16558, 16872, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "the", "111", "passengers", "and", "six", "crew", "on", "board", "the", "ferry", "Tri", "##dent", "Seven", ",", "owned", "by", "France", "'", "s", "Em", "##era", "##ud", "line", ",", "were", "rescued", "by", "a", "variety", "of", "private", "and", "commercial", "boats", "after", "fire", "broke", "out", "in", "the", "engine", "room", "soon", "after", "it", "left", "port", "." ], "ids": [ 18051, 12415, 10105, 15821, 37008, 10111, 12449, 24032, 10135, 17936, 10105, 69607, 36642, 21029, 21077, 117, 17012, 10155, 10688, 112, 187, 11289, 12015, 11679, 12117, 117, 10309, 106435, 10155, 169, 20311, 10108, 14591, 10111, 17331, 46760, 10662, 13559, 30500, 10950, 10106, 10105, 18240, 19555, 17864, 10662, 10271, 12153, 16874, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 1, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "88", "-", "year", "-", "old", "woman", "was", "taken", "to", "hospital", "with", "leg", "injuries", ",", "according", "to", "a", "spoke", "##sman", "for", "G", "##uer", "##nsey", "police", "." ], "ids": [ 10313, 12074, 118, 10924, 118, 12898, 18299, 10134, 15109, 10114, 18141, 10169, 33810, 49718, 117, 18071, 10114, 169, 50005, 24305, 10142, 144, 19047, 78919, 15034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "The", "ferry", ",", "which", "was", "to", "##wed", "into", "port", ",", "had", "been", "bound", "for", "Jersey", ",", "another", "in", "a", "cluster", "of", "small", "British", "-", "ruled", "islands", "off", "north", "-", "west", "France", "." ], "ids": [ 10117, 69607, 117, 10319, 10134, 10114, 48854, 10708, 16874, 117, 10374, 10590, 46538, 10142, 14448, 117, 12864, 10106, 169, 66758, 10108, 12474, 11160, 118, 34920, 33294, 11898, 12756, 118, 13735, 10688, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "OS", "##CE", "delay", "##s", "decision", "on", "refuge", "##e", "voting", "." ], "ids": [ 18398, 43161, 76497, 10107, 19231, 10135, 63655, 10112, 48814, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kurt", "Sc", "##hor", "##k" ], "ids": [ 18190, 55260, 39854, 10174 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "SAR", "##A", "##J", "##E", "##VO", "1996", "-", "08", "-", "26" ], "ids": [ 97404, 10738, 15417, 11259, 70325, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bosnia", "'", "s", "election", "organiser", "##s", "will", "decide", "on", "Tuesday", "whether", "or", "not", "to", "post", "##pone", "municipal", "elections", "scheduled", "as", "part", "of", "nationwide", "ballot", "##ing", ",", "an", "OS", "##CE", "spoke", "##s", "##woman", "said", "on", "Monday", "." ], "ids": [ 29634, 112, 187, 13685, 93446, 10107, 11337, 19068, 10135, 70245, 21883, 10345, 10472, 10114, 11841, 35741, 14935, 22054, 34081, 10146, 10668, 10108, 82771, 93339, 10230, 117, 10151, 18398, 43161, 50005, 10107, 79999, 12415, 10135, 40714, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Official", "##s", "from", "the", "Organisation", "for", "Security", "and", "Cooperation", "in", "Europe", "(", "OS", "##CE", ")", "are", "considering", "the", "post", "##pone", "##ment", "following", "allegations", "of", "serious", "irregular", "##ities", "in", "the", "registration", "of", "Ser", "##b", "refugees", "." ], "ids": [ 17678, 10107, 10188, 10105, 22223, 10142, 20924, 10111, 97225, 10106, 11767, 113, 18398, 43161, 114, 10301, 81243, 10105, 11841, 35741, 10426, 11901, 85190, 10108, 32342, 55143, 17285, 10106, 10105, 80315, 10108, 39759, 10457, 71797, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "International", "observer", "##s", "say", "the", "alleged", "irregular", "##ities", "could", "affect", "the", "outcome", "of", "voting", "for", "municipal", "ass", "##em", "##bli", "##es", "." ], "ids": [ 10771, 79368, 10107, 23763, 10105, 48164, 55143, 17285, 12174, 60600, 10105, 89097, 10108, 48814, 10142, 14935, 13935, 10451, 48850, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Tomorrow", ".", ".", "." ], "ids": [ 107, 37670, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "the", "Provisional", "Election", "Commission", "will", "consider", "the", "possible", "post", "##pone", "##ment", "of", "municipal", "elections", "only", ".", ".", "." ], "ids": [ 10105, 73689, 36512, 14941, 11337, 44856, 10105, 14128, 11841, 35741, 10426, 10108, 14935, 22054, 10893, 119, 119, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "the", "other", "elections", "will", "be", "held", "on", "September", "14", ",", "\"", "OS", "##CE", "spoke", "##s", "##woman", "A", "##got", "##a", "Ku", "##per", "##man", "told", "reporter", "##s", "in", "Sarajevo", "." ], "ids": [ 10105, 10684, 22054, 11337, 10347, 11991, 10135, 10596, 10247, 117, 107, 18398, 43161, 50005, 10107, 79999, 138, 47163, 10113, 49869, 12713, 10589, 21937, 41408, 10107, 10106, 21402, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "I", "think", "that", "it", "would", "be", "very", "difficult", "to", "select", "which", "municipal", "elections", "would", "have", "to", "be", "cancelled", "." ], "ids": [ 107, 146, 27874, 10189, 10271, 10894, 10347, 12558, 25232, 10114, 47054, 10319, 14935, 22054, 10894, 10529, 10114, 10347, 60557, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "think", "probably", "if", "the", "decision", "(", "to", "can", "##cell", ")", "were", "to", "be", "taken", "it", "would", "probably", "be", "all", "municipal", "elections", ".", "." ], "ids": [ 146, 27874, 23282, 12277, 10105, 19231, 113, 10114, 10944, 110300, 114, 10309, 10114, 10347, 15109, 10271, 10894, 23282, 10347, 10435, 14935, 22054, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ ".", "\"" ], "ids": [ 119, 107 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Ku", "##per", "##man", "added", "that", "options", "other", "than", "post", "##pone", "##ment", "were", "also", "on", "the", "table", ",", "but", "she", "refused", "to", "sp", "##eci", "##fy", "what", "they", "were", "." ], "ids": [ 49869, 12713, 10589, 16288, 10189, 53121, 10684, 11084, 11841, 35741, 10426, 10309, 10379, 10135, 10105, 21783, 117, 10473, 10833, 29622, 10114, 32650, 95076, 24203, 12976, 10689, 10309, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Dayton", "peace", "agreement", "gave", "the", "OS", "##CE", "a", "mandate", "to", "organise", "Bosnia", "##n", "elections", "." ], "ids": [ 10117, 74767, 28101, 25432, 15362, 10105, 18398, 43161, 169, 106424, 10114, 55081, 29634, 10115, 22054, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "The", "Provisional", "Election", "Commission", "is", "OS", "##CE", "'", "s", "top", "rule", "-", "making", "body", "for", "the", "poll", "." ], "ids": [ 10117, 73689, 36512, 14941, 10124, 18398, 43161, 112, 187, 12364, 21983, 118, 14293, 14333, 10142, 10105, 70156, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "600", ",", "000", "refugees", "have", "registered", "to", "vote", "in", "55", "countries", "around", "the", "world", ",", "representing", "about", "20", "per", "cent", "of", "Bosnia", "'", "s", "total", "electo", "##rate", "." ], "ids": [ 15946, 11084, 11796, 117, 10259, 71797, 10529, 33712, 10114, 18926, 10106, 11358, 15911, 12166, 10105, 11356, 117, 31221, 10978, 10197, 10178, 32882, 10108, 29634, 112, 187, 11339, 103219, 19779, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "are", "due", "to", "begin", "voting", "on", "Wednesday", ",", "August", "28", ",", "just", "one", "day", "after", "the", "PE", "##C", "is", "supposed", "to", "make", "its", "decision", "." ], "ids": [ 11696, 10301, 10850, 10114, 16135, 48814, 10135, 57611, 117, 10735, 10348, 117, 12820, 10464, 11940, 10662, 10105, 80468, 10858, 10124, 59516, 10114, 13086, 10474, 19231, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ball", "##oti", "##ng", "inside", "Bosnia", "is", "scheduled", "for", "September", "14", ",", "when", "citizens", "are", "sl", "##ated", "to", "elect", "municipal", "and", "canton", "##al", "ass", "##em", "##bli", "##es", ",", "separate", "Mo", "##sle", "##m", "-", "C", "##roat", "and", "Ser", "##b", "parliament", "##s", ",", "a", "national", "House", "of", "Representatives", "and", "a", "three", "-", "man", "Presiden", "##cy", "." ], "ids": [ 19479, 23841, 10376, 22978, 29634, 10124, 34081, 10142, 10596, 10247, 117, 10841, 29812, 10301, 38523, 22525, 10114, 106095, 14935, 10111, 20035, 10415, 13935, 10451, 48850, 10171, 117, 19361, 34987, 42176, 10147, 118, 140, 64825, 10111, 39759, 10457, 40519, 10107, 117, 169, 11844, 11545, 10108, 37774, 10111, 169, 11003, 118, 10817, 33382, 11710, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 2, 6, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Sarajevo", "daily", "newspaper", ",", "Dne", "##vi", "Ava", "##z", ",", "which", "is", "close", "to", "Bosnia", "'", "s", "Mo", "##sle", "##m", "nationalist", "SD", "##A", "party", ",", "on", "Monday", "said", "the", "OS", "##CE", "would", "post", "##pone", "the", "municipal", "-", "level", "elections", "until", "the", "Spring", "of", "1997", "because", "of", "the", "refuge", "##e", "registration", "problems", "." ], "ids": [ 138, 21402, 27636, 22047, 117, 55001, 11310, 103933, 10305, 117, 10319, 10124, 16065, 10114, 29634, 112, 187, 34987, 42176, 10147, 99451, 27589, 10738, 14039, 117, 10135, 40714, 12415, 10105, 18398, 43161, 10894, 11841, 35741, 10105, 14935, 118, 13277, 22054, 11444, 10105, 18698, 10108, 10391, 12373, 10108, 10105, 63655, 10112, 80315, 20390, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 6, 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SD", "##A", "has", "a", "representative", "on", "the", "Provisional", "Election", "Commission", "." ], "ids": [ 27589, 10738, 10393, 169, 33786, 10135, 10105, 73689, 36512, 14941, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "\"", "I", "do", "n", "'", "t", "know", "what", "the", "source", "of", "the", "Dne", "##vi", "Ava", "##z", "report", "is", ",", "but", "it", "is", "consistent", "with", "what", "I", "have", "heard", "from", "western", "diplomat", "##s", "and", "from", "inside", "the", "OS", "##CE", ",", "\"", "said", "an", "OS", "##CE", "staff", "member", "in", "Sarajevo", "who", "asked", "not", "to", "be", "named", "." ], "ids": [ 107, 146, 10149, 182, 112, 188, 21852, 12976, 10105, 15247, 10108, 10105, 55001, 11310, 103933, 10305, 17553, 10124, 117, 10473, 10271, 10124, 54787, 10169, 12976, 146, 10529, 32240, 10188, 16672, 45652, 10107, 10111, 10188, 22978, 10105, 18398, 43161, 117, 107, 12415, 10151, 18398, 43161, 18927, 12008, 10106, 21402, 10479, 22151, 10472, 10114, 10347, 12038, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "word", "is", "that", "Fr", "##owi", "##ck", "has", "decided", "to", "post", "##pone", "municipal", "elections", "but", "that", "he", "will", "wait", "for", "one", "more", "session", "of", "the", "PE", "##C", "on", "Tuesday", "to", "take", "everyone", "'", "s", "temperature", "on", "the", "issue", ".", "\"" ], "ids": [ 107, 10117, 12307, 10124, 10189, 33884, 22578, 11263, 10393, 17270, 10114, 11841, 35741, 14935, 22054, 10473, 10189, 10261, 11337, 83279, 10142, 10464, 10798, 30066, 10108, 10105, 80468, 10858, 10135, 70245, 10114, 13574, 48628, 112, 187, 23509, 10135, 10105, 15557, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ambassador", "Robert", "Fr", "##owi", "##ck", ",", "an", "American", ",", "heads", "the", "OS", "##CE", "mission", "in", "Bosnia", "." ], "ids": [ 55060, 10820, 33884, 22578, 11263, 117, 10151, 10536, 117, 42399, 10105, 18398, 43161, 17032, 10106, 29634, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 2, 9, 9, 9, 3, 7, 9, 9, 1, 9 ] }, { "tokens": [ "OS", "##CE", "and", "independent", "monitor", "##s", "alle", "##ge", "that", "Ser", "##b", "authorities", "have", "systematic", "##ally", "disco", "##ura", "##ged", "refugees", "from", "register", "##ing", "to", "cast", "a", "ballot", "in", "the", "places", "they", "lived", "before", "the", "war", "." ], "ids": [ 18398, 43161, 10111, 16584, 60774, 10107, 10968, 10525, 10189, 39759, 10457, 28308, 10529, 57912, 19777, 14884, 11465, 18832, 71797, 10188, 47424, 10230, 10114, 18922, 169, 93339, 10106, 10105, 19261, 10689, 17603, 11360, 10105, 10338, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Instead", ",", "the", "refugees", "were", "said", "to", "have", "been", "directed", "by", "their", "authorities", "to", "vote", "from", "strategic", "towns", "which", "had", "Mo", "##sle", "##m", "major", "##ities", "before", "the", "43", "-", "month", "Bosnia", "##n", "war", ",", "but", "which", "are", "now", "under", "##pop", "##ulated", "as", "a", "result", "of", "\"", "ethnic", "clean", "##sing", "\"", "." ], "ids": [ 47556, 117, 10105, 71797, 10309, 12415, 10114, 10529, 10590, 15446, 10155, 10455, 28308, 10114, 18926, 10188, 52009, 26656, 10319, 10374, 34987, 42176, 10147, 11922, 17285, 11360, 10105, 11370, 118, 14064, 29634, 10115, 10338, 117, 10473, 10319, 10301, 11858, 10571, 63229, 37725, 10146, 169, 14493, 10108, 107, 34216, 55911, 16357, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Diplomat", "##s", "explain", "the", "purpose", "of", "this", "electoral", "engineering", "is", "to", "secure", "Ser", "##b", "control", "over", "pi", "##vot", "##al", "towns", "inside", "the", "49", "per", "cent", "of", "Bosnia", "known", "as", "the", "Ser", "##b", "republic", ",", "con", "##sol", "##idat", "##ing", "through", "the", "ballot", "box", "what", "was", "initially", "taken", "in", "war", "." ], "ids": [ 101849, 10107, 67004, 10105, 24564, 10108, 10531, 29125, 25008, 10124, 10114, 45853, 39759, 10457, 12608, 10491, 24109, 63129, 10415, 26656, 22978, 10105, 11580, 10178, 32882, 10108, 29634, 11053, 10146, 10105, 39759, 10457, 108499, 117, 10173, 43115, 90710, 10230, 11222, 10105, 93339, 21509, 12976, 10134, 20465, 15109, 10106, 10338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "top", "U", ".", "N", ".", "refuge", "##e", "official", "in", "the", "Balkans", "high", "##lighted", "the", "voter", "registration", "problem", "on", "Monday", "." ], "ids": [ 10117, 12364, 158, 119, 151, 119, 63655, 10112, 14731, 10106, 10105, 89251, 11846, 108892, 10105, 101309, 80315, 18077, 10135, 40714, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Results", "of", "the", "registration", "for", "September", "elections", "her", "##ald", "a", "dis", "##mal", "future", "for", "multi", "-", "ethnic", "##ity", "in", "Bos", "##ia", "-", "Hercegovina", ",", "\"", "war", "##ned", "So", "##ren", "Jesse", "##n", "-", "Petersen", ",", "Special", "En", "##voy", "for", "the", "U", ".", "N", ".", "High", "Commissioner", "for", "Re", "##fuge", "##es", "in", "Former", "Yugoslavia", "." ], "ids": [ 107, 33036, 10108, 10105, 80315, 10142, 10596, 22054, 10485, 54793, 169, 27920, 16120, 16711, 10142, 21247, 118, 34216, 11949, 10106, 86792, 10280, 118, 28664, 117, 107, 10338, 17021, 12882, 10969, 27213, 10115, 118, 46277, 117, 13690, 10243, 81843, 10142, 10105, 158, 119, 151, 119, 11956, 24366, 10142, 20304, 101935, 10171, 10106, 42355, 38168, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "In", "the", "run", "-", "up", "to", "elections", ",", "nationalist", "##ic", "political", "leaders", "are", "playing", "the", "ethnic", "/", "sec", "##tarian", "card", ",", "drum", "##ming", "up", "support", "within", "their", "constitue", "##ncies", "by", "playing", "on", "bitter", "memories", "or", "fear", ".", "\"" ], "ids": [ 107, 10167, 10105, 14095, 118, 10741, 10114, 22054, 117, 99451, 11130, 13736, 24155, 10301, 14879, 10105, 34216, 120, 37913, 109810, 23050, 117, 37345, 16405, 10741, 13145, 12381, 10455, 41124, 21512, 10155, 14879, 10135, 97737, 87012, 10345, 44929, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "tr", "##uce", ",", "Le", "##bed", "faces", "tou", "##ghe", "##r", "Che", "##chen", "problem", "." ], "ids": [ 11301, 32221, 24075, 117, 10281, 33627, 48343, 52586, 61069, 10129, 44131, 11909, 18077, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Ala", "##stair", "Macdonald" ], "ids": [ 56500, 96772, 51867 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "26" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alexander", "Le", "##bed", "may", "finally", "get", "to", "discuss", "his", "Che", "##chen", "peace", "proposals", "with", "Boris", "Ye", "##lts", "##in", "on", "Tuesday", "after", "a", "lost", "weekend", "in", "the", "region", "when", "he", "was", "forced", "to", "abandon", "plans", "to", "sign", "a", "new", "political", "treaty", "with", "the", "separat", "##ist", "rebels", "." ], "ids": [ 12063, 10281, 33627, 11387, 21256, 15329, 10114, 71695, 10226, 44131, 11909, 28101, 93646, 10169, 21463, 20567, 72847, 10245, 10135, 70245, 10662, 169, 14172, 43440, 10106, 10105, 12220, 10841, 10261, 10134, 20054, 10114, 56566, 18195, 10114, 26794, 169, 10751, 13736, 56353, 10169, 10105, 81806, 11293, 57545, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "could", "be", "a", "sob", "##ering", "experience", "for", "the", "Kr", "##emlin", "security", "chief", "who", ",", "just", "two", "months", "after", "being", "appointed", "by", "the", "president", "and", "two", "head", "##y", "weeks", "after", "taking", "charge", "of", "the", "Che", "##chen", "crisis", ",", "had", "promised", "to", "w", "##rap", "up", "the", "20", "-", "month", "war", "by", "the", "weekend", "." ], "ids": [ 10377, 12174, 10347, 169, 22755, 19232, 20627, 10142, 10105, 17640, 110169, 21849, 19421, 10479, 117, 12820, 10551, 15555, 10662, 11223, 14896, 10155, 10105, 12931, 10111, 10551, 13578, 10157, 20750, 10662, 18084, 18163, 10108, 10105, 44131, 11909, 22859, 117, 10374, 77137, 10114, 191, 53750, 10741, 10105, 10197, 118, 14064, 10338, 10155, 10105, 43440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Despite", "a", "mo", "##od", "of", "com", "##pro", "##mise", "in", "the", "region", "after", "some", "of", "the", "worst", "fighting", "of", "the", "war", ",", "Le", "##bed", "may", "be", "just", "finding", "out", "that", "con", "##clu", "##ding", "a", "long", "-", "term", "settlement", ",", "some", "##where", "between", "rebel", "demands", "for", "independence", "and", "Moscow", "'", "s", "ins", "##isten", "##ce", "that", "Che", "##chny", "##a", "remain", "part", "of", "Russia", ",", "will", "be", "no", "easy", "matter", "." ], "ids": [ 21230, 169, 46912, 12680, 10108, 10212, 73099, 19738, 10106, 10105, 12220, 10662, 11152, 10108, 10105, 62006, 27535, 10108, 10105, 10338, 117, 10281, 33627, 11387, 10347, 12820, 43977, 10950, 10189, 10173, 78225, 13971, 169, 11695, 118, 13719, 23931, 117, 11152, 30935, 10948, 56696, 64886, 10142, 31412, 10111, 18744, 112, 187, 15498, 17146, 10419, 10189, 44131, 95063, 10113, 25430, 10668, 10108, 14664, 117, 11337, 10347, 10192, 44346, 27904, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "chain", "-", "smo", "##king", "former", "para", "##tro", "##op", "general", "with", "a", "sharp", "line", "in", "dead", "##pan", "put", "##down", "##s", "and", "a", "soldier", "'", "s", "kn", "##ack", "for", "making", "life", "sound", "simple", ",", "Le", "##bed", "managed", "to", "arra", "##nge", "an", "amb", "##iti", "##ous", "cea", "##sef", "##ire", "in", "the", "region", "last", "week", ",", "days", "after", "the", "Russian", "army", "threatened", "to", "bomb", "its", "way", "back", "into", "the", "rebel", "-", "held", "Che", "##chen", "capital", "G", "##ro", "##zny", "." ], "ids": [ 138, 32768, 118, 91053, 15629, 11775, 10220, 14239, 13362, 11389, 10169, 169, 77348, 12117, 10106, 23457, 15119, 14499, 27160, 10107, 10111, 169, 50803, 112, 187, 96820, 33145, 10142, 14293, 12103, 19302, 16205, 117, 10281, 33627, 22391, 10114, 38192, 18180, 10151, 10559, 13903, 13499, 25578, 107749, 11627, 10106, 10105, 12220, 12469, 16118, 117, 13990, 10662, 10105, 13463, 17977, 44593, 10114, 41654, 10474, 13170, 12014, 10708, 10105, 56696, 118, 11991, 44131, 11909, 12185, 144, 10567, 25424, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 5, 9 ] }, { "tokens": [ "He", "returned", "at", "the", "weekend", ",", "pl", "##ed", "##ging", "to", "conclude", "a", "political", "settlement", "that", "would", "make", "this", "tr", "##uce", "work", "where", "all", "others", "have", "failed", "." ], "ids": [ 10357, 14030, 10160, 10105, 43440, 117, 20648, 10336, 13808, 10114, 79460, 169, 13736, 23931, 10189, 10894, 13086, 10531, 32221, 24075, 11424, 10940, 10435, 14633, 10529, 20775, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "then", "he", "apparently", "thought", "better", "of", "it", "." ], "ids": [ 16976, 11059, 10261, 47731, 18957, 18322, 10108, 10271, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Say", "##ing", "he", "needed", "to", "tid", "##y", "up", "legal", "loose", "ends", "on", "the", "deal", "-", "-", "and", "also", "cover", "his", "back", "against", "un", "##named", "pro", "-", "war", "scheme", "##rs", "in", "Moscow", "-", "-", "he", "flew", "back", "to", "the", "capital", "empty", "-", "handed", "on", "Sunday", "." ], "ids": [ 24625, 10230, 10261, 23794, 10114, 15201, 10157, 10741, 17139, 102920, 29047, 10135, 10105, 19918, 118, 118, 10111, 10379, 16068, 10226, 12014, 11327, 10119, 95196, 11284, 118, 10338, 41209, 10943, 10106, 18744, 118, 118, 10261, 64284, 12014, 10114, 10105, 12185, 65042, 118, 44040, 10135, 19731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "met", "Russian", "Prime", "Minister", "Viktor", "Cher", "##nomy", "##rdin", "on", "Monday", "and", ",", "according", "to", "the", "press", "service", "of", "Le", "##bed", "'", "s", "Security", "Council", ",", "could", "meet", "Ye", "##lts", "##in", "on", "Tuesday", "." ], "ids": [ 10357, 10428, 13463, 19924, 14355, 24970, 35554, 100395, 86890, 10135, 40714, 10111, 117, 18071, 10114, 10105, 21040, 11989, 10108, 10281, 33627, 112, 187, 20924, 12821, 117, 12174, 23267, 20567, 72847, 10245, 10135, 70245, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 3, 7, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "It", "was", "not", "clear", "if", "the", "start", "of", "Ye", "##lts", "##in", "'", "s", "holiday", ",", "announced", "later", ",", "would", "affect", "plans", "to", "talk", "." ], "ids": [ 10377, 10134, 10472, 24866, 12277, 10105, 15148, 10108, 20567, 72847, 10245, 112, 187, 71806, 117, 13854, 10873, 117, 10894, 60600, 18195, 10114, 31311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Moscow", "'", "s", "as", "yet", "und", "##is", "##closed", "proposals", "on", "Che", "##chny", "##a", "'", "s", "political", "future", "have", ",", "mean", "##while", ",", "been", "sent", "back", "to", "do", "the", "rounds", "of", "various", "government", "departments", "." ], "ids": [ 18744, 112, 187, 10146, 21833, 10130, 10291, 75379, 93646, 10135, 44131, 95063, 10113, 112, 187, 13736, 16711, 10529, 117, 36110, 67977, 117, 10590, 14541, 12014, 10114, 10149, 10105, 44759, 10108, 13547, 12047, 61704, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "not", "known", "what", "caused", "the", "delay", "in", "the", "peace", "plan", "." ], "ids": [ 10377, 10124, 10472, 11053, 12976, 19513, 10105, 76497, 10106, 10105, 28101, 13065, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sp", "##ecu", "##lation", "mounted", "last", "week", "that", "Le", "##bed", "was", "operating", "out", "on", "a", "li", "##mb", "in", "Che", "##chny", "##a", "as", "Ye", "##lts", "##in", ",", "hard", "##ly", "seen", "since", "his", "re", "##ele", "##ction", "last", "month", ",", "kept", "out", "of", "sight", "and", "then", "gave", "an", "interview", "critici", "##sing", "his", "en", "##voy", "just", "as", "he", "c", "##lin", "##ched", "a", "tr", "##uce", "." ], "ids": [ 46361, 97038, 19718, 44709, 12469, 16118, 10189, 10281, 33627, 10134, 24210, 10950, 10135, 169, 11614, 27012, 10106, 44131, 95063, 10113, 10146, 20567, 72847, 10245, 117, 19118, 10454, 15652, 11764, 10226, 11639, 12739, 17530, 12469, 14064, 117, 26546, 10950, 10108, 78327, 10111, 11059, 15362, 10151, 21213, 87672, 16357, 10226, 10110, 81843, 12820, 10146, 10261, 171, 13020, 35456, 169, 32221, 24075, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Cher", "##nomy", "##rdin", "took", "pain", "##s", "at", "the", "weekend", "to", "ins", "##ist", "Le", "##bed", "was", "playing", "for", "a", "united", "team", "and", "that", "the", "proposals", "he", "took", "to", "rebel", "chief", "-", "of", "-", "staff", "As", "##lan", "Mask", "##hado", "##v", "had", "been", "agreed", "by", "Ye", "##lts", "##in", "." ], "ids": [ 16976, 35554, 100395, 86890, 12149, 38576, 10107, 10160, 10105, 43440, 10114, 15498, 11293, 10281, 33627, 10134, 14879, 10142, 169, 89284, 11121, 10111, 10189, 10105, 93646, 10261, 12149, 10114, 56696, 19421, 118, 10108, 118, 18927, 10882, 12055, 69189, 54719, 10477, 10374, 10590, 25577, 10155, 20567, 72847, 10245, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "If", "that", "were", "the", "case", ",", "it", "was", "unclear", "why", "Le", "##bed", "suddenly", "found", "it", "necessary", "to", "have", "the", "deal", "veri", "##fied", "in", "Moscow", "." ], "ids": [ 14535, 10189, 10309, 10105, 13474, 117, 10271, 10134, 94475, 31237, 10281, 33627, 80263, 11823, 10271, 27039, 10114, 10529, 10105, 19918, 55011, 19907, 10106, 18744, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Le", "##bed", "himself", "said", "he", "was", "concerned", "that", "powerful", "interests", "in", "Moscow", ",", "who", "have", "profit", "##ed", "from", "the", "war", "and", "want", "it", "to", "go", "on", ",", "would", "seize", "on", "any", "ina", "##de", "##qua", "##cy", "in", "the", "deal", "to", "remove", "him", "." ], "ids": [ 10281, 33627, 14764, 12415, 10261, 10134, 47451, 10189, 29481, 36026, 10106, 18744, 117, 10479, 10529, 25081, 10336, 10188, 10105, 10338, 10111, 21528, 10271, 10114, 11783, 10135, 117, 10894, 75325, 10135, 11178, 22944, 10253, 32973, 11710, 10106, 10105, 19918, 10114, 51600, 10957, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mask", "##hado", "##v", "war", "##ned", "that", "Le", "##bed", "risk", "##ed", "the", "same", "fate", "as", "a", "former", "Russian", "army", "commander", "in", "the", "region", "who", "sought", "a", "com", "##pro", "##mise", "and", "was", "blow", "##n", "up", "last", "year", "by", "-", "-", "so", "the", "Che", "##chen", "##s", "say", "-", "-", "Russian", "forces", "." ], "ids": [ 69189, 54719, 10477, 10338, 17021, 10189, 10281, 33627, 24179, 10336, 10105, 11561, 75633, 10146, 169, 11775, 13463, 17977, 27703, 10106, 10105, 12220, 10479, 32570, 169, 10212, 73099, 19738, 10111, 10134, 106194, 10115, 10741, 12469, 10924, 10155, 118, 118, 10380, 10105, 44131, 11909, 10107, 23763, 118, 118, 13463, 13729, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Mask", "##hado", "##v", "may", "also", "have", "made", "new", "demands", "on", "Le", "##bed", ",", "forcing", "him", "to", "check", "back", "with", "the", "Kr", "##emlin", "on", "what", "he", "could", "offer", "." ], "ids": [ 69189, 54719, 10477, 11387, 10379, 10529, 11019, 10751, 64886, 10135, 10281, 33627, 117, 75098, 10957, 10114, 43662, 12014, 10169, 10105, 17640, 110169, 10135, 12976, 10261, 12174, 24443, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "rebel", "spoke", "##sman", "said", "the", "two", "military", "men", "had", "come", "close", "to", "agreement", "on", "a", "face", "-", "saving", "formula", "accept", "##able", "to", "both", "sides", "and", "involving", "a", "referendum", "on", "independence", "at", "some", "future", "date", "." ], "ids": [ 138, 56696, 50005, 24305, 12415, 10105, 10551, 14041, 10588, 10374, 10678, 16065, 10114, 25432, 10135, 169, 13295, 118, 90682, 29659, 45218, 13096, 10114, 11408, 27263, 10111, 40368, 169, 39697, 10135, 31412, 10160, 11152, 16711, 13664, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cher", "##nomy", "##rdin", "said", "voters", "should", "decide", "Che", "##chny", "##a", "'", "s", "future", "but", "stress", "##ed", "there", "was", "no", "question", "of", "the", "government", "lett", "##ing", "the", "region", "quit", "the", "Russian", "Federation", "-", "-", "something", "Moscow", "fear", "##s", "could", "encourage", "separat", "##ist", "tende", "##ncies", "in", "other", "ethnic", "regions", ",", "particularly", "in", "the", "strategic", "North", "Caucasus", "." ], "ids": [ 35554, 100395, 86890, 12415, 55450, 14819, 19068, 44131, 95063, 10113, 112, 187, 16711, 10473, 39608, 10336, 11155, 10134, 10192, 20210, 10108, 10105, 12047, 14852, 10230, 10105, 12220, 101237, 10105, 13463, 18975, 118, 118, 26133, 18744, 44929, 10107, 12174, 62729, 81806, 11293, 106302, 21512, 10106, 10684, 34216, 21721, 117, 19658, 10106, 10105, 52009, 11225, 95615, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Le", "##bed", "may", "be", "be", "finding", "that", "closing", "that", "political", "gap", "between", "the", "two", "sides", "is", "more", "difficult", "than", "just", "ending", "a", "war", "." ], "ids": [ 10281, 33627, 11387, 10347, 10347, 43977, 10189, 57409, 10189, 13736, 55995, 10948, 10105, 10551, 27263, 10124, 10798, 25232, 11084, 12820, 29077, 169, 10338, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", "on", "holiday", "from", "Monday", "-", "Inter", "##fa", "##x", "." ], "ids": [ 20567, 72847, 10245, 10135, 71806, 10188, 40714, 118, 24362, 13369, 10686, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "26" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "President", "Boris", "Ye", "##lts", "##in", "began", "a", "new", "summer", "holiday", "on", "Monday", "but", "would", "remain", "in", "control", "of", "affairs", "of", "state", ",", "Inter", "##fa", "##x", "news", "agency", "said", "." ], "ids": [ 13463, 12811, 21463, 20567, 72847, 10245, 11941, 169, 10751, 17995, 71806, 10135, 40714, 10473, 10894, 25430, 10106, 12608, 10108, 43417, 10108, 11388, 117, 24362, 13369, 10686, 14424, 34649, 12415, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "head", "of", "state", "'", "s", "holiday", "has", "only", "just", "begun", ",", "\"", "the", "agency", "quoted", "Sergei", "Ya", "##str", "##zh", "##em", "##bs", "##ky", "as", "saying", ",", "adding", "that", "the", "president", "was", "currently", "in", "a", "Kr", "##emlin", "residence", "near", "Moscow", "." ], "ids": [ 107, 10117, 13578, 10108, 11388, 112, 187, 71806, 10393, 10893, 12820, 49510, 117, 107, 10105, 34649, 70676, 42794, 25148, 53142, 15104, 10451, 19528, 11445, 10146, 22807, 117, 44841, 10189, 10105, 12931, 10134, 15313, 10106, 169, 17640, 110169, 33879, 12883, 18744, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 9 ] }, { "tokens": [ "Inter", "##fa", "##x", "said", "Ya", "##stre", "##zh", "##em", "##bs", "##ky", "did", "not", "ex", "##clu", "##de", "that", "Ye", "##lts", "##in", "could", "spend", "some", "time", "in", "other", "places", "." ], "ids": [ 24362, 13369, 10686, 12415, 25148, 27495, 15104, 10451, 19528, 11445, 12172, 10472, 11419, 78225, 10253, 10189, 20567, 72847, 10245, 12174, 63222, 11152, 10635, 10106, 10684, 19261, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "would", "continue", "working", "on", "various", "documents", "and", "might", "meet", "\"", "one", "state", "off", "##ical", "or", "another", "\"", "." ], "ids": [ 10357, 10894, 17734, 14616, 10135, 13547, 21784, 10111, 20970, 23267, 107, 10464, 11388, 11898, 17616, 10345, 12864, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "One", "must", "give", "B", ".", "Ye", "##lts", "##in", "a", "chance", "to", "rest", "and", "recover", "his", "health", "after", "the", "elections", ",", "\"", "Inter", "##fa", "##x", "quoted", "Ya", "##stre", "##zh", "##em", "##bs", "##ky", "as", "saying", "." ], "ids": [ 107, 11340, 14982, 18090, 139, 119, 20567, 72847, 10245, 169, 27893, 10114, 17333, 10111, 94962, 10226, 17004, 10662, 10105, 22054, 117, 107, 24362, 13369, 10686, 70676, 25148, 27495, 15104, 10451, 19528, 11445, 10146, 22807, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "\"", "(", "Ye", "##lts", "##in", ")", "controls", "internal", "and", "international", "policies", ",", "daily", "receives", "a", "big", "pack", "##et", "of", "documents", "from", "Moscow", ",", "which", "demand", "his", "intervention", ".", ".", "." ], "ids": [ 107, 113, 20567, 72847, 10245, 114, 59897, 29868, 10111, 12533, 38572, 117, 27636, 59468, 169, 22185, 78978, 10308, 10108, 21784, 10188, 18744, 117, 10319, 34394, 10226, 40152, 119, 119, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Many", "of", "those", "documents", "return", "to", "the", "president", "'", "s", "administration", "the", "same", "day", ",", "\"", "he", "said", "." ], "ids": [ 17244, 10108, 12676, 21784, 15079, 10114, 10105, 12931, 112, 187, 17941, 10105, 11561, 11940, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", "went", "on", "a", "two", "-", "day", "trip", "outside", "Moscow", "last", "week", "to", "check", "out", "a", "holiday", "home", "." ], "ids": [ 20567, 72847, 10245, 13446, 10135, 169, 10551, 118, 11940, 37307, 17555, 18744, 12469, 16118, 10114, 43662, 10950, 169, 71806, 11816, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yu", "##go", "Za", "##stava", "workers", "'", "protest", "enters", "2nd", "week", "." ], "ids": [ 19387, 10797, 14074, 33653, 23829, 112, 36627, 58379, 14105, 16118, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "26" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thousand", "##s", "of", "workers", "of", "Serbia", "'", "s", "Za", "##stava", "arms", "factory", "entered", "the", "second", "week", "of", "protests", "on", "Monday", "over", "un", "##pai", "##d", "wa", "##ges", "and", "the", "lack", "of", "a", "programme", "to", "rev", "##ive", "the", "plant", "'", "s", "production", "." ], "ids": [ 61795, 10107, 10108, 23829, 10108, 20141, 112, 187, 14074, 33653, 28150, 34974, 19226, 10105, 11132, 16118, 10108, 60931, 10135, 40714, 10491, 10119, 48778, 10162, 11471, 13156, 10111, 10105, 23582, 10108, 169, 19611, 10114, 86095, 11942, 10105, 16430, 112, 187, 12116, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "are", "stub", "##born", ",", "have", "strength", "and", "time", "to", "pers", "##ist", "until", "our", "demands", "are", "met", ",", "\"", "said", "the", "factory", "'", "s", "trade", "union", "secretary", "Dr", "##agu", "##tin", "Stan", "##oj", "##lov", "##ic", "." ], "ids": [ 107, 12865, 10301, 66337, 32315, 117, 10529, 33318, 10111, 10635, 10114, 108839, 11293, 11444, 17446, 64886, 10301, 10428, 117, 107, 12415, 10105, 34974, 112, 187, 18908, 20763, 37664, 11612, 47540, 15364, 26637, 21799, 26511, 11130, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "\"", "We", "are", "united", "and", "we", "are", "waiting", "for", "the", "government", "to", "decide", "what", "to", "do", "with", "us", ".", "\"" ], "ids": [ 107, 12865, 10301, 89284, 10111, 11951, 10301, 62052, 10142, 10105, 12047, 10114, 19068, 12976, 10114, 10149, 10169, 19626, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "unions", "demanded", "payment", "of", "June", "and", "July", "wa", "##ges", "and", "last", "year", "'", "s", "holiday", "pay", ",", "and", "called", "on", "government", "to", "develop", "a", "revival", "programme", "for", "the", "plant", "." ], "ids": [ 15006, 76841, 78164, 67701, 10108, 11120, 10111, 11112, 11471, 13156, 10111, 12469, 10924, 112, 187, 71806, 16868, 117, 10111, 11552, 10135, 12047, 10114, 26800, 169, 64975, 19611, 10142, 10105, 16430, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "former", "Yugoslav", "national", "army", "con", "##sumed", "90", "percent", "of", "Za", "##stava", "'", "s", "pre", "-", "war", "output", ",", "but", "like", "the", "rest", "of", "Yugoslavia", "'", "s", "economy", ",", "the", "new", "army", "of", "Serbia", "and", "Montenegro", "is", "c", "##rip", "##ple", "##d", "by", "lack", "of", "funds", "." ], "ids": [ 10117, 11775, 93444, 11844, 17977, 10173, 72987, 10919, 22362, 10108, 14074, 33653, 112, 187, 12229, 118, 10338, 37131, 117, 10473, 11850, 10105, 17333, 10108, 38168, 112, 187, 27570, 117, 10105, 10751, 17977, 10108, 20141, 10111, 29251, 10124, 171, 68228, 22238, 10162, 10155, 23582, 10108, 32067, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Kr", "##agu", "##jeva", "##c", "where", "the", "plant", "is", "based", ",", "9", ",", "000", "to", "10", ",", "000", "people", "gathered", "in", "the", "central", "square", "to", "express", "their", "bitter", "##ness", "at", "what", "Stan", "##oj", "##lov", "##ic", "called", "government", "ind", "##iff", "##eren", "##ce", "." ], "ids": [ 10167, 17640, 47540, 36367, 10350, 10940, 10105, 16430, 10124, 11610, 117, 130, 117, 10259, 10114, 10150, 117, 10259, 11426, 69918, 10106, 10105, 12397, 15163, 10114, 47620, 10455, 97737, 14010, 10160, 12976, 26637, 21799, 26511, 11130, 11552, 12047, 30386, 31025, 13653, 10419, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ruling", "Socialist", "Party", "last", "week", "accused", "Serbia", "'", "s", "opposition", "of", "st", "##ir", "##ring", "up", "social", "un", "##rest", "and", "using", "workers", "'", "already", "difficult", "social", "position", "for", "their", "own", "interests", "." ], "ids": [ 10117, 50788, 42637, 12529, 12469, 16118, 37303, 20141, 112, 187, 21227, 10108, 28780, 10835, 13135, 10741, 12142, 10119, 34189, 10111, 13382, 23829, 112, 19034, 25232, 12142, 12956, 10142, 10455, 12542, 36026, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Late", "wa", "##ges", ",", "no", "work", "and", "(", "the", "lack", "of", "a", ")", "production", "programme", "are", "the", "main", "reasons", "for", "their", "protests", ",", "\"", "a", "senior", "member", "of", "the", "local", "Socialist", "Party", "branch", "told", "Reuters", "." ], "ids": [ 107, 25139, 11471, 13156, 117, 10192, 11424, 10111, 113, 10105, 23582, 10108, 169, 114, 12116, 19611, 10301, 10105, 12126, 31725, 10142, 10455, 60931, 117, 107, 169, 17843, 12008, 10108, 10105, 11436, 42637, 12529, 24660, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 3, 9 ] }, { "tokens": [ "\"", "But", "there", "is", "a", "significant", "influence", "of", "opposition", "parties", "that", "are", "collecting", "points", "ahead", "of", "coming", "elections", ".", "\"" ], "ids": [ 107, 16976, 11155, 10124, 169, 17912, 17306, 10108, 21227, 18708, 10189, 10301, 88737, 12789, 35629, 10108, 23959, 22054, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Federal", "Yugoslav", "elections", "are", "due", "on", "November", "3", "." ], "ids": [ 14492, 93444, 22054, 10301, 10850, 10135, 10819, 124, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "party", "official", "said", "the", "union", "'", "s", "figure", "on", "the", "number", "of", "protest", "##ers", "was", "ex", "##agg", "##erated", ".", "\"" ], "ids": [ 10117, 14039, 14731, 12415, 10105, 20763, 112, 187, 17527, 10135, 10105, 11487, 10108, 36627, 10901, 10134, 11419, 99274, 79903, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "were", "about", "1", ",", "400", "to", "1", ",", "600", "people", "at", "the", "protest", "today", "-", "-", "much", "less", "then", "last", "week", "." ], "ids": [ 11723, 10309, 10978, 122, 117, 11176, 10114, 122, 117, 11796, 11426, 10160, 10105, 36627, 18745, 118, 118, 13172, 15306, 11059, 12469, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "But", "there", "were", "more", "observer", "##s", "and", "passer", "##s", "by", ",", "\"", "he", "said", "." ], "ids": [ 107, 16976, 11155, 10309, 10798, 79368, 10107, 10111, 34650, 10107, 10155, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Go", "##rdan", "##a", "Ku", "##ki", "##c", ",", "Belgrade", "News", "##room", "+", "381", "11", "222", "425", "##4" ], "ids": [ 118, 118, 14439, 75252, 10113, 49869, 10506, 10350, 117, 48084, 12219, 25525, 116, 35402, 10193, 22717, 33437, 11011 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Croatian", "len", "##ding", "rate", "falls", "to", "8", ".", "0", "vs", "9", ".", "1", "p", "##ct", "." ], "ids": [ 48963, 28859, 13971, 18344, 35017, 10114, 129, 119, 121, 14987, 130, 119, 122, 184, 14526, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Z", "##AG", "##RE", "##B", "1996", "-", "08", "-", "26" ], "ids": [ 163, 109865, 66014, 11274, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Croatian", "len", "##ding", "rate", "fell", "to", "8", ".", "0", "percent", "on", "Monday", "from", "last", "Friday", "'", "s", "9", ".", "1", "percent", "after", "thin", "demand", "for", "kuna", "forced", "bank", "len", "##ders", "to", "trim", "their", "rates", "further", "." ], "ids": [ 10117, 48963, 28859, 13971, 18344, 25194, 10114, 129, 119, 121, 22362, 10135, 40714, 10188, 12469, 30767, 112, 187, 130, 119, 122, 22362, 10662, 61470, 34394, 10142, 39301, 20054, 19423, 28859, 25779, 10114, 102859, 10455, 38200, 14586, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "##bank", "call", "money", "was", "down", "to", "8", ".", "0", "from", "10", ".", "0", "percent", "." ], "ids": [ 24362, 20583, 20575, 17920, 10134, 12935, 10114, 129, 119, 121, 10188, 10150, 119, 121, 22362, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##sure", "##rs", "'", "five", "-", "10", "and", "10", "-", "15", "day", "loans", "were", "made", "at", "a", "st", "##eady", "8", ".", "0", "percent", "after", "last", "week", "'", "s", "drop", "from", "an", "earlier", "15", "percent", "." ], "ids": [ 10167, 47394, 10943, 112, 12403, 118, 10150, 10111, 10150, 118, 10208, 11940, 106416, 10309, 11019, 10160, 169, 28780, 61973, 129, 119, 121, 22362, 10662, 12469, 16118, 112, 187, 36365, 10188, 10151, 18905, 10208, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "Zagreb", "Money", "Market", "settlements", "sh", "##ran", "##k", "to", "17", ".", "4", "million", "kuna", ",", "of", "which", "deal", "##ers", "put", "new", "bor", "##rowing", "at", "a", "me", "##ag", "##re", "5", ".", "5", "million", "." ], "ids": [ 25220, 18772, 24002, 28409, 55959, 48201, 12111, 10174, 10114, 10273, 119, 125, 12473, 39301, 117, 10108, 10319, 19918, 10901, 14499, 10751, 27728, 77449, 10160, 169, 10911, 14520, 10246, 126, 119, 126, 12473, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Supply", "stood", "at", "a", "high", "180", "million", "kuna", "." ], "ids": [ 96832, 39320, 10160, 169, 11846, 13912, 12473, 39301, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "##night", "trade", "at", "the", "weekend", "left", "a", "sur", "##plus", "of", "1", ".", "2", "billion", "kuna", "on", "the", "supply", "side", "after", "40", "million", "were", "settled", "." ], "ids": [ 15704, 45217, 18908, 10160, 10105, 43440, 12153, 169, 10326, 70413, 10108, 122, 119, 123, 25848, 39301, 10135, 10105, 28914, 12250, 10662, 10533, 12473, 10309, 29014, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Croatia", "'", "s", "central", "bank", "again", "stayed", "out", "of", "the", "foreign", "exchange", "market", "." ], "ids": [ 34993, 112, 187, 12397, 19423, 13123, 42296, 10950, 10108, 10105, 20796, 27714, 17313, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "calculated", "the", "kuna", "mid", "##rates", "for", "Tuesday", "'", "s", "trade", "stronger", "at", "5", ".", "242", "##0", "against", "the", "dollar", "and", "slightly", "weak", "##er", "at", "3", ".", "548", "##6", "against", "the", "German", "mark", "." ], "ids": [ 10377, 87382, 10105, 39301, 15607, 32406, 10142, 70245, 112, 187, 18908, 85688, 10160, 126, 119, 27297, 10929, 11327, 10105, 34807, 10111, 31603, 61285, 10165, 10160, 124, 119, 48774, 11211, 11327, 10105, 12026, 29221, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "-", "-", "Ko", "##lum", "##bina", "Ben", "##cev", "##ic", ",", "Zagreb", "News", "##room", ",", "385", "-", "1", "-", "455", "##70", "##7", "##5" ], "ids": [ 118, 118, 30186, 20571, 29368, 13304, 49556, 11130, 117, 18772, 12219, 25525, 117, 31548, 118, 122, 118, 38767, 48205, 11305, 11166 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SV", "##CD", "Bulgaria", "air", "traffic", "control", "##lers", "to", "strike", "September", "3", "." ], "ids": [ 25452, 40952, 21935, 12566, 26482, 12608, 36090, 10114, 37456, 10596, 124, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##F", "##IA", "1996", "-", "08", "-", "26" ], "ids": [ 71020, 11565, 35976, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bulgarian", "air", "traffic", "control", "##lers", "will", "go", "on", "strike", "on", "September", "3", "demand", "##ing", "higher", "pay", ",", "the", "chief", "of", "the", "Bulgarian", "association", "of", "air", "traffic", "control", "##lers", "(", "Bu", "##lat", "##ka", ")", "said", "on", "Monday", "." ], "ids": [ 43680, 12566, 26482, 12608, 36090, 11337, 11783, 10135, 37456, 10135, 10596, 124, 34394, 10230, 17981, 16868, 117, 10105, 19421, 10108, 10105, 43680, 18061, 10108, 12566, 26482, 12608, 36090, 113, 11916, 16698, 10371, 114, 12415, 10135, 40714, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stefan", "Rai", "##chev", "told", "a", "news", "conference", "the", "strike", "by", "more", "than", "half", "of", "the", "1", ",", "380", "traffic", "control", "##lers", "and", "tech", "##nici", "##ans", "would", "paral", "##yse", "traffic", "which", "has", "increased", "by", "10", "percent", "since", "last", "year", "." ], "ids": [ 17399, 31249, 99462, 21937, 169, 14424, 25029, 10105, 37456, 10155, 10798, 11084, 13877, 10108, 10105, 122, 117, 22296, 26482, 12608, 36090, 10111, 100986, 17829, 15008, 10894, 102568, 45158, 26482, 10319, 10393, 19299, 10155, 10150, 22362, 11764, 12469, 10924, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "1", ",", "500", "planes", "per", "day", "fly", "over", "Bulgaria", ",", "in", "a", "strategic", "location", "between", "Europe", "and", "the", "Middle", "and", "the", "Far", "East", ",", "Rai", "##chev", "said", "." ], "ids": [ 15946, 11084, 122, 117, 10757, 39972, 10178, 11940, 26155, 10491, 21935, 117, 10106, 169, 52009, 18214, 10948, 11767, 10111, 10105, 15441, 10111, 10105, 26747, 11830, 117, 31249, 99462, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 1, 5, 9, 4, 8, 9, 9 ] }, { "tokens": [ "The", "director", "general", "of", "the", "air", "traffic", "service", "Valentin", "Val", "##kov", "said", "last", "Friday", "that", "a", "control", "##lers", "'", "strike", "would", "be", "illegal", "." ], "ids": [ 10117, 12461, 11389, 10108, 10105, 12566, 26482, 11989, 44460, 16190, 16433, 12415, 12469, 30767, 10189, 169, 12608, 36090, 112, 37456, 10894, 10347, 39806, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Val", "##kov", "said", "he", "could", "not", "cu", "##rb", "the", "summer", "charter", "flights", "of", "national", "carrier", "Balkan", "Airlines", ",", "which", "carries", "thousands", "of", "foreign", "tourists", "to", "the", "Bulgarian", "Black", "Sea", "resort", "##s", "." ], "ids": [ 16190, 16433, 12415, 10261, 12174, 10472, 10854, 50579, 10105, 17995, 49725, 55650, 10108, 11844, 53402, 31442, 17768, 117, 10319, 64216, 39966, 10108, 20796, 85709, 10114, 10105, 43680, 11750, 14741, 60637, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 1, 5, 9, 9, 9 ] }, { "tokens": [ "But", "Rai", "##chev", "said", "it", "would", "be", "\"", "discrimination", "\"", "against", "the", "other", "airline", "##s", "if", "only", "Balkan", "planes", "were", "guided", "in", "." ], "ids": [ 16976, 31249, 99462, 12415, 10271, 10894, 10347, 107, 66191, 107, 11327, 10105, 10684, 67878, 10107, 12277, 10893, 31442, 39972, 10309, 92486, 10106, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Under", "the", "law", "before", "launch", "##ing", "the", "strike", "we", "have", "to", "sign", "an", "agreement", "with", "our", "employer", "for", "a", "minimal", "transport", "servi", "##cing", "of", "emergency", "flights", ",", "\"", "Rai", "##chev", "said", "." ], "ids": [ 107, 12594, 10105, 13255, 11360, 29227, 10230, 10105, 37456, 11951, 10529, 10114, 26794, 10151, 25432, 10169, 17446, 94526, 10142, 169, 57284, 16024, 64803, 19113, 10108, 44461, 55650, 117, 107, 31249, 99462, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Rai", "##chev", "said", "a", "lock", "-", "out", "with", "military", "air", "control", "##lers", "was", "impossible", "as", "they", "did", "not", "speak", "English", "." ], "ids": [ 31249, 99462, 12415, 169, 79601, 118, 10950, 10169, 14041, 12566, 12608, 36090, 10134, 38199, 10146, 10689, 12172, 10472, 41541, 11616, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "The", "control", "##lers", "are", "demand", "##ing", "the", "monthly", "wa", "##ge", "be", "increased", "to", "$", "1", ",", "000", "per", "month", "from", "the", "current", "$", "230", ",", "as", "well", "as", "the", "resignation", "of", "the", "air", "traffic", "service", "'", "s", "management", "." ], "ids": [ 10117, 12608, 36090, 10301, 34394, 10230, 10105, 61673, 11471, 10525, 10347, 19299, 10114, 109, 122, 117, 10259, 10178, 14064, 10188, 10105, 14978, 109, 16888, 117, 10146, 11206, 10146, 10105, 66129, 10108, 10105, 12566, 26482, 11989, 112, 187, 17150, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "also", "demand", "the", "financial", "separation", "of", "the", "350", "air", "control", "##lers", "from", "the", "technical", "staff", "." ], "ids": [ 11696, 10379, 34394, 10105, 20570, 72891, 10108, 10105, 14992, 12566, 12608, 36090, 10188, 10105, 29914, 18927, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Lili", "##ana", "Sem", "##erd", "##jie", "##va", ",", "Sofia", "News", "##room", ",", "359", "-", "2", "-", "845", "##6", "##1" ], "ids": [ 118, 118, 87043, 11631, 62825, 13819, 93246, 10362, 117, 21416, 12219, 25525, 117, 35403, 118, 123, 118, 60558, 11211, 10759 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", "'", "s", "wife", "has", "ki", "##dne", "##y", "operation", "." ], "ids": [ 20567, 72847, 10245, 112, 187, 14384, 10393, 10879, 20714, 10157, 20080, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "26" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Na", "##ina", "Ye", "##lts", "##in", ",", "wife", "of", "the", "Russian", "president", ",", "has", "under", "##gone", "\"", "a", "planned", "operation", "\"", "on", "her", "left", "ki", "##dne", "##y", "and", "is", "in", "a", "sat", "##is", "##fa", "##ctory", "condition", ",", "It", "##ar", "-", "Tas", "##s", "news", "agency", "said", "on", "Monday", "." ], "ids": [ 10685, 11067, 20567, 72847, 10245, 117, 14384, 10108, 10105, 13463, 12931, 117, 10393, 10571, 56893, 107, 169, 24292, 20080, 107, 10135, 10485, 12153, 10879, 20714, 10157, 10111, 10124, 10106, 169, 20694, 10291, 13369, 79181, 24713, 117, 10377, 10354, 118, 57387, 10107, 14424, 34649, 12415, 10135, 40714, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tas", "##s", "quoted", "the", "Kr", "##emlin", "press", "service", "as", "saying", "the", "operation", "took", "place", "on", "Saturday", "in", "the", "Central", "Clinical", "Hospital", "which", "treat", "##s", "top", "officials", "." ], "ids": [ 57387, 10107, 70676, 10105, 17640, 110169, 21040, 11989, 10146, 22807, 10105, 20080, 12149, 11192, 10135, 24848, 10106, 10105, 11885, 47206, 16025, 10319, 81634, 10107, 12364, 27730, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mrs", "Ye", "##lts", "##in", "would", "be", "released", "from", "hospital", "in", "a", "few", "days", "." ], "ids": [ 18830, 20567, 72847, 10245, 10894, 10347, 11539, 10188, 18141, 10106, 169, 13824, 13990, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Doctor", "Sergei", "Mir", "##ono", "##v", "told", "Tas", "##s", "Na", "##ina", "was", "\"", "in", "permanent", "contact", "\"", "with", "her", "husband", "and", "two", "daughters", ",", "Ye", "##lena", "and", "Tat", "##yana", "." ], "ids": [ 17376, 42794, 43209, 12507, 10477, 21937, 57387, 10107, 10685, 11067, 10134, 107, 10106, 21295, 20637, 107, 10169, 10485, 19634, 10111, 10551, 43392, 117, 20567, 52907, 10111, 86561, 31523, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 3, 7, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9 ] }, { "tokens": [ "The", "state", "of", "health", "of", "Boris", "Ye", "##lts", "##in", ",", "who", "had", "two", "heart", "attacks", "last", "year", ",", "has", "been", "the", "centre", "of", "media", "and", "market", "sp", "##ecu", "##lation", "after", "he", "won", "a", "second", "term", "in", "office", "in", "the", "July", "3", "election", "run", "-", "off", "and", "all", "but", "disappeared", "from", "the", "public", "eye", "." ], "ids": [ 10117, 11388, 10108, 17004, 10108, 21463, 20567, 72847, 10245, 117, 10479, 10374, 10551, 21736, 26483, 12469, 10924, 117, 10393, 10590, 10105, 12672, 10108, 12518, 10111, 17313, 32650, 97038, 19718, 10662, 10261, 11367, 169, 11132, 13719, 10106, 14301, 10106, 10105, 11112, 124, 13685, 14095, 118, 11898, 10111, 10435, 10473, 81466, 10188, 10105, 11683, 32684, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "presidential", "spoke", "##sman", "said", "on", "Monday", "Ye", "##lts", "##in", "was", "in", "Moscow", "but", "could", "give", "no", "details", "about", "his", "agenda", "or", "whether", "meetings", "were", "planned", "." ], "ids": [ 138, 36476, 50005, 24305, 12415, 10135, 40714, 20567, 72847, 10245, 10134, 10106, 18744, 10473, 12174, 18090, 10192, 29500, 10978, 10226, 70231, 10345, 21883, 47307, 10309, 24292, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", "is", "expected", "to", "go", "on", "holiday", "in", "the", "near", "future", ",", "but", "officials", "have", "not", "yet", "said", "where", "he", "will", "go", "or", "when", "." ], "ids": [ 20567, 72847, 10245, 10124, 25973, 10114, 11783, 10135, 71806, 10106, 10105, 12883, 16711, 117, 10473, 27730, 10529, 10472, 21833, 12415, 10940, 10261, 11337, 11783, 10345, 10841, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Most", "##osta", "##l", "Z", "share", "##holders", "app", "##rove", "bonds", "." ], "ids": [ 14361, 26986, 10161, 163, 23867, 75111, 72894, 75662, 93163, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AR", "##SA", "##W", "1996", "-", "08", "-", "26" ], "ids": [ 160, 52188, 27138, 13034, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##re", "##holders", "of", "the", "Polish", "construction", "firm", "Most", "##osta", "##l", "Za", "##br", "##ze", "Holding", "SA", "approved", "a", "25", "-", "million", "-", "z", "##loty", ",", "five", "-", "year", "convert", "##ible", "issue", "with", "a", "par", "value", "of", "100", "z", "##loty", "##s", "each", ",", "the", "company", "'", "s", "spoke", "##sman", "said", "on", "Monday", "." ], "ids": [ 106583, 10246, 75111, 10108, 10105, 19870, 13407, 23410, 14361, 26986, 10161, 14074, 36867, 10870, 47821, 21318, 29855, 169, 10258, 118, 12473, 118, 194, 103931, 117, 12403, 118, 10924, 92028, 22529, 15557, 10169, 169, 10248, 19211, 10108, 10407, 194, 103931, 10107, 11948, 117, 10105, 12100, 112, 187, 50005, 24305, 12415, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Piotr", "Grab", "##owski", "told", "Reuters", "that", "a", "Most", "##osta", "##l", "extraordinary", "share", "##holders", "meeting", "on", "Saturday", "had", "decided", "that", "the", "price", "of", "the", "250", ",", "000", "bonds", "would", "be", "set", "as", "a", "10", "-", "session", "average", "price", "of", "Most", "##osta", "##l", "shares", "plus", "a", "premiu", "##m", "." ], "ids": [ 32642, 61020, 27098, 21937, 46617, 10189, 169, 14361, 26986, 10161, 105509, 23867, 75111, 19822, 10135, 24848, 10374, 17270, 10189, 10105, 30839, 10108, 10105, 12214, 117, 10259, 93163, 10894, 10347, 11847, 10146, 169, 10150, 118, 30066, 13551, 30839, 10108, 14361, 26986, 10161, 45751, 10563, 169, 93244, 10147, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 3, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "premiu", "##m", "will", "be", "no", "lower", "than", "15", "percent", "and", "will", "be", "set", "by", "management", "before", "the", "issue", ".", ".", "." ], "ids": [ 107, 10117, 93244, 10147, 11337, 10347, 10192, 18165, 11084, 10208, 22362, 10111, 11337, 10347, 11847, 10155, 17150, 11360, 10105, 15557, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "which", "we", "ex", "##pect", "at", "the", "beginning", "of", "next", "year", ",", "\"", "Grab", "##ow", "##ksi", "said", "." ], "ids": [ 10319, 11951, 11419, 51511, 10160, 10105, 17967, 10108, 13451, 10924, 117, 107, 61020, 16602, 12287, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Most", "##osta", "##l", ",", "based", "in", "southern", "Poland", ",", "wants", "to", "offer", "the", "bonds", "to", "large", "investors", "in", "a", "public", "offering", ",", "paying", "an", "annual", "coup", "##on", "of", "no", "more", "than", "80", "percent", "of", "the", "yield", "of", "the", "bench", "##mark", "52", "-", "week", "T", "-", "bill", "." ], "ids": [ 14361, 26986, 10161, 117, 11610, 10106, 17156, 17879, 117, 45769, 10114, 24443, 10105, 93163, 10114, 12077, 83795, 10106, 169, 11683, 42281, 117, 81846, 10151, 19246, 26854, 10263, 10108, 10192, 10798, 11084, 10832, 22362, 10108, 10105, 95757, 10108, 10105, 86696, 22719, 11525, 118, 16118, 157, 118, 34497, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "firm", "has", "signed", "an", "agreement", "with", "the", "Polish", "Development", "Bank", "(", "PB", "##R", ")", "to", "manage", "the", "issue", "and", "plans", "them", "to", "be", "listed", "on", "the", "Warsaw", "bou", "##rse", "'", "s", "bond", "market", "." ], "ids": [ 10117, 23410, 10393, 14775, 10151, 25432, 10169, 10105, 19870, 14502, 13533, 113, 105789, 11273, 114, 10114, 59251, 10105, 15557, 10111, 18195, 11345, 10114, 10347, 17585, 10135, 10105, 43669, 94335, 16239, 112, 187, 55185, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Grab", "##owski", "also", "said", "share", "##holders", "approved", "the", "issue", "of", "1", ".", "6", "million", "shares", "for", "which", "the", "bonds", "could", "be", "exchange", "##d", ",", "a", "ratio", "of", "6", ".", "4", "shares", "per", "bond", "." ], "ids": [ 61020, 27098, 10379, 12415, 23867, 75111, 29855, 10105, 15557, 10108, 122, 119, 127, 12473, 45751, 10142, 10319, 10105, 93163, 12174, 10347, 27714, 10162, 117, 169, 26755, 10108, 127, 119, 125, 45751, 10178, 55185, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "also", "said", "share", "##holders", "approved", "the", "issue", "of", "2", ".", "6", "million", "new", "shares", ",", "two", "million", "of", "which", "are", "ear", "##marked", "for", "large", "investors", "and", "600", ",", "000", "for", "retail", "domestic", "investors", "." ], "ids": [ 10357, 10379, 12415, 23867, 75111, 29855, 10105, 15557, 10108, 123, 119, 127, 12473, 10751, 45751, 117, 10551, 12473, 10108, 10319, 10301, 104700, 88425, 10142, 12077, 83795, 10111, 11796, 117, 10259, 10142, 52232, 31084, 83795, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "price", "will", "be", "determined", "through", "book", "-", "building", "." ], "ids": [ 10117, 30839, 11337, 10347, 30706, 11222, 12748, 118, 12585, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Most", "##osta", "##l", "plans", "to", "use", "the", "proceeds", "from", "the", "issues", "to", "add", "companies", "to", "its", "holding", "and", "moderni", "##se", "its", "plant", "." ], "ids": [ 14361, 26986, 10161, 18195, 10114, 11760, 10105, 105309, 10188, 10105, 17850, 10114, 42852, 18866, 10114, 10474, 29008, 10111, 84984, 10341, 10474, 16430, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Warsaw", "News", "##room", "+", "48", "22", "653", "970", "##0" ], "ids": [ 118, 118, 43669, 12219, 25525, 116, 11300, 10306, 58905, 44800, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Unknown", "group", "ki", "##dna", "##ps", "Dutch", "couple", "in", "Costa", "Rica", "." ], "ids": [ 66451, 11795, 10879, 35630, 13221, 17693, 20969, 10106, 13902, 20834, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9 ] }, { "tokens": [ "SA", "##N", "J", "##OS", "##E", ",", "Costa", "Rica", "1996", "-", "08", "-", "26" ], "ids": [ 21318, 11537, 147, 21793, 11259, 117, 13902, 20834, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kid", "##nap", "##pers", "have", "seized", "a", "Dutch", "couple", "who", "manage", "a", "farm", "in", "northern", "Costa", "Rica", "and", "have", "demanded", "a", "$", "1", ".", "5", "million", "ran", "##som", ",", "authorities", "said", "on", "Monday", "." ], "ids": [ 25867, 57992, 24193, 10529, 80176, 169, 17693, 20969, 10479, 59251, 169, 30568, 10106, 17335, 13902, 20834, 10111, 10529, 78164, 169, 109, 122, 119, 126, 12473, 17044, 32081, 117, 28308, 12415, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Official", "##s", "said", "Humberto", "Hu", "##eite", "Z", "##yre", "##cha", "and", "his", "wife", "Jet", "##ty", "Kors", ",", "both", "50", ",", "were", "ki", "##dna", "##pped", "late", "on", "Saturday", "or", "early", "Sunday", "." ], "ids": [ 17678, 10107, 12415, 83570, 43707, 74832, 163, 31993, 12964, 10111, 10226, 14384, 39933, 11195, 89906, 117, 11408, 10462, 117, 10309, 10879, 35630, 44357, 13002, 10135, 24848, 10345, 11732, 19731, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Col", "." ], "ids": [ 24927, 119 ], "entity": [ "B-LOC", "O" ], "entity_ids": [ 1, 9 ] }, { "tokens": [ "Mis", "##ael", "Valerio", ",", "head", "of", "border", "police", "at", "the", "Security", "Ministry", ",", "told", "reporter", "##s", "surveillance", "of", "the", "northern", "border", "with", "Nicaragua", "has", "been", "stepped", "up", "to", "keep", "the", "ki", "##dna", "##pper", "##s", "from", "fl", "##ee", "##ing", "Costa", "Rica", "." ], "ids": [ 99946, 72808, 97227, 117, 13578, 10108, 20949, 15034, 10160, 10105, 20924, 19170, 117, 21937, 41408, 10107, 58553, 10108, 10105, 17335, 20949, 10169, 32337, 10393, 10590, 99116, 10741, 10114, 23819, 10105, 10879, 35630, 26248, 10107, 10188, 58768, 13321, 10230, 13902, 20834, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Pre", "##limi", "##nary", "reports", "said", "the", "couple", "were", "ki", "##dna", "##pped", "on", "the", "\"", "Alta", "##mira", "\"", "farm", ",", "owned", "by", "Dutch", "##man", "Richard", "Wi", "##sing", "##a", ",", "at", "Agua", "##s", "Za", "##rca", "##s", "de", "San", "Carlos", "near", "the", "Costa", "Rica", "-", "Nicaragua", "border", "." ], "ids": [ 35248, 89337, 58198, 26610, 12415, 10105, 20969, 10309, 10879, 35630, 44357, 10135, 10105, 107, 22798, 66807, 107, 30568, 117, 17012, 10155, 17693, 10589, 11118, 52742, 16357, 10113, 117, 10160, 47312, 10107, 14074, 22549, 10107, 10104, 10469, 12050, 12883, 10105, 13902, 20834, 118, 32337, 20949, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 8, 9, 9, 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "Un", "##con", "##fir", "##med", "news", "reports", "said", "a", "vehicle", "belonging", "to", "them", "was", "found", "abandoned", "at", "Santa", "Maria", "de", "Poco", "##sol", ",", "about", "12", "miles", "(", "20", "km", ")", "north", "of", "the", "site", "of", "the", "ab", "##duction", "." ], "ids": [ 11038, 23486, 61644, 21986, 14424, 26610, 12415, 169, 27404, 54188, 10114, 11345, 10134, 11823, 32296, 10160, 11154, 11066, 10104, 37261, 43115, 117, 10978, 10186, 14148, 113, 10197, 10204, 114, 12756, 10108, 10105, 11920, 10108, 10105, 11357, 54366, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "reports", "said", "authorities", "found", "a", "statement", ",", "supposed", "##ly", "from", "the", "ki", "##dna", "##pper", "##s", ",", "in", "the", "vehicle", ",", "addressed", "to", "Wi", "##sing", "##a", "and", "demand", "##ing", "a", "$", "1", ".", "5", "million", "ran", "##som", "." ], "ids": [ 10117, 26610, 12415, 28308, 11823, 169, 33311, 117, 59516, 10454, 10188, 10105, 10879, 35630, 26248, 10107, 117, 10106, 10105, 27404, 117, 71121, 10114, 52742, 16357, 10113, 10111, 34394, 10230, 169, 109, 122, 119, 126, 12473, 17044, 32081, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wi", "##sing", "##a", "was", "believed", "to", "be", "travelling", "in", "Europe", ",", "they", "said", "." ], "ids": [ 52742, 16357, 10113, 10134, 20718, 10114, 10347, 81353, 10106, 11767, 117, 10689, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Swiss", "tourist", "guide", "and", "a", "German", "tourist", "were", "ki", "##dna", "##pped", "in", "the", "same", "area", "on", "New", "Year", "'", "s", "Day", "by", "a", "group", "of", "former", "Nicaragua", "##n", "guerrilla", "##s", "." ], "ids": [ 138, 22984, 61431, 25083, 10111, 169, 12026, 61431, 10309, 10879, 35630, 44357, 10106, 10105, 11561, 11168, 10135, 10287, 13567, 112, 187, 12360, 10155, 169, 11795, 10108, 11775, 32337, 10115, 106552, 10107, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Reg", "##ula", "Susana", "Siegfried", ",", "50", ",", "and", "Nicola", "Fl", "##eu", "##chau", "##s", ",", "25", ",", "were", "released", "after", "71", "days", "after", "a", "$", "200", ",", "000", "ran", "##som", "was", "paid", "." ], "ids": [ 107990, 13313, 92717, 43800, 117, 10462, 117, 10111, 31561, 29981, 16831, 75401, 10107, 117, 10258, 117, 10309, 11539, 10662, 12513, 13990, 10662, 169, 109, 10777, 117, 10259, 17044, 32081, 10134, 25938, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "biz", "##arre", "t", "##wis", "##t", ",", "Fl", "##eu", "##chau", "##s", "and", "the", "leader", "of", "the", "ki", "##dna", "##pper", "##s", ",", "Julio", "Cesar", "Vega", "Rojas", ",", "developed", "a", "sentiment", "##al", "att", "##achment", "during", "her", "cap", "##tivi", "##ty", ",", "according", "to", "photographs", "printed", "in", "Costa", "Rica", "##n", "newspapers", "and", "court", "documents", "including", "a", "love", "letter", "written", "by", "Vega", "." ], "ids": [ 10167, 169, 94912, 35460, 188, 83648, 10123, 117, 29981, 16831, 75401, 10107, 10111, 10105, 15014, 10108, 10105, 10879, 35630, 26248, 10107, 117, 23617, 70418, 26810, 52460, 117, 14628, 169, 70762, 10415, 10788, 58031, 10939, 10485, 13337, 30878, 11195, 117, 18071, 10114, 54194, 44632, 10106, 13902, 20834, 10115, 48473, 10111, 14866, 21784, 11198, 169, 16138, 19310, 13398, 10155, 26810, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "Inter", "##ac", "##ciones", "ups", "Mexico", "GDP", "for", "##eca", "##st", ",", "lower", "##s", "peso", "." ], "ids": [ 24362, 18306, 11822, 107717, 10490, 47832, 10142, 33588, 10562, 117, 18165, 10107, 23072, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##X", "##IC", "##O", "C", "##IT", "##Y", "1996", "-", "08", "-", "26" ], "ids": [ 47430, 12674, 30889, 11403, 140, 37611, 14703, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "##ac", "##ciones", "broke", "##rage", "on", "Monday", "raised", "its", "for", "##eca", "##sts", "for", "1996", "gross", "domestic", "product", "growth", "to", "4", ".", "3", "percent", "from", "3", ".", "8", "percent", ",", "but", "it", "kept", "its", "1997", "projection", "un", "##chang", "##ed", "at", "4", ".", "5", "percent", ",", "a", "statement", "said", "." ], "ids": [ 24362, 18306, 11822, 30500, 40696, 10135, 40714, 20526, 10474, 10142, 33588, 28036, 10142, 10389, 92746, 31084, 21535, 14609, 10114, 125, 119, 124, 22362, 10188, 124, 119, 129, 22362, 117, 10473, 10271, 26546, 10474, 10391, 92739, 10119, 64208, 10336, 10160, 125, 119, 126, 22362, 117, 169, 33311, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Economist", "Alonso", "Ce", "##rve", "##ra", "said", "the", "revision", "##s", "were", "chief", "##ly", "fuel", "##ed", "by", "stronger", "than", "expected", "growth", "of", "7", ".", "2", "percent", "in", "the", "second", "quarter", "and", "he", "for", "##eca", "##st", "an", "annual", "GDP", "rise", "of", "6", ".", "1", "percent", "in", "the", "third", "quarter", "and", "4", ".", "9", "percent", "in", "Q", "##4", "." ], "ids": [ 88422, 24341, 13338, 40252, 10288, 12415, 10105, 41643, 10107, 10309, 19421, 10454, 30550, 10336, 10155, 85688, 11084, 25973, 14609, 10108, 128, 119, 123, 22362, 10106, 10105, 11132, 28330, 10111, 10261, 10142, 33588, 10562, 10151, 19246, 47832, 28710, 10108, 127, 119, 122, 22362, 10106, 10105, 12628, 28330, 10111, 125, 119, 130, 22362, 10106, 154, 11011, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "firm", "also", "revised", "down", "its", "year", "-", "end", "peso", "for", "##eca", "##st", "to", "7", ".", "85", "-", "8", ".", "15", "per", "dollar", "from", "8", ".", "20", "-", "8", ".", "50", "." ], "ids": [ 10117, 23410, 10379, 41226, 12935, 10474, 10924, 118, 11572, 23072, 10142, 33588, 10562, 10114, 128, 119, 12017, 118, 129, 119, 10208, 10178, 34807, 10188, 129, 119, 10197, 118, 129, 119, 10462, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "for", "##eca", "##st", "an", "end", "1997", "peso", "in", "the", "range", "of", "9", ".", "20", "-", "9", ".", "40", "." ], "ids": [ 10377, 10142, 33588, 10562, 10151, 11572, 10391, 23072, 10106, 10105, 15601, 10108, 130, 119, 10197, 118, 130, 119, 10533, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "##ac", "##ciones", "kept", "its", "1996", "and", "1997", "inflation", "for", "##eca", "##st", "un", "##chang", "##ed", "at", "26", "percent", "and", "20", "percent", ",", "ex", "##pect", "##ing", "the", "government", "'", "s", "1997", "inflation", "target", "to", "be", "around", "15", "percent", "." ], "ids": [ 24362, 18306, 11822, 26546, 10474, 10389, 10111, 10391, 105888, 10142, 33588, 10562, 10119, 64208, 10336, 10160, 10314, 22362, 10111, 10197, 22362, 117, 11419, 51511, 10230, 10105, 12047, 112, 187, 10391, 105888, 28564, 10114, 10347, 12166, 10208, 22362, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "bu", "##mpe", "##d", "up", "its", "average", "interest", "rate", "projection", "in", "1997", "to", "25", ".", "8", "percent", "from", "23", "percent", "." ], "ids": [ 10377, 11499, 29165, 10162, 10741, 10474, 13551, 17644, 18344, 92739, 10106, 10391, 10114, 10258, 119, 129, 22362, 10188, 10328, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fi", "##scal", "policy", "was", "expected", "to", "be", "loose", "##ned", "a", "bit", "in", "the", "second", "half", "of", "this", "year", ",", "bo", "##osti", "##ng", "growth", "without", "running", "into", "a", "deficit", "." ], "ids": [ 36448, 51504, 14368, 10134, 25973, 10114, 10347, 102920, 17021, 169, 17684, 10106, 10105, 11132, 13877, 10108, 10531, 10924, 117, 20506, 29319, 10376, 14609, 13663, 18020, 10708, 169, 107383, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Next", "year", ",", "the", "fiscal", "policy", "will", "have", "less", "margin", "of", "freedom", "because", "the", "government", "will", "have", "to", "face", "commitment", "##s", "that", "it", "has", "taken", "on", "under", "different", "support", "scheme", "##s", "for", "the", "banks", ",", "debt", "##ors", "and", "firms", ",", "\"", "the", "broke", "##rage", "said", "." ], "ids": [ 107, 24721, 10924, 117, 10105, 43645, 14368, 11337, 10529, 15306, 53388, 10108, 33700, 12373, 10105, 12047, 11337, 10529, 10114, 13295, 75010, 10107, 10189, 10271, 10393, 15109, 10135, 10571, 12902, 13145, 41209, 10107, 10142, 10105, 41375, 117, 55869, 16379, 10111, 84459, 117, 107, 10105, 30500, 40696, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Henry", "Tri", "##cks", ",", "Mexico", "City", "news", "##room", "+", "525", "728", "-", "956", "##0" ], "ids": [ 118, 118, 11601, 36642, 18676, 117, 10490, 10773, 14424, 25525, 116, 35316, 73423, 118, 71019, 10929 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Banco", "##me", "##xt", "official", "says", "Mexico", "peso", "level", "suitable", "." ], "ids": [ 30067, 10627, 28883, 14731, 22153, 10490, 23072, 13277, 55668, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##X", "##IC", "##O", "C", "##IT", "##Y", "1996", "-", "08", "-", "26" ], "ids": [ 47430, 12674, 30889, 11403, 140, 37611, 14703, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "top", "official", "of", "export", "development", "bank", "Banco", "##me", "##xt", "said", "the", "peso", "'", "s", "app", "##rec", "##iation", "against", "the", "dollar", "this", "year", "has", "not", "hur", "##t", "demand", "for", "Mexican", "export", "##s", "." ], "ids": [ 138, 12364, 14731, 10108, 59220, 13405, 19423, 30067, 10627, 28883, 12415, 10105, 23072, 112, 187, 72894, 74755, 32767, 11327, 10105, 34807, 10531, 10924, 10393, 10472, 52824, 10123, 34394, 10142, 15323, 59220, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "a", "suitable", "exchange", "rate", "." ], "ids": [ 107, 12865, 10529, 169, 55668, 27714, 18344, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "have", "n", "'", "t", "felt", "a", "drop", "-", "off", "in", "demand", ".", ".", ".", "." ], "ids": [ 12865, 10529, 182, 112, 188, 24666, 169, 36365, 118, 11898, 10106, 34394, 119, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "have", "no", "basis", "for", "saying", "that", "the", "exchange", "rate", "is", "affect", "##ing", "export", "##s", ",", "\"", "Rafael", "Moreno", "Tur", "##rent", ",", "deputy", "director", "general", "for", "foreign", "trade", "promotion", "at", "the", "bank", ",", "said", "at", "a", "news", "conference", "." ], "ids": [ 12865, 10529, 10192, 17172, 10142, 22807, 10189, 10105, 27714, 18344, 10124, 60600, 10230, 59220, 10107, 117, 107, 17673, 29614, 105549, 28208, 117, 45404, 12461, 11389, 10142, 20796, 18908, 23175, 10160, 10105, 19423, 117, 12415, 10160, 169, 14424, 25029, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colombia", "##n", "peso", "close", "##s", "lower", ",", "importe", "##rs", "buy", "dl", "##rs", "." ], "ids": [ 15223, 10115, 23072, 16065, 10107, 18165, 117, 90621, 10943, 47715, 63940, 10943, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##O", "##GO", "##TA", "1996", "-", "08", "-", "26" ], "ids": [ 139, 11403, 83821, 24951, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colombia", "'", "s", "peso", "closed", "lower", "at", "1", ",", "044", "after", "coming", "under", "pressure", "from", "dollar", "-", "buy", "##ing", "by", "importe", "##rs", "seeking", "to", "meet", "their", "commitment", "##s", "abroad", ",", "inter", "##bank", "deal", "##ers", "said", "." ], "ids": [ 15223, 112, 187, 23072, 18440, 18165, 10160, 122, 117, 101679, 10662, 23959, 10571, 23460, 10188, 34807, 118, 47715, 10230, 10155, 90621, 10943, 51285, 10114, 23267, 10455, 75010, 10107, 50901, 117, 22021, 20583, 19918, 10901, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "the", "second", "consecutive", "session", "that", "saw", "the", "peso", ",", "which", "ended", "at", "1", ",", "04", "##1", "Friday", ",", "close", "lower", "." ], "ids": [ 10377, 10134, 10105, 11132, 29864, 30066, 10189, 17112, 10105, 23072, 117, 10319, 18428, 10160, 122, 117, 10814, 10759, 30767, 117, 16065, 18165, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "(", "dollar", "'", "s", ")", "rise", "was", "due", "to", "demand", "from", "importe", "##rs", "who", "have", "a", "lot", "of", "wire", "transfer", "##s", "ac", "##cum", "##ulated", ",", "\"", "one", "deal", "##er", "said", "." ], "ids": [ 107, 10117, 113, 34807, 112, 187, 114, 28710, 10134, 10850, 10114, 34394, 10188, 90621, 10943, 10479, 10529, 169, 19826, 10108, 68033, 21110, 10107, 13621, 23722, 37725, 117, 107, 10464, 19918, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##tri", "##but", "##ing", "to", "the", "peso", "'", "s", "weak", "##ness", ",", "another", "deal", "##er", "said", "banks", "who", "might", "have", "sold", "green", "##backs", "in", "Monday", "'", "s", "trading", "appeared", "to", "sh", "##y", "away", "from", "the", "market", "." ], "ids": [ 12845, 21570, 23170, 10230, 10114, 10105, 23072, 112, 187, 61285, 14010, 117, 12864, 19918, 10165, 12415, 41375, 10479, 20970, 10529, 15337, 23320, 68694, 10106, 40714, 112, 187, 46663, 14565, 10114, 48201, 10157, 14942, 10188, 10105, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", ",", "according", "to", "the", "trade", "##r", ",", "was", "typical", "of", "month", "-", "end", "position", "-", "sq", "##uari", "##ng", "-", "-", "and", "the", "fact", "that", "a", "stronger", "U", ".", "S", ".", "currency", "helps", "limit", "some", "foreign", "exchange", "losses", "." ], "ids": [ 10747, 117, 18071, 10114, 10105, 18908, 10129, 117, 10134, 36772, 10108, 14064, 118, 11572, 12956, 118, 27164, 85429, 10376, 118, 118, 10111, 10105, 18638, 10189, 169, 85688, 158, 119, 156, 119, 83759, 58170, 34316, 11152, 20796, 27714, 45353, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "reported", "355", "trade", "##s", "for", "a", "total", "of", "$", "142", "million", "and", "said", "the", "peso", "hit", "an", "intra", "-", "day", "high", "of", "1", ",", "037", "before", "heading", "lower", "into", "the", "close", "." ], "ids": [ 54521, 10901, 15943, 33195, 18908, 10107, 10142, 169, 11339, 10108, 109, 19893, 12473, 10111, 12415, 10105, 23072, 14946, 10151, 69617, 118, 11940, 11846, 10108, 122, 117, 110384, 11360, 82839, 18165, 10708, 10105, 16065, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Juan", "Guillermo", "London", "##o", ",", "Bog", "##ota", "news", "##room", ",", "571", "610", "794", "##4" ], "ids": [ 118, 118, 11686, 27578, 10829, 10133, 117, 97033, 15192, 14424, 25525, 117, 49567, 33427, 73970, 11011 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "'", "s", "Has", "##him", "##oto", "leaves", "Brazil", "for", "Peru", "." ], "ids": [ 11891, 112, 187, 45896, 31362, 19235, 24516, 16765, 10142, 18158, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 1, 9, 1, 9 ] }, { "tokens": [ "BR", "##AS", "##IL", "##IA", "1996", "-", "08", "-", "26" ], "ids": [ 49351, 38025, 38850, 35976, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japanese", "Prime", "Minister", "Ryu", "##taro", "Has", "##him", "##oto", "left", "Brasil", "##ia", "on", "Monday", "for", "Lima", ",", "the", "pen", "##ult", "##imate", "stop", "on", "a", "10", "-", "day", "Latin", "American", "tour", ",", "a", "Brazilian", "Foreign", "Ministry", "spoke", "##s", "##woman", "said", "." ], "ids": [ 13847, 19924, 14355, 97479, 64618, 45896, 31362, 19235, 12153, 12264, 10280, 10135, 40714, 10142, 18671, 117, 10105, 66558, 16203, 56783, 20517, 10135, 169, 10150, 118, 11940, 14617, 10536, 12842, 117, 169, 32818, 20277, 19170, 50005, 10107, 79999, 12415, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 2, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Has", "##him", "##oto", ",", "who", "has", "already", "visited", "Mexico", "and", "Chile", ",", "spent", "three", "days", "in", "Brazil", "." ], "ids": [ 45896, 31362, 19235, 117, 10479, 10393, 19034, 30270, 10490, 10111, 13218, 117, 18571, 11003, 13990, 10106, 16765, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "After", "Peru", ",", "he", "was", "due", "to", "go", "to", "Costa", "Rica", "." ], "ids": [ 11301, 18158, 117, 10261, 10134, 10850, 10114, 11783, 10114, 13902, 20834, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Nicaragua", "##n", "president", "has", "operation", "in", "U", ".", "S", "." ], "ids": [ 32337, 10115, 12931, 10393, 20080, 10106, 158, 119, 156, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "MAN", "##AG", "##U", "##A", ",", "Nicaragua", "1996", "-", "08", "-", "26" ], "ids": [ 73020, 109865, 12022, 10738, 117, 32337, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nicaragua", "##n", "President", "Violet", "##a", "Cham", "##or", "##ro", "underwent", "successful", "surgery", "in", "the", "United", "States", "on", "Monday", "to", "correct", "a", "compression", "in", "her", "lower", "spin", "##al", "column", ",", "the", "government", "said", "." ], "ids": [ 32337, 10115, 12811, 74301, 10113, 96727, 10667, 10567, 78074, 17330, 44811, 10106, 10105, 10609, 10859, 10135, 40714, 10114, 49148, 169, 98295, 10106, 10485, 18165, 30428, 10415, 41278, 117, 10105, 12047, 12415, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Doctor", "##s", "at", "Johns", "Hopkins", "Hospital", "in", "Baltimore", "found", "an", "in", "##f", "##lama", "##tion", "in", "her", "spin", "##al", "column", "that", ",", "once", "treated", ",", "will", "free", "her", "of", "chronic", "pain", "in", "her", "back", "and", "one", "leg", "that", "has", "limited", "her", "movement", ",", "a", "government", "statement", "said", "." ], "ids": [ 17376, 10107, 10160, 32138, 26326, 16025, 10106, 21413, 11823, 10151, 10106, 10575, 24540, 10822, 10106, 10485, 30428, 10415, 41278, 10189, 117, 14907, 45369, 117, 11337, 13961, 10485, 10108, 91347, 38576, 10106, 10485, 12014, 10111, 10464, 33810, 10189, 10393, 19264, 10485, 17123, 117, 169, 12047, 33311, 12415, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "(", "Cham", "##or", "##ro", ")", "is", "in", "good", "health", "and", ",", "according", "to", "her", "doctors", ",", "will", "be", "able", "to", "return", "to", "Nicaragua", "next", "week", ",", "\"", "it", "said", "." ], "ids": [ 107, 113, 96727, 10667, 10567, 114, 10124, 10106, 15198, 17004, 10111, 117, 18071, 10114, 10485, 82782, 117, 11337, 10347, 16197, 10114, 15079, 10114, 32337, 13451, 16118, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cham", "##or", "##ro", ",", "66", ",", "had", "com", "##plained", "of", "lower", "back", "pain", "since", "a", "trip", "to", "Taiwan", "in", "May", ",", "when", "pain", "forced", "her", "to", "go", "to", "Taipei", "University", "Hospital", "for", "an", "examination", "." ], "ids": [ 96727, 10667, 10567, 117, 12215, 117, 10374, 10212, 103154, 10108, 18165, 12014, 38576, 11764, 169, 37307, 10114, 19449, 10106, 10725, 117, 10841, 38576, 20054, 10485, 10114, 11783, 10114, 50291, 10404, 16025, 10142, 10151, 65548, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "She", "su", "##ffers", "from", "os", "##te", "##op", "##oros", "##is", ",", "a", "disease", "that", "weak", "##ens", "the", "bones", ",", "and", "has", "repeatedly", "flow", "##n", "to", "Washington", "for", "treatment", "." ], "ids": [ 11149, 10198, 85779, 10188, 10427, 10216, 13362, 83845, 10291, 117, 169, 21911, 10189, 61285, 12457, 10105, 48222, 117, 10111, 10393, 77998, 30676, 10115, 10114, 11586, 10142, 21379, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "She", "is", "scheduled", "to", "step", "down", "in", "January", "after", "a", "term", "of", "nearly", "seven", "years", "." ], "ids": [ 11149, 10124, 34081, 10114, 31877, 12935, 10106, 11238, 10662, 169, 13719, 10108, 21377, 15767, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eight", "dro", "##wn", "in", "Venezuela", "##n", "boat", "##ing", "accident", "." ], "ids": [ 43788, 33741, 20395, 10106, 15693, 10115, 30418, 10230, 25037, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "MA", "##RA", "##CA", "##IB", "##O", ",", "Venezuela", "1996", "-", "08", "-", "26" ], "ids": [ 27277, 29990, 46900, 72918, 11403, 117, 15693, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eight", "members", "of", "a", "family", ",", "five", "of", "them", "children", "aged", "between", "two", "and", "seven", ",", "dro", "##wne", "##d", "when", "their", "small", "boat", "sank", "on", "Lake", "Mara", "##ca", "##ibo", "in", "western", "Venezuela", "early", "on", "Monday", ",", "authorities", "said", "." ], "ids": [ 43788, 12464, 10108, 169, 11365, 117, 12403, 10108, 11345, 12694, 30262, 10948, 10551, 10111, 15767, 117, 33741, 43201, 10162, 10841, 10455, 12474, 30418, 61581, 10135, 11441, 48690, 10425, 68514, 10106, 16672, 15693, 11732, 10135, 40714, 117, 28308, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "accident", "happened", "when", "the", "Sanchez", "Za", "##rra", "##ga", "family", "took", "their", "boat", "out", "for", "a", "night", "##time", "spin", ",", "Civil", "Defence", "and", "Coast", "Guard", "officials", "said", "." ], "ids": [ 10117, 25037, 44936, 10841, 10105, 66007, 14074, 21084, 10483, 11365, 12149, 10455, 30418, 10950, 10142, 169, 16903, 18086, 30428, 117, 14906, 31621, 10111, 17498, 28739, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9 ] }, { "tokens": [ "The", "cause", "of", "the", "sin", "##king", "was", "not", "known", "but", "officials", "said", "the", "boat", "had", "a", "hole", "in", "the", "ster", "##n", "and", "no", "life", "##ja", "##ckets", "." ], "ids": [ 10117, 15311, 10108, 10105, 10795, 15629, 10134, 10472, 11053, 10473, 27730, 12415, 10105, 30418, 10374, 169, 51604, 10106, 10105, 78342, 10115, 10111, 10192, 12103, 10320, 81143, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Three", "members", "of", "the", "party", "were", "rescued", "un", "##hur", "##t", "." ], "ids": [ 15139, 12464, 10108, 10105, 14039, 10309, 106435, 10119, 27077, 10123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Banco", "de", "Mexico", "to", "in", "##ject", "3", ".", "412", "bl", "##n", "pesos", "." ], "ids": [ 30067, 10104, 10490, 10114, 10106, 56617, 124, 119, 32736, 21484, 10115, 68019, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##X", "##IC", "##O", "C", "##IT", "##Y", "1996", "-", "08", "-", "26" ], "ids": [ 47430, 12674, 30889, 11403, 140, 37611, 14703, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Banco", "de", "Mexico", "sought", "to", "in", "##ject", "3", ".", "412", "billion", "pesos", "in", "the", "secondary", "market", "on", "Monday", "through", "three", "credit", "auction", "##s", ",", "deal", "##ers", "said", "." ], "ids": [ 30067, 10104, 10490, 32570, 10114, 10106, 56617, 124, 119, 32736, 25848, 68019, 10106, 10105, 26072, 17313, 10135, 40714, 11222, 11003, 37021, 106733, 10107, 117, 19918, 10901, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "auction", "##s", "were", "offered", "as", "follows", ":" ], "ids": [ 10117, 106733, 10107, 10309, 20841, 10146, 23698, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##O", "##UN", "##T", "TER", "##M" ], "ids": [ 24339, 11403, 69849, 11090, 103462, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "206", "bl", "##n", "9", "days" ], "ids": [ 122, 119, 21717, 21484, 10115, 130, 13990 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "206", "bl", "##n", "3", "days" ], "ids": [ 122, 119, 21717, 21484, 10115, 124, 13990 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "000", "bl", "##n", "1", "day" ], "ids": [ 122, 119, 10259, 21484, 10115, 122, 11940 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Mexico", "City", "news", "##room", "525", "728", "-", "955", "##9" ], "ids": [ 118, 10490, 10773, 14424, 25525, 35316, 73423, 118, 60640, 11373 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "couple", "ki", "##dna", "##pped", "in", "Costa", "Rica", "." ], "ids": [ 17693, 20969, 10879, 35630, 44357, 10106, 13902, 20834, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "SA", "##N", "J", "##OS", "##E", ",", "Costa", "Rica", "1996", "-", "08", "-", "26" ], "ids": [ 21318, 11537, 147, 21793, 11259, 117, 13902, 20834, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Dutch", "couple", "who", "manage", "a", "farm", "in", "northern", "Costa", "Rica", "have", "been", "ki", "##dna", "##pped", "by", "an", "uni", "##dent", "##ified", "group", "demand", "##ing", "$", "1", ".", "5", "million", "in", "ran", "##som", ",", "authorities", "said", "on", "Monday", "." ], "ids": [ 138, 17693, 20969, 10479, 59251, 169, 30568, 10106, 17335, 13902, 20834, 10529, 10590, 10879, 35630, 44357, 10155, 10151, 69191, 21029, 31825, 11795, 34394, 10230, 109, 122, 119, 126, 12473, 10106, 17044, 32081, 117, 28308, 12415, 10135, 40714, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Official", "##s", "said", "Humberto", "Hu", "##eite", "Z", "##yre", "##cha", "and", "his", "wife", "Jet", "##ty", "Kors", ",", "both", "50", ",", "were", "ki", "##dna", "##pped", "late", "Saturday", "or", "early", "Sunday", "." ], "ids": [ 17678, 10107, 12415, 83570, 43707, 74832, 163, 31993, 12964, 10111, 10226, 14384, 39933, 11195, 89906, 117, 11408, 10462, 117, 10309, 10879, 35630, 44357, 13002, 24848, 10345, 11732, 19731, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Col", "." ], "ids": [ 24927, 119 ], "entity": [ "B-LOC", "O" ], "entity_ids": [ 1, 9 ] }, { "tokens": [ "Mis", "##ael", "Valerio", ",", "head", "of", "border", "police", "at", "the", "Security", "Ministry", ",", "told", "reporter", "##s", "that", "surveillance", "of", "the", "country", "'", "s", "northern", "border", "with", "Nicaragua", "has", "been", "stepped", "up", "to", "stop", "the", "ki", "##dna", "##pper", "##s", "from", "fl", "##ee", "##ing", "Costa", "Rica", "." ], "ids": [ 99946, 72808, 97227, 117, 13578, 10108, 20949, 15034, 10160, 10105, 20924, 19170, 117, 21937, 41408, 10107, 10189, 58553, 10108, 10105, 12723, 112, 187, 17335, 20949, 10169, 32337, 10393, 10590, 99116, 10741, 10114, 20517, 10105, 10879, 35630, 26248, 10107, 10188, 58768, 13321, 10230, 13902, 20834, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "No", "other", "details", "were", "immediately", "available", "." ], "ids": [ 10657, 10684, 29500, 10309, 24029, 14579, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Melbourne", "train", "coll", "##ides", "with", "truck", ",", "15", "injured", "." ], "ids": [ 56898, 39469, 118, 17784, 17767, 28552, 17092, 10169, 58907, 117, 10208, 36081, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##L", "##B", "##O", "##UR", "##NE", "1996", "-", "08", "-", "26" ], "ids": [ 47430, 11369, 11274, 11403, 98348, 93280, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fi", "##fte", "##en", "people", "were", "injured", "when", "a", "suburban", "passenger", "train", "and", "a", "truck", "coll", "##ide", "##d", "at", "a", "street", "-", "level", "rail", "crossing", "in", "the", "Australian", "city", "of", "Melbourne", "on", "Monday", ",", "said", "rail", "and", "amb", "##ulance", "officials", "." ], "ids": [ 36448, 22878, 10136, 11426, 10309, 36081, 10841, 169, 89091, 33155, 17767, 10111, 169, 58907, 28552, 13315, 10162, 10160, 169, 23840, 118, 13277, 29547, 41031, 10106, 10105, 12829, 11584, 10108, 17784, 10135, 40714, 117, 12415, 29547, 10111, 10559, 99565, 27730, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "injured", ",", "which", "included", "a", "pregnant", "woman", ",", "were", "taken", "to", "hospital", ",", "but", "were", "not", "in", "a", "serious", "condition", ",", "an", "amb", "##ulance", "spoke", "##sman", "told", "Reuters", "." ], "ids": [ 10117, 36081, 117, 10319, 12742, 169, 82495, 18299, 117, 10309, 15109, 10114, 18141, 117, 10473, 10309, 10472, 10106, 169, 32342, 24713, 117, 10151, 10559, 99565, 50005, 24305, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "A", "Public", "Transport", "Corporation", "spoke", "##sman", "said", "the", "train", ",", "coll", "##ide", "##d", "with", "the", "truck", "loaded", "with", "concrete", "p", "##yl", "##ons", "in", "the", "north", "Melbourne", "suburb", "of", "Preston", "just", "before", "8", ".", "30", "a", ".", "m", ".", "." ], "ids": [ 138, 14647, 21817, 14456, 50005, 24305, 12415, 10105, 17767, 117, 28552, 13315, 10162, 10169, 10105, 58907, 103927, 10169, 41651, 184, 27652, 13326, 10106, 10105, 12756, 17784, 54824, 10108, 35119, 12820, 11360, 129, 119, 10244, 169, 119, 181, 119, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "train", "was", "dera", "##iled", "when", "a", "corner", "of", "the", "driver", "'", "s", "com", "##part", "##ment", "caught", "the", "rear", "of", "the", "truck", ",", "the", "spoke", "##sman", "said", "." ], "ids": [ 10117, 17767, 10134, 95465, 79257, 10841, 169, 33625, 10108, 10105, 25926, 112, 187, 10212, 48433, 10426, 39797, 10105, 31845, 10108, 10105, 58907, 117, 10105, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "truck", "was", "over", "##tur", "##ned", ",", "sp", "##illing", "its", "load", "onto", "the", "crossing", ",", "and", "career", "##ed", "into", "the", "nearby", "Bell", "St", "Station", "." ], "ids": [ 10117, 58907, 10134, 10491, 15698, 17021, 117, 32650, 75579, 10474, 58490, 31095, 10105, 41031, 117, 10111, 13021, 10336, 10708, 10105, 22301, 15521, 10838, 14295, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "\"", "Re", "##marka", "##bly", "both", "the", "train", "driver", "and", "the", "truck", "driver", "were", "not", "injured", ",", "\"", "the", "rail", "spoke", "##sman", "said", "." ], "ids": [ 107, 20304, 97579, 31748, 11408, 10105, 17767, 25926, 10111, 10105, 58907, 25926, 10309, 10472, 36081, 117, 107, 10105, 29547, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "had", "the", "potential", "to", "be", "quite", "a", "nas", "##ty", "accident", ".", "\"" ], "ids": [ 107, 10377, 10374, 10105, 23078, 10114, 10347, 31324, 169, 12947, 11195, 25037, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "373", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 37358, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "capture", "Auckland", "gun", "##man", "." ], "ids": [ 18051, 32083, 33920, 23103, 10589, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "AU", "##C", "##K", "##LA", "##ND", "1996", "-", "08", "-", "27" ], "ids": [ 29088, 10858, 11733, 44376, 58521, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "gun", "##man", "being", "hun", "##ted", "on", "Auckland", "'", "s", "North", "Shore", "was", "captured", "by", "police", "just", "after", "9", "a", ".", "m", ".", "on", "Tuesday", ",", "New", "Zealand", "Press", "Association", "reported", "." ], "ids": [ 138, 23103, 10589, 11223, 12041, 11912, 10135, 33920, 112, 187, 11225, 49181, 10134, 25030, 10155, 15034, 12820, 10662, 130, 169, 119, 181, 119, 10135, 70245, 117, 10287, 14451, 10568, 11751, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Senior", "Sergeant", "Dave", "Pearson", "of", "Auckland", "police", "said", "John", "Grant", "Fa", "##gan", "was", "in", "police", "custody", ",", "but", "further", "details", "of", "his", "capture", "would", "not", "be", "released", "until", "a", "press", "conference", "later", "in", "the", "day", "." ], "ids": [ 22902, 54118, 16073, 38453, 10108, 33920, 15034, 12415, 10421, 17606, 44271, 11972, 10134, 10106, 15034, 103772, 117, 10473, 14586, 29500, 10108, 10226, 32083, 10894, 10472, 10347, 11539, 11444, 169, 21040, 25029, 10873, 10106, 10105, 11940, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fa", "##gan", "had", "earlier", "telephone", "##d", "an", "Auckland", "radio", "station", "in", "a", "dis", "##tra", "##ught", "state", ",", "saying", "he", "fear", "##ed", "for", "his", "life", "." ], "ids": [ 44271, 11972, 10374, 18905, 69009, 10162, 10151, 33920, 12429, 11825, 10106, 169, 27920, 13207, 53206, 11388, 117, 22807, 10261, 44929, 10336, 10142, 10226, 12103, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "he", "did", "not", "have", "a", "weapon", "when", "taken", "into", "custody", "and", "was", "now", "co", "##oper", "##ating", "with", "them", "." ], "ids": [ 18051, 12415, 10261, 12172, 10472, 10529, 169, 54157, 10841, 15109, 10708, 103772, 10111, 10134, 11858, 11170, 56361, 33121, 10169, 11345, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Radio", "New", "Zealand", "reported", "earlier", "that", "an", "armed", "man", "on", "Monday", "entered", "the", "North", "##cote", "College", "swimming", "pool", "changing", "shed", "##s", "and", "con", "##front", "##ed", "a", "16", "-", "year", "-", "old", "school", "##girl", "." ], "ids": [ 12083, 10287, 14451, 15943, 18905, 10189, 10151, 34174, 10817, 10135, 40714, 19226, 10105, 11225, 93245, 11454, 53164, 34183, 43068, 106942, 10107, 10111, 10173, 31044, 10336, 169, 10250, 118, 10924, 118, 12898, 11393, 92507, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "shot", "was", "fired", ",", "but", "on", "##lo", "##oke", "##rs", "managed", "to", "disa", "##rm", "the", "man", "." ], "ids": [ 138, 19508, 10134, 38903, 117, 10473, 10135, 10715, 37861, 10943, 22391, 10114, 36474, 19341, 10105, 10817, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Wellington", "news", "##room", "64", "4", "473", "-", "474", "##6" ], "ids": [ 118, 118, 28557, 14424, 25525, 11295, 125, 39130, 118, 46989, 11211 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "seek", "fu", "##git", "##ive", "after", "Auckland", "gun", "incident", "." ], "ids": [ 18051, 48394, 11005, 26264, 11942, 10662, 33920, 23103, 28005, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Auckland", "police", "were", "seeking", "an", "escaped", "gun", "##man", "on", "Tuesday", "after", "an", "incident", "in", "which", "he", "fired", "at", "a", "16", "-", "year", "-", "old", "school", "##girl", ",", "Radio", "New", "Zealand", "said", "." ], "ids": [ 33920, 15034, 10309, 51285, 10151, 65602, 23103, 10589, 10135, 70245, 10662, 10151, 28005, 10106, 10319, 10261, 38903, 10160, 169, 10250, 118, 10924, 118, 12898, 11393, 92507, 117, 12083, 10287, 14451, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "The", "man", "entered", "the", "North", "##cote", "College", "swimming", "pool", "changing", "shed", "##s", "on", "Monday", "and", "told", "the", "girl", "and", "a", "friend", ":", "\"", "You", "'", "re", "for", "it", "now", ".", "\"" ], "ids": [ 10117, 10817, 19226, 10105, 11225, 93245, 11454, 53164, 34183, 43068, 106942, 10107, 10135, 40714, 10111, 21937, 10105, 24699, 10111, 169, 20104, 131, 107, 11065, 112, 11639, 10142, 10271, 11858, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "shot", "was", "fired", ",", "but", "on", "##lo", "##oke", "##rs", "managed", "to", "seize", "the", "gun", ",", "the", "radio", "said", "." ], "ids": [ 138, 19508, 10134, 38903, 117, 10473, 10135, 10715, 37861, 10943, 22391, 10114, 75325, 10105, 23103, 117, 10105, 12429, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", ",", "who", "were", "unsuccessful", "in", "finding", "the", "man", "over", "##night", ",", "described", "him", "as", "dis", "##tur", "##bed", "and", "dangerous", "." ], "ids": [ 18051, 117, 10479, 10309, 57669, 10106, 43977, 10105, 10817, 10491, 45217, 117, 13010, 10957, 10146, 27920, 15698, 33627, 10111, 57195, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Wellington", "news", "##room", "64", "4", "473", "-", "474", "##6" ], "ids": [ 118, 118, 28557, 14424, 25525, 11295, 125, 39130, 118, 46989, 11211 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SI", "##ME", "##X", "Brent", "closed", "on", "Monday", "o", "##wing", "to", "IP", "##E", "holiday", "." ], "ids": [ 39675, 42424, 12674, 56333, 18440, 10135, 40714, 183, 25649, 10114, 24124, 11259, 71806, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "SI", "##NG", "##AP", "##OR", "##E", "1996", "-", "08", "-", "26" ], "ids": [ 39675, 34065, 38423, 42622, 11259, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Brent", "c", "##rude", "future", "##s", "market", "on", "the", "Singapore", "International", "Monetary", "Exchange", "(", "SI", "##ME", "##X", ")", "was", "closed", "on", "Monday", "in", "respect", "for", "a", "U", ".", "K", ".", "national", "holiday", "." ], "ids": [ 10117, 56333, 171, 97417, 16711, 10107, 17313, 10135, 10105, 19437, 10771, 100549, 32424, 113, 39675, 42424, 12674, 114, 10134, 18440, 10135, 40714, 10106, 28944, 10142, 169, 158, 119, 148, 119, 11844, 71806, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "THE", "SI", "##ME", "##X", "Brent", "market", "keeps", "to", "the", "trading", "schedule", "of", "the", "International", "Petroleum", "Exchange", "(", "IP", "##E", ")", "in", "London", ",", "which", "is", "closed", "for", "a", "British", "bank", "holiday", "." ], "ids": [ 17443, 39675, 42424, 12674, 56333, 17313, 107781, 10114, 10105, 46663, 52561, 10108, 10105, 10771, 89589, 32424, 113, 24124, 11259, 114, 10106, 10829, 117, 10319, 10124, 18440, 10142, 169, 11160, 19423, 71806, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Contra", "##cts", "traded", "in", "Singapore", "are", "mutual", "##ly", "offs", "##et", "against", "contracts", "traded", "in", "London", "." ], "ids": [ 62046, 39159, 52696, 10106, 19437, 10301, 85412, 10454, 51851, 10308, 11327, 69690, 52696, 10106, 10829, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "-", "-", "Singapore", "News", "##room", "(", "+", "65", "870", "308", "##1", ")" ], "ids": [ 118, 118, 19437, 12219, 25525, 113, 116, 10843, 44472, 29644, 10759, 114 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Metro", "slide", "##s", "3", ".", "3", "p", "##ct", "after", "market", "opens", "." ], "ids": [ 20640, 92010, 10107, 124, 119, 124, 184, 14526, 10662, 17313, 70702, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SI", "##NG", "##AP", "##OR", "##E", "1996", "-", "08", "-", "26" ], "ids": [ 39675, 34065, 38423, 42622, 11259, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "in", "retail", "##er", "Metro", "Holdings", "dropped", "3", ".", "31", "percent", ",", "or", "Singapore", "$", "0", ".", "20", ",", "to", "S", "$", "5", ".", "85", "minutes", "after", "the", "market", "opened", "on", "Monday", "." ], "ids": [ 106583, 11234, 10106, 52232, 10165, 20640, 57727, 30241, 124, 119, 10413, 22362, 117, 10345, 19437, 109, 121, 119, 10197, 117, 10114, 156, 109, 126, 119, 12017, 15304, 10662, 10105, 17313, 14377, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "By", "012", "##0", "GMT", ",", "357", ",", "000", "Metro", "shares", "had", "been", "traded", "." ], "ids": [ 12716, 69878, 10929, 20362, 117, 33590, 117, 10259, 20640, 45751, 10374, 10590, 52696, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Friday", ",", "Metro", "Holdings", "topped", "gain", "##ers", ",", "soa", "##ring", "by", "S", "$", "1", ".", "55", "to", "close", "at", "S", "$", "6", ".", "05", "on", "market", "rum", "##ours", "of", "a", "take", "##over", "bid", "by", "First", "Capital", "Corp", "." ], "ids": [ 10576, 30767, 117, 20640, 57727, 86866, 25881, 10901, 117, 56108, 13135, 10155, 156, 109, 122, 119, 11358, 10114, 16065, 10160, 156, 109, 127, 119, 10831, 10135, 17313, 52522, 69265, 10108, 169, 13574, 16666, 50385, 10155, 12128, 21433, 44687, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "company", "said", "it", "was", "not", "aware", "of", "any", "reason", "for", "the", "surge", "." ], "ids": [ 10117, 12100, 12415, 10271, 10134, 10472, 66625, 10108, 11178, 27949, 10142, 10105, 69824, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Singapore", "news", "##room", "(", "65", "870", "##30", "##80", ")" ], "ids": [ 118, 118, 19437, 14424, 25525, 113, 10843, 44472, 32792, 44026, 114 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indonesian", "ru", "##pia", "##h", "stable", "in", "quiet", "late", "trading", "." ], "ids": [ 47340, 13483, 17837, 10237, 38430, 10106, 104951, 13002, 46663, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "JA", "##KA", "##RT", "##A", "1996", "-", "08", "-", "26" ], "ids": [ 53399, 67813, 46935, 10738, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Indonesian", "ru", "##pia", "##h", "was", "stable", "against", "the", "dollar", "in", "quiet", "trading", "on", "Monday", ",", "deal", "##ers", "said", "." ], "ids": [ 10117, 47340, 13483, 17837, 10237, 10134, 38430, 11327, 10105, 34807, 10106, 104951, 46663, 10135, 40714, 117, 19918, 10901, 12415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "volume", "was", "thin", "following", "a", "public", "holiday", "in", "Hong", "Kong", "and", "the", "United", "Kingdom", "." ], "ids": [ 11696, 12415, 15901, 10134, 61470, 11901, 169, 11683, 71806, 10106, 15078, 14577, 10111, 10105, 10609, 14648, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "We", "did", "n", "'", "t", "see", "anything", "from", "Singapore", "operators", "either", "." ], "ids": [ 107, 12865, 12172, 182, 112, 188, 12888, 42819, 10188, 19437, 72931, 16106, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "a", "pretty", "quiet", "day", ",", "\"", "one", "foreign", "bank", "deal", "##er", "said", "." ], "ids": [ 10377, 112, 187, 169, 108361, 104951, 11940, 117, 107, 10464, 20796, 19423, 19918, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spot", "ru", "##pia", "##h", "was", "quoted", "at", "2", ",", "342", ".", "0", "/", "42", ".", "5", "at", "09", "##15", "GMT", ",", "un", "##chang", "##ed", "from", "the", "opening", "level", "." ], "ids": [ 97362, 13483, 17837, 10237, 10134, 70676, 10160, 123, 117, 34430, 119, 121, 120, 11276, 119, 126, 10160, 11035, 37462, 20362, 117, 10119, 64208, 10336, 10188, 10105, 17975, 13277, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "soft", "##er", "in", "the", "morning", "due", "to", "relatively", "ample", "ru", "##pia", "##h", "liquid", "##ity", "but", "recovered", "later", "." ], "ids": [ 10377, 10134, 44898, 10165, 10106, 10105, 28757, 10850, 10114, 28436, 106775, 13483, 17837, 10237, 58538, 11949, 10473, 55051, 10873, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tomorrow", "and", "today", "ru", "##pia", "##h", "closed", "at", "2", ",", "342", ".", "00", "/", "42", ".", "45", "and", "2", ",", "341", ".", "5", "/", "42", ".", "0", ",", "respectively", "." ], "ids": [ 37670, 10111, 18745, 13483, 17837, 10237, 18440, 10160, 123, 117, 34430, 119, 11025, 120, 11276, 119, 10827, 10111, 123, 117, 35957, 119, 126, 120, 11276, 119, 121, 117, 25179, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Another", "deal", "##er", "said", "operators", "were", "re", "##lu", "##cta", "##nt", "to", "un", "##load", "ru", "##pia", "##h", "despite", "ample", "conditions", "due", "to", "the", "month", "-", "end", "factor", "." ], "ids": [ 17101, 19918, 10165, 12415, 72931, 10309, 11639, 11435, 24290, 10368, 10114, 10119, 64312, 13483, 17837, 10237, 22087, 106775, 17315, 10850, 10114, 10105, 14064, 118, 11572, 21834, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "are", "two", "factors", "which", "determine", "the", "market", "at", "present", "." ], "ids": [ 107, 11723, 10301, 10551, 31075, 10319, 37284, 10105, 17313, 10160, 12254, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "liquid", "##ity", "at", "month", "-", "end", "and", "the", "next", "court", "hearing", "scheduled", "for", "Thursday", ",", "\"", "the", "deal", "##er", "said", "." ], "ids": [ 10117, 58538, 11949, 10160, 14064, 118, 11572, 10111, 10105, 13451, 14866, 51191, 34081, 10142, 67067, 117, 107, 10105, 19918, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mega", "##wati", "Su", "##kar", "##no", "##put", "##ri", ",", "de", "##posed", "leader", "of", "the", "Indonesian", "Democratic", "Party", "(", "PD", "##I", ")", "has", "sue", "##d", "the", "government", "for", "ou", "##sting", "her", "as", "PD", "##I", "leader", "." ], "ids": [ 35693, 66790, 12271, 15190, 10343, 27876, 10401, 117, 10104, 76996, 15014, 10108, 10105, 47340, 19281, 12529, 113, 65535, 11281, 114, 10393, 15893, 10162, 10105, 12047, 10142, 10431, 85660, 10485, 10146, 65535, 11281, 15014, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "The", "central", "Jakarta", "court", "ad", "##jou", "##rne", "##d", "the", "case", "last", "Thursday", "for", "possible", "out", "-", "of", "-", "court", "settlement", "." ], "ids": [ 10117, 12397, 14164, 14866, 10840, 98214, 14366, 10162, 10105, 13474, 12469, 67067, 10142, 14128, 10950, 118, 10108, 118, 14866, 23931, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "hearing", "is", "due", "to", "res", "##ume", "on", "Thursday", "." ], "ids": [ 10117, 51191, 10124, 10850, 10114, 39429, 20467, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mega", "##wati", "'", "s", "lawyer", "##s", "said", "they", "were", "still", "discuss", "##ing", "a", "possible", "out", "of", "court", "settlement", "but", "they", "was", "not", "op", "##timi", "##stic", "an", "agreement", "could", "be", "reached", "." ], "ids": [ 35693, 66790, 112, 187, 38055, 10107, 12415, 10689, 10309, 12647, 71695, 10230, 169, 14128, 10950, 10108, 14866, 23931, 10473, 10689, 10134, 10472, 10303, 82064, 26666, 10151, 25432, 12174, 10347, 17087, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "deal", "##er", "said", "this", "issue", "remained", "a", "factor", "but", "its", "importance", "to", "the", "market", "seemed", "to", "di", "##mini", "##sh", "." ], "ids": [ 10117, 19918, 10165, 12415, 10531, 15557, 15980, 169, 21834, 10473, 10474, 21912, 10114, 10105, 17313, 64676, 10114, 10120, 37249, 13264, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "liquid", "##ity", "would", "be", "the", "main", "concern", "for", "the", "next", "few", "days", "." ], "ids": [ 10357, 12415, 58538, 11949, 10894, 10347, 10105, 12126, 43607, 10142, 10105, 13451, 13824, 13990, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "##night", "s", "##wa", "##p", "was", "at", "0", ".", "45", "/", "0", ".", "48", "and", "tom", "/", "next", "at", "0", ".", "50", "/", "0", ".", "55", "." ], "ids": [ 15704, 45217, 187, 11037, 10410, 10134, 10160, 121, 119, 10827, 120, 121, 119, 11300, 10111, 19132, 120, 13451, 10160, 121, 119, 10462, 120, 121, 119, 11358, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "-", "month", "s", "##wa", "##p", "was", "at", "18", ".", "0", "/", "18", ".", "5", ",", "two", "at", "34", ".", "0", "/", "35", ".", "0", ",", "three", "at", "52", ".", "75", "/", "53", ".", "50", "and", "six", "at", "106", ".", "5", "/", "107", ".", "0", "points", "." ], "ids": [ 11340, 118, 14064, 187, 11037, 10410, 10134, 10160, 10218, 119, 121, 120, 10218, 119, 126, 117, 10551, 10160, 11069, 119, 121, 120, 10803, 119, 121, 117, 11003, 10160, 11525, 119, 11417, 120, 11756, 119, 10462, 10111, 12449, 10160, 16084, 119, 126, 120, 15844, 119, 121, 12789, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "central", "bank", "kept", "its", "intervention", "rate", "at", "2", ",", "337", "/", "2", ",", "455", "and", "the", "conversion", "rate", "at", "2", ",", "337", "/", "2", ",", "383", "on", "Monday", "." ], "ids": [ 10117, 12397, 19423, 26546, 10474, 40152, 18344, 10160, 123, 117, 32225, 120, 123, 117, 38767, 10111, 10105, 45109, 18344, 10160, 123, 117, 32225, 120, 123, 117, 35663, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Senate", "intelligence", "chairman", "in", "Saudi", "bomb", "probe", "." ], "ids": [ 22294, 30151, 27627, 10106, 26598, 41654, 110239, 119 ], "entity": [ "B-ORG", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "D", "##UB", "##A", "##I", "1996", "-", "08", "-", "26" ], "ids": [ 141, 82439, 10738, 11281, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Senate", "Intelligence", "Committee", "chairman", "Ar", "##len", "Sp", "##ect", "##er", ",", "who", "has", "questioned", "whether", "Defence", "Secretary", "William", "Perry", "should", "res", "##ign", "over", "the", "latest", "bombing", "in", "Saudi", "Arabia", ",", "met", "Saudi", "officials", "on", "Monday", "during", "a", "brief", "visit", "to", "the", "kingdom", "." ], "ids": [ 158, 119, 156, 119, 22294, 28854, 14481, 27627, 18484, 11608, 46361, 56906, 10165, 117, 10479, 10393, 101173, 21883, 31621, 19382, 10694, 20191, 14819, 39429, 58445, 10491, 10105, 50908, 67011, 10106, 26598, 27860, 117, 10428, 26598, 27730, 10135, 40714, 10939, 169, 29040, 27541, 10114, 10105, 12293, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 3, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "U", ".", "S", ".", "em", "##bas", "##sy", "spoke", "##sman", "in", "R", "##iya", "##dh", "said", "Sp", "##ect", "##er", ",", "who", "arrived", "from", "neighbouring", "Oman", "on", "Sunday", "and", "left", "on", "Monday", ",", "had", "talks", "with", "Saudi", "and", "American", "officials", "in", "D", "##hah", "##ran", ",", "where", "19", "U", ".", "S", ".", "air", "##men", "were", "killed", "by", "a", "fuel", "truck", "bomb", "on", "June", "25", ",", "and", "R", "##iya", "##dh", "." ], "ids": [ 138, 158, 119, 156, 119, 10266, 21322, 16105, 50005, 24305, 10106, 155, 14990, 20193, 12415, 46361, 56906, 10165, 117, 10479, 22584, 10188, 79475, 47864, 10135, 19731, 10111, 12153, 10135, 40714, 117, 10374, 56672, 10169, 26598, 10111, 10536, 27730, 10106, 141, 73414, 12111, 117, 10940, 10270, 158, 119, 156, 119, 12566, 11418, 10309, 15875, 10155, 169, 30550, 58907, 41654, 10135, 11120, 10258, 117, 10111, 155, 14990, 20193, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 2, 9, 9, 1, 5, 5, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Sp", "##ect", "##er", "met", "Crown", "Prince", "Abdullah", "and", "Minister", "of", "Defence", "and", "Aviation", "Prince", "Sultan", "in", "Je", "##dda", "##h", ",", "Saudi", "state", "television", "and", "the", "official", "Saudi", "Press", "Agency", "reported", "." ], "ids": [ 46361, 56906, 10165, 10428, 25614, 14185, 32200, 10111, 14355, 10108, 31621, 10111, 28561, 14185, 17529, 10106, 13796, 36611, 10237, 117, 26598, 11388, 14162, 10111, 10105, 14731, 26598, 10568, 21887, 15943, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 4, 8, 9, 9, 9, 3, 7, 7, 9, 4, 9, 1, 5, 5, 9, 2, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "He", "had", "earlier", "visited", "Japan", ",", "South", "Korea", "and", "China", "." ], "ids": [ 10357, 10374, 18905, 30270, 11891, 117, 11056, 14096, 10111, 11593, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ "Sp", "##ect", "##er", "said", "after", "the", "bombing", "there", "should", "be", "a", "sh", "##ake", "-", "up", "at", "the", "Pen", "##tago", "##n", "and", "questioned", "whether", "Perry", "should", "res", "##ign", "." ], "ids": [ 46361, 56906, 10165, 12415, 10662, 10105, 67011, 11155, 14819, 10347, 169, 48201, 26389, 118, 10741, 10160, 10105, 52559, 107594, 10115, 10111, 101173, 21883, 20191, 14819, 39429, 58445, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "he", "was", "not", "sat", "##isfied", "with", "some", "of", "Perry", "'", "s", "answer", "##s", "to", "the", "committee", "'", "s", "questions", "in", "closed", "testi", "##mony", "last", "month", "." ], "ids": [ 10357, 12415, 10261, 10134, 10472, 20694, 108813, 10169, 11152, 10108, 20191, 112, 187, 57085, 10107, 10114, 10105, 27634, 112, 187, 26686, 10106, 18440, 41319, 91481, 12469, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "question", "of", "whether", "Perry", "should", "res", "##ign", "remained", "open", ",", "the", "Pennsylvania", "Republican", "said", "." ], "ids": [ 10117, 20210, 10108, 21883, 20191, 14819, 39429, 58445, 15980, 14087, 117, 10105, 14726, 21776, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 1, 2, 9, 9 ] }, { "tokens": [ "FBI", "Director", "Louis", "Free", "##h", ",", "who", "has", "twice", "visited", "Saudi", "Arabia", "to", "seek", "improved", "cooperation", "with", "Saudi", "in", "##vesti", "##gator", "##s", ",", "told", "the", "committee", "he", "was", "not", "entirely", "sat", "##isfied", "with", "Saudi", "cooperation", "on", "the", "D", "##hah", "##ran", "bomb", "and", "a", "previous", "bomb", "attack", "in", "R", "##iya", "##dh", "." ], "ids": [ 27254, 15480, 11334, 16122, 10237, 117, 10479, 10393, 26261, 30270, 26598, 27860, 10114, 48394, 34605, 56547, 10169, 26598, 10106, 63996, 75791, 10107, 117, 21937, 10105, 27634, 10261, 10134, 10472, 34053, 20694, 108813, 10169, 26598, 56547, 10135, 10105, 141, 73414, 12111, 41654, 10111, 169, 16741, 41654, 16342, 10106, 155, 14990, 20193, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "\"", "If", "we", "'", "re", "to", "stay", "in", "Saudi", "Arabia", ",", "we", "need", "to", "have", "total", "cooperation", ",", "\"", "Sp", "##ect", "##er", "said", "." ], "ids": [ 107, 14535, 11951, 112, 11639, 10114, 29597, 10106, 26598, 27860, 117, 11951, 17367, 10114, 10529, 11339, 56547, 117, 107, 46361, 56906, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "The", "United", "States", "has", "5", ",", "000", "U", ".", "S", ".", "air", "force", "and", "other", "military", "personnel", "in", "Saudi", "Arabia", "." ], "ids": [ 10117, 10609, 10859, 10393, 126, 117, 10259, 158, 119, 156, 119, 12566, 15031, 10111, 10684, 14041, 23889, 10106, 26598, 27860, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Hij", "##ack", "##ed", "Sudan", "##ese", "plane", "leaves", "Cyprus", "for", "Britain", "." ], "ids": [ 12076, 33145, 10336, 28407, 13565, 35007, 24516, 45639, 10142, 16032, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "LA", "##RNA", "##CA", ",", "Cyprus", "1996", "-", "08", "-", "27" ], "ids": [ 29079, 83931, 46900, 117, 45639, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Sudan", "Airways", "plane", "with", "199", "passengers", "and", "crew", "which", "was", "hija", "##cked", "to", "Cyprus", "took", "off", "from", "La", "##rna", "##ca", "airport", "after", "ref", "##uell", "##ing", "and", "headed", "to", "Britain", "early", "on", "Tuesday", ",", "witnesses", "said", "." ], "ids": [ 138, 28407, 29791, 35007, 10169, 23366, 37008, 10111, 24032, 10319, 10134, 26429, 72333, 10114, 45639, 12149, 11898, 10188, 10159, 13471, 10425, 28460, 10662, 48056, 55420, 10230, 10111, 33336, 10114, 16032, 11732, 10135, 70245, 117, 109898, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "an", "unknown", "number", "of", "hija", "##cker", "##s", "were", "on", "board", "the", "Airbus", "310", "which", "was", "hija", "##cked", "on", "its", "way", "from", "K", "##hart", "##oum", "to", "Amman", "in", "Jordan", "." ], "ids": [ 18051, 12415, 10151, 27306, 11487, 10108, 26429, 19153, 10107, 10309, 10135, 17936, 10105, 35540, 23993, 10319, 10134, 26429, 72333, 10135, 10474, 13170, 10188, 148, 34567, 88314, 10114, 107098, 10106, 16366, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 1, 9 ] }, { "tokens": [ "One", "had", "threatened", "to", "blow", "it", "up", "unless", "it", "was", "ref", "##uelle", "##d", "and", "they", "were", "taken", "to", "London", "where", "they", "intended", "to", "surrender", "and", "seek", "political", "as", "##ylum", "." ], "ids": [ 11340, 10374, 44593, 10114, 106194, 10271, 10741, 60015, 10271, 10134, 48056, 36252, 10162, 10111, 10689, 10309, 15109, 10114, 10829, 10940, 10689, 24071, 10114, 75614, 10111, 48394, 13736, 10146, 54716, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kur", "##ds", "c", "##lash", "again", "in", "Iraq", ",", "dozen", "##s", "reported", "dead", "." ], "ids": [ 61912, 13268, 171, 25297, 13123, 10106, 21455, 117, 84956, 10107, 15943, 23457, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##KA", "##RA", "1996", "-", "08", "-", "26" ], "ids": [ 50972, 67813, 29990, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Heavy", "fighting", "broke", "out", "between", "two", "rival", "Kur", "##dish", "faction", "##s", "in", "northern", "Iraq", "at", "mid", "##night", "Sunday", "and", "at", "least", "29", "people", "were", "killed", ",", "one", "of", "the", "groups", "said", "on", "Monday", "." ], "ids": [ 31920, 27535, 30500, 10950, 10948, 10551, 24792, 61912, 67522, 84395, 10107, 10106, 17335, 21455, 10160, 15607, 45217, 19731, 10111, 10160, 16298, 10386, 11426, 10309, 15875, 117, 10464, 10108, 10105, 15647, 12415, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Kurdistan", "Democratic", "Party", "(", "K", "##DP", ")", "said", "the", "Patriot", "##ic", "Union", "of", "Kurdistan", "(", "P", "##U", "##K", ")", "had", "broken", "the", "U", ".", "S", ".", "-", "broke", "##red", "cea", "##sef", "##ire", "agreed", "between", "the", "two", "parties", "last", "week", "." ], "ids": [ 10117, 86246, 19281, 12529, 113, 148, 54714, 114, 12415, 10105, 107222, 11130, 11457, 10108, 86246, 113, 153, 12022, 11733, 114, 10374, 36197, 10105, 158, 119, 156, 119, 118, 30500, 15711, 25578, 107749, 11627, 25577, 10948, 10105, 10551, 18708, 12469, 16118, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "faction", "##s", "reached", "a", "cea", "##sef", "##ire", "on", "Friday", "after", "a", "week", "of", "fie", "##rce", "fighting", "which", "had", "put", "an", "end", "to", "a", "tr", "##uce", "agreed", "a", "year", "earlier", "." ], "ids": [ 10117, 84395, 10107, 17087, 169, 25578, 107749, 11627, 10135, 30767, 10662, 169, 16118, 10108, 29959, 31526, 27535, 10319, 10374, 14499, 10151, 11572, 10114, 169, 32221, 24075, 25577, 169, 10924, 18905, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "P", "##U", "##K", "leadership", "who", "pl", "##ed", "##ged", "to", "end", "fighting", "and", "co", "##oper", "##ate", "with", "the", "latest", "U", ".", "S", ".", "initiative", "started", "a", "major", "military", "offensive", "against", "K", "##DP", "positions", ",", "\"", "the", "K", "##DP", "said", "in", "a", "statement", "." ], "ids": [ 107, 10117, 153, 12022, 11733, 25121, 10479, 20648, 10336, 18832, 10114, 11572, 27535, 10111, 11170, 56361, 12436, 10169, 10105, 50908, 158, 119, 156, 119, 34960, 13457, 169, 11922, 14041, 31820, 11327, 148, 54714, 23188, 117, 107, 10105, 148, 54714, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "heavy", "fighting", "started", "at", "mid", "##night", "in", "the", "region", "div", "##iding", "the", "two", "war", "##ring", "faction", "##s", ",", "with", "the", "P", "##U", "##K", "aim", "##ing", "to", "break", "through", "to", "K", "##DP", "'", "s", "headquarters", "in", "Salah", "##uddin", "." ], "ids": [ 10377, 12415, 18296, 27535, 13457, 10160, 15607, 45217, 10106, 10105, 12220, 76486, 28142, 10105, 10551, 10338, 13135, 84395, 10107, 117, 10169, 10105, 153, 12022, 11733, 56048, 10230, 10114, 24194, 11222, 10114, 148, 54714, 112, 187, 28245, 10106, 44581, 76170, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "The", "K", "##DP", "said", "29", "P", "##U", "##K", "fighters", "were", "killed", "in", "the", "attack", "." ], "ids": [ 10117, 148, 54714, 12415, 10386, 153, 12022, 11733, 62450, 10309, 15875, 10106, 10105, 16342, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "did", "not", "provide", "details", "of", "K", "##DP", "casualties", "and", "a", "P", "##U", "##K", "spoke", "##sman", "was", "not", "immediately", "available", "for", "comment", "." ], "ids": [ 10377, 12172, 10472, 16871, 29500, 10108, 148, 54714, 69297, 10111, 169, 153, 12022, 11733, 50005, 24305, 10134, 10472, 24029, 14579, 10142, 49641, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "statement", "said", "the", "P", "##U", "##K", "resumed", "its", "attack", "on", "Monday", "morning", "on", "K", "##DP", "positions", "near", "Raw", "##ando", "##uz", "and", "ind", "##is", "##cri", "##minat", "##ely", "shell", "##ed", "the", "town", "of", "Day", "##ana", ",", "killing", "a", "priest", "and", "in", "##jur", "##ing", "some", "civilians", "." ], "ids": [ 10117, 33311, 12415, 10105, 153, 12022, 11733, 68655, 10474, 16342, 10135, 40714, 28757, 10135, 148, 54714, 23188, 12883, 30712, 13904, 20498, 10111, 30386, 10291, 99590, 104130, 44096, 43332, 10336, 10105, 12221, 10108, 12360, 11631, 117, 34248, 169, 40981, 10111, 10106, 56671, 10230, 11152, 77485, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fighting", "has", "threatened", "a", "U", ".", "S", ".", "-", "led", "peace", "plan", "to", "unit", "##e", "the", "mountain", "##ous", "Kur", "##dish", "region", "in", "northern", "Iraq", "against", "President", "Saddam", "Hussein", "." ], "ids": [ 10117, 27535, 10393, 44593, 169, 158, 119, 156, 119, 118, 12857, 28101, 13065, 10114, 16511, 10112, 10105, 25233, 13499, 61912, 67522, 12220, 10106, 17335, 21455, 11327, 12811, 85431, 49053, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 9, 9, 4, 8, 9 ] }, { "tokens": [ "A", "U", ".", "S", ".", "-", "led", "air", "force", "has", "protected", "Iraqi", "Kur", "##ds", "against", "attack", "from", "Baghdad", "since", "shortly", "after", "the", "Gulf", "War", "in", "1991", "." ], "ids": [ 138, 158, 119, 156, 119, 118, 12857, 12566, 15031, 10393, 38522, 57806, 61912, 13268, 11327, 16342, 10188, 73055, 11764, 31555, 10662, 10105, 28239, 11277, 10106, 10442, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Egypt", "to", "press", "Britain", "over", "Islam", "##ist", "conference", "." ], "ids": [ 20440, 10114, 21040, 16032, 10491, 14727, 11293, 25029, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 2, 6, 9, 9 ] }, { "tokens": [ "CA", "##IR", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 24707, 73522, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egypt", "will", "tell", "Britain", "it", "is", "concerned", "about", "a", "meeting", "of", "Islam", "##ists", "to", "be", "held", "in", "London", "soon", ",", "Foreign", "Minister", "Am", "##r", "Mo", "##ussa", "said", "on", "Monday", "." ], "ids": [ 20440, 11337, 41549, 16032, 10271, 10124, 47451, 10978, 169, 19822, 10108, 14727, 18206, 10114, 10347, 11991, 10106, 10829, 17864, 117, 20277, 14355, 11500, 10129, 34987, 24630, 12415, 10135, 40714, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "is", "a", "question", "mark", "over", "this", "issue", "." ], "ids": [ 107, 11723, 10124, 169, 20210, 29221, 10491, 10531, 15557, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", ",", "and", "many", "other", "countries", ",", "do", "n", "'", "t", "understand", "this", "(", "Britain", "'", "s", ")", "position", ",", "\"", "Mo", "##ussa", "told", "reporter", "##s", "." ], "ids": [ 12865, 117, 10111, 11299, 10684, 15911, 117, 10149, 182, 112, 188, 49151, 10531, 113, 16032, 112, 187, 114, 12956, 117, 107, 34987, 24630, 21937, 41408, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Egypt", "will", "contact", "the", "British", "government", "to", "find", "out", "the", "truth", "of", "the", "matter", "and", "to", "discuss", "the", "possible", "consequences", "of", "such", "an", "un", "##fort", "##una", "##te", "step", ",", "\"", "he", "added", "." ], "ids": [ 107, 20440, 11337, 20637, 10105, 11160, 12047, 10114, 17860, 10950, 10105, 47226, 10108, 10105, 27904, 10111, 10114, 71695, 10105, 14128, 82459, 10108, 11049, 10151, 10119, 23044, 14212, 10216, 31877, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egyptian", "government", "newspapers", "have", "criticised", "Britain", "for", "allowing", "Islam", "##ists", ",", "whom", "they", "brand", "as", "\"", "terrorist", "##s", "\"", ",", "to", "hold", "their", "conference", ",", "saying", "the", "meeting", "will", "be", "a", "chance", "for", "dangerous", "Mo", "##sle", "##m", "militants", "to", "plot", "against", "their", "countries", "of", "origin", "." ], "ids": [ 34624, 12047, 48473, 10529, 91588, 16032, 10142, 28357, 14727, 18206, 117, 18104, 10689, 23467, 10146, 107, 76482, 10107, 107, 117, 10114, 18500, 10455, 25029, 117, 22807, 10105, 19822, 11337, 10347, 169, 27893, 10142, 57195, 34987, 42176, 10147, 73829, 10114, 32473, 11327, 10455, 15911, 10108, 22608, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "not", "clear", "when", "the", "conference", "will", "be", "held", "." ], "ids": [ 10377, 10124, 10472, 24866, 10841, 10105, 25029, 11337, 10347, 11991, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "About", "1", ",", "000", "people", "have", "been", "killed", "in", "Egypt", "since", "Islamic", "militants", "took", "up", "arms", "in", "1992", "in", "an", "attempt", "to", "over", "##th", "##row", "the", "government", "and", "set", "up", "a", "strict", "Islamic", "state", "." ], "ids": [ 16260, 122, 117, 10259, 11426, 10529, 10590, 15875, 10106, 20440, 11764, 22150, 73829, 12149, 10741, 28150, 10106, 10450, 10106, 10151, 21395, 10114, 10491, 11143, 21454, 10105, 12047, 10111, 11847, 10741, 169, 68930, 22150, 11388, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Cairo", "says", "several", "Egyptian", "militants", "on", "the", "run", "from", "death", "sentence", "##s", "or", "conviction", "##s", "for", "violent", "attacks", "at", "home", "have", "taken", "shelter", "in", "Britain", "." ], "ids": [ 37580, 22153, 11736, 34624, 73829, 10135, 10105, 14095, 10188, 12557, 49219, 10107, 10345, 94259, 10107, 10142, 43934, 26483, 10160, 11816, 10529, 15109, 85947, 10106, 16032, 119 ], "entity": [ "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Israeli", "army", "ran", "##sa", "##cks", "Bed", "##ou", "##in", "Palestinian", "camp", "." ], "ids": [ 28446, 17977, 17044, 10466, 18676, 76757, 11010, 10245, 56119, 16700, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "AL", "-", "M", "##UN", "##TA", "##R", ",", "West", "Bank", "1996", "-", "08", "-", "26" ], "ids": [ 47271, 118, 150, 69849, 24951, 11273, 117, 11164, 13533, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israeli", "security", "forces", "ran", "##sa", "##cked", "a", "Bed", "##ou", "##in", "en", "##cam", "##pment", "in", "the", "West", "Bank", "on", "Monday", "to", "ex", "##pel", "them", "from", "an", "area", "which", "Palestinian", "##s", "say", "had", "been", "ear", "##marked", "for", "Jewish", "settlement", "expansion", ",", "residents", "said", "." ], "ids": [ 28446, 21849, 13729, 17044, 10466, 72333, 169, 76757, 11010, 10245, 10110, 67354, 75758, 10106, 10105, 11164, 13533, 10135, 40714, 10114, 11419, 17703, 11345, 10188, 10151, 11168, 10319, 56119, 10107, 23763, 10374, 10590, 104700, 88425, 10142, 17119, 23931, 24837, 117, 22058, 12415, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "soldiers", "sto", "##le", "a", "gold", "neck", "##lace", "and", "about", "$", "2", ",", "000", "in", "Israeli", "currency", "from", "an", "elderly", "woman", "and", "her", "daughter", "-", "in", "-", "law", "while", "rum", "##ma", "##ging", "through", "their", "lu", "##gga", "##ge", "before", "destroying", "family", "sh", "##ack", "##s", "and", "animal", "barn", "##s", "." ], "ids": [ 11696, 12415, 23324, 47264, 10284, 169, 18128, 63938, 72654, 10111, 10978, 109, 123, 117, 10259, 10106, 28446, 83759, 10188, 10151, 106226, 18299, 10111, 10485, 15243, 118, 10106, 118, 13255, 11371, 52522, 10369, 13808, 11222, 10455, 14657, 38541, 10525, 11360, 105082, 11365, 48201, 33145, 10107, 10111, 18882, 22231, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "ra", "##mme", "##d", "our", "sh", "##ack", "##s", "with", "je", "##ep", "##s", "and", "destroyed", "the", "sh", "##ack", "over", "my", "baby", ",", "\"", "said", "25", "-", "year", "-", "old", "Amin", "##a", "Muhammad", ".", "\"" ], "ids": [ 107, 11696, 11859, 21209, 10162, 17446, 48201, 33145, 10107, 10169, 10144, 19986, 10107, 10111, 24089, 10105, 48201, 33145, 10491, 15127, 40138, 117, 107, 12415, 10258, 118, 10924, 118, 12898, 61915, 10113, 17573, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "He", "was", "saved", "only", "by", "a", "mira", "##cle", ".", "\"" ], "ids": [ 10357, 10134, 59185, 10893, 10155, 169, 51259, 19478, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "spoke", "##sman", "for", "Israel", "'", "s", "civil", "administration", "in", "the", "West", "Bank", "said", "the", "Bed", "##ou", "##ins", "were", "moved", "because", "they", "were", "en", "##cam", "##ped", "on", "an", "Israeli", "army", "firing", "zone", "." ], "ids": [ 138, 50005, 24305, 10142, 12991, 112, 187, 14161, 17941, 10106, 10105, 11164, 13533, 12415, 10105, 76757, 11010, 14411, 10309, 13059, 12373, 10689, 10309, 10110, 67354, 16898, 10135, 10151, 28446, 17977, 68573, 15245, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "The", "spoke", "##sman", "Peter", "Le", "##rner", "said", "he", "knew", "nothing", "about", "soldiers", "having", "stolen", "anything", "from", "the", "Palestinian", "##s", "." ], "ids": [ 10117, 50005, 24305, 10979, 10281, 65730, 12415, 10261, 46000, 33338, 10978, 23324, 13677, 78173, 42819, 10188, 10105, 56119, 10107, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Israeli", "security", "forces", "have", "been", "pur", "##su", "##ing", "Bed", "##ou", "##in", "Palestinian", "##s", "living", "in", "the", "des", "##olat", "##e", "wilde", "##rness", "between", "East", "Jerusalem", "and", "the", "Dead", "Sea", ",", "where", "several", "Jewish", "settlements", "have", "been", "established", "." ], "ids": [ 28446, 21849, 13729, 10529, 10590, 32385, 12892, 10230, 76757, 11010, 10245, 56119, 10107, 14625, 10106, 10105, 10139, 99447, 10112, 39351, 110208, 10948, 11830, 20599, 10111, 10105, 16349, 14741, 117, 10940, 11736, 17119, 55959, 10529, 10590, 13245, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Israeli", "army", "also", "uses", "the", "area", "for", "military", "training", "." ], "ids": [ 10117, 28446, 17977, 10379, 19873, 10105, 11168, 10142, 14041, 15722, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "base", "metal", "##s", "and", "s", "##cra", "##p", "prices", "-", "August", "26", "." ], "ids": [ 158, 119, 156, 119, 11404, 13795, 10107, 10111, 187, 40333, 10410, 57476, 118, 10735, 10314, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "premiu", "##ms", "added", "to", "LM", "##E", "official", "cash", "settlement", "price", ",", "except", "for", "copper", ",", "which", "is", "added", "to", "the", "COM", "##E", "##X", "spot", "month", "." ], "ids": [ 158, 119, 156, 119, 93244, 12387, 16288, 10114, 107879, 11259, 14731, 52828, 23931, 30839, 117, 23423, 10142, 61576, 117, 10319, 10124, 16288, 10114, 10105, 80645, 11259, 12674, 28504, 14064, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Premium", "includes", "price", "for", "delivery", "to", "consumer", "'", "s", "works", "." ], "ids": [ 72759, 15433, 30839, 10142, 55626, 10114, 64580, 112, 187, 14009, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-" ], "ids": [ 118, 118 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Al", "##umi", "##num", ":", "Western", "grade", "3", ".", "25", "-", "3", ".", "75", "cents", "/", "pound" ], "ids": [ 10883, 17019, 18991, 131, 13163, 21958, 124, 119, 10258, 118, 124, 119, 11417, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "grade", "A7", "##E", "3", ".", "25", "-", "3", ".", "75", "cents", "/", "pound" ], "ids": [ 13463, 21958, 80505, 11259, 124, 119, 10258, 118, 124, 119, 11417, 63487, 120, 99233 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "grade", "A", "##0", "nominal", "2", ".", "00", "-", "2", ".", "25", "cents", "/", "pound" ], "ids": [ 13463, 21958, 138, 10929, 67255, 123, 119, 11025, 118, 123, 119, 10258, 63487, 120, 99233 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zi", "##nc", ":", "Special", "high", "grade", "SH", "##G", "5", ".", "50", "-", "6", ".", "00", "cents", "/", "pound" ], "ids": [ 99890, 29420, 131, 13690, 11846, 21958, 38702, 11447, 126, 119, 10462, 118, 127, 119, 11025, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lead", "3", ".", "50", "-", "4", ".", "00", "cents", "/", "pound" ], "ids": [ 48860, 124, 119, 10462, 118, 125, 119, 11025, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tin", "(", "Grade", "A", ")", "6", ".", "5", "-", "8", ".", "5", "cents", "/", "pound" ], "ids": [ 48800, 113, 39871, 138, 114, 127, 119, 126, 118, 129, 119, 126, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "low", "lead", ",", "50", "pp", "##m", ")", "9", ".", "0", "-", "10", ".", "5", "cents", "/", "pound" ], "ids": [ 113, 15626, 14107, 117, 10462, 11309, 10147, 114, 130, 119, 121, 118, 10150, 119, 126, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nickel", "(", "me", "##lti", "##ng", "grade", ")", "9", ".", "0", "-", "12", ".", "0", "cents", "/", "pound" ], "ids": [ 108636, 113, 10911, 45505, 10376, 21958, 114, 130, 119, 121, 118, 10186, 119, 121, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Copper", "(", "high", "grade", "cat", "##hode", ")", "2", ".", "50", "-", "3", ".", "0", "cents", "/", "pound" ], "ids": [ 98715, 113, 11846, 21958, 41163, 82440, 114, 123, 119, 10462, 118, 124, 119, 121, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-" ], "ids": [ 118, 118 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Al", "##umi", "##num", "allo", "##y", "(", "A3", "##80", "grade", ")", ",", "Midwest" ], "ids": [ 10883, 17019, 18991, 20779, 10157, 113, 67400, 44026, 21958, 114, 117, 103736 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1 ] }, { "tokens": [ "and", "East", "coast", ",", "delivered", "to", "consumer", "65", "-", "66", "cents", "/", "pound" ], "ids": [ 10111, 11830, 22216, 117, 37577, 10114, 64580, 10843, 118, 12215, 63487, 120, 99233 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-" ], "ids": [ 118, 118 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Al", "##umi", "##num", "s", "##cra", "##p", ",", "Midwest", "and", "East", "coast", "average", "price", "," ], "ids": [ 10883, 17019, 18991, 187, 40333, 10410, 117, 103736, 10111, 11830, 22216, 13551, 30839, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "delivered", "to", "consumer" ], "ids": [ 37577, 10114, 64580 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Old", "She", "##et", "and", "Cast", "metal", "42", "to", "44", "cents", "/", "pound" ], "ids": [ 13773, 11149, 10308, 10111, 66871, 13795, 11276, 10114, 11126, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turn", "##ings", ",", "clean", "and", "dry", "43", "to", "44", "cents", "/", "pound" ], "ids": [ 36750, 18800, 117, 55911, 10111, 36796, 11370, 10114, 11126, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mixed", "low", "-", "copper", "clip", "##s", "48", "to", "49", "cents", "/", "pound" ], "ids": [ 56291, 15626, 118, 61576, 48545, 10107, 11300, 10114, 11580, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-" ], "ids": [ 118, 118 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Copper", "s", "##cra", "##p", ",", "Midwest", "and", "East", "coast", "average", "price", "," ], "ids": [ 98715, 187, 40333, 10410, 117, 103736, 10111, 11830, 22216, 13551, 30839, 117 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "delivered", "to", "consumer" ], "ids": [ 37577, 10114, 64580 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "No", "##2", "Re", "##fine", "##d", "75", "to", "77", "cents", "/", "pound" ], "ids": [ 10657, 10729, 20304, 100456, 10162, 11417, 10114, 12527, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "##1", "Bare", "Bright", "91", "to", "92", "cents", "/", "pound" ], "ids": [ 10657, 10759, 104412, 48348, 12519, 10114, 12458, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "##1", "Burn", "##t", "87", "to", "90", "cents", "/", "pound" ], "ids": [ 10657, 10759, 49331, 10123, 12581, 10114, 10919, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-" ], "ids": [ 118, 118 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Lead", "batteries", ",", "delivered", "consumer", "4", ".", "5", "to", "6", ".", "0", "cents", "/", "pound" ], "ids": [ 48860, 72781, 117, 37577, 64580, 125, 119, 126, 10114, 127, 119, 121, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Producer", "list", "/", "transaction", "prices" ], "ids": [ 158, 119, 156, 119, 46020, 13416, 120, 105042, 57476 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-" ], "ids": [ 118, 118 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Al", "##can", "al", "##umi", "##num", ",", "U", ".", "S", ".", "Midwest", "(", "effective", "date", ":", "August", "1", ",", "1996", ")" ], "ids": [ 10883, 24154, 10164, 17019, 18991, 117, 158, 119, 156, 119, 103736, 113, 26874, 13664, 131, 10735, 122, 117, 10389, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##10", "##20", "ing", "##ot", "75", "cents", "/", "pound" ], "ids": [ 153, 20305, 22650, 11600, 11290, 11417, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ex", "##trus", "##ion", "bill", "##et", "85", "cents", "/", "pound" ], "ids": [ 11419, 66730, 11046, 34497, 10308, 12017, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nora", "##nda", "al", "##umi", "##num", ",", "U", ".", "S", ".", "Midwest", "(", "effective", "date", ":", "August", "1", ",", "1996", ")" ], "ids": [ 42504, 11861, 10164, 17019, 18991, 117, 158, 119, 156, 119, 103736, 113, 26874, 13664, 131, 10735, 122, 117, 10389, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ing", "##ot", "75", "cents", "/", "pound" ], "ids": [ 11600, 11290, 11417, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ex", "##trus", "##ion", "bill", "##et", "85", "cents", "/", "pound" ], "ids": [ 11419, 66730, 11046, 34497, 10308, 12017, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RS", "##R", "pure", "lead", "price", "(", "effective", "date", ":", "March", "20", ",", "1996", ")" ], "ids": [ 33000, 11273, 33166, 14107, 30839, 113, 26874, 13664, 131, 11144, 10197, 117, 10389, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "52", "cents", "/", "pound" ], "ids": [ 11525, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Doe", "Run", "pure", "lead", "price", "(", "effective", "date", ":", "August", "14", ",", "1996", ")" ], "ids": [ 71335, 21485, 33166, 14107, 30839, 113, 26874, 13664, 131, 10735, 10247, 117, 10389, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "50", "cents", "/", "pound" ], "ids": [ 10462, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "AS", "##AR", "##CO", "pure", "lead", "(", "effective", "date", ":", "August", "1", ",", "1996", ")" ], "ids": [ 17421, 52188, 82272, 33166, 14107, 113, 26874, 13664, 131, 10735, 122, 117, 10389, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "premiu", "##m", "over", "LM", "##E", "cash", "7", ".", "5", "cents", "/", "pound" ], "ids": [ 93244, 10147, 10491, 107879, 11259, 52828, 128, 119, 126, 63487, 120, 99233 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "(", "New", "York", "com", "##mo", "##diti", "##es", "des", "##k", "212", "859", "1646", ")" ], "ids": [ 118, 118, 113, 10287, 10482, 10212, 11033, 63203, 10171, 10139, 10174, 22023, 80786, 44635, 114 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Florida", "boy", "kills", "himself", "before", "starting", "new", "school", "." ], "ids": [ 13668, 26905, 69179, 14764, 11360, 21868, 10751, 11393, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FOR", "##T", "LA", "##UD", "##ER", "##DA", "##LE", ",", "Fl", "##a", ".", "1996", "-", "08", "-", "26" ], "ids": [ 109544, 11090, 29079, 86888, 24093, 36382, 51036, 117, 29981, 10113, 119, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "12", "-", "year", "-", "old", "Florida", "boy", "hang", "##ed", "himself", "in", "his", "back", "##yard", "just", "hours", "before", "he", "was", "due", "to", "start", "at", "a", "new", "school", "on", "Monday", ",", "police", "said", "." ], "ids": [ 138, 10186, 118, 10924, 118, 12898, 13668, 26905, 60083, 10336, 14764, 10106, 10226, 12014, 29629, 12820, 19573, 11360, 10261, 10134, 10850, 10114, 15148, 10160, 169, 10751, 11393, 10135, 40714, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Samuel", "Graham", ",", "who", "told", "his", "family", "earlier", "that", "he", "was", "ner", "##vous", "about", "starting", "at", "a", "new", "school", "because", "he", "fear", "##ed", "tea", "##sing", "about", "his", "weight", "problem", ",", "had", "been", "due", "to", "spend", "his", "first", "day", "at", "Parkway", "Middle", "School", "Monday", ",", "police", "said", "." ], "ids": [ 14829, 16928, 117, 10479, 21937, 10226, 11365, 18905, 10189, 10261, 10134, 59097, 61211, 10978, 21868, 10160, 169, 10751, 11393, 12373, 10261, 44929, 10336, 57675, 16357, 10978, 10226, 25512, 18077, 117, 10374, 10590, 10850, 10114, 63222, 10226, 10422, 11940, 10160, 102143, 15441, 10984, 40714, 117, 15034, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "boy", "was", "last", "seen", "alive", "Sunday", "night", "when", "he", "joined", "his", "two", "younger", "brothers", "and", "father", "in", "a", "bed", "##time", "prayer", "." ], "ids": [ 10117, 26905, 10134, 12469, 15652, 57057, 19731, 16903, 10841, 10261, 13914, 10226, 10551, 27461, 28764, 10111, 13194, 10106, 169, 30113, 18086, 82012, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "younger", "brothers", "found", "him", "hang", "##ing", "from", "a", "tree", "early", "Monday", "morning", "." ], "ids": [ 13214, 27461, 28764, 11823, 10957, 60083, 10230, 10188, 169, 23194, 11732, 40714, 28757, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "father", "cut", "him", "down", "and", "tried", "to", "rev", "##ive", "him", "but", "para", "##medi", "##cs", "pronounced", "him", "dead", "when", "they", "arrived", "." ], "ids": [ 11597, 13194, 21610, 10957, 12935, 10111, 27156, 10114, 86095, 11942, 10957, 10473, 10220, 96092, 13331, 74473, 10957, 23457, 10841, 10689, 22584, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Bro", "##ward", "County", "Sheriff", "'", "s", "Office", "found", "a", "step", "sto", "##ol", "and", "a", "flash", "##light", "under", "the", "tree", "where", "the", "boy", "was", "hang", "##ed", "." ], "ids": [ 10117, 32470, 16988, 10886, 49406, 112, 187, 13348, 11823, 169, 31877, 47264, 11481, 10111, 169, 59946, 24310, 10571, 10105, 23194, 10940, 10105, 26905, 10134, 60083, 10336, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "there", "was", "no", "sign", "of", "fou", "##l", "play", "and", "that", "in", "##vesti", "##gator", "##s", "believed", "the", "death", "was", "a", "suicide", "." ], "ids": [ 11696, 12415, 11155, 10134, 10192, 26794, 10108, 12688, 10161, 12253, 10111, 10189, 10106, 63996, 75791, 10107, 20718, 10105, 12557, 10134, 169, 35656, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CB", "##OT", "rice", "close", "##s", "higher", "on", "technical", "bou", "##nce", "." ], "ids": [ 59791, 62146, 59039, 16065, 10107, 17981, 10135, 29914, 94335, 12150, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CB", "##OT", "rice", "future", "##s", "closed", "higher", "on", "a", "technical", "bou", "##nce", "tied", "to", "signs", "the", "market", "was", "over", "##sol", "##d", ",", "trade", "##rs", "said", "." ], "ids": [ 59791, 62146, 59039, 16711, 10107, 18440, 17981, 10135, 169, 29914, 94335, 12150, 42780, 10114, 45033, 10105, 17313, 10134, 10491, 43115, 10162, 117, 18908, 10943, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "ra", "##lli", "##ed", "on", "ideas", "the", "market", "was", "over", "##sol", "##d", ",", "\"", "a", "trade", "##r", "said", "." ], "ids": [ 107, 10377, 11859, 14088, 10336, 10135, 23802, 10105, 17313, 10134, 10491, 43115, 10162, 117, 107, 169, 18908, 10129, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "said", "the", "U", ".", "S", ".", "cash", "market", "remains", "well", "above", "the", "bench", "##mark", "Thai", "price", "which", "limited", "gains", "." ], "ids": [ 15006, 10943, 12415, 10105, 158, 119, 156, 119, 52828, 17313, 19602, 11206, 16038, 10105, 86696, 22719, 26207, 30839, 10319, 19264, 92193, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rice", "future", "##s", "volume", "was", "estimated", "at", "450", "contracts", ",", "up", "from", "202", "Friday", "." ], "ids": [ 31423, 16711, 10107, 15901, 10134, 25267, 10160, 16718, 69690, 117, 10741, 10188, 22171, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rice", "options", "volume", "was", "estimated", "at", "50", "contracts", ",", "down", "from", "56", "Friday", "." ], "ids": [ 31423, 53121, 15901, 10134, 25267, 10160, 10462, 69690, 117, 12935, 10188, 11628, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rice", "future", "##s", "closed", "13", "to", "16", "cents", "per", "c", "##w", "##t", "higher", ",", "with", "September", "up", "16", "at", "$", "10", ".", "28", "a", "c", "##w", "##t", "." ], "ids": [ 31423, 16711, 10107, 18440, 10249, 10114, 10250, 63487, 10178, 171, 10874, 10123, 17981, 117, 10169, 10596, 10741, 10250, 10160, 109, 10150, 119, 10348, 169, 171, 10874, 10123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sam", "Nelson", "312", "-", "408", "-", "872", "##1" ], "ids": [ 14268, 15962, 25104, 118, 36899, 118, 77107, 10759 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Talbot", "##t", "to", "meet", "Russian", ",", "Canadian", "counter", "##parts", "." ], "ids": [ 47728, 10123, 10114, 23267, 13463, 117, 14023, 46298, 86197, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 2, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deputy", "Secretary", "of", "State", "St", "##ro", "##be", "Talbot", "##t", "flew", "to", "Ottawa", "on", "Monday", "to", "meet", "his", "Russian", "counter", "##part", "and", "discuss", "a", "range", "of", "bila", "##teral", "and", "European", "security", "issues", ",", "the", "State", "Department", "said", "." ], "ids": [ 32389, 19382, 10108, 11104, 10838, 10567, 11044, 47728, 10123, 64284, 10114, 13731, 10135, 40714, 10114, 23267, 10226, 13463, 46298, 48433, 10111, 71695, 169, 15601, 10108, 12517, 98161, 10111, 11914, 21849, 17850, 117, 10105, 11104, 12933, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Talbot", "##t", ",", "the", "second", "-", "ranking", "State", "Department", "official", ",", "was", "to", "meet", "Russian", "Deputy", "Foreign", "Minister", "Georg", "##y", "Ma", "##med", "##ov", "as", "part", "of", "a", "regular", "pattern", "of", "consulta", "##tions", ",", "the", "department", "said", "." ], "ids": [ 47728, 10123, 117, 10105, 11132, 118, 27153, 11104, 12933, 14731, 117, 10134, 10114, 23267, 13463, 32389, 20277, 14355, 13994, 10157, 13744, 21986, 11024, 10146, 10668, 10108, 169, 15670, 36265, 10108, 86153, 15024, 117, 10105, 21079, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "is", "much", "to", "discuss", "on", "the", "fall", "calendar", ",", "\"", "acting", "chief", "spoke", "##sman", "G", "##lyn", "Davies", "said", ".", "\"" ], "ids": [ 107, 11723, 10124, 13172, 10114, 71695, 10135, 10105, 18042, 61637, 117, 107, 25086, 19421, 50005, 24305, 144, 34417, 23539, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "There", "'", "s", "a", "fairly", "intensive", "diplomatic", "calendar", "coming", "up", "in", "the", "fall", ".", "\"" ], "ids": [ 11723, 112, 187, 169, 76281, 73636, 64838, 61637, 23959, 10741, 10106, 10105, 18042, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "Talbot", "##t", ",", "who", "was", "scheduled", "to", "return", "on", "Tuesday", ",", "would", "also", "to", "meet", "his", "Canadian", "counter", "##part", ",", "Gordon", "Smith", ",", "in", "Ottawa", "for", "talks", "that", "would", "include", "the", "situation", "in", "Haiti", "." ], "ids": [ 10357, 12415, 47728, 10123, 117, 10479, 10134, 34081, 10114, 15079, 10135, 70245, 117, 10894, 10379, 10114, 23267, 10226, 14023, 46298, 48433, 117, 14898, 11673, 117, 10106, 13731, 10142, 56672, 10189, 10894, 12363, 10105, 18586, 10106, 38180, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Midwest", "ho", "##g", "market", "seen", "st", "##eady", "Tuesday", "-", "trade", "." ], "ids": [ 158, 119, 156, 119, 103736, 13173, 10240, 17313, 15652, 28780, 61973, 70245, 118, 18908, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Midwest", "direct", "cash", "ho", "##g", "prices", "Tuesday", "were", "seen", "st", "##eady", "following", "strong", "demand", "Monday", "that", "lift", "##ed", "prices", "as", "much", "as", "$", "1", ".", "50", "per", "c", "##w", "##t", "in", "some", "areas", ",", "lives", "##tock", "deal", "##ers", "said", "." ], "ids": [ 103736, 16934, 52828, 13173, 10240, 57476, 70245, 10309, 15652, 28780, 61973, 11901, 18093, 34394, 40714, 10189, 63376, 10336, 57476, 10146, 13172, 10146, 109, 122, 119, 10462, 10178, 171, 10874, 10123, 10106, 11152, 14544, 117, 21418, 60458, 19918, 10901, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "demand", "was", "sp", "##ark", "##ed", "by", "Saturday", "'", "s", "active", "sl", "##au", "##ghter", ",", "which", "left", "some", "pack", "##ers", "short", "on", "supplies", "to", "get", "Monday", "operations", "started", ",", "they", "said", "." ], "ids": [ 10117, 34394, 10134, 32650, 36269, 10336, 10155, 24848, 112, 187, 14459, 38523, 11705, 45953, 117, 10319, 12153, 11152, 78978, 10901, 13716, 10135, 49963, 10114, 15329, 40714, 18356, 13457, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Top", "prices", "in", "Iowa", "/", "southern", "Minnesota", "Tuesday", "were", "expected", "to", "range", "from", "mostly", "$", "59", ".", "50", "to", "$", "60", ".", "00", ",", "st", "##eady", "following", "a", "$", "0", ".", "50", "-", "$", "1", ".", "50", "jump", "Monday", "." ], "ids": [ 12685, 57476, 10106, 18421, 120, 17156, 16306, 70245, 10309, 25973, 10114, 15601, 10188, 19774, 109, 11867, 119, 10462, 10114, 109, 10709, 119, 11025, 117, 28780, 61973, 11901, 169, 109, 121, 119, 10462, 118, 109, 122, 119, 10462, 54941, 40714, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Illinois", "top", "##s", "were", "seen", "match", "##ing", "Monday", "'", "s", "at", "$", "59", ".", "00", "with", "top", "##s", "in", "Indiana", "at", "$", "57", ".", "50", "." ], "ids": [ 14922, 12364, 10107, 10309, 15652, 12356, 10230, 40714, 112, 187, 10160, 109, 11867, 119, 11025, 10169, 12364, 10107, 10106, 16564, 10160, 109, 11817, 119, 10462, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "However", ",", "USD", "##A", "reported", "top", "##s", "of", "$", "58", ".", "00", "in", "Illinois", "and", "in", "Iowa", "/", "southern", "Minnesota", ",", "$", "60", ".", "00", "on", "some", "ho", "##gs", "Monday", "." ], "ids": [ 12209, 117, 24868, 10738, 15943, 12364, 10107, 10108, 109, 11824, 119, 11025, 10106, 14922, 10111, 10106, 18421, 120, 17156, 16306, 117, 109, 10709, 119, 11025, 10135, 11152, 13173, 15703, 40714, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##tem", "##pts", "to", "move", "prices", "higher", "again", "Tuesday", "could", "be", "offs", "##et", "by", "expected", "increased", "ho", "##g", "marketing", "##s", "this", "week", ",", "sources", "said", "." ], "ids": [ 11699, 19665, 83609, 10114, 18577, 57476, 17981, 13123, 70245, 12174, 10347, 51851, 10308, 10155, 25973, 19299, 13173, 10240, 29465, 10107, 10531, 16118, 117, 19023, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Producer", "##s", "were", "expected", "to", "ship", "as", "many", "ho", "##gs", "as", "they", "can", "ahead", "of", "the", "Labor", "Day", "holiday", "weekend", ",", "they", "said", "." ], "ids": [ 46020, 10107, 10309, 25973, 10114, 17309, 10146, 11299, 13173, 15703, 10146, 10689, 10944, 35629, 10108, 10105, 31017, 12360, 71806, 43440, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dem", "##and", "for", "ho", "##gs", "is", "expected", "to", "be", "light", "by", "the", "end", "of", "the", "week", ",", "as", "the", "industry", "prepare", "##s", "for", "Labor", "Day", ",", "Monday", ",", "September", "1", "when", "most", "U", ".", "S", ".", "pack", "##ers", "will", "be", "closed", "." ], "ids": [ 37312, 14752, 10142, 13173, 15703, 10124, 25973, 10114, 10347, 15765, 10155, 10105, 11572, 10108, 10105, 16118, 117, 10146, 10105, 17425, 69977, 10107, 10142, 31017, 12360, 117, 40714, 117, 10596, 122, 10841, 10992, 158, 119, 156, 119, 78978, 10901, 11337, 10347, 18440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Bob", "Jan", "##is", "312", "-", "983", "-", "734", "##7", "-", "-" ], "ids": [ 118, 118, 13583, 11806, 10291, 25104, 118, 63823, 118, 76734, 11305, 118, 118 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gore", "presents", "new", "image", "of", "lead", "attack", "dog", "." ], "ids": [ 42036, 41175, 10751, 18170, 10108, 14107, 16342, 17835, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "Pos", "##ner" ], "ids": [ 10631, 94071, 11129 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "more", "mild", "-", "manner", "##ed", "and", "mee", "##k", "Al", "Gore", ",", "the", "vice", "president", "and", "likely", "heir", "apparent", "to", "President", "Bill", "Clinton", ",", "emerged", "on", "Monday", "as", "the", "new", "Democratic", "attack", "dog", "leading", "a", "front", "-", "line", "assault", "on", "Bob", "Dol", "##e", "and", "House", "Speaker", "New", "##t", "G", "##ing", "##rich", "." ], "ids": [ 10657, 10798, 89176, 118, 39750, 10336, 10111, 25436, 10174, 10883, 42036, 117, 10105, 16543, 12931, 10111, 22497, 72143, 51200, 10114, 12811, 13160, 24139, 117, 50658, 10135, 40714, 10146, 10105, 10751, 19281, 16342, 17835, 16018, 169, 14589, 118, 12117, 50150, 10135, 13583, 100035, 10112, 10111, 11545, 64844, 10287, 10123, 144, 10230, 27749, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "While", "Clinton", "takes", "a", "train", "trip", "to", "the", "Democratic", "Convention", "that", "will", "ren", "##omina", "##te", "him", "on", "Wednesday", "for", "a", "second", "term", ",", "Gore", "is", "the", "bright", "star", "in", "the", "convention", "city", "now", "." ], "ids": [ 14600, 24139, 19135, 169, 17767, 37307, 10114, 10105, 19281, 25318, 10189, 11337, 63256, 103637, 10216, 10957, 10135, 57611, 10142, 169, 11132, 13719, 117, 42036, 10124, 10105, 72041, 16624, 10106, 10105, 37812, 11584, 11858, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Crow", "##ds", "an", "##xi", "##ously", "wait", "for", "his", "appearances", ",", "th", "##rust", "##ing", "out", "hands", "for", "him", "to", "gr", "##ip", "as", "they", "s", "##cre", "##am", "\"", "12", "more", "years", "\"", "-", "-", "a", "wish", "##ful", "hope", "to", "eight", "years", "of", "Gore", "after", "a", "Clinton", "re", "-", "election", "." ], "ids": [ 56977, 13268, 10151, 20572, 47173, 83279, 10142, 10226, 22905, 117, 77586, 56657, 10230, 10950, 27925, 10142, 10957, 10114, 30518, 17437, 10146, 10689, 187, 27794, 11008, 107, 10186, 10798, 10855, 107, 118, 118, 169, 66069, 14446, 50725, 10114, 16222, 10855, 10108, 42036, 10662, 169, 24139, 11639, 118, 13685, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "a", "15", "-", "hour", "span", "from", "Sunday", "evening", "to", "Monday", "morning", ",", "so", "many", "people", "jam", "##med", "Gore", "events", "that", "the", "fire", "mars", "##hal", "stopped", "members", "of", "Congress", ",", "reporter", "##s", "and", "others", "from", "entering", "a", "pro", "-", "Israel", "rally", "and", "a", "meeting", "of", "the", "New", "York", "delegation", "." ], "ids": [ 15704, 169, 10208, 118, 24730, 51551, 10188, 19731, 42135, 10114, 40714, 28757, 117, 10380, 11299, 11426, 25694, 21986, 42036, 15284, 10189, 10105, 13559, 11438, 18453, 40949, 12464, 10108, 15984, 117, 41408, 10107, 10111, 14633, 10188, 44824, 169, 11284, 118, 12991, 58575, 10111, 169, 19822, 10108, 10105, 10287, 10482, 98689, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "In", "his", "appearances", ",", "the", "often", "st", "##iff", "and", "wooden", "Gore", "seemed", "transformed", "into", "a", "new", "ene", "##rge", "##tic", ",", "ge", "##stu", "##ring", "\"", "pol", "\"", "as", "he", "ri", "##pped", "into", "Republican", "presidential", "nominee", "Dol", "##e", "and", "G", "##ing", "##rich", ",", "who", "has", "emerged", "as", "the", "favorite", "right", "-", "wing", "foi", "##l", "of", "Democrats", "." ], "ids": [ 10167, 10226, 22905, 117, 10105, 12899, 28780, 31025, 10111, 43678, 42036, 64676, 77395, 10708, 169, 10751, 33723, 28163, 13275, 117, 46503, 19987, 13135, 107, 16304, 107, 10146, 10261, 29956, 44357, 10708, 21776, 36476, 81878, 100035, 10112, 10111, 144, 10230, 27749, 117, 10479, 10393, 50658, 10146, 10105, 55768, 13448, 118, 22571, 10448, 10161, 10108, 56282, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "Gore", "told", "a", "ro", "##aring", "labor", "rally", "of", "about", "1", ",", "000", "union", "workers", "that", "Dol", "##e", "and", "G", "##ing", "##rich", "were", "the", "virtual", "personi", "##fa", "##ction", "of", "evil", ",", "without", "even", "mention", "##ing", "that", "former", "Housing", "Secretary", "Jack", "Kemp", "is", "Dol", "##e", "'", "s", "running", "mate", "." ], "ids": [ 42036, 21937, 169, 25470, 96025, 27605, 58575, 10108, 10978, 122, 117, 10259, 20763, 23829, 10189, 100035, 10112, 10111, 144, 10230, 27749, 10309, 10105, 37859, 37295, 13369, 17530, 10108, 57154, 117, 13663, 13246, 33507, 10230, 10189, 11775, 52229, 19382, 12342, 87499, 10124, 100035, 10112, 112, 187, 18020, 43465, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "With", "equal", "measures", "of", "ig", "##nor", "##ance", "and", "au", "##da", "##city", "this", "two", "-", "headed", "monster", "of", "Dol", "##e", "and", "G", "##ing", "##rich", "has", "been", "launch", "##ing", "an", "all", "out", "assault", "on", "decades", "of", "progress", "of", "behalf", "of", "working", "men", "and", "women", ",", "\"", "Gore", "said", "to", "who", "##ops", "of", "\"", "12", "more", "years", ".", "\"" ], "ids": [ 107, 12613, 32943, 38606, 10108, 23602, 36064, 16460, 10111, 10257, 10229, 70999, 10531, 10551, 118, 33336, 76343, 10108, 100035, 10112, 10111, 144, 10230, 27749, 10393, 10590, 29227, 10230, 10151, 10435, 10950, 50150, 10135, 33256, 10108, 40316, 10108, 50683, 10108, 14616, 10588, 10111, 13190, 117, 107, 42036, 12415, 10114, 10479, 26134, 10108, 107, 10186, 10798, 10855, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "want", "to", "drive", "you", "out", "of", "politics", "and", "they", "ca", "n", "'", "t", ",", "\"", "he", "added", ".", "\"" ], "ids": [ 107, 11696, 21528, 10114, 23806, 13028, 10950, 10108, 25674, 10111, 10689, 11135, 182, 112, 188, 117, 107, 10261, 16288, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "want", "to", "silence", "your", "voices", "in", "elections", ".", "\"" ], "ids": [ 11696, 21528, 10114, 72445, 20442, 77314, 10106, 22054, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "a", "downtown", "hotel", "Monday", ",", "the", "48", "-", "year", "-", "old", "Gore", "gave", "Wisconsin", "dele", "##gates", "a", "taste", "again", "of", "the", "new", "Gore", "." ], "ids": [ 11699, 169, 42216, 19157, 40714, 117, 10105, 11300, 118, 10924, 118, 12898, 42036, 15362, 17909, 28250, 71675, 169, 84298, 13123, 10108, 10105, 10751, 42036, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "\"", "I", "want", "you", "to", "ask", "this", "question", "." ], "ids": [ 107, 146, 21528, 13028, 10114, 63001, 10531, 20210, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "What", "would", "Wisconsin", "face", "if", "the", "same", "extrem", "##ist", "coalition", ",", "the", "G", "##ing", "##rich", "/", "Dol", "##e", "Congress", ",", "also", "controlled", "the", "executive", "branch", "?", "\"" ], "ids": [ 12489, 10894, 17909, 13295, 12277, 10105, 11561, 44112, 11293, 41028, 117, 10105, 144, 10230, 27749, 120, 100035, 10112, 15984, 117, 10379, 29050, 10105, 22676, 24660, 136, 107 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gore", "said", "." ], "ids": [ 42036, 12415, 119 ], "entity": [ "B-PER", "O", "O" ], "entity_ids": [ 4, 9, 9 ] }, { "tokens": [ "Not", "##ing", "the", "next", "presidential", "term", "will", "probably", "see", "two", "or", "three", "Supreme", "Court", "justice", "nominations", ",", "he", "war", "##ned", ",", "\"", "Their", "extrem", "##ist", "agenda", "would", "come", "out", "of", "the", "G", "##ing", "##rich", "Congress", ",", "into", "and", "through", "the", "Dol", "##e", "White", "House", ",", "down", "through", "the", "Supreme", "Court", ".", "\"" ], "ids": [ 16040, 10230, 10105, 13451, 36476, 13719, 11337, 23282, 12888, 10551, 10345, 11003, 22872, 14100, 25791, 66408, 117, 10261, 10338, 17021, 117, 107, 17551, 44112, 11293, 70231, 10894, 10678, 10950, 10108, 10105, 144, 10230, 27749, 15984, 117, 10708, 10111, 11222, 10105, 100035, 10112, 12136, 11545, 117, 12935, 11222, 10105, 22872, 14100, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "He", "painted", "a", "scene", "of", "horror", "##s", "he", "saw", "if", "Republicans", "controlled", "the", "White", "House", "and", "the", "Congress", "they", "hold", "now", ".", "\"" ], "ids": [ 10357, 37992, 169, 18167, 10108, 39108, 10107, 10261, 17112, 12277, 93700, 29050, 10105, 12136, 11545, 10111, 10105, 15984, 10689, 18500, 11858, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Our", "personal", "and", "religious", "liber", "##ties", "would", "be", "at", "risk", "." ], "ids": [ 18465, 14927, 10111, 19366, 72517, 14197, 10894, 10347, 10160, 24179, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Medi", "##care", "would", "be", "at", "risk", "of", "with", "##ering", "on", "the", "vin", "##e", "." ], "ids": [ 41512, 22277, 10894, 10347, 10160, 24179, 10108, 10169, 19232, 10135, 10105, 38973, 10112, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Medi", "##ca", "##id", "would", "be", "at", "risk", "of", "being", "taken", "away", "from", "poor", "children", "." ], "ids": [ 41512, 10425, 11249, 10894, 10347, 10160, 24179, 10108, 11223, 15109, 14942, 10188, 23247, 12694, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Education", "would", "be", "at", "risk", "." ], "ids": [ 15063, 10894, 10347, 10160, 24179, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "environment", "would", "be", "at", "risk", "from", "the", "poll", "##uter", "##s", "that", "control", "that", "coalition", ",", "\"", "he", "said", "." ], "ids": [ 10117, 26069, 10894, 10347, 10160, 24179, 10188, 10105, 70156, 54092, 10107, 10189, 12608, 10189, 41028, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "new", "style", "mixed", "an", "assault", "on", "Republicans", "with", "what", "he", "sees", "as", "\"", "product", "##ive", "opportunity", ",", "a", "vision", "for", "the", "future", "that", "lift", "##s", "up", "working", "families", ",", "that", "build", "##s", "Wisconsin", "stronger", ",", "that", "build", "##s", "America", "stronger", "." ], "ids": [ 11597, 10751, 13351, 23742, 10151, 50150, 10135, 93700, 10169, 12976, 10261, 41369, 10146, 107, 21535, 11942, 34468, 117, 169, 30237, 10142, 10105, 16711, 10189, 63376, 10107, 10741, 14616, 15300, 117, 10189, 23332, 10107, 17909, 85688, 117, 10189, 23332, 10107, 11440, 85688, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "With", "your", "help", "we", "can", "re", "-", "elect", "Bill", "Clinton", ".", "\"" ], "ids": [ 12613, 20442, 15217, 11951, 10944, 11639, 118, 106095, 13160, 24139, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Dol", "##e", "'", "s", "tax", "cut", "plans", "were", "called", "\"", "deja", "-", "voo", "##do", "##o", "economics", ".", ".", ".", ".", "It", "'", "s", "a", "warm", "##ed", "-", "over", "plan", "that", "failed", "and", "drove", "our", "economy", "into", "a", "dit", "##ch", "." ], "ids": [ 100035, 10112, 112, 187, 25468, 21610, 18195, 10309, 11552, 107, 46624, 118, 85413, 10317, 10133, 55181, 119, 119, 119, 119, 10377, 112, 187, 169, 50089, 10336, 118, 10491, 13065, 10189, 20775, 10111, 72256, 17446, 27570, 10708, 169, 11690, 10269, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "got", "burned", "once", "and", "we", "wo", "n", "'", "t", "let", "that", "happen", "to", "our", "nation", "again", ".", "\"" ], "ids": [ 12865, 19556, 63838, 14907, 10111, 11951, 12796, 182, 112, 188, 13595, 10189, 84630, 10114, 17446, 22274, 13123, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gore", "ri", "##dic", "##ule", "##d", "Dol", "##e", "'", "s", "defense", "of", "the", "tobacco", "industry", ",", "praised", "Clinton", "for", "\"", "courage", "\"", "in", "ad", "##vancing", "regulations", "of", "it", "." ], "ids": [ 42036, 29956, 55170, 16115, 10162, 100035, 10112, 112, 187, 30100, 10108, 10105, 92887, 17425, 117, 38394, 24139, 10142, 107, 87787, 107, 10106, 10840, 104122, 56729, 10108, 10271, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "the", "dele", "##gates", "of", "Wisconsin", ",", "a", "leading", "dair", "##y", "state", ",", "Gore", "had", "the", "right", "audience", "in", "po", "##king", "fun", "at", "Dol", "##e", "'", "s", "comparison", "to", "add", "##ict", "##ion", "to", "tobacco", "to", "those", "who", "ca", "n", "'", "t", "tol", "##erate", "milk", "." ], "ids": [ 11469, 10105, 28250, 71675, 10108, 17909, 117, 169, 16018, 67186, 10157, 11388, 117, 42036, 10374, 10105, 13448, 26070, 10106, 10514, 15629, 41807, 10160, 100035, 10112, 112, 187, 56542, 10114, 42852, 106788, 11046, 10114, 92887, 10114, 12676, 10479, 11135, 182, 112, 188, 53183, 64474, 64301, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Some", "people", "say", "milk", "is", "bad", "for", "you", ",", "\"", "Gore", "said", "as", "Wisconsin", "dele", "##gates", "held", "al", "##oft", "a", "plastic", "in", "##f", "##lated", "co", "##w", "." ], "ids": [ 107, 13885, 11426, 23763, 64301, 10124, 15838, 10142, 13028, 117, 107, 42036, 12415, 10146, 17909, 28250, 71675, 11991, 10164, 50532, 169, 60280, 10106, 10575, 50476, 11170, 10874, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "praised", "Clinton", "for", "veto", "##ing", "the", "Republican", "Congress", "'", "attempt", "to", "rep", "##eal", "parts", "of", "the", "Clean", "Air", "Act", ",", "and", "criticized", "Republicans", "for", "\"", "sl", "##ashi", "##ng", "money", "to", "combat", "drugs", "in", "schools", ".", "\"" ], "ids": [ 10357, 38394, 24139, 10142, 104017, 10230, 10105, 21776, 15984, 112, 21395, 10114, 76456, 30759, 15569, 10108, 10105, 79657, 11704, 13968, 117, 10111, 42318, 93700, 10142, 107, 38523, 51151, 10376, 17920, 10114, 18159, 40421, 10106, 16009, 119, 107 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "B-MISC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 2, 3, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "choice", "has", "never", "been", "starke", "##r", ",", "the", "stake", "##s", "today", "have", "never", "been", "higher", ",", "\"", "Gore", "said", ".", "\"" ], "ids": [ 107, 10117, 30865, 10393, 14794, 10590, 61824, 10129, 117, 10105, 90081, 10107, 18745, 10529, 14794, 10590, 17981, 117, 107, 42036, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "We", "'", "re", "not", "going", "to", "let", "them", "get", "away", "with", "that", ".", "\"" ], "ids": [ 12865, 112, 11639, 10472, 19090, 10114, 13595, 11345, 15329, 14942, 10169, 10189, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Actor", "Reeve", "high", "##lights", "Democrats", "'", "first", "night", "." ], "ids": [ 30136, 89016, 11846, 56552, 56282, 112, 10422, 16903, 119 ], "entity": [ "O", "B-PER", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "high", "##lights", "of", "the", "first", "day", "of", "the", "Democratic", "convention", "on", "Monday", "were", "expected", "to", "feature", "a", "mix", "of", "party", "leaders", "and", "people", "who", "have", "overcome", "ad", "##versi", "##ty", "." ], "ids": [ 10117, 11846, 56552, 10108, 10105, 10422, 11940, 10108, 10105, 19281, 37812, 10135, 40714, 10309, 25973, 10114, 19072, 169, 28236, 10108, 14039, 24155, 10111, 11426, 10479, 10529, 105445, 10840, 97209, 11195, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Among", "the", "latter", "were", "gun", "control", "advocate", "Sarah", "Brady", "and", "actor", "Christopher", "Reeve", "and", "the", "politicians", "included", "Rep", "." ], "ids": [ 24470, 10105, 21692, 10309, 23103, 12608, 77761, 16548, 45982, 10111, 14066, 15244, 89016, 10111, 10105, 75284, 12742, 72337, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 4, 8, 9, 9, 9, 9, 2, 6 ] }, { "tokens": [ "Richard", "G", "##ep", "##hardt", "and", "Sen", "." ], "ids": [ 11118, 144, 19986, 48211, 10111, 18082, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Thomas", "Das", "##ch", "##le", "." ], "ids": [ 11096, 10672, 10269, 10284, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9 ] }, { "tokens": [ "Here", "are", "thu", "##mb", "##nai", "##l", "profile", "##s", "of", "the", "convention", "'", "s", "key", "Monday", "speakers", "." ], "ids": [ 18249, 10301, 23886, 27012, 32191, 10161, 29549, 10107, 10108, 10105, 37812, 112, 187, 18444, 40714, 58193, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sarah", "Brady", "-", "-", "The", "nation", "'", "s", "tou", "##ghe", "##st", "gun", "control", "law", "is", "named", "after", "Ronald", "Reagan", "'", "s", "press", "secretary", "James", "Brady", "but", "it", "was", "his", "wife", "who", "was", "the", "major", "force", "behind", "its", "passage", "." ], "ids": [ 16548, 45982, 118, 118, 10117, 22274, 112, 187, 52586, 61069, 10562, 23103, 12608, 13255, 10124, 12038, 10662, 21474, 41984, 112, 187, 21040, 37664, 10900, 45982, 10473, 10271, 10134, 10226, 14384, 10479, 10134, 10105, 11922, 15031, 17155, 10474, 22718, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "head", "of", "Hand", "##gun", "Control", "Inc", ".", ",", "Sarah", "Brady", ",", "54", ",", "campaign", "##ed", "non", "##stop", "for", "tou", "##gh", "gun", "control", "in", "the", "years", "following", "the", "shooting", "of", "her", "husband", "and", "then", "President", "Reagan", "in", "1981", "." ], "ids": [ 10882, 13578, 10108, 20749, 32657, 20083, 13604, 119, 117, 16548, 45982, 117, 11653, 117, 17323, 10336, 10446, 78881, 10142, 52586, 15774, 23103, 12608, 10106, 10105, 10855, 11901, 10105, 38969, 10108, 10485, 19634, 10111, 11059, 12811, 41984, 10106, 10654, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "Her", "re", "##ward", "was", "the", "passage", "in", "1993", "of", "the", "\"", "Brady", "Bill", "\"", "which", "requires", "a", "mandato", "##ry", "five", "-", "day", "waiting", "period", "for", "purchase", "of", "hand", "##gun", "##s", "and", "also", "mandate", "##s", "background", "check", "##s", "for", "would", "-", "be", "gun", "purchase", "##rs", "." ], "ids": [ 13229, 11639, 16988, 10134, 10105, 22718, 10106, 10463, 10108, 10105, 107, 45982, 13160, 107, 10319, 39575, 169, 31705, 10908, 12403, 118, 11940, 62052, 13127, 10142, 37891, 10108, 15230, 32657, 10107, 10111, 10379, 106424, 10107, 25903, 43662, 10107, 10142, 10894, 118, 10347, 23103, 37891, 10943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reagan", "recovered", "fully", "from", "his", "wound", "##s", "but", "Brady", ",", "who", "was", "close", "to", "death", "after", "being", "shot", "by", "John", "Hi", "##nc", "##kley", "Jr", "." ], "ids": [ 41984, 55051, 27217, 10188, 10226, 109205, 10107, 10473, 45982, 117, 10479, 10134, 16065, 10114, 12557, 10662, 11223, 19508, 10155, 10421, 20065, 29420, 103538, 12966, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ ",", "suffered", "serious", "brain", "damage", "." ], "ids": [ 117, 26090, 32342, 34467, 26115, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sarah", "was", "Brady", "'", "s", "second", "wife", "and", "they", "have", "a", "son", ",", "James", "Scott", "Brady", "Jr", "." ], "ids": [ 16548, 10134, 45982, 112, 187, 11132, 14384, 10111, 10689, 10529, 169, 10312, 117, 10900, 12812, 45982, 12966, 119 ], "entity": [ "B-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Before", "the", "assassination", "attempt", ",", "she", "had", "worked", "for", "Republican", "con", "##gres", "##smen", "and", "for", "the", "Republican", "Party", "." ], "ids": [ 19318, 10105, 94509, 21395, 117, 10833, 10374, 13858, 10142, 21776, 10173, 68094, 60785, 10111, 10142, 10105, 21776, 12529, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Christopher", "Reeve", "-", "-", "Reeve", "was", "best", "known", "for", "playing", "the", "comic", "book", "hero", "Superman", "in", "four", "movies", "but", "his", "greatest", "hero", "##ics", "came", "in", "real", "life", "." ], "ids": [ 15244, 89016, 118, 118, 89016, 10134, 12504, 11053, 10142, 14879, 10105, 31761, 12748, 51670, 30048, 10106, 11598, 39129, 10473, 10226, 31434, 51670, 16981, 13383, 10106, 13486, 12103, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reeve", ",", "an", "accomplished", "rider", "who", "owned", "several", "horses", ",", "suffered", "multiple", "injuries", "including", "two", "sh", "##atte", "##red", "neck", "verte", "##bra", "##e", "when", "he", "was", "thrown", "from", "his", "horse", "at", "an", "e", "##quest", "##rian", "event", "in", "Cu", "##lp", "##ep", "##per", ",", "Virginia", ",", "on", "May", "27", ",", "1995", "." ], "ids": [ 89016, 117, 10151, 83251, 95232, 10479, 17012, 11736, 48998, 117, 26090, 19865, 49718, 11198, 10551, 48201, 43961, 15711, 63938, 70332, 13581, 10112, 10841, 10261, 10134, 88590, 10188, 10226, 30491, 10160, 10151, 173, 93877, 20764, 14416, 10106, 34387, 35451, 19986, 12713, 117, 13634, 117, 10135, 10725, 10365, 117, 10436, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Almost", "entirely", "paral", "##y", "##zed", ",", "Reeve", "underwent", "extensive", "surgery", "to", "fu", "##se", "the", "verte", "##bra", "##e", "to", "the", "base", "of", "the", "skull", "and", "prevent", "any", "further", "damage", "to", "his", "spin", "##e", "." ], "ids": [ 64435, 34053, 102568, 10157, 18309, 117, 89016, 78074, 29164, 44811, 10114, 11005, 10341, 10105, 70332, 13581, 10112, 10114, 10105, 11404, 10108, 10105, 94671, 10111, 29320, 11178, 14586, 26115, 10114, 10226, 30428, 10112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "allowed", "him", "to", "be", "moved", "to", "a", "semi", "-", "up", "##right", "position", "." ], "ids": [ 13646, 18162, 10957, 10114, 10347, 13059, 10114, 169, 15900, 118, 10741, 33661, 12956, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "time", "he", "re", "##gain", "##ed", "the", "power", "of", "speech", ",", "so", "much", "so", "that", "he", "was", "asked", "to", "address", "the", "opening", "night", "of", "the", "Democratic", "National", "Convention", "." ], "ids": [ 15704, 10635, 10261, 11639, 85473, 10336, 10105, 13183, 10108, 29811, 117, 10380, 13172, 10380, 10189, 10261, 10134, 22151, 10114, 32198, 10105, 17975, 16903, 10108, 10105, 19281, 10655, 25318, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "Reeve", ",", "43", ",", "was", "classical", "##ly", "trained", "as", "an", "actor", "but", "became", "the", "proto", "##typ", "##ical", "hands", "##ome", "leading", "man", "." ], "ids": [ 89016, 117, 11370, 117, 10134, 30427, 10454, 33626, 10146, 10151, 14066, 10473, 11179, 10105, 26739, 53320, 17616, 27925, 22451, 16018, 10817, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "performed", "in", "summer", "stock", "and", "soap", "opera", "##s", "before", "being", "plu", "##cked", "as", "an", "almost", "unknown", "to", "play", "the", "lead", "in", "\"", "Superman", "\"", "and", "three", "sequel", "##s", "." ], "ids": [ 10357, 15282, 10106, 17995, 20511, 10111, 64493, 13335, 10107, 11360, 11223, 13651, 72333, 10146, 10151, 17122, 27306, 10114, 12253, 10105, 14107, 10106, 107, 30048, 107, 10111, 11003, 48333, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Richard", "G", "##ep", "##hardt", "-", "-", "G", "##ep", "##hardt", ",", "House", "Democratic", "leader", ",", "is", "a", "politician", "with", "a", "\"", "Mr", "Clean", "\"", "reputation", "who", "sought", "the", "presidency", "eight", "years", "ago", "and", "is", "widely", "believed", "to", "still", "have", "amb", "##itions", "for", "the", "job", "." ], "ids": [ 11118, 144, 19986, 48211, 118, 118, 144, 19986, 48211, 117, 11545, 19281, 15014, 117, 10124, 169, 20354, 10169, 169, 107, 12916, 79657, 107, 44214, 10479, 32570, 10105, 97059, 16222, 10855, 36390, 10111, 10124, 24300, 20718, 10114, 12647, 10529, 10559, 52213, 10142, 10105, 23627, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 3, 2, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##ep", "##hardt", ",", "55", ",", "the", "son", "of", "a", "milk", "##man", "from", "a", "working", "class", "district", "of", "St", ".", "Louis", ",", "is", "a", "con", "##sum", "##mate", "congressional", "inside", "##r", ",", "sufficient", "##ly", "skill", "##ed", "in", "com", "##pro", "##mise", "and", "the", "ways", "of", "the", "legislature", "to", "manage", "the", "often", "-", "un", "##rul", "##y", "House", "Democrats", "." ], "ids": [ 144, 19986, 48211, 117, 11358, 117, 10105, 10312, 10108, 169, 64301, 10589, 10188, 169, 14616, 13596, 12107, 10108, 10838, 119, 11334, 117, 10124, 169, 10173, 31417, 27801, 94137, 22978, 10129, 117, 55269, 10454, 76917, 10336, 10106, 10212, 73099, 19738, 10111, 10105, 30360, 10108, 10105, 62879, 10114, 59251, 10105, 12899, 118, 10119, 24849, 10157, 11545, 56282, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "B-MISC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 2, 9 ] }, { "tokens": [ "A", "former", "lawyer", ",", "he", "was", "in", "the", "front", "line", "of", "President", "Bill", "Clinton", "'", "s", "battle", "with", "the", "Republican", "-", "led", "Congress", "over", "the", "budget", "but", "has", "opposed", "the", "president", "'", "s", "decision", "to", "sign", "the", "Republican", "-", "written", "welfare", "reform", "bill", "." ], "ids": [ 138, 11775, 38055, 117, 10261, 10134, 10106, 10105, 14589, 12117, 10108, 12811, 13160, 24139, 112, 187, 18758, 10169, 10105, 21776, 118, 12857, 15984, 10491, 10105, 25293, 10473, 10393, 30488, 10105, 12931, 112, 187, 19231, 10114, 26794, 10105, 21776, 118, 13398, 78366, 34800, 34497, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 2, 6, 6, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "He", "advocated", "tou", "##gh", "action", "against", "foreign", "countries", "to", "cut", "U", ".", "S", ".", "trade", "deficit", "##s", "but", "sometimes", "been", "out", "of", "step", "with", "the", "party", "'", "s", "liberal", "wing", "." ], "ids": [ 10357, 109182, 52586, 15774, 14204, 11327, 20796, 15911, 10114, 21610, 158, 119, 156, 119, 18908, 107383, 10107, 10473, 17611, 10590, 10950, 10108, 31877, 10169, 10105, 14039, 112, 187, 28950, 22571, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "an", "opponent", "of", "ab", "##ortion", "until", "1986", "and", "voted", "for", "President", "Ronald", "Reagan", "'", "s", "big", "tax", "cut", "bill", "." ], "ids": [ 10357, 10134, 10151, 53610, 10108, 11357, 95171, 11444, 10578, 10111, 34584, 10142, 12811, 21474, 41984, 112, 187, 22185, 25468, 21610, 34497, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##ep", "##hardt", ",", "a", "red", "-", "hair", "##ed", "square", "-", "ja", "##wed", "man", ",", "is", "a", "less", "than", "fie", "##ry", "ora", "##tor", "." ], "ids": [ 144, 19986, 48211, 117, 169, 10680, 118, 40830, 10336, 15163, 118, 10201, 48854, 10817, 117, 10124, 169, 15306, 11084, 29959, 10908, 14480, 11813, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "1988", "bid", "for", "the", "Democratic", "nomination", "only", "took", "off", "after", "he", "re", "##cre", "##ated", "himself", "as", "a", "fire", "##bre", "##ath", "##ing", "reform", "##er", "of", "the", "establishment", ",", "standing", "up", "for", "blue", "coll", "##ar", "workers", "and", "farmers", "." ], "ids": [ 11597, 10548, 50385, 10142, 10105, 19281, 30807, 10893, 12149, 11898, 10662, 10261, 11639, 27794, 22525, 14764, 10146, 169, 13559, 13724, 44196, 10230, 34800, 10165, 10108, 10105, 31989, 117, 32173, 10741, 10142, 23254, 28552, 10354, 23829, 10111, 55543, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tom", "Das", "##ch", "##le", "-", "-", "Das", "##ch", "##le", ",", "48", ",", "was", "largely", "unknown", "outside", "Washington", "and", "his", "state", "of", "South", "Dakota", "when", "he", "sur", "##pris", "##ingly", "beat", "more", "prominent", "rivals", "to", "become", "Senate", "Democratic", "leader", "after", "the", "party", "lost", "its", "majority", "to", "the", "Republicans", "in", "1994", "." ], "ids": [ 12275, 10672, 10269, 10284, 118, 118, 10672, 10269, 10284, 117, 11300, 117, 10134, 25340, 27306, 17555, 11586, 10111, 10226, 11388, 10108, 11056, 21435, 10841, 10261, 10326, 45666, 56299, 27868, 10798, 22861, 71908, 10114, 13461, 22294, 19281, 15014, 10662, 10105, 14039, 14172, 10474, 19471, 10114, 10105, 93700, 10106, 10444, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "A", "mild", "-", "manner", "##ed", "and", "youth", "##ful", "man", "who", "rose", "rapidly", "after", "entering", "the", "Senate", "in", "1987", ",", "he", "presented", "himself", "as", "a", "Midwest", "moderate", ",", "as", "a", "Democratic", "winner", "in", "a", "Republican", "state", "able", "to", "unit", "##e", "Senate", "faction", "##s", "." ], "ids": [ 138, 89176, 118, 39750, 10336, 10111, 24215, 14446, 10817, 10479, 29467, 47489, 10662, 44824, 10105, 22294, 10106, 10581, 117, 10261, 20027, 14764, 10146, 169, 103736, 62483, 117, 10146, 169, 19281, 20826, 10106, 169, 21776, 11388, 16197, 10114, 16511, 10112, 22294, 84395, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9, 9, 2, 9, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "Con", "##cer", "##n", "that", "he", "might", "be", "steam", "##rolle", "##red", "by", "the", "vast", "##ly", "more", "experienced", "Republican", "leader", "Bob", "Dol", "##e", "was", "dis", "##pelle", "##d", "when", "he", "showed", "a", "tou", "##gh", "edge", ",", "out", "##mane", "##uve", "##ring", "Dol", "##e", "in", "a", "w", "##rang", "##le", "over", "s", "##cra", "##pping", "a", "gas", "tax", "and", "raising", "the", "federal", "minimum", "wa", "##ge", "." ], "ids": [ 12845, 17505, 10115, 10189, 10261, 20970, 10347, 45833, 47820, 15711, 10155, 10105, 35472, 10454, 10798, 40727, 21776, 15014, 13583, 100035, 10112, 10134, 27920, 93357, 10162, 10841, 10261, 27463, 169, 52586, 15774, 30599, 117, 10950, 38154, 42412, 13135, 100035, 10112, 10106, 169, 191, 24141, 10284, 10491, 187, 40333, 53570, 169, 16091, 25468, 10111, 59252, 10105, 16293, 26503, 11471, 10525, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "his", "early", "Senate", "years", "he", "was", "seen", "as", "a", "\"", "pra", "##iri", "##e", "pop", "##ulis", "##t", "\"", ",", "working", "on", "legislation", "protecting", "farmers", "'", "prices", "and", "also", "on", "com", "##pensa", "##ting", "veterans", "sick", "##ened", "by", "Agent", "Orange", "def", "##olia", "##nt", "sp", "##ray", "##ing", "in", "the", "Vietnam", "War", "." ], "ids": [ 10167, 10226, 11732, 22294, 10855, 10261, 10134, 15652, 10146, 169, 107, 69857, 19334, 10112, 13717, 52393, 10123, 107, 117, 14616, 10135, 40807, 106279, 55543, 112, 57476, 10111, 10379, 10135, 10212, 74599, 12141, 95320, 101003, 27867, 10155, 36065, 20557, 100745, 49057, 10368, 32650, 23432, 10230, 10106, 10105, 15940, 11277, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Das", "##ch", "##le", "was", "a", "key", "player", "in", "President", "Bill", "Clinton", "'", "s", "failed", "attempt", "at", "s", "##we", "##eping", "health", "##care", "changes", "but", "when", "he", "became", "minority", "leader", "he", "declared", "he", "would", "be", "no", "water", "-", "carrier", "for", "the", "White", "House", "." ], "ids": [ 10672, 10269, 10284, 10134, 169, 18444, 12928, 10106, 12811, 13160, 24139, 112, 187, 20775, 21395, 10160, 187, 12577, 79654, 17004, 22277, 19010, 10473, 10841, 10261, 11179, 54147, 15014, 10261, 25019, 10261, 10894, 10347, 10192, 12286, 118, 53402, 10142, 10105, 12136, 11545, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "He", "has", "made", "clear", "he", "opposed", "Clinton", "'", "s", "signing", "of", "the", "Republican", "-", "initiated", "welfare", "reform", "bill", "." ], "ids": [ 10357, 10393, 11019, 24866, 10261, 30488, 24139, 112, 187, 46529, 10108, 10105, 21776, 118, 56571, 78366, 34800, 34497, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "He", "has", "spent", "his", "adult", "life", "in", "politics", ",", "coming", "to", "Congress", "as", "an", "aide", "in", "1972", "after", "three", "years", "in", "the", "Air", "Force", "and", "then", "being", "elected", "to", "the", "House", "of", "Representatives", "himself", "in", "1978", "." ], "ids": [ 10357, 10393, 18571, 10226, 30521, 12103, 10106, 25674, 117, 23959, 10114, 15984, 10146, 10151, 23135, 10106, 10677, 10662, 11003, 10855, 10106, 10105, 11704, 13384, 10111, 11059, 11223, 14254, 10114, 10105, 11545, 10108, 37774, 14764, 10106, 10693, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "boy", ",", "13", ",", "accused", "of", "murder", "##ing", "adopt", "##ive", "mother", "." ], "ids": [ 158, 119, 156, 119, 26905, 117, 10249, 117, 37303, 10108, 29448, 10230, 106916, 11942, 15293, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DA", "##LL", "##AS", "1996", "-", "08", "-", "26" ], "ids": [ 47855, 82834, 38025, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "13", "-", "year", "-", "old", "Dallas", "boy", "has", "been", "charged", "with", "murder", "##ing", "his", "adopt", "##ive", "mother", "over", "the", "weekend", ",", "police", "said", "on", "Monday", "." ], "ids": [ 138, 10249, 118, 10924, 118, 12898, 20003, 26905, 10393, 10590, 38253, 10169, 29448, 10230, 10226, 106916, 11942, 15293, 10491, 10105, 43440, 117, 15034, 12415, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Margaret", "M", "##c", "##C", "##ull", "##ough", ",", "55", ",", "was", "found", "dead", "in", "her", "home", "on", "Saturday", "with", "guns", "##hot", "wound", "##s", "to", "the", "head", "." ], "ids": [ 18014, 150, 10350, 10858, 39233, 73603, 117, 11358, 117, 10134, 11823, 23457, 10106, 10485, 11816, 10135, 24848, 10169, 31199, 55788, 109205, 10107, 10114, 10105, 13578, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", ",", "who", "at", "first", "thought", "her", "son", "had", "been", "ki", "##dna", "##pped", ",", "found", "him", "on", "Sunday", "with", "a", "friend", "in", "his", "mother", "'", "s", "car", "in", "Oklahoma", "and", "arrested", "him", "." ], "ids": [ 18051, 117, 10479, 10160, 10422, 18957, 10485, 10312, 10374, 10590, 10879, 35630, 44357, 117, 11823, 10957, 10135, 19731, 10169, 169, 20104, 10106, 10226, 15293, 112, 187, 13000, 10106, 19585, 10111, 29479, 10957, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "A", "shot", "##gun", "and", "a", ".", "357", "hand", "##gun", "were", "found", "in", "the", "car", "." ], "ids": [ 138, 19508, 32657, 10111, 169, 119, 33590, 15230, 32657, 10309, 11823, 10106, 10105, 13000, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "police", "spoke", "##sman", "said", "the", "boy", "was", "being", "questioned", ".", "\"" ], "ids": [ 138, 15034, 50005, 24305, 12415, 10105, 26905, 10134, 11223, 101173, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "are", "talking", "to", "him", "now", "about", "the", "motive", "and", "everything", "else", ".", "\"" ], "ids": [ 11696, 10301, 78254, 10114, 10957, 11858, 10978, 10105, 101101, 10111, 42536, 40843, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M", "##c", "##C", "##ull", "##ough", "had", "adopted", "the", "boy", ",", "who", "was", "the", "grandson", "of", "her", "late", "husband", ",", "shortly", "after", "his", "birth", "but", "nei", "##gh", "##bours", "said", "they", "often", "had", "lo", "##ud", "arguments", "." ], "ids": [ 150, 10350, 10858, 39233, 73603, 10374, 24726, 10105, 26905, 117, 10479, 10134, 10105, 60111, 10108, 10485, 13002, 19634, 117, 31555, 10662, 10226, 24711, 10473, 11888, 15774, 97497, 12415, 10689, 12899, 10374, 10406, 11679, 67524, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistani", "bou", "##rse", "to", "use", "new", "re", "##com", "##posed", "index", "." ], "ids": [ 66797, 94335, 16239, 10114, 11760, 10751, 11639, 22530, 76996, 19776, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##RA", "##CH", "##I", ",", "Pakistan", "1996", "-", "08", "-", "26" ], "ids": [ 85314, 29990, 86448, 11281, 117, 15437, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Karachi", "Stock", "Exchange", "(", "KS", "##E", ")", "said", "on", "Monday", "it", "would", "introduce", "a", "new", "re", "##com", "##posed", "KS", "##E", "-", "100", "index", "on", "September", "10", "." ], "ids": [ 10117, 82344, 31916, 32424, 113, 61080, 11259, 114, 12415, 10135, 40714, 10271, 10894, 55741, 169, 10751, 11639, 22530, 76996, 61080, 11259, 118, 10407, 19776, 10135, 10596, 10150, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "KS", "##E", "statement", "said", "the", "re", "##com", "##posed", "index", "would", "be", "more", "representative", ",", "cap", "##turing", "market", "capital", "##isation", "of", "82", ".", "3", "percent", ",", "up", "from", "79", ".", "9", "percent", "previously", "." ], "ids": [ 138, 61080, 11259, 33311, 12415, 10105, 11639, 22530, 76996, 19776, 10894, 10347, 10798, 33786, 117, 13337, 64581, 17313, 12185, 20312, 10108, 12180, 119, 124, 22362, 117, 10741, 10188, 12791, 119, 130, 22362, 17477, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Karachi", "news", "##room", "922", "##1", "-", "568", "##51", "##9", "##2" ], "ids": [ 118, 118, 82344, 14424, 25525, 72446, 10759, 118, 54879, 77581, 11373, 10729 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "N", "##W", "##E", "oil", "products", "mixed", ",", "holiday", "du", "##lls", "trade", "." ], "ids": [ 151, 13034, 11259, 21073, 20895, 23742, 117, 71806, 10168, 22881, 18908, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "N", "##W", "##E", "oil", "products", "were", "mixed", "on", "Monday", "but", "markets", "were", "be", "##cal", "##med", "because", "of", "a", "public", "holiday", "in", "the", "United", "Kingdom", ",", "trade", "##rs", "said", "." ], "ids": [ 151, 13034, 11259, 21073, 20895, 10309, 23742, 10135, 40714, 10473, 42893, 10309, 10347, 15794, 21986, 12373, 10108, 169, 11683, 71806, 10106, 10105, 10609, 14648, 117, 18908, 10943, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "explosion", "at", "Rep", "##sol", "'", "s", "Puerto", "##llan", "##o", "ref", "##iner", "##y", ",", "which", "killed", "four", "workers", ",", "had", "not", "affected", "output", "of", "oil", "products", ",", "an", "official", "said", "." ], "ids": [ 10313, 53021, 10160, 72337, 43115, 112, 187, 15968, 73884, 10133, 48056, 33488, 10157, 117, 10319, 15875, 11598, 23829, 117, 10374, 10472, 36276, 37131, 10108, 21073, 20895, 117, 10151, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "plant", "is", "function", "##ing", "as", "usual", ",", "\"", "Jose", "Manuel", "Prieto", ",", "director", "of", "personnel", ",", "told", "Spanish", "state", "television", "." ], "ids": [ 107, 10117, 16430, 10124, 19367, 10230, 10146, 49176, 117, 107, 23029, 13108, 80360, 117, 12461, 10108, 23889, 117, 21937, 14661, 11388, 14162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Gas", "##oline", "prices", "were", "notion", "##ally", "un", "##chang", "##ed", "from", "Friday", "despite", "sa", "##gging", "NY", "##ME", "##X", "numbers", ",", "with", "the", "ar", "##bit", "##rage", "window", "to", "the", "U", ".", "S", ".", "considered", "closed", "for", "the", "moment", "." ], "ids": [ 34874, 96541, 57476, 10309, 48213, 19777, 10119, 64208, 10336, 10188, 30767, 22087, 10148, 54468, 22550, 42424, 12674, 20953, 117, 10169, 10105, 10456, 20768, 40696, 39051, 10114, 10105, 158, 119, 156, 119, 14289, 18440, 10142, 10105, 14316, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Euro", "##grade", "bar", "##ges", "were", "offered", "at", "$", "207", "f", "##ob", "AR", "##A", "for", "Amsterdam", "-", "Rotterdam", "barrel", "##s", ",", "and", "at", "$", "206", "for", "full", "AR", "##A", "material", "." ], "ids": [ 17526, 82892, 18121, 13156, 10309, 20841, 10160, 109, 22730, 174, 31165, 50884, 10738, 10142, 14017, 118, 25136, 93397, 10107, 117, 10111, 10160, 109, 21717, 10142, 13375, 50884, 10738, 13540, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "is", "no", "market", "at", "the", "moment", ",", "\"", "one", "Rotterdam", "trade", "##r", "said", ".", "\"" ], "ids": [ 107, 11723, 10124, 10192, 17313, 10160, 10105, 14316, 117, 107, 10464, 25136, 18908, 10129, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Maybe", "sentiment", "is", "a", "little", "bit", "weak", "##er", "but", "prices", "have", "not", "changed", ".", "\"" ], "ids": [ 107561, 70762, 10124, 169, 16745, 17684, 61285, 10165, 10473, 57476, 10529, 10472, 17695, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Out", "##right", "gas", "oil", "prices", "were", "notion", "##ally", "soft", "##er", "as", "the", "NY", "##ME", "##X", "heat", "##ing", "oil", "contract", "headed", "lower", ",", "and", "following", "news", "that", "the", "Indian", "Oil", "Corp", "(", "IOC", ")", "had", "issued", "a", "tender", "to", "buy", "only", "120", ",", "000", "tonnes", "of", "high", "speed", "diesel", "for", "October", "." ], "ids": [ 14504, 33661, 16091, 21073, 57476, 10309, 48213, 19777, 44898, 10165, 10146, 10105, 22550, 42424, 12674, 33955, 10230, 21073, 16108, 33336, 18165, 117, 10111, 11901, 14424, 10189, 10105, 12544, 33049, 44687, 113, 26423, 114, 10374, 21694, 169, 96486, 10114, 47715, 10893, 12048, 117, 10259, 39435, 10108, 11846, 19085, 40233, 10142, 11212, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Asian", "trade", "##rs", "had", "earlier", "expected", "an", "IOC", "tender", "for", "around", "400", ",", "000", "tonnes", "." ], "ids": [ 16900, 18908, 10943, 10374, 18905, 25973, 10151, 26423, 96486, 10142, 12166, 11176, 117, 10259, 39435, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AR", "##A", "gas", "oil", "bar", "##ges", "were", "quiet", "although", "one", "trade", "##r", "said", "he", "had", "seen", "offers", "at", "$", "1", "a", "ton", "##ne", "over", "September", "IP", "##E", "for", "pro", "##mpt", "barrel", "##s", ",", "while", "Antwerp", "material", "was", "available", "for", "0", "-", "50", "cents", "over", "September", "." ], "ids": [ 50884, 10738, 16091, 21073, 18121, 13156, 10309, 104951, 14779, 10464, 18908, 10129, 12415, 10261, 10374, 15652, 23818, 10160, 109, 122, 169, 22464, 10238, 10491, 10596, 24124, 11259, 10142, 11284, 109361, 93397, 10107, 117, 11371, 85332, 13540, 10134, 14579, 10142, 121, 118, 10462, 63487, 10491, 10596, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "IOC", "tender", "had", "\"", "a", "bear", "##ish", "impact", ",", "but", "not", "a", "great", "impact", ",", "\"", "one", "German", "player", "said", "." ], "ids": [ 10117, 26423, 96486, 10374, 107, 169, 54052, 15529, 21316, 117, 10473, 10472, 169, 14772, 21316, 117, 107, 10464, 12026, 12928, 12415, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Fuel", "oil", "markets", "were", "also", "list", "##less", "." ], "ids": [ 103599, 21073, 42893, 10309, 10379, 13416, 14985, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Off", "##ers", "were", "around", "a", "dollar", "a", "ton", "##ne", "higher", "at", "$", "102", "f", "##ob", "AR", "##A", "but", "bid", "##s", "were", "s", "##car", "##ce", "." ], "ids": [ 23490, 10901, 10309, 12166, 169, 34807, 169, 22464, 10238, 17981, 10160, 109, 14818, 174, 31165, 50884, 10738, 10473, 50385, 10107, 10309, 187, 15983, 10419, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Nicholas", "Sha", "##x", "##son", ",", "London", "news", "##room", "+", "44", "171", "542", "816", "##7" ], "ids": [ 118, 118, 19289, 106583, 10686, 11599, 117, 10829, 14424, 25525, 116, 11126, 22478, 51620, 60750, 11305 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Prairie", "##s", "saw", "no", "fr", "##ost", "Monday", ",", "none", "rest", "of", "week", "." ], "ids": [ 57105, 10107, 17112, 10192, 12127, 18239, 40714, 117, 46638, 17333, 10108, 16118, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##IN", "##NI", "##P", "##EG", "1996", "-", "08", "-", "26" ], "ids": [ 160, 27128, 52898, 11127, 104036, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Canada", "'", "s", "Prairie", "##s", "saw", "no", "fr", "##ost", "on", "Monday", "morning", "and", "none", "was", "expected", "any", "##where", "on", "the", "grain", "##belt", "until", "late", "in", "the", "Labour", "Day", "long", "weekend", ",", "Environment", "Canada", "said", "." ], "ids": [ 11635, 112, 187, 57105, 10107, 17112, 10192, 12127, 18239, 10135, 40714, 28757, 10111, 46638, 10134, 25973, 11178, 30935, 10135, 10105, 69132, 83742, 11444, 13002, 10106, 10105, 25606, 12360, 11695, 43440, 117, 36408, 11635, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "\"", "App", "##aren", "##tly", ",", "we", "'", "re", "home", "free", "for", "the", "rest", "of", "the", "week", "." ], "ids": [ 107, 73784, 12997, 69253, 117, 11951, 112, 11639, 11816, 13961, 10142, 10105, 17333, 10108, 10105, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "re", "not", "calling", "for", "any", "fr", "##ost", "until", "after", "the", "weekend", "when", "it", "starts", "to", "cool", "off", "in", "northwestern", "Alberta", "after", "the", "weekend", "probably", "Monday", "or", "Tuesday", ",", "\"", "met", "##eo", "##rol", "##ogist", "Gerald", "Mach", "##nee", "told", "Reuters", "." ], "ids": [ 12865, 112, 11639, 10472, 37023, 10142, 11178, 12127, 18239, 11444, 10662, 10105, 43440, 10841, 10271, 33039, 10114, 67420, 11898, 10106, 89929, 25488, 10662, 10105, 43440, 23282, 40714, 10345, 70245, 117, 107, 10428, 15998, 22698, 100191, 30483, 65654, 56059, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 9 ] }, { "tokens": [ "Sp", "##rag", "##ue", ",", "Manitoba", ",", "on", "the", "Minnesota", "border", "was", "the", "cold", "spot", "of", "the", "Prairie", "##s", "Monday", "morning", "at", "4", ".", "0", "Celsius", "(", "39", ".", "2", "F", ")", "." ], "ids": [ 46361, 31351, 12772, 117, 37166, 117, 10135, 10105, 16306, 20949, 10134, 10105, 41626, 28504, 10108, 10105, 57105, 10107, 40714, 28757, 10160, 125, 119, 121, 102972, 113, 11303, 119, 123, 143, 114, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Temperatur", "##es", "at", "ground", "level", "can", "be", "2", ".", "0", "to", "5", ".", "0", "Celsius", "lower", "than", "at", "chest", "level", "depending", "on", "winds", "##pe", "##ed", ",", "sky", "conditions", "and", "ground", "surface", "mois", "##ture", "." ], "ids": [ 88455, 10171, 10160, 16912, 13277, 10944, 10347, 123, 119, 121, 10114, 126, 119, 121, 102972, 18165, 11084, 10160, 94230, 13277, 45812, 10135, 63782, 11355, 10336, 117, 62368, 17315, 10111, 16912, 16004, 17083, 16023, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Free", "##zing", "occurs", "at", "0", "Celsius", "(", "32", ".", "0", "F", ")", "." ], "ids": [ 16122, 19308, 31136, 10160, 121, 102972, 113, 10842, 119, 121, 143, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "North", "Battle", "##ford", ",", "Sa", "##sk", "." ], "ids": [ 11225, 14810, 13387, 117, 12404, 11478, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 5, 9 ] }, { "tokens": [ ",", "reported", "a", "low", "of", "5", ".", "0", "Celsius", "(", "41", ".", "0", "F", ")", "and", "Grande", "Prairie", ",", "Alta", "." ], "ids": [ 117, 15943, 169, 15626, 10108, 126, 119, 121, 102972, 113, 11349, 119, 121, 143, 114, 10111, 12800, 57105, 117, 22798, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ ",", "in", "the", "Peace", "River", "Valley", "reported", "7", ".", "0", "Celsius", "(", "44", ".", "6", "F", ")", "." ], "ids": [ 117, 10106, 10105, 20705, 11575, 14390, 15943, 128, 119, 121, 102972, 113, 11126, 119, 127, 143, 114, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Mach", "##nee", "dismissed", "talk", "of", "fr", "##ost", "Wednesday", "by", "propone", "##nts", "of", "the", "\"", "full", "moon", ",", "fr", "##ost", "soon", "\"", "school", "of", "thought", "." ], "ids": [ 65654, 56059, 59379, 31311, 10108, 12127, 18239, 57611, 10155, 76210, 14073, 10108, 10105, 107, 13375, 60109, 117, 12127, 18239, 17864, 107, 11393, 10108, 18957, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Low", "##s", "on", "August", "28", "across", "the", "Prairie", "##s", "should", "range", "from", "8", ".", "0", "to", "12", ".", "0", "Celsius", "with", "high", "##s", "around", "30", ".", "0", "Celsius", "." ], "ids": [ 28803, 10107, 10135, 10735, 10348, 15130, 10105, 57105, 10107, 14819, 15601, 10188, 129, 119, 121, 10114, 10186, 119, 121, 102972, 10169, 11846, 10107, 12166, 10244, 119, 121, 102972, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "-", "-", "Gilbert", "Le", "G", "##ras", "204", "947", "354", "##8" ], "ids": [ 118, 118, 18608, 10281, 144, 12783, 22253, 81188, 33540, 11396 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Br", "##ush", "Well", "##man", "comments", "on", "be", "##ryl", "##lium", "lawsuit", "##s", "." ], "ids": [ 38508, 37026, 37025, 10589, 61565, 10135, 10347, 60702, 62321, 83706, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "1996", "-", "08", "-", "26" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Br", "##ush", "Well", "##man", "Inc", "said", "Monday", "that", "10", "of", "24", "lawsuit", "##s", "involving", "chronic", "be", "##ryl", "##lium", "disease", "have", "been", "dismissed", "since", "July", "1", "." ], "ids": [ 38508, 37026, 37025, 10589, 13604, 12415, 40714, 10189, 10150, 10108, 10233, 83706, 10107, 40368, 91347, 10347, 60702, 62321, 21911, 10529, 10590, 59379, 11764, 11112, 122, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "leading", "U", ".", "S", ".", "be", "##ryl", "##lium", "producer", "said", "in", "a", "conference", "call", "it", "has", "traditionally", "been", "pro", "-", "active", "regarding", "the", "work", "##place", "disease", ",", "a", "lung", "ail", "##ment", "which", "can", "affect", "##s", "a", "small", "percent", "of", "people", "whose", "immune", "systems", "are", "susceptible", "." ], "ids": [ 10117, 16018, 158, 119, 156, 119, 10347, 60702, 62321, 16607, 12415, 10106, 169, 25029, 20575, 10271, 10393, 58217, 10590, 11284, 118, 14459, 33295, 10105, 11424, 30236, 21911, 117, 169, 66041, 91230, 10426, 10319, 10944, 60600, 10107, 169, 12474, 22362, 10108, 11426, 16879, 96945, 16768, 10301, 109036, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Of", "the", "14", "remaining", "suit", "##s", ",", "10", "were", "filed", "by", "employees", "of", "industrial", "Br", "##ush", "Well", "##man", "customers", "and", "Br", "##ush", "Well", "##man", "li", "##ability", "in", "such", "suit", "##s", "is", "typically", "covered", "by", "insurance", ",", "Timothy", "Reid", ",", "vice", "president", "of", "corporate", "communications", ",", "said", "on", "the", "call", "." ], "ids": [ 12610, 10105, 10247, 21448, 26315, 10107, 117, 10150, 10309, 45959, 10155, 35056, 10108, 18138, 38508, 37026, 37025, 10589, 49260, 10111, 38508, 37026, 37025, 10589, 11614, 35717, 10106, 11049, 26315, 10107, 10124, 24622, 21543, 10155, 49756, 117, 32425, 32309, 117, 16543, 12931, 10108, 46666, 42919, 117, 12415, 10135, 10105, 20575, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "was", "respond", "##ing", "to", "an", "article", "in", "Sunday", "'", "s", "New", "York", "Times", "." ], "ids": [ 10117, 12100, 10134, 100062, 10230, 10114, 10151, 13262, 10106, 19731, 112, 187, 10287, 10482, 12020, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "He", "said", "the", "article", "largely", "rei", "##tera", "##ted", "information", "about", "the", "suit", "##s", "and", "the", "disease", "which", "had", "previously", "been", "made", "public", "via", "Sec", "##urities", "and", "Exchange", "Commission", "fil", "##ings", "and", "annual", "reports", "." ], "ids": [ 10357, 12415, 10105, 13262, 25340, 14243, 22833, 11912, 12929, 10978, 10105, 26315, 10107, 10111, 10105, 21911, 10319, 10374, 17477, 10590, 11019, 11683, 11406, 109754, 82073, 10111, 32424, 14941, 40503, 18800, 10111, 19246, 26610, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Br", "##ush", "Well", "##man", "has", "been", "a", "leader", "in", "dealing", "with", "health", "and", "safety", "issues", "(", "related", "to", "chronic", "Be", "##ryl", "##lium", "disease", ")", "for", "nearly", "50", "years", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 38508, 37026, 37025, 10589, 10393, 10590, 169, 15014, 10106, 73082, 10169, 17004, 10111, 27116, 17850, 113, 16382, 10114, 91347, 14321, 60702, 62321, 21911, 114, 10142, 21377, 10462, 10855, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "have", "a", "record", "of", "going", "beyond", "regulatory", "requirements", ".", ".", ".", "and", "we", "consistently", "share", "the", "most", "current", "information", "available", ".", ".", ".", "with", "customers", "and", "employees", ".", "\"" ], "ids": [ 12865, 10529, 169, 12410, 10108, 19090, 28569, 102026, 39282, 119, 119, 119, 10111, 11951, 97742, 23867, 10105, 10992, 14978, 12929, 14579, 119, 119, 119, 10169, 49260, 10111, 35056, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "customer", "employee", "suit", "##s", "were", "filed", "in", "1990", "-", "95", ",", "he", "said", "." ], "ids": [ 10117, 72378, 69312, 26315, 10107, 10309, 45959, 10106, 10420, 118, 11978, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "class", "action", "filed", "by", "a", "former", "Br", "##ush", "Well", "##man", "employee", "in", "April", "1996", "was", "dismissed", "in", "July", ",", "he", "said", "." ], "ids": [ 138, 13596, 14204, 45959, 10155, 169, 11775, 38508, 37026, 37025, 10589, 69312, 10106, 10780, 10389, 10134, 59379, 10106, 11112, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "is", "\"", "vigor", "##ously", "defending", "\"", "the", "remaining", "four", "suit", "##s", "filed", "by", "former", "and", "current", "Br", "##ush", "Well", "##man", "employees", ",", "he", "said", "." ], "ids": [ 10117, 12100, 10124, 107, 90525, 47173, 53730, 107, 10105, 21448, 11598, 26315, 10107, 45959, 10155, 11775, 10111, 14978, 38508, 37026, 37025, 10589, 35056, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "a", "delayed", "opening", ",", "the", "stock", "was", "off", "1", "-", "1", "/", "2", "to", "18", "-", "7", "/", "8", "." ], "ids": [ 11301, 169, 67058, 17975, 117, 10105, 20511, 10134, 11898, 122, 118, 122, 120, 123, 10114, 10218, 118, 128, 120, 129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Cleveland", "News", "##des", "##k", "216", "-", "579", "-", "007", "##7" ], "ids": [ 118, 118, 21342, 12219, 10920, 10174, 23677, 118, 49741, 118, 35964, 11305 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Salomon", "cuts", "ref", "##iner", "Q", "##3", "EP", "##S", "view", "on", "margin", "concern", "." ], "ids": [ 54801, 73311, 48056, 33488, 154, 10884, 14111, 10731, 17904, 10135, 53388, 43607, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "26" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Salomon", "Brothers", "anal", "##yst", "Paul", "Tin", "##g", "said", "he", "cut", "his", "share", "earning", "##s", "estimates", "on", "ref", "##iner", "##s", "for", "the", "third", "quarter", "on", "the", "belief", "the", "companies", "will", "face", "sharp", "revision", "##s", "in", "ref", "##ining", "and", "marketing", "margin", "##s", "." ], "ids": [ 54801, 18274, 106615, 62769, 10772, 48800, 10240, 12415, 10261, 21610, 10226, 23867, 56981, 10107, 45870, 10135, 48056, 33488, 10107, 10142, 10105, 12628, 28330, 10135, 10105, 46863, 10105, 18866, 11337, 13295, 77348, 41643, 10107, 10106, 48056, 23025, 10111, 29465, 53388, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "cut", "his", "third", "-", "quarter", "share", "earning", "##s", "estimate", "on", ":" ], "ids": [ 10357, 21610, 10226, 12628, 118, 28330, 23867, 56981, 10107, 78059, 10135, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Diamond", "Sha", "##m", "##rock", "Inc", "to", "$", "0", ".", "38", "from", "$", "0", ".", "73", "versus", "the", "Street", "'", "s", "consensus", "$", "0", ".", "63" ], "ids": [ 118, 118, 25174, 106583, 10147, 46571, 13604, 10114, 109, 121, 119, 11171, 10188, 109, 121, 119, 12545, 32412, 10105, 11962, 112, 187, 72049, 109, 121, 119, 12256 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sun", "Co", "to", "$", "0", ".", "15", "from", "$", "0", ".", "85", "versus", "the", "consensus", "$", "0", ".", "63" ], "ids": [ 118, 118, 13967, 13098, 10114, 109, 121, 119, 10208, 10188, 109, 121, 119, 12017, 32412, 10105, 72049, 109, 121, 119, 12256 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "To", "##sco", "Corp", "to", "$", "0", ".", "95", "from", "$", "1", ".", "03", "versus", "the", "consensus", "$", "0", ".", "94" ], "ids": [ 118, 118, 11469, 22402, 44687, 10114, 109, 121, 119, 11978, 10188, 109, 122, 119, 10907, 32412, 10105, 72049, 109, 121, 119, 12749 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Total", "Petroleum", "(", "North", "America", ")", "Ltd", "to", "$", "0", ".", "15", "from", "$", "0", ".", "46", "versus", "the", "consensus", "$", "0", ".", "33" ], "ids": [ 118, 118, 25220, 89589, 113, 11225, 11440, 114, 15129, 10114, 109, 121, 119, 10208, 10188, 109, 121, 119, 11528, 32412, 10105, 72049, 109, 121, 119, 11000 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "And", ",", "Vale", "##ro", "Energy", "Corp", "to", "$", "0", ".", "27", "from", "$", "0", ".", "55", "compared", "with", "the", "consensus", "$", "0", ".", "40", "." ], "ids": [ 118, 118, 12689, 117, 32286, 10567, 21058, 44687, 10114, 109, 121, 119, 10365, 10188, 109, 121, 119, 11358, 25626, 10169, 10105, 72049, 109, 121, 119, 10533, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ES", "##AL", "##E", "-", "Marion", "County", "Board", "of", "Education", ",", "W", ".", "Va", "." ], "ids": [ 23837, 25054, 32002, 11259, 118, 27276, 10886, 14743, 10108, 15063, 117, 160, 119, 14723, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 1, 5, 5, 9 ] }, { "tokens": [ "AM", "##T", ":", "3", ",", "250", ",", "000", "DA", "##TE", ":", "09", "/", "04", "/", "96", "NYC", "Time", ":", "1200", "C", "##US", "##IP", ":", "569", "##3", "##99" ], "ids": [ 24339, 11090, 131, 124, 117, 12214, 117, 10259, 47855, 29833, 131, 11035, 120, 10814, 120, 12308, 106703, 12000, 131, 17234, 140, 32612, 30331, 131, 53670, 10884, 88657 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ISS", "##UE", "##R", ":", "Marion", "County", "Board", "of", "Education", "ST", ":", "W", "##V" ], "ids": [ 58915, 62674, 11273, 131, 27276, 10886, 14743, 10108, 15063, 53317, 131, 160, 11779 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "ISS", "##UE", ":", "Public", "School", ",", "Series", "1996", "TA", "##X", "ST", "##AT", ":", "Exempt", "-", "U", "##L", "##T" ], "ids": [ 58915, 62674, 131, 14647, 10984, 117, 13239, 10389, 91075, 12674, 53317, 32071, 131, 44600, 118, 158, 11369, 11090 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M", "/", "SP", "/", "F", ":", "NA", "/", "NA", "/", "NA", "B", "##O", "##OK", "EN", "##T", "##R", "##Y", ":", "Y" ], "ids": [ 150, 120, 22570, 120, 143, 131, 56586, 120, 56586, 120, 56586, 139, 11403, 63310, 31278, 11090, 11273, 14703, 131, 162 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EN", "##HA", "##NC", "##EM", "##EN", "##TS", ":", "None", "BA", "##NK", "Q", "##U", "##AL", ":", "Y" ], "ids": [ 31278, 58132, 100230, 67753, 50655, 36545, 131, 86481, 39999, 78043, 154, 12022, 32002, 131, 162 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "D", "##TD", ":", "09", "/", "01", "/", "96", "SU", "##RE", "B", "##ID", ":", "N" ], "ids": [ 141, 95936, 131, 11035, 120, 10669, 120, 12308, 86643, 66014, 139, 28895, 131, 151 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "D", "##UE", ":", "5", "/", "1", "/", "98", "-", "02", "SR", "MG", "##R", ":" ], "ids": [ 141, 62674, 131, 126, 120, 122, 120, 12327, 118, 10983, 23032, 38668, 11273, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", "##ST", "CP", "##N", ":", "05", "/", "01", "/", "97" ], "ids": [ 122, 32995, 40070, 11537, 131, 10831, 120, 10669, 120, 12328 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##LL", ":", "Non", "-", "Call", "##able", "N", "##IC" ], "ids": [ 24707, 82834, 131, 14890, 118, 23553, 13096, 151, 30889 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##L", "##IV", "##ER", "##Y", ":", "9", "/", "17", "/", "96", "app", "##rox", "OR", "##DE", "##RS", ":" ], "ids": [ 25067, 11369, 91238, 24093, 14703, 131, 130, 120, 10273, 120, 12308, 72894, 86821, 69308, 60675, 39469, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##Y", "##ING", "AG", "##EN", "##T", ":", "Wes", "##B", "##anc", "##o", "Bank", "Fair", "##mont", ",", "Fair", "##mont" ], "ids": [ 32349, 14703, 50183, 17935, 50655, 11090, 131, 48055, 11274, 82531, 10133, 13533, 25697, 21984, 117, 25697, 21984 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 1, 5, 9, 1, 5 ] }, { "tokens": [ "L", ".", "O", ".", ":", "Step", "##toe", "&", "Johnson", ",", "Clark", "##sburg" ], "ids": [ 149, 119, 152, 119, 131, 41653, 60995, 111, 13241, 117, 15740, 29270 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 1, 5 ] }, { "tokens": [ "F", ".", "A", ".", ":", "Ferris", ",", "Baker", "Watts", ",", "Inc", ".", ",", "Charleston" ], "ids": [ 143, 119, 138, 119, 131, 101621, 117, 16865, 52376, 117, 13604, 119, 117, 52975 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 1 ] }, { "tokens": [ "LA", "##ST", "SA", "##LE", ":", "$", "7", ",", "330", ",", "000", "(", "MB", "##IA", ")", "3", "/", "1", "/", "90", "@", "6", ".", "1490", "##0", "%", "N", "##IC", ";", "4", "##yr", "##s", "4", "##mos", "Av", "##g", ";", "BB", "##I", "-", "7", ".", "27", "%" ], "ids": [ 29079, 32995, 21318, 51036, 131, 109, 128, 117, 20564, 117, 10259, 113, 29653, 35976, 114, 124, 120, 122, 120, 10919, 137, 127, 119, 52182, 10929, 110, 151, 30889, 132, 125, 20728, 10107, 125, 13386, 33799, 10240, 132, 49622, 11281, 118, 128, 119, 10365, 110 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "Am", "##oun", "##t", "Co", "##up", "##on", "Yi", "##eld", "Price", "Con", "##c", "." ], "ids": [ 13567, 11500, 43971, 10123, 13098, 14590, 10263, 40512, 24317, 23002, 12845, 10350, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1998", "575", ",", "000" ], "ids": [ 10363, 42813, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1999", "610", ",", "000" ], "ids": [ 10324, 33427, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "2000", "650", ",", "000" ], "ids": [ 10180, 21132, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "2001", "685", ",", "000" ], "ids": [ 10272, 58986, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "2002", "730", ",", "000" ], "ids": [ 10276, 45177, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "COM", "##P", "##ET", "##IT", "##IV", "##E", "PR", "##E", "-", "SA", "##LE", "CO", "##NT", "##RI", "##BU", "##TE", "##D", "BY", "J", ".", "J", ".", "K", "##EN", "##NY", "K", "-", "SH", "##EE", "##TS", ":" ], "ids": [ 80645, 11127, 52338, 37611, 91238, 11259, 23837, 11259, 118, 21318, 51036, 32992, 77261, 46876, 108865, 29833, 11490, 66710, 147, 119, 147, 119, 148, 50655, 85771, 148, 118, 38702, 95825, 36545, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##LA", "##NC", "##E", "-", "Ohio", "ref", "##und", "##ing", "bonds", "at", "$", "290", ",", "000", "." ], "ids": [ 39999, 44376, 100230, 11259, 118, 13608, 48056, 17242, 10230, 93163, 10160, 109, 21138, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##AT", "##E", "OF", "OH", "##IO" ], "ids": [ 53317, 32071, 11259, 23240, 29639, 37174 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "RE", ":", "$", "70", ",", "375", ",", "000" ], "ids": [ 71033, 131, 109, 10923, 117, 25403, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "OH", "##IO", "B", "##UI", "##LD", "##ING", "AU", "##TH", "##OR", "##IT", "##Y", ")" ], "ids": [ 113, 29639, 37174, 139, 83259, 62943, 50183, 29088, 109166, 42622, 37611, 14703, 114 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "ST", "##AT", "##E", "FA", "##CI", "##L", "##IT", "##IE", "##S", "RE", "##F", "##UN", "##DI", "##NG", "B", "##ON", "##DS" ], "ids": [ 53317, 32071, 11259, 20794, 89955, 11369, 37611, 71655, 10731, 71033, 11565, 69849, 58730, 34065, 139, 30118, 33953 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1996", "SE", "##RI", "##ES", "A" ], "ids": [ 10389, 23056, 46876, 25054, 138 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "RE", "##PR", "##IC", "##ING", "OF", "THE", "BA", "##LA", "##NC", "##E", "OF", "THE", "B", "##ON", "##DS", "IN", "THE", "ACC", "##O", "##UN", "##T", "." ], "ids": [ 71033, 73386, 30889, 50183, 23240, 17443, 39999, 44376, 100230, 11259, 23240, 17443, 139, 30118, 33953, 36351, 17443, 106857, 11403, 69849, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ",", "215", ",", "000", ".", "00" ], "ids": [ 130, 117, 22050, 117, 10259, 119, 11025 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##CA", "##SE", "##K", "GO", "##VE", "##RN", "##ME", "##NT", "OF", "##F", "##IC", "##E", "B", "##UI", "##LD", "##ING" ], "ids": [ 152, 46900, 39039, 11733, 41525, 68560, 90412, 42424, 77261, 23240, 11565, 30889, 11259, 139, 83259, 62943, 50183 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "C", ")" ], "ids": [ 113, 140, 114 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "MO", "##OD", "##Y", "'", "S", ":", "A1", "S", "&", "P", ":", "AA", "-", "F", "##IT", "##CH", ":", "AA", "-" ], "ids": [ 102059, 77836, 14703, 112, 156, 131, 30183, 156, 111, 153, 131, 30369, 118, 143, 37611, 86448, 131, 30369, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##NF", "##IR", "##ME", "##D", "CO", "##NF", "##IR", "##ME", "##D" ], "ids": [ 32992, 94954, 73522, 42424, 11490, 32992, 94954, 73522, 42424, 11490 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Del", "##iver", "##y", "Date", ":", "08", "/", "29", "/", "1996" ], "ids": [ 15973, 37884, 10157, 29897, 131, 11052, 120, 10386, 120, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mat", "##uri", "##ty", "Balance", "Co", "##up", "##on", "List" ], "ids": [ 57471, 13091, 11195, 100777, 13098, 14590, 10263, 12339 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", "/", "01", "/", "1998", "##C", "125", "##M", "4", ".", "50", "4", ".", "20" ], "ids": [ 10150, 120, 10669, 120, 10363, 10858, 14048, 11517, 125, 119, 10462, 125, 119, 10197 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ",", "045", ",", "000", ".", "00" ], "ids": [ 127, 117, 98603, 117, 10259, 119, 11025 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "V", "##ER", "##N", "RI", "##FF", "##E", "CE", "##NT", "##ER" ], "ids": [ 159, 24093, 11537, 56658, 82678, 11259, 31078, 77261, 24093 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "D", ")" ], "ids": [ 113, 141, 114 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "MO", "##OD", "##Y", "'", "S", ":", "A1", "S", "&", "P", ":", "AA", "-", "F", "##IT", "##CH", ":", "AA", "-" ], "ids": [ 102059, 77836, 14703, 112, 156, 131, 30183, 156, 111, 153, 131, 30369, 118, 143, 37611, 86448, 131, 30369, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##NF", "##IR", "##ME", "##D", "CO", "##NF", "##IR", "##ME", "##D" ], "ids": [ 32992, 94954, 73522, 42424, 11490, 32992, 94954, 73522, 42424, 11490 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Del", "##iver", "##y", "Date", ":", "08", "/", "29", "/", "1996" ], "ids": [ 15973, 37884, 10157, 29897, 131, 11052, 120, 10386, 120, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mat", "##uri", "##ty", "Balance", "Co", "##up", "##on", "List" ], "ids": [ 57471, 13091, 11195, 100777, 13098, 14590, 10263, 12339 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", "/", "01", "/", "1998", "##D", "165", "##M", "4", ".", "50", "4", ".", "20" ], "ids": [ 10150, 120, 10669, 120, 10363, 11490, 19233, 11517, 125, 119, 10462, 125, 119, 10197 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Grand", "Total", ":", "290", "##M" ], "ids": [ 11319, 25220, 131, 21138, 11517 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Goldman", ",", "Sachs", "&", "Co", "." ], "ids": [ 57886, 117, 65631, 111, 13098, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "A", ".", "G", ".", "Edwards", "&", "Sons", ",", "Inc", "." ], "ids": [ 138, 119, 144, 119, 17263, 111, 17747, 117, 13604, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Ban", "##c", "One", "Capital", "Corporation" ], "ids": [ 21631, 10350, 11340, 21433, 14456 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "S", ".", "B", ".", "K", "-", "Brooks", "Investment", "Corp", "." ], "ids": [ 156, 119, 139, 119, 148, 118, 27625, 63254, 44687, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Season", "##go", "##od", "&", "Mayer" ], "ids": [ 23179, 10797, 12680, 111, 29018 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "-", "U", ".", "S", ".", "Municipal", "Des", "##k", ",", "212", "-", "859", "-", "1650" ], "ids": [ 118, 118, 158, 119, 156, 119, 18069, 13810, 10174, 117, 22023, 118, 80786, 118, 29117 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Washington", "Post", "business", "-", "Aug", "26", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 11586, 14539, 14155, 118, 53012, 10314, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Washington", "Post", "carried", "only", "local", "business", "stories", "on", "August", "26", ",", "1996", "." ], "ids": [ 10117, 11586, 14539, 21086, 10893, 11436, 14155, 21158, 10135, 10735, 10314, 117, 10389, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chelsea", "makes", "political", "debut", "on", "Clinton", "train", "trip", "." ], "ids": [ 21450, 20562, 13736, 13424, 10135, 24139, 17767, 37307, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "CH", "##IL", "##L", "##IC", "##OT", "##H", "##E", ",", "Ohio", "1996", "-", "08", "-", "25" ], "ids": [ 39774, 38850, 11369, 30889, 62146, 12396, 11259, 117, 13608, 10389, 118, 11052, 118, 10258 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Chelsea", "Clinton", ",", "until", "now", "care", "##fully", "shield", "##ed", "from", "the", "exposure", "of", "public", "life", ",", "made", "her", "political", "debut", "on", "Sunday", "on", "her", "father", "'", "s", "w", "##his", "##tles", "##top", "train", "trip", "." ], "ids": [ 118, 21450, 24139, 117, 11444, 11858, 11131, 42920, 88939, 10336, 10188, 10105, 56771, 10108, 11683, 12103, 117, 11019, 10485, 13736, 13424, 10135, 19731, 10135, 10485, 13194, 112, 187, 191, 49311, 37627, 37253, 17767, 37307, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chelsea", ",", "16", ",", "was", "at", "President", "Bill", "Clinton", "'", "s", "side", "as", "he", "rode", "the", "rail", "##s", "through", "parts", "of", "West", "Virginia", ",", "Kentucky", "and", "Ohio", ",", "and", "was", "introduced", "at", "every", "stop", "." ], "ids": [ 21450, 117, 10250, 117, 10134, 10160, 12811, 13160, 24139, 112, 187, 12250, 10146, 10261, 53895, 10105, 29547, 10107, 11222, 15569, 10108, 11164, 13634, 117, 19627, 10111, 13608, 117, 10111, 10134, 17037, 10160, 14234, 20517, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "even", "worked", "ro", "##peli", "##nes", ",", "sh", "##aki", "##ng", "hands", "with", "ex", "##cited", "fans", "." ], "ids": [ 11149, 13246, 13858, 25470, 77558, 11496, 117, 48201, 22471, 10376, 27925, 10169, 11419, 96691, 20950, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hillary", "Rod", "##ham", "Clinton", "saw", "her", "husband", "and", "daughter", "off", "on", "the", "trip", "in", "Huntington", ",", "West", "Virginia", "and", "then", "went", "on", "to", "Chicago", "to", "begin", "a", "ri", "##gor", "##ous", "Democratic", "Convention", "schedule", "." ], "ids": [ 72734, 30602, 13196, 24139, 17112, 10485, 19634, 10111, 15243, 11898, 10135, 10105, 37307, 10106, 71552, 117, 11164, 13634, 10111, 11059, 13446, 10135, 10114, 12317, 10114, 16135, 169, 29956, 28025, 13499, 19281, 25318, 52561, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Ask", "##ed", "if", "Chelsea", "would", "have", "a", "prominent", "role", "in", "the", "campaign", ",", "White", "House", "spoke", "##sman", "Mike", "M", "##c", "##C", "##ur", "##ry", "said", ":", "\"", "She", "'", "ll", "do", "what", "she", "did", "today", "when", "she", "can", "." ], "ids": [ 93919, 10336, 12277, 21450, 10894, 10529, 169, 22861, 12971, 10106, 10105, 17323, 117, 12136, 11545, 50005, 24305, 13270, 150, 10350, 10858, 10546, 10908, 12415, 131, 107, 11149, 112, 22469, 10149, 12976, 10833, 12172, 18745, 10841, 10833, 10944, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "has", "to", "go", "back", "to", "school", ".", "\"" ], "ids": [ 11149, 10393, 10114, 11783, 12014, 10114, 11393, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "president", "'", "s", "daughter", "is", "going", "into", "her", "senior", "year", "of", "high", "school", "at", "Sid", "##well", "Friends", "School", ",", "a", "private", "school", "in", "Washington", "." ], "ids": [ 10117, 12931, 112, 187, 15243, 10124, 19090, 10708, 10485, 17843, 10924, 10108, 11846, 11393, 10160, 31091, 15862, 23113, 10984, 117, 169, 14591, 11393, 10106, 11586, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "M", "##c", "##C", "##ur", "##ry", "said", "Chelsea", "has", "asked", "to", "go", "on", "the", "train", "trip", "and", "attend", "the", "convention", "where", "her", "father", "will", "be", "ren", "##omina", "##ted", ",", "but", "said", "her", "exposure", "did", "not", "signal", "the", "start", "of", "a", "new", "political", "career", "." ], "ids": [ 150, 10350, 10858, 10546, 10908, 12415, 21450, 10393, 22151, 10114, 11783, 10135, 10105, 17767, 37307, 10111, 34465, 10105, 37812, 10940, 10485, 13194, 11337, 10347, 63256, 103637, 11912, 117, 10473, 12415, 10485, 56771, 12172, 10472, 25495, 10105, 15148, 10108, 169, 10751, 13736, 13021, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chelsea", "\"", "is", "a", "very", "pois", "##ed", "young", "lady", ",", "but", "she", "'", "s", "not", "that", "much", "interested", "in", "politics", ",", "\"", "the", "spoke", "##sman", "said", "." ], "ids": [ 21450, 107, 10124, 169, 12558, 20487, 10336, 14739, 61082, 117, 10473, 10833, 112, 187, 10472, 10189, 13172, 40905, 10106, 25674, 117, 107, 10105, 50005, 24305, 12415, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "closing", "share", "market", "report", "." ], "ids": [ 17693, 57409, 23867, 17313, 17553, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "26" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "shares", "drift", "##ed", "to", "a", "lower", "close", "on", "Monday", ",", "drag", "##ged", "down", "by", "weak", "##ness", "in", "the", "domestic", "bond", "market", "and", "turno", "##ver", "de", "##pressed", "by", "the", "UK", "bank", "holiday", "and", "lack", "of", "any", "significant", "U", ".", "S", ".", "economic", "data", "." ], "ids": [ 17693, 45751, 60246, 10336, 10114, 169, 18165, 16065, 10135, 40714, 117, 71840, 18832, 12935, 10155, 61285, 14010, 10106, 10105, 31084, 55185, 17313, 10111, 17440, 12563, 10104, 96616, 10155, 10105, 10523, 19423, 71806, 10111, 23582, 10108, 11178, 17912, 158, 119, 156, 119, 13925, 11165, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "The", "AE", "##X", "index", "of", "leading", "shares", "closed", "4", ".", "54", "points", "easier", "at", "556", ".", "19", ",", "the", "day", "'", "s", "low", "." ], "ids": [ 10117, 35060, 12674, 19776, 10108, 16018, 45751, 18440, 125, 119, 11653, 12789, 81853, 10160, 54919, 119, 10270, 117, 10105, 11940, 112, 187, 15626, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Dutch", "market", "had", "been", "on", "the", "defensive", "all", "day", "but", "a", "soft", "##er", "start", "to", "Wall", "Street", "did", "little", "to", "bo", "##ost", "sentiment", "in", "late", "trade", ",", "deal", "##ers", "said", "." ], "ids": [ 10117, 17693, 17313, 10374, 10590, 10135, 10105, 38385, 10435, 11940, 10473, 169, 44898, 10165, 15148, 10114, 19523, 11962, 12172, 16745, 10114, 20506, 18239, 70762, 10106, 13002, 18908, 117, 19918, 10901, 12415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "was", "always", "going", "to", "be", "a", "tou", "##gh", "day", "with", "participation", "so", "low", "." ], "ids": [ 107, 10377, 10134, 19540, 19090, 10114, 10347, 169, 52586, 15774, 11940, 10169, 25784, 10380, 15626, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "only", "thing", "really", "wo", "##rry", "##ing", "the", "market", "was", "the", "bonds", ",", "and", "that", "drag", "##ged", "us", "lower", ",", "\"", "one", "deal", "##er", "said", "." ], "ids": [ 16976, 10105, 10893, 40414, 30181, 12796, 31862, 10230, 10105, 17313, 10134, 10105, 93163, 117, 10111, 10189, 71840, 18832, 19626, 18165, 117, 107, 10464, 19918, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stock", "##s", "were", "down", "across", "the", "board", ",", "with", "Dutch", "PTT", "top", "##ping", "the", "volume", "list", "and", "closing", "down", "1", ".", "90", "gu", "##ild", "##ers", "at", "58", ".", "70", "." ], "ids": [ 31916, 10107, 10309, 12935, 15130, 10105, 17936, 117, 10169, 17693, 26227, 12364, 15398, 10105, 15901, 13416, 10111, 57409, 12935, 122, 119, 10919, 75980, 65820, 10901, 10160, 11824, 119, 10923, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "post", "and", "tele", "##com", "##s", "firm", "posted", "an", "8", ".", "5", "percent", "rise", "in", "first", "half", "earning", "##s", "on", "Friday", ",", "just", "below", "anal", "##yst", "##s", "'", "ex", "##pectations", "." ], "ids": [ 10117, 11841, 10111, 56142, 22530, 10107, 23410, 51232, 10151, 129, 119, 126, 22362, 28710, 10106, 10422, 13877, 56981, 10107, 10135, 30767, 117, 12820, 17544, 106615, 62769, 10107, 112, 11419, 96815, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "##HC", "Cal", "##and", "reported", "first", "half", "results", "well", "under", "for", "##eca", "##sts", "on", "Monday", "and", "the", "shares", "suffered", "as", "a", "result", "." ], "ids": [ 146, 41524, 41280, 14752, 15943, 10422, 13877, 17466, 11206, 10571, 10142, 33588, 28036, 10135, 40714, 10111, 10105, 45751, 26090, 10146, 169, 14493, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "were", "trading", "un", "##chang", "##ed", "just", "before", "the", "release", "of", "figures", "but", "closed", "2", ".", "40", "gu", "##ild", "##ers", "down", "at", "80", ".", "70", "after", "it", "reported", "net", "profits", "of", "34", ".", "9", "million", "gu", "##ild", "##ers", "against", "36", ".", "6", "million", "last", "year", "and", "estimates", "ranging", "from", "37", ".", "5", "to", "47", ".", "2", "million", "." ], "ids": [ 11696, 10309, 46663, 10119, 64208, 10336, 12820, 11360, 10105, 14072, 10108, 21068, 10473, 18440, 123, 119, 10533, 75980, 65820, 10901, 12935, 10160, 10832, 119, 10923, 10662, 10271, 15943, 11988, 100106, 10108, 11069, 119, 130, 12473, 75980, 65820, 10901, 11327, 11055, 119, 127, 12473, 12469, 10924, 10111, 45870, 55432, 10188, 11204, 119, 126, 10114, 11413, 119, 123, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "##HC", "also", "for", "##eca", "##st", "post", "tax", "earning", "##s", "rising", "21", "percent", "for", "the", "full", "year", "." ], "ids": [ 146, 41524, 10379, 10142, 33588, 10562, 11841, 25468, 56981, 10107, 53816, 10296, 22362, 10142, 10105, 13375, 10924, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bank", "##ing", "group", "IN", "##G", "traded", "ex", "-", "divide", "##nd", "today", "and", "finished", "0", ".", "60", "gu", "##ild", "##ers", "weak", "##er", "at", "52", ".", "90", "as", "a", "result", "." ], "ids": [ 13533, 10230, 11795, 36351, 11447, 52696, 11419, 118, 41430, 11534, 18745, 10111, 15972, 121, 119, 10709, 75980, 65820, 10901, 61285, 10165, 10160, 11525, 119, 10919, 10146, 169, 14493, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Nu", "##trici", "##a", "sh", "##rug", "##ged", "off", "its", "ex", "-", "div", "tag", "to", "soa", "##r", "a", "further", "4", ".", "10", "gu", "##ild", "##ers", "to", "214", ".", "40", "continuing", "its", "ex", "##plosive", "rally", "sp", "##ark", "##ed", "by", "the", "51", "percent", "jump", "in", "first", "half", "net", "profits", "last", "week", ",", "which", "set", "the", "market", "ali", "##ght", "on", "Friday", ",", "sending", "the", "shares", "up", "18", ".", "40", "at", "210", ".", "00", "by", "the", "close", "." ], "ids": [ 16976, 28336, 80576, 10113, 48201, 58550, 18832, 11898, 10474, 11419, 118, 76486, 37836, 10114, 56108, 10129, 169, 14586, 125, 119, 10150, 75980, 65820, 10901, 10114, 23759, 119, 10533, 47635, 10474, 11419, 83655, 58575, 32650, 36269, 10336, 10155, 10105, 11524, 22362, 54941, 10106, 10422, 13877, 11988, 100106, 12469, 16118, 117, 10319, 11847, 10105, 17313, 12134, 20687, 10135, 30767, 117, 67306, 10105, 45751, 10741, 10218, 119, 10533, 10160, 17131, 119, 11025, 10155, 10105, 16065, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Engineering", "concern", "St", "##or", "##k", "started", "the", "day", "well", "as", "the", "shares", "attracted", "some", "follow", "-", "through", "interest", "to", "the", "announcement", "late", "on", "Friday", "that", "its", "Fokker", "Aviation", "unit", "had", "won", "a", "major", "order", "." ], "ids": [ 18952, 43607, 10838, 10667, 10174, 13457, 10105, 11940, 11206, 10146, 10105, 45751, 48906, 11152, 28086, 118, 11222, 17644, 10114, 10105, 76557, 13002, 10135, 30767, 10189, 10474, 69476, 28561, 16511, 10374, 11367, 169, 11922, 12990, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "rally", "was", "short", "-", "lived", "and", "St", "##or", "##k", "ended", "just", "0", ".", "20", "up", "at", "51", ".", "00", "gu", "##ild", "##ers", "." ], "ids": [ 16976, 10105, 58575, 10134, 13716, 118, 17603, 10111, 10838, 10667, 10174, 18428, 12820, 121, 119, 10197, 10741, 10160, 11524, 119, 11025, 75980, 65820, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Amsterdam", "News", "##room", "+", "31", "20", "504", "5000" ], "ids": [ 118, 118, 14017, 12219, 25525, 116, 10413, 10197, 43098, 17436 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##pie", "to", "quit", "French", "assembly", "seat", "as", "film", "opens", "." ], "ids": [ 14248, 19237, 10114, 101237, 11894, 38946, 17687, 10146, 10458, 70702, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "26" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "businessman", "and", "soccer", "boss", "Bernard", "Ta", "##pie", "said", "that", "he", "would", "give", "up", "his", "seat", "in", "the", "National", "Assembly", "by", "Wednesday", ",", "the", "day", "a", "film", "by", "Claude", "Le", "##lou", "##che", "in", "which", "he", "stars", "opens", "in", "France", "." ], "ids": [ 42355, 49910, 10111, 41356, 48246, 14450, 14248, 19237, 12415, 10189, 10261, 10894, 18090, 10741, 10226, 17687, 10106, 10105, 10655, 17918, 10155, 57611, 117, 10105, 11940, 169, 10458, 10155, 14318, 10281, 37925, 11119, 10106, 10319, 10261, 20756, 70702, 10106, 10688, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "I", "will", "no", "longer", "be", "deputy", "by", "the", "time", "the", "film", "opens", ",", "\"", "he", "said", "in", "a", "broadcast", "interview", "." ], "ids": [ 107, 146, 11337, 10192, 20165, 10347, 45404, 10155, 10105, 10635, 10105, 10458, 70702, 117, 107, 10261, 12415, 10106, 169, 21391, 21213, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Just", "about", ",", "\"", "he", "told", "Europe", "1", "radio", "when", "asked", "whether", "he", "had", "sent", "his", "letter", "of", "resignation", "to", "Assembly", "speaker", "Philippe", "Se", "##guin", "." ], "ids": [ 107, 17116, 10978, 117, 107, 10261, 21937, 11767, 122, 12429, 10841, 22151, 21883, 10261, 10374, 14541, 10226, 19310, 10108, 66129, 10114, 17918, 57738, 15408, 11045, 86041, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9 ] }, { "tokens": [ "A", "Se", "##guin", "spoke", "##s", "##woman", "confirmed", "that", "no", "letter", "or", "call", "had", "yet", "been", "received", "." ], "ids": [ 138, 11045, 86041, 50005, 10107, 79999, 27347, 10189, 10192, 19310, 10345, 20575, 10374, 21833, 10590, 12296, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##pie", ",", "53", ",", "was", "res", "##ign", "##ing", "just", "ahead", "of", "expected", "government", "action", "to", "eje", "##ct", "him", "from", "the", "Assembly", "following", "a", "finding", "by", "the", "Supreme", "Court", "that", "he", "was", "bank", "##rupt", "and", "thus", "in", "##elig", "##ible", "for", "public", "office", "for", "a", "five", "-", "year", "period", "." ], "ids": [ 14248, 19237, 117, 11756, 117, 10134, 39429, 58445, 10230, 12820, 35629, 10108, 25973, 12047, 14204, 10114, 86923, 14526, 10957, 10188, 10105, 17918, 11901, 169, 43977, 10155, 10105, 22872, 14100, 10189, 10261, 10134, 19423, 46791, 10111, 18450, 10106, 44134, 22529, 10142, 11683, 14301, 10142, 169, 12403, 118, 10924, 13127, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##pie", ",", "the", "target", "of", "a", "bli", "##zza", "##rd", "of", "legal", "actions", "over", "his", "now", "-", "destroyed", "business", "empire", "and", "the", "Marseille", "soccer", "team", "he", "once", "ran", ",", "has", "a", "starring", "role", "in", "Le", "##lou", "##che", "'", "s", "\"", "Homme", ",", "femmes", ":", "mode", "d", "'", "emploi", "\"", "(", "Men", ",", "women", ":", "instructions", "for", "use", ")", "." ], "ids": [ 14248, 19237, 117, 10105, 28564, 10108, 169, 19457, 15003, 12023, 10108, 17139, 22115, 10491, 10226, 11858, 118, 24089, 14155, 34873, 10111, 10105, 25016, 41356, 11121, 10261, 14907, 17044, 117, 10393, 169, 27519, 12971, 10106, 10281, 37925, 11119, 112, 187, 107, 39237, 117, 21560, 131, 18417, 172, 112, 41305, 107, 113, 13026, 117, 13190, 131, 68026, 10142, 11760, 114, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "plays", "a", "power", "-", "hung", "##ry", "lawyer", "in", "the", "movie", "described", "as", "\"", "a", "tender", "and", "cruel", "comedy", "\"", "by", "Le", "##lou", "##che", ",", "who", "is", "making", "his", "35", "##th", "film", "." ], "ids": [ 10357, 17724, 169, 13183, 118, 68971, 10908, 38055, 10106, 10105, 18379, 13010, 10146, 107, 169, 96486, 10111, 105034, 25737, 107, 10155, 10281, 37925, 11119, 117, 10479, 10124, 14293, 10226, 10803, 11143, 10458, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "have", "paid", "too", "dea", "##rly", "for", "mixing", "two", "careers", ",", "\"", "Ta", "##pie", "said", ".", "\"" ], "ids": [ 107, 146, 10529, 25938, 16683, 42492, 52347, 10142, 53413, 10551, 110196, 117, 107, 14248, 19237, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "In", "France", ",", "you", "cannot", "be", "a", "film", "artist", "and", "a", "national", "politician", "at", "the", "same", "time", "." ], "ids": [ 10167, 10688, 117, 13028, 25259, 10347, 169, 10458, 16410, 10111, 169, 11844, 20354, 10160, 10105, 11561, 10635, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "is", "why", "I", "will", "no", "longer", "be", "deputy", "by", "the", "time", "the", "film", "opens", ".", "\"" ], "ids": [ 13646, 10124, 31237, 146, 11337, 10192, 20165, 10347, 45404, 10155, 10105, 10635, 10105, 10458, 70702, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Justice", "Minister", "Jacques", "To", "##ub", "##on", "began", "last", "month", "the", "formal", "process", "of", "eje", "##cting", "Ta", "##pie", "from", "the", "French", "parliament", "as", "well", "as", "strip", "##ping", "him", "of", "his", "seat", "in", "the", "European", "parliament", "." ], "ids": [ 17086, 14355, 12745, 11469, 20664, 10263, 11941, 12469, 14064, 10105, 23129, 15138, 10108, 86923, 64716, 14248, 19237, 10188, 10105, 11894, 40519, 10146, 11206, 10146, 44445, 15398, 10957, 10108, 10226, 17687, 10106, 10105, 11914, 40519, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "French", "procedure", "was", "expected", "to", "be", "completed", "before", "October", "2", ",", "when", "the", "National", "Assembly", "is", "to", "re", "##con", "##vene", "after", "a", "summer", "break", ",", "but", "the", "European", "procedure", "was", "expected", "to", "take", "longer", "." ], "ids": [ 10117, 11894, 48244, 10134, 25973, 10114, 10347, 15782, 11360, 11212, 123, 117, 10841, 10105, 10655, 17918, 10124, 10114, 11639, 23486, 61190, 10662, 169, 17995, 24194, 117, 10473, 10105, 11914, 48244, 10134, 25973, 10114, 13574, 20165, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##pie", "'", "s", "lawyer", "has", "said", "he", "inte", "##nds", "to", "appeal", "to", "the", "European", "Court", "of", "Human", "Rights", "in", "an", "effort", "to", "prevent", "or", "delay", "the", "loss", "of", "his", "European", "seat", "." ], "ids": [ 14248, 19237, 112, 187, 38055, 10393, 12415, 10261, 14168, 27090, 10114, 44861, 10114, 10105, 11914, 14100, 10108, 15426, 22305, 10106, 10151, 24912, 10114, 29320, 10345, 76497, 10105, 18576, 10108, 10226, 11914, 17687, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "But", "such", "an", "appeal", ",", "even", "if", "the", "court", "were", "to", "accept", "the", "case", ",", "which", "it", "is", "not", "ob", "##lige", "##d", "to", "do", ",", "would", "not", "sus", "##pend", "enforcement", "of", "the", "French", "judge", "##ment", "against", "him", "." ], "ids": [ 16976, 11049, 10151, 44861, 117, 13246, 12277, 10105, 14866, 10309, 10114, 45218, 10105, 13474, 117, 10319, 10271, 10124, 10472, 17339, 14425, 10162, 10114, 10149, 117, 10894, 10472, 10846, 63592, 64736, 10108, 10105, 11894, 31624, 10426, 11327, 10957, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##pie", "faces", "a", "probable", "spell", "in", "prison", "after", "he", "lose", "##s", "his", "parliamentary", "im", "##mun", "##ity", ",", "since", "two", "appeal", "courts", "have", "confirmed", "jail", "sentence", "##s", "of", "eight", "and", "six", "months", "against", "him", "for", "tax", "fraud", "and", "ri", "##gging", "a", "soccer", "match", "." ], "ids": [ 14248, 19237, 48343, 169, 38400, 76738, 10106, 20538, 10662, 10261, 48742, 10107, 10226, 50485, 10211, 34326, 11949, 117, 11764, 10551, 44861, 32860, 10529, 27347, 75934, 49219, 10107, 10108, 16222, 10111, 12449, 15555, 11327, 10957, 10142, 25468, 93070, 10111, 29956, 54468, 169, 41356, 12356, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "is", "appeal", "##ing", "in", "both", "cases", "to", "the", "Supreme", "Court", "." ], "ids": [ 10357, 10124, 44861, 10230, 10106, 11408, 16480, 10114, 10105, 22872, 14100, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Bank", "of", "France", "dra", "##ins", "3", ".", "9", "bl", "##n", "F", "##fr", "at", "tender", "." ], "ids": [ 13533, 10108, 10688, 68507, 14411, 124, 119, 130, 21484, 10115, 143, 71843, 10160, 96486, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "26" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Bank", "of", "France", "dra", "##ined", "3", ".", "9", "billion", "francs", "at", "a", "sec", "##urities", "rep", "##ur", "##chas", "##e", "tender", "held", "on", "Monday", "to", "allo", "##cate", "funds", "for", "injection", "into", "the", "money", "market", "on", "Tuesday", "." ], "ids": [ 10117, 13533, 10108, 10688, 68507, 28751, 124, 119, 130, 25848, 49303, 10160, 169, 37913, 82073, 76456, 10546, 30389, 10112, 96486, 11991, 10135, 40714, 10114, 20779, 26054, 32067, 10142, 91879, 10708, 10105, 17920, 17313, 10135, 70245, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "accepted", "bid", "##s", "for", "44", ".", "3", "billion", "francs", "in", "new", "liquid", "##ity", ",", "3", ".", "9", "billion", "less", "than", "the", "48", ".", "2", "billion", "leaving", "the", "market", "on", "Tuesday", "when", "a", "previous", "pa", "##ct", "ex", "##pire", "##s", "." ], "ids": [ 10377, 24926, 50385, 10107, 10142, 11126, 119, 124, 25848, 49303, 10106, 10751, 58538, 11949, 117, 124, 119, 130, 25848, 15306, 11084, 10105, 11300, 119, 123, 25848, 21005, 10105, 17313, 10135, 70245, 10841, 169, 16741, 10931, 14526, 11419, 72079, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "new", "pa", "##ct", "ex", "##pire", "##s", "on", "September", "3", "." ], "ids": [ 10117, 10751, 10931, 14526, 11419, 72079, 10107, 10135, 10596, 124, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Bank", "of", "France", "said", "it", "allocated", "13", ".", "4", "billion", "francs", "to", "bid", "##ders", "offering", "Treasury", "bill", "##s", "as", "coll", "##ater", "##al", ",", "sat", "##is", "##fying", "3", ".", "4", "percent", "of", "such", "demand", "." ], "ids": [ 10117, 13533, 10108, 10688, 12415, 10271, 99109, 10249, 119, 125, 25848, 49303, 10114, 50385, 25779, 42281, 77201, 34497, 10107, 10146, 28552, 38524, 10415, 117, 20694, 10291, 62596, 124, 119, 125, 22362, 10108, 11049, 34394, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "allo", "##tted", "a", "further", "30", ".", "9", "billion", "to", "bid", "##ders", "putting", "up", "private", "paper", ",", "sat", "##is", "##fying", "12", ".", "5", "percent", "of", "this", "demand", "." ], "ids": [ 10377, 20779, 95408, 169, 14586, 10244, 119, 130, 25848, 10114, 50385, 25779, 71028, 10741, 14591, 17895, 117, 20694, 10291, 62596, 10186, 119, 126, 22362, 10108, 10531, 34394, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Paris", "News", "##room", "+", "33", "1", "422", "##1", "545", "##2" ], "ids": [ 118, 118, 10728, 12219, 25525, 116, 11000, 122, 38735, 10759, 49589, 10729 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RA", "##B", "##O", "##BA", "##NK", "[", "RA", "##B", "##N", ".", "CN", "]", "SE", "##ES", "H", "##2", "NET", "GR", "##OW", "##TH", "UN", "##DE", "##R", "10", "PC", "##T", "." ], "ids": [ 64007, 11274, 11403, 35999, 78043, 164, 64007, 11274, 11537, 119, 73067, 166, 23056, 25054, 145, 10729, 41645, 58787, 33893, 109166, 26578, 60675, 11273, 10150, 16355, 11090, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "26" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "co", "-", "operative", "bank", "Ra", "##bo", "##bank", "Nederland", "BA", "'", "s", "net", "profit", "growth", "might", "slow", "to", "less", "than", "than", "10", "year", "percent", "in", "the", "second", "half", "of", "1996", ",", "executive", "board", "chairman", "Herman", "Wi", "##jf", "##fels", "said", "on", "Monday", "." ], "ids": [ 17693, 11170, 118, 75721, 19423, 38571, 11790, 20583, 16059, 39999, 112, 187, 11988, 25081, 14609, 20970, 41573, 10114, 15306, 11084, 11084, 10150, 10924, 22362, 10106, 10105, 11132, 13877, 10108, 10389, 117, 22676, 17936, 27627, 22303, 52742, 63194, 52163, 12415, 10135, 40714, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "The", "un", "##liste", "##d", "bank", "earlier", "announced", "a", "1996", "interim", "net", "profit", "of", "853", "million", "gu", "##ild", "##ers", ",", "up", "21", ".", "5", "percent", "on", "the", "702", "million", "gu", "##ild", "##ers", "reported", "in", "the", "first", "half", "of", "1995", "." ], "ids": [ 10117, 10119, 26719, 10162, 19423, 18905, 13854, 169, 10389, 63313, 11988, 25081, 10108, 73149, 12473, 75980, 65820, 10901, 117, 10741, 10296, 119, 126, 22362, 10135, 10105, 62049, 12473, 75980, 65820, 10901, 15943, 10106, 10105, 10422, 13877, 10108, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "second", "-", "half", "profit", "growth", "would", "de", "##pend", "on", "customer", "demand", "for", "loans", ",", "which", "was", "already", "ea", "##sing", ",", "and", "the", "performance", "of", "financial", "markets", ",", "which", "were", "strong", "in", "the", "first", "half", "and", "bo", "##oste", "##d", "sec", "##urities", ",", "trading", "and", "under", "##writing", "income", "." ], "ids": [ 10357, 12415, 11132, 118, 13877, 25081, 14609, 10894, 10104, 63592, 10135, 72378, 34394, 10142, 106416, 117, 10319, 10134, 19034, 22257, 16357, 117, 10111, 10105, 14432, 10108, 20570, 42893, 117, 10319, 10309, 18093, 10106, 10105, 10422, 13877, 10111, 20506, 45722, 10162, 37913, 82073, 117, 46663, 10111, 10571, 74847, 18245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "ex", "##pect", "reason", "##able", "growth", "in", "the", "second", "half", "." ], "ids": [ 107, 12865, 11419, 51511, 27949, 13096, 14609, 10106, 10105, 11132, 13877, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Maybe", "it", "will", "be", "in", "single", "-", "dig", "##its", ",", "\"", "Wi", "##jf", "##fels", "told", "Reuters", "." ], "ids": [ 107561, 10271, 11337, 10347, 10106, 11376, 118, 80592, 15508, 117, 107, 52742, 63194, 52163, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 9 ] }, { "tokens": [ "He", "said", "growth", "in", "customer", "demand", "in", "the", "first", "half", "was", "50", "percent", "above", "normal", "but", "it", "was", "hard", "to", "maintain", "this", "pace", "." ], "ids": [ 10357, 12415, 14609, 10106, 72378, 34394, 10106, 10105, 10422, 13877, 10134, 10462, 22362, 16038, 16626, 10473, 10271, 10134, 19118, 10114, 37215, 10531, 32547, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ra", "##bo", "##bank", "'", "s", "net", "profit", "was", "1", ".", "43", "billion", "gu", "##ild", "##ers", "in", "1995", "." ], "ids": [ 38571, 11790, 20583, 112, 187, 11988, 25081, 10134, 122, 119, 11370, 25848, 75980, 65820, 10901, 10106, 10436, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "bank", "earlier", "war", "##ned", "that", "profit", "growth", "would", "slow", "in", "the", "second", "half", ",", "citing", "the", "increasing", "momentum", "in", "profit", "growth", "in", "the", "comparative", "period", "of", "1995", "and", "increased", "investment", "." ], "ids": [ 10117, 19423, 18905, 10338, 17021, 10189, 25081, 14609, 10894, 41573, 10106, 10105, 11132, 13877, 117, 71306, 10105, 30816, 89635, 10106, 25081, 14609, 10106, 10105, 101258, 13127, 10108, 10436, 10111, 19299, 37933, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Wi", "##jf", "##fels", "was", "unable", "to", "quant", "##ify", "second", "half", "investment", "to", "improve", "and", "extend", "domestic", "and", "offshore", "services", "." ], "ids": [ 16976, 52742, 63194, 52163, 10134, 30553, 10114, 28784, 48281, 11132, 13877, 37933, 10114, 33992, 10111, 62504, 31084, 10111, 99806, 12639, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Garry", "West", ",", "Amsterdam", "news", "##room", "+", "31", "20", "504", "5000" ], "ids": [ 118, 118, 89374, 11164, 117, 14017, 14424, 25525, 116, 10413, 10197, 43098, 17436 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "FR", "##AN", "##CE", "-", "LE", "MO", "##ND", "##E", "AU", "##G", "26", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 64655, 41275, 43161, 118, 84977, 102059, 58521, 11259, 29088, 11447, 10314, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "26" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "leading", "stories", "in", "Monday", "'", "s", "afternoon", "daily", "Le", "Monde", ",", "dated", "Aug", "27", "." ], "ids": [ 13252, 10301, 16018, 21158, 10106, 40714, 112, 187, 73213, 27636, 10281, 33074, 117, 39724, 53012, 10365, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##ON", "##T", "PA", "##GE" ], "ids": [ 64655, 30118, 11090, 32349, 58719 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "I", "##pso", "##s", "poll", "reports", "majority", "of", "French", "public", "opinion", "sy", "##mpa", "##thi", "##ses", "with", "pl", "##ight", "of", "African", "##s", "seeking", "to", "ren", "##ew", "or", "obtain", "work", "and", "residence", "permit", "##s", ",", "calling", "government", "\"", "stub", "##born", ",", "\"", "\"", "confused", "\"", "and", "\"", "cold", "-", "heart", "##ed", ".", "\"" ], "ids": [ 118, 118, 146, 66518, 10107, 70156, 26610, 19471, 10108, 11894, 11683, 32282, 12261, 31285, 53504, 13149, 10169, 20648, 27521, 10108, 13839, 10107, 51285, 10114, 63256, 26127, 10345, 47361, 11424, 10111, 33879, 52345, 10107, 117, 37023, 12047, 107, 66337, 32315, 117, 107, 107, 73173, 107, 10111, 107, 41626, 118, 21736, 10336, 119, 107 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##US", "##INE", "##SS", "PAGES" ], "ids": [ 139, 32612, 83198, 49248, 36127 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "SNCF", "railway", "trade", "unions", "want", "ren", "##ego", "##tia", "##tion", "of", "government", "bai", "##lou", "##t", "package", ",", "as", "European", "Union", "prepare", "##s", "more", "proposals", "to", "increase", "competition", "." ], "ids": [ 118, 118, 61711, 18271, 18908, 76841, 21528, 63256, 12419, 16180, 10822, 10108, 12047, 48775, 37925, 10123, 62432, 117, 10146, 11914, 11457, 69977, 10107, 10798, 93646, 10114, 20299, 16622, 119 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "World", "steel", "market", "shows", "signs", "of", "up", "##tur", "##n", "." ], "ids": [ 118, 118, 10315, 28605, 17313, 15573, 45033, 10108, 10741, 15698, 10115, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Paris", "News", "##room", "+", "33", "1", "42", "21", "53", "81" ], "ids": [ 118, 118, 10728, 12219, 25525, 116, 11000, 122, 11276, 10296, 11756, 12324 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ATR", "##IA", "SE", "##ES", "H", "##2", "RE", "##SU", "##L", "##T", "UP", "ON", "H", "##1", "." ], "ids": [ 109174, 35976, 23056, 25054, 145, 10729, 71033, 88592, 11369, 11090, 53197, 49339, 145, 10759, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##EL", "##SI", "##NK", "##I", "1996", "-", "08", "-", "26" ], "ids": [ 145, 68999, 44802, 78043, 11281, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finnish", "foods", "##tu", "##ffs", "group", "At", "##ria", "Oy", "said", "in", "a", "statement", "on", "Monday", "it", "ex", "##pects", "its", "result", "to", "improve", "in", "the", "second", "half", "of", "1996", "compared", "to", "the", "first", "half", "." ], "ids": [ 37268, 109310, 10991, 93840, 11795, 11699, 11021, 35978, 12415, 10106, 169, 33311, 10135, 40714, 10271, 11419, 92385, 10474, 14493, 10114, 33992, 10106, 10105, 11132, 13877, 10108, 10389, 25626, 10114, 10105, 10422, 13877, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "result", "of", "the", "second", "year", "-", "half", "is", "expected", "to", "improve", "on", "the", "early", "part", "of", "the", "year", ",", "\"", "At", "##ria", "said", "." ], "ids": [ 107, 10117, 14493, 10108, 10105, 11132, 10924, 118, 13877, 10124, 25973, 10114, 33992, 10135, 10105, 11732, 10668, 10108, 10105, 10924, 117, 107, 11699, 11021, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "At", "##ria", "said", "earlier", "its", "January", "-", "June", "profit", "before", "extraordinary", "items", ",", "app", "##rop", "##riat", "##ions", "and", "taxes", "fell", "to", "15", "million", "mark", "##ka", "from", "39", "in", "the", "first", "-", "half", "of", "1995", "." ], "ids": [ 11699, 11021, 12415, 18905, 10474, 11238, 118, 11120, 25081, 11360, 105509, 34109, 117, 72894, 30698, 65441, 15880, 10111, 49870, 25194, 10114, 10208, 12473, 29221, 10371, 10188, 11303, 10106, 10105, 10422, 118, 13877, 10108, 10436, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##IG", "##HT", "-", "BE", "##L", "##GI", "##AN", "##S", "SP", "##EE", "##D", "AF", "##TER", "SC", "##H", "##UM", "##AC", "##H", "##ER", "'", "S", "W", "##IN", "." ], "ids": [ 49351, 89696, 81012, 118, 46291, 11369, 100075, 41275, 10731, 22570, 95825, 11490, 55640, 99552, 18137, 12396, 72679, 30340, 12396, 24093, 112, 156, 160, 27128, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS" ], "ids": [ 49351, 32612, 39039, 66934 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5 ] }, { "tokens": [ "Michael", "Schumacher", "'", "s", "victory", "in", "the", "Belgian", "Formula", "One", "Grand", "Prix", "at", "Spa", "-", "Franco", "##rch", "##amp", "##s", "sp", "##ark", "##ed", "a", "speed", "##ing", "epi", "##demi", "##c", "on", "Belgian", "roads", "after", "the", "race", "was", "over", "." ], "ids": [ 10631, 37761, 112, 187, 19735, 10106, 10105, 36652, 21459, 11340, 11319, 12835, 10160, 64766, 118, 16644, 24030, 53692, 10107, 32650, 36269, 10336, 169, 19085, 10230, 17247, 108986, 10350, 10135, 36652, 36970, 10662, 10105, 14025, 10134, 10491, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 2, 2, 6, 6, 6, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bel", "##ga", "news", "agency", "reported", "that", "police", "check", "##ed", "more", "than", "3", ",", "000", "drivers", "am", "##d", "book", "##ed", "222", "for", "speed", "##ing", "on", "their", "way", "home", "after", "the", "race", "." ], "ids": [ 47197, 10483, 14424, 34649, 15943, 10189, 15034, 43662, 10336, 10798, 11084, 124, 117, 10259, 54598, 10392, 10162, 12748, 10336, 22717, 10142, 19085, 10230, 10135, 10455, 13170, 11816, 10662, 10105, 14025, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "were", "clock", "##ed", "doing", "180", "kilometres", "an", "hour", "(", "112", "miles", "per", "hour", ")", ",", "Bel", "##ga", "said", "." ], "ids": [ 13885, 10309, 52843, 10336, 30918, 13912, 20127, 10151, 24730, 113, 16129, 14148, 10178, 24730, 114, 117, 47197, 10483, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Schumacher", "won", "the", "race", "in", "1", "hour", "28", "minutes", "15", ".", "125", "seconds", "at", "an", "average", "speed", "of", "208", ".", "442", "km", "/", "hour", "(", "130", "m", ".", "p", ".", "h", ".", ")", "." ], "ids": [ 37761, 11367, 10105, 14025, 10106, 122, 24730, 10348, 15304, 10208, 119, 14048, 34290, 10160, 10151, 13551, 19085, 10108, 21881, 119, 38334, 10204, 120, 24730, 113, 13389, 181, 119, 184, 119, 176, 119, 114, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thai", "PM", "propose", "##s", "Sept", "18", "for", "no", "-", "confidence", "debate", "." ], "ids": [ 26207, 46161, 30027, 10107, 51768, 10218, 10142, 10192, 118, 74187, 29632, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##NG", "##KO", "##K", "1996", "-", "08", "-", "26" ], "ids": [ 39999, 34065, 57277, 11733, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thai", "Prime", "Minister", "Ban", "##har", "##n", "Si", "##lpa", "-", "arch", "##a", "on", "Monday", "proposed", "September", "18", "as", "the", "date", "for", "parliamentary", "debate", "on", "an", "opposition", "no", "-", "confidence", "motion", "ac", "##cus", "##ing", "him", "of", "in", "##com", "##pet", "##ence", "." ], "ids": [ 26207, 19924, 14355, 21631, 18387, 10115, 11741, 70285, 118, 69154, 10113, 10135, 40714, 21622, 10596, 10218, 10146, 10105, 13664, 10142, 50485, 29632, 10135, 10151, 21227, 10192, 118, 74187, 30107, 13621, 14319, 10230, 10957, 10108, 10106, 22530, 19094, 18492, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "president", "of", "parliament", "had", "earlier", "said", "September", "11", "could", "be", "set", "for", "the", "debate", "." ], "ids": [ 10117, 12931, 10108, 40519, 10374, 18905, 12415, 10596, 10193, 12174, 10347, 11847, 10142, 10105, 29632, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "opposition", "motion", "against", "Ban", "##har", "##n", "accuse", "##s", "him", "of", "being", "in", "##com", "##pet", "##ent", ",", "lack", "##ing", "et", "##hical", "leadership", "and", "alle", "##ges", "his", "administration", "is", "cor", "##rupt", "." ], "ids": [ 10117, 21227, 30107, 11327, 21631, 18387, 10115, 93413, 10107, 10957, 10108, 11223, 10106, 22530, 19094, 11405, 117, 23582, 10230, 10131, 100979, 25121, 10111, 10968, 13156, 10226, 17941, 10124, 29162, 46791, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "critics", "alle", "##ge", "he", "may", "be", "attempting", "to", "delay", "the", "debate", "." ], "ids": [ 11597, 29832, 10968, 10525, 10261, 11387, 10347, 63494, 10114, 76497, 10105, 29632, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ban", "##har", "##n", "has", "denied", "the", "accusations", "and", "said", "he", "is", "ready", "to", "clear", "himself", "in", "parliament", "." ], "ids": [ 21631, 18387, 10115, 10393, 47467, 10105, 103961, 10111, 12415, 10261, 10124, 42374, 10114, 24866, 14764, 10106, 40519, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "In", "my", "opinion", "September", "18", "would", "be", "a", "con", "##veni", "##ent", "date", "for", "the", "government", "to", "answer", "questions", "." ], "ids": [ 107, 10167, 15127, 32282, 10596, 10218, 10894, 10347, 169, 10173, 53590, 11405, 13664, 10142, 10105, 12047, 10114, 57085, 26686, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "has", "nothing", "to", "do", "with", "the", "accusa", "##tion", "that", "I", "am", "trying", "to", "escape", "the", "debate", ",", "\"", "Ban", "##har", "##n", "told", "reporter", "##s", "after", "meeting", "coalition", "partners", "." ], "ids": [ 10747, 10393, 33338, 10114, 10149, 10169, 10105, 106888, 10822, 10189, 146, 10392, 32862, 10114, 30220, 10105, 29632, 117, 107, 21631, 18387, 10115, 21937, 41408, 10107, 10662, 19822, 41028, 48125, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ban", "##har", "##n", "'", "s", "13", "-", "month", "-", "old", ",", "six", "-", "party", "coalition", "government", "controls", "209", "seats", "in", "the", "391", "-", "seat", "lower", "house", "of", "parliament", "." ], "ids": [ 21631, 18387, 10115, 112, 187, 10249, 118, 14064, 118, 12898, 117, 12449, 118, 14039, 41028, 12047, 59897, 23404, 26893, 10106, 10105, 40366, 118, 17687, 18165, 13215, 10108, 40519, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Political", "in", "##fig", "##hti", "##ng", "within", "Ban", "##har", "##n", "'", "s", "Chart", "Thai", "party", "has", "raised", "doubt", "##s", "whether", "he", "can", "hold", "his", "supporters", "together", "and", "defeat", "the", "opposition", "motion", ",", "political", "anal", "##yst", "##s", "said", "." ], "ids": [ 18907, 10106, 74115, 31270, 10376, 12381, 21631, 18387, 10115, 112, 187, 17873, 26207, 14039, 10393, 20526, 86697, 10107, 21883, 10261, 10944, 18500, 10226, 42957, 14229, 10111, 24800, 10105, 21227, 30107, 117, 13736, 106615, 62769, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "are", "still", "waiting", "to", "fi", "##x", "a", "date", "." ], "ids": [ 107, 12865, 10301, 12647, 62052, 10114, 14045, 10686, 169, 13664, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "September", "18", "is", "regarded", "as", "tentative", "because", "we", "still", "have", "not", "received", "the", "order", "to", "fi", "##x", "it", "on", "the", "agenda", ",", "\"", "said", "an", "official", "at", "parliament", "'", "s", "agenda", "section", "." ], "ids": [ 10596, 10218, 10124, 34937, 10146, 67161, 12373, 11951, 12647, 10529, 10472, 12296, 10105, 12990, 10114, 14045, 10686, 10271, 10135, 10105, 70231, 117, 107, 12415, 10151, 14731, 10160, 40519, 112, 187, 70231, 14893, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "last", "no", "-", "confidence", "debate", "against", "Ban", "##har", "##n", "'", "s", "coalition", "in", "May", "was", "won", "by", "the", "government", "." ], "ids": [ 10117, 12469, 10192, 118, 74187, 29632, 11327, 21631, 18387, 10115, 112, 187, 41028, 10106, 10725, 10134, 11367, 10155, 10105, 12047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fontaine", "-", "6", "##mt", "##h", "parent", "for", "##eca", "##st", "." ], "ids": [ 39616, 118, 127, 18193, 10237, 43045, 10142, 33588, 10562, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "26" ], "ids": [ 76531, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Six", "months", "to", "August", "31", ",", "1996" ], "ids": [ 20615, 15555, 10114, 10735, 10413, 117, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "billion", "##s", "of", "ye", "##n", "unless", "specified", ")" ], "ids": [ 113, 10106, 25848, 10107, 10108, 11023, 10115, 60015, 64561, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##TE", "##ST", "PR", "##E", "##VI", "##O", "##US", "ACT", "##U", "##AL" ], "ids": [ 29079, 29833, 32995, 23837, 11259, 90939, 11403, 32612, 90119, 12022, 32002 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Par", "##ent", ")", "FOR", "##EC", "##AS", "##T", "FOR", "##EC", "##AS", "##T", "Y", "##EA", "##R", "-", "AG", "##O" ], "ids": [ 113, 17434, 11405, 114, 109544, 35826, 38025, 11090, 109544, 35826, 38025, 11090, 162, 36789, 11273, 118, 17935, 11403 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sales", "3", ".", "30", "3", ".", "17", "2", ".", "75" ], "ids": [ 48514, 124, 119, 10244, 124, 119, 10273, 123, 119, 11417 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Current", "400", "million", "260", "million", "231", "million" ], "ids": [ 37293, 11176, 12473, 17948, 12473, 25034, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "170", "million", "170", "million", "142", "million" ], "ids": [ 32577, 15410, 12473, 15410, 12473, 19893, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Fontaine", "Co", "Ltd", "sell", "##s", "women", "\"", "s", "fashion", "wi", "##gs", "." ], "ids": [ 49307, 29833, 118, 39616, 13098, 15129, 36300, 10107, 13190, 107, 187, 35055, 23040, 15703, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Manila", "international", "co", "##con", "##ut", "oil", "prices", "." ], "ids": [ 32377, 12533, 11170, 23486, 11159, 21073, 57476, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##IL", "##A", "1996", "-", "08", "-", "26" ], "ids": [ 73020, 38850, 10738, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "International", "Philippine", "co", "##con", "##ut", "oil", "prices", "as", "reported", "by", "the", "United", "Coco", "##nut", "Associations", "of", "the", "Philippines", "(", "dollars", "per", "ton", "##ne", "ci", "##f", "Europe", ")", "." ], "ids": [ 10771, 28893, 11170, 23486, 11159, 21073, 57476, 10146, 15943, 10155, 10105, 10609, 70728, 18548, 99593, 10108, 10105, 20759, 113, 27953, 10178, 22464, 10238, 11322, 10575, 11767, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Buy", "##ers", "Selle", "##rs", "Last", "Pre", "##v" ], "ids": [ 109211, 10901, 52719, 10943, 14812, 35248, 10477 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jul", "##A", "##ug", "775", "787", ".", "50", "un", "##q", "un", "##q" ], "ids": [ 65855, 10738, 19951, 61416, 53172, 119, 10462, 10119, 11703, 10119, 11703 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aug", "##S", "##ep", "752", ".", "50", "758", ".", "75", "un", "##q", "un", "##q" ], "ids": [ 53012, 10731, 19986, 62380, 119, 10462, 75077, 119, 11417, 10119, 11703, 10119, 11703 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sep", "##O", "##ct", "733", ".", "75", "743", ".", "50", "un", "##q", "un", "##q" ], "ids": [ 67281, 11403, 14526, 75536, 119, 11417, 68937, 119, 10462, 10119, 11703, 10119, 11703 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oct", "##N", "##ov", "un", "##q", "740", "un", "##q", "un", "##q" ], "ids": [ 45442, 11537, 11024, 10119, 11703, 45926, 10119, 11703, 10119, 11703 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nov", "##D", "##ec", "un", "##q", "732", ".", "50", "un", "##q", "un", "##q" ], "ids": [ 36779, 11490, 15953, 10119, 11703, 62267, 119, 10462, 10119, 11703, 10119, 11703 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RE", "##SE", "##AR", "##CH", "AL", "##ER", "##T", "-", "Aron", "##kas", "##ei", "cut", "." ], "ids": [ 71033, 39039, 52188, 86448, 47271, 24093, 11090, 118, 101132, 16438, 11998, 21610, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "26" ], "ids": [ 76531, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nom", "##ura", "Research", "Institute", "Ltd", "down", "##grade", "##d", "Aron", "##kas", "##ei", "Co", "Ltd", "to", "a", "\"", "2", "\"", "rating", "from", "its", "previous", "\"", "1", "\"", ",", "market", "sources", "said", "on", "Monday", "." ], "ids": [ 107732, 11465, 12959, 12031, 15129, 12935, 82892, 10162, 101132, 16438, 11998, 13098, 15129, 10114, 169, 107, 123, 107, 31035, 10188, 10474, 16741, 107, 122, 107, 117, 17313, 19023, 12415, 10135, 40714, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "its", "three", "-", "grade", "rating", "system", ",", "the", "research", "institute", "ass", "##ign", "##s", "a", "\"", "2", "\"", "rating", "to", "issues", "whose", "values", "it", "sees", "moving", "within", "10", "percentage", "points", "in", "either", "direction", "of", "the", "key", "225", "-", "share", "Ni", "##kke", "##i", "average", "over", "the", "next", "six", "months", "." ], "ids": [ 10167, 10474, 11003, 118, 21958, 31035, 11787, 117, 10105, 14108, 42301, 13935, 58445, 10107, 169, 107, 123, 107, 31035, 10114, 17850, 16879, 31313, 10271, 41369, 23557, 12381, 10150, 46971, 12789, 10106, 16106, 15599, 10108, 10105, 18444, 20843, 118, 23867, 30409, 25389, 10116, 13551, 10491, 10105, 13451, 12449, 15555, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nom", "##ura", "officials", "were", "not", "immediately", "available", "for", "comment", "." ], "ids": [ 107732, 11465, 27730, 10309, 10472, 24029, 14579, 10142, 49641, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Tunisia", "-", "Aug", "26", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 51173, 118, 53012, 10314, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##NI", "##S", "1996", "-", "08", "-", "26" ], "ids": [ 94747, 52898, 10731, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "the", "leading", "stories", "in", "the", "Tunisia", "##n", "press", "on", "Monday", "." ], "ids": [ 13252, 10301, 10105, 16018, 21158, 10106, 10105, 51173, 10115, 21040, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "PR", "##ESS", "##E" ], "ids": [ 29079, 23837, 76505, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "English", "langage", "to", "be", "taught", "as", "of", "the", "eighth", "year", "of", "the", "primary", "school", "instead", "of", "the", "third", "year", "of", "the", "secondary", "school", "." ], "ids": [ 118, 11616, 67052, 10114, 10347, 26015, 10146, 10108, 10105, 46758, 10924, 10108, 10105, 17627, 11393, 17427, 10108, 10105, 12628, 10924, 10108, 10105, 26072, 11393, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LE", "T", "##EM", "##PS" ], "ids": [ 84977, 157, 67753, 46983 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "International", "Fair", "opens", "in", "the", "northern", "city", "of", "Be", "##ja", "with", "the", "participation", "of", "16", "foreign", "countries", "." ], "ids": [ 118, 10771, 25697, 70702, 10106, 10105, 17335, 11584, 10108, 14321, 10320, 10169, 10105, 25784, 10108, 10250, 20796, 15911, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "N", ".", "official", "Ek", "##eus", "heads", "for", "Baghdad", "." ], "ids": [ 158, 119, 151, 119, 14731, 35769, 19048, 42399, 10142, 73055, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 4, 8, 9, 9, 1, 9 ] }, { "tokens": [ "MAN", "##AM", "##A", "1996", "-", "08", "-", "26" ], "ids": [ 73020, 36535, 10738, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Senior", "United", "Nations", "arms", "official", "Rolf", "Ek", "##eus", "left", "Bahrain", "for", "Baghdad", "on", "Monday", "for", "talks", "with", "Iraqi", "officials", ",", "a", "U", ".", "N", ".", "spoke", "##sman", "said", "." ], "ids": [ 22902, 10609, 15145, 28150, 14731, 31371, 35769, 19048, 12153, 56769, 10142, 73055, 10135, 40714, 10142, 56672, 10169, 57806, 27730, 117, 169, 158, 119, 151, 119, 50005, 24305, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 4, 8, 8, 9, 1, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "spoke", "##sman", "said", "Ek", "##eus", ",", "chairman", "of", "the", "United", "Nations", "Special", "Commission", "(", "UN", "##SC", "##OM", ")", ",", "would", "spend", "two", "or", "three", "days", "in", "Iraq", "but", "declined", "to", "give", "further", "details", "." ], "ids": [ 10117, 50005, 24305, 12415, 35769, 19048, 117, 27627, 10108, 10105, 10609, 15145, 13690, 14941, 113, 26578, 36175, 37079, 114, 117, 10894, 63222, 10551, 10345, 11003, 13990, 10106, 21455, 10473, 44948, 10114, 18090, 14586, 29500, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "N", ".", "oficials", "have", "said", "Ek", "##eus", "would", "hold", "talks", "with", "Iraqi", "Deputy", "Prime", "Minister", "Ta", "##re", "##q", "Aziz", "and", "other", "officials", "as", "part", "of", "an", "agreement", "Iraq", "reached", "with", "the", "United", "Nations", "in", "June", "to", "hold", "higher", "level", "political", "talks", "with", "Ek", "##eus", "." ], "ids": [ 158, 119, 151, 119, 98277, 10529, 12415, 35769, 19048, 10894, 18500, 56672, 10169, 57806, 32389, 19924, 14355, 14248, 10246, 11703, 46563, 10111, 10684, 27730, 10146, 10668, 10108, 10151, 25432, 21455, 17087, 10169, 10105, 10609, 15145, 10106, 11120, 10114, 18500, 17981, 13277, 13736, 56672, 10169, 35769, 19048, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 4, 8, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "The", "Security", "Council", "on", "Friday", "asked", "Iraq", "to", "stop", "block", "##ing", "arms", "inspector", "##s", "search", "for", "con", "##cea", "##led", "weapons", "or", "materials", "they", "believe", "were", "being", "shut", "##tle", "##d", "around", "to", "avoid", "detection", "." ], "ids": [ 10117, 20924, 12821, 10135, 30767, 22151, 21455, 10114, 20517, 27242, 10230, 28150, 104701, 10107, 22419, 10142, 10173, 37839, 16376, 31881, 10345, 23193, 10689, 30587, 10309, 11223, 70323, 16406, 10162, 12166, 10114, 33253, 91578, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dis", "##arm", "##ing", "Iraq", "of", "weapons", "of", "mass", "destruction", "under", "1991", "Gulf", "War", "cea", "##sef", "##ire", "terms", "is", "a", "pre", "##re", "##quis", "##ite", "before", "the", "lift", "##ing", "of", "c", "##rip", "##pling", "san", "##ctions", "imposed", "on", "Iraq", "in", "1990", "for", "in", "##vad", "##ing", "Kuwait", "." ], "ids": [ 101270, 76171, 10230, 21455, 10108, 31881, 10108, 22038, 33733, 10571, 10442, 28239, 11277, 25578, 107749, 11627, 18873, 10124, 169, 12229, 10246, 53499, 12704, 11360, 10105, 63376, 10230, 10108, 171, 68228, 51741, 14608, 42068, 83358, 10135, 21455, 10106, 10420, 10142, 10106, 16678, 10230, 44892, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Lebanon", "-", "Aug", "26", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 40037, 118, 53012, 10314, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##IR", "##UT", "1996", "-", "08", "-", "26" ], "ids": [ 46291, 73522, 65729, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "the", "leading", "stories", "in", "the", "Beirut", "press", "on", "Monday", "." ], "ids": [ 13252, 10301, 10105, 16018, 21158, 10106, 10105, 43822, 21040, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "-", "NA", "##HA", "##R" ], "ids": [ 50972, 118, 56586, 58132, 11273 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "The", "north", "Lebanon", "elections", ".", ".", "." ], "ids": [ 118, 10117, 12756, 40037, 22054, 119, 119, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Almost", "no", "chance", "at", "all", "for", "any", "complete", "ticket", "to", "win", "alto", "##get", "##her", "and", "the", "results", "will", "weak", "##en", "some", "leaders", "." ], "ids": [ 64435, 10192, 27893, 10160, 10435, 10142, 11178, 17876, 59037, 10114, 14125, 15402, 14908, 14206, 10111, 10105, 17466, 11337, 61285, 10136, 11152, 24155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "The", "surprise", ".", ".", "." ], "ids": [ 118, 10117, 48886, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Opposition", "Bou", "##tros", "Har", "##b", "scoring", "high", "in", "preliminary", "results", "and", "former", "prime", "minister", "Omar", "Kara", "##me", "moves", "back", "##wards", "." ], "ids": [ 69053, 62583, 34715, 55737, 10457, 27346, 11846, 10106, 68097, 17466, 10111, 11775, 19287, 16930, 27221, 34635, 10627, 49157, 12014, 30086, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Fear", "##s", "of", "an", "Israeli", "operation", "causes", "the", "red", "##ist", "##ribution", "of", "Syrian", "troops", "locations", "in", "Lebanon", "." ], "ids": [ 118, 36912, 10107, 10108, 10151, 28446, 20080, 25781, 10105, 10680, 11293, 84608, 10108, 44152, 20836, 32602, 10106, 40037, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9 ] }, { "tokens": [ "AS", "-", "SA", "##F", "##IR" ], "ids": [ 17421, 118, 21318, 11565, 73522 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Parliament", "Speaker", "Be", "##rri", ":", "The", "occupied", "south", "should", "not", "be", "used", "as", "a", "winning", "card", "in", "elections", "." ], "ids": [ 118, 19173, 64844, 14321, 24874, 131, 10117, 28634, 13144, 14819, 10472, 10347, 11031, 10146, 169, 16542, 23050, 10106, 22054, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Price", "##s", "of", "alimentar", "##y", "goods", "up", "13", ".", "4", "percent", "in", "1996", "." ], "ids": [ 118, 23002, 10107, 10108, 101680, 10157, 36931, 10741, 10249, 119, 125, 22362, 10106, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AL", "-", "AN", "##WA", "##R" ], "ids": [ 47271, 118, 50972, 42196, 11273 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Christian", "Mar", "##oni", "##te", "Patria", "##rch", "Sf", "##eir", ":", "We", "fear", "a", "movement", "from", "democracy", "to", "di", "##ctat", "##ors", "##hip", "." ], "ids": [ 118, 11757, 15734, 14639, 10216, 65330, 24030, 95278, 50705, 131, 12865, 44929, 169, 17123, 10188, 67519, 10114, 10120, 95400, 16379, 17883, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AD", "-", "DI", "##Y", "##AR" ], "ids": [ 22992, 118, 110014, 14703, 52188 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "A", "cabinet", "minister", ":", "\"", "Lebanon", "First", "\"", "aims", "at", "split", "##ting", "the", "Syrian", "-", "Lebanese", "peace", "tracks", "with", "Israel", "." ], "ids": [ 118, 138, 33801, 16930, 131, 107, 40037, 12128, 107, 67789, 10160, 24137, 12141, 10105, 44152, 118, 101257, 28101, 17965, 10169, 12991, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 1, 9 ] }, { "tokens": [ "N", "##ID", "##A", "'", "A", "AL", "-", "W", "##AT", "##AN" ], "ids": [ 151, 28895, 10738, 112, 138, 47271, 118, 160, 32071, 41275 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Prime", "Minister", "Hari", "##ri", ":", "Elections", "are", "the", "beginning", "of", "a", "long", "political", "life", "which", "we", "begin", "with", "an", "in", "##com", "##plete", "ticket", "of", "17", "candidates", "." ], "ids": [ 118, 19924, 14355, 39769, 10401, 131, 69618, 10301, 10105, 17967, 10108, 169, 11695, 13736, 12103, 10319, 11951, 16135, 10169, 10151, 10106, 22530, 97598, 59037, 10108, 10273, 33439, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "The", "Lebanese", "Association", "for", "the", "Democracy", "of", "Elections", "cited", "51", "incidents", "of", "violation", "in", "the", "north", "Lebanon", "round", "." ], "ids": [ 118, 10117, 101257, 11751, 10142, 10105, 45762, 10108, 69618, 41164, 11524, 73451, 10108, 88993, 10106, 10105, 12756, 40037, 13569, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Malta", "-", "Aug", "26", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 23259, 118, 53012, 10314, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "VA", "##LL", "##ET", "##TA", "1996", "-", "08", "-", "26" ], "ids": [ 69342, 82834, 52338, 24951, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "the", "leading", "stories", "in", "the", "Mal", "##tese", "press", "on", "Monday", "." ], "ids": [ 13252, 10301, 10105, 16018, 21158, 10106, 10105, 18076, 63760, 21040, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "THE", "TIME", "##S" ], "ids": [ 17443, 89275, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "-", "Vis", "##itors", "sl", "##am", "bus", "and", "taxi", "drivers", "for", "che", "##ating", "." ], "ids": [ 118, 76020, 69273, 38523, 11008, 19369, 10111, 72231, 54598, 10142, 10262, 33121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tourist", "##s", "interviewed", "in", "Malta", "com", "##plain", "about", "over", "-", "char", "##ging", "." ], "ids": [ 109782, 10107, 94501, 10106, 23259, 10212, 88975, 10978, 10491, 118, 101328, 13808, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "-", "NA", "##Z", "##Z", "##J", "##ON" ], "ids": [ 36351, 118, 56586, 13966, 13966, 15417, 30118 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "-", "Government", "considering", "measures", "for", "better", "road", "discipline", "." ], "ids": [ 118, 14581, 81243, 38606, 10142, 18322, 15485, 38022, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Malta", ",", "with", "a", "population", "of", "365", ",", "000", ",", "has", "195", ",", "000", "registered", "vehicles", ",", "with", "80", ",", "000", "new", "cars", "having", "been", "introduced", "on", "the", "con", "##gest", "##ed", "roads", "in", "10", "years", "." ], "ids": [ 23259, 117, 10169, 169, 11077, 10108, 25385, 117, 10259, 117, 10393, 21825, 117, 10259, 33712, 27237, 117, 10169, 10832, 117, 10259, 10751, 24602, 13677, 10590, 17037, 10135, 10105, 10173, 63952, 10336, 36970, 10106, 10150, 10855, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Five", "people", "arrested", "in", "Romania", "after", "drugs", "contain", "##er", "found", "in", "Malta", "." ], "ids": [ 118, 19268, 11426, 29479, 10106, 13927, 10662, 40421, 36003, 10165, 11823, 10106, 23259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "contain", "##er", ",", "with", "7", ".", "5", "tonnes", "of", "can", "##nabis", ",", "was", "found", "in", "Malta", "Free", "##port", "in", "transit", "from", "Singapore", "to", "Romania", "." ], "ids": [ 10117, 36003, 10165, 117, 10169, 128, 119, 126, 39435, 10108, 10944, 85215, 117, 10134, 11823, 10106, 23259, 16122, 15520, 10106, 60486, 10188, 19437, 10114, 13927, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "L", "-", "OR", "##I", "##Z", "##Z", "##ON", "##T" ], "ids": [ 149, 118, 69308, 11281, 13966, 13966, 30118, 11090 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "-", "Opposition", "leader", "Alfred", "Sant", "on", "steep", "rise", "in", "taxes", "over", "10", "years", "." ], "ids": [ 118, 69053, 15014, 13730, 12595, 10135, 102718, 28710, 10106, 49870, 10491, 10150, 10855, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "rei", "##tera", "##tes", "promise", "that", "a", "future", "Labour", "government", "will", "remove", "VA", "##T", "." ], "ids": [ 10357, 14243, 22833, 11197, 73871, 10189, 169, 16711, 25606, 12047, 11337, 51600, 69342, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tamil", "##s", "demonstrate", "outside", "U", ".", "N", ".", "headquarters", "." ], "ids": [ 22489, 10107, 98343, 17555, 158, 119, 151, 119, 28245, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "GE", "##NE", "##VA", "1996", "-", "08", "-", "26" ], "ids": [ 62997, 93280, 47172, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thousand", "##s", "of", "Tamil", "##s", "demonstrated", "outside", "the", "United", "Nations", "'", "European", "headquarters", "in", "Geneva", "on", "Monday", "to", "appeal", "for", "U", ".", "N", ".", "recognition", "of", "their", "fight", "for", "independence", "from", "Sri", "Lanka", "." ], "ids": [ 61795, 10107, 10108, 22489, 10107, 57627, 17555, 10105, 10609, 15145, 112, 11914, 28245, 10106, 47244, 10135, 40714, 10114, 44861, 10142, 158, 119, 151, 119, 31477, 10108, 10455, 20780, 10142, 31412, 10188, 16098, 20828, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 3, 7, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "The", "demo", "##nst", "##rators", ",", "said", "by", "police", "to", "number", "6", ",", "000", ",", "also", "ur", "##ged", "the", "release", "of", "Nada", "##raja", "##h", "Mur", "##ali", "##dara", "##n", ",", "Swiss", "-", "based", "leader", "of", "the", "the", "Tamil", "Tiger", "guerrilla", "##s", ",", "who", "has", "been", "held", "in", "a", "Zurich", "jail", "since", "April", "on", "charges", "of", "ex", "##tor", "##tion", "." ], "ids": [ 10117, 30776, 40300, 94721, 117, 12415, 10155, 15034, 10114, 11487, 127, 117, 10259, 117, 10379, 10399, 18832, 10105, 14072, 10108, 74909, 78518, 10237, 103192, 13133, 63138, 10115, 117, 22984, 118, 11610, 15014, 10108, 10105, 10105, 22489, 25899, 106552, 10107, 117, 10479, 10393, 10590, 11991, 10106, 169, 55885, 75934, 11764, 10780, 10135, 31128, 10108, 11419, 11813, 10822, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 2, 6, 6, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "demo", "##nst", "##rators", "delivered", "an", "appeal", "to", "the", "U", ".", "N", ".", "human", "rights", "centre", "demand", "##ing", "an", "immediate", "end", "to", "\"", "state", "terrorism", "\"", "against", "Tamil", "##s", "and", "the", "Liberation", "Tigers", "of", "Tamil", "E", "##ela", "##m", "(", "L", "##T", "##TE", ")", "." ], "ids": [ 10117, 30776, 40300, 94721, 37577, 10151, 44861, 10114, 10105, 158, 119, 151, 119, 14179, 16691, 12672, 34394, 10230, 10151, 46938, 11572, 10114, 107, 11388, 96969, 107, 11327, 22489, 10107, 10111, 10105, 54766, 38640, 10108, 22489, 142, 15108, 10147, 113, 149, 11090, 29833, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "F", "##OC", "##US", "-", "Euro", "##bours", "##es", "end", "mixed", "but", "London", "recover", "##s", "." ], "ids": [ 143, 49378, 32612, 118, 17526, 97497, 10171, 11572, 23742, 10473, 10829, 94962, 10107, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Leonard", "Santo", "##relli" ], "ids": [ 20318, 14953, 50566 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "European", "bou", "##rse", "##s", "closed", "mixed", "on", "Tuesday", "with", "London", "c", "##law", "##ing", "back", "most", "of", "the", "day", "'", "s", "losses", "despite", "an", "uns", "##tead", "##y", "start", "on", "wall", "Street", ",", "hit", "by", "inflation", "wo", "##rries", "." ], "ids": [ 11914, 94335, 16239, 10107, 18440, 23742, 10135, 70245, 10169, 10829, 171, 37811, 10230, 12014, 10992, 10108, 10105, 11940, 112, 187, 45353, 22087, 10151, 15826, 55099, 10157, 15148, 10135, 26699, 11962, 117, 14946, 10155, 105888, 12796, 107788, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "dollar", "weak", "##ened", "during", "the", "day", "with", "many", "deal", "##ers", "side", "##lined", "because", "of", "uncertain", "##ty", "over", "Tokyo", "'", "s", "monet", "##ary", "direction", "ahead", "of", "the", "important", "Japanese", "Tank", "##an", "economic", "survey", "out", "on", "Wednesday", "." ], "ids": [ 10117, 34807, 61285, 27867, 10939, 10105, 11940, 10169, 11299, 19918, 10901, 12250, 75066, 12373, 10108, 108308, 11195, 10491, 15308, 112, 187, 79139, 14926, 15599, 35629, 10108, 10105, 12452, 13847, 45010, 10206, 13925, 35035, 10950, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "it", "recovered", "at", "the", "close", "of", "trade", "." ], "ids": [ 16976, 10271, 55051, 10160, 10105, 16065, 10108, 18908, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stock", "##s", "in", "London", "started", "the", "week", "badly", "after", "a", "three", "-", "day", "weekend", ",", "sl", "##ip", "##ping", "0", ".", "3", "percent", ",", "but", "bar", "##gain", "-", "hun", "##ters", "later", "moved", "in", "and", "the", "F", "##TS", "##E", "index", "recovered", "most", "of", "the", "lost", "ground", "to", "end", "only", "just", "in", "negative", "ground", "." ], "ids": [ 31916, 10107, 10106, 10829, 13457, 10105, 16118, 91810, 10662, 169, 11003, 118, 11940, 43440, 117, 38523, 17437, 15398, 121, 119, 124, 22362, 117, 10473, 18121, 85473, 118, 12041, 21891, 10873, 13059, 10106, 10111, 10105, 143, 36545, 11259, 19776, 55051, 10992, 10108, 10105, 14172, 16912, 10114, 11572, 10893, 12820, 10106, 25785, 16912, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tuesday", "'", "s", "patch", "##y", "showing", "in", "London", "followed", "a", "string", "of", "records", "last", "week", ",", "cu", "##lmi", "##nating", "in", "Friday", "'", "s", "trading", "high", "of", "3", ",", "911", ",", "fuel", "##led", "by", "a", "wave", "of", "European", "interest", "rate", "cuts", "." ], "ids": [ 70245, 112, 187, 105741, 10157, 37501, 10106, 10829, 15689, 169, 33714, 10108, 18791, 12469, 16118, 117, 10854, 45659, 66844, 10106, 30767, 112, 187, 46663, 11846, 10108, 124, 117, 38375, 117, 30550, 16376, 10155, 169, 32981, 10108, 11914, 17644, 18344, 73311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "The", "London", "bou", "##rse", "drew", "little", "help", "from", "the", "uns", "##ett", "##led", "morning", "on", "Wall", "Street", ",", "which", "sl", "##ip", "##ped", "in", "and", "out", "of", "positive", "ground", "after", "a", "stronger", "-", "than", "-", "expected", "August", "consumer", "confidence", "report", "ref", "##uelle", "##d", "inflation", "fear", "##s", ",", "pull", "##ing", "U", ".", "S", ".", "Tre", "##asu", "##ries", "back", "from", "their", "early", "peaks", "." ], "ids": [ 10117, 10829, 94335, 16239, 49098, 16745, 15217, 10188, 10105, 15826, 13985, 16376, 28757, 10135, 19523, 11962, 117, 10319, 38523, 17437, 16898, 10106, 10111, 10950, 10108, 19737, 16912, 10662, 169, 85688, 118, 11084, 118, 25973, 10735, 64580, 74187, 17553, 48056, 36252, 10162, 105888, 44929, 10107, 117, 80870, 10230, 158, 119, 156, 119, 30932, 62182, 15388, 12014, 10188, 10455, 11732, 86666, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shortly", "after", "the", "report", "appeared", "showing", "the", "confidence", "index", "rising", "to", "109", ".", "4", "in", "August", "from", "a", "revised", "107", ".", "0", "in", "July", ",", "Wall", "Street", "re", "##lin", "##quis", "##hed", "virtually", "all", "its", "morning", "gains", "." ], "ids": [ 50752, 10662, 10105, 17553, 14565, 37501, 10105, 74187, 19776, 53816, 10114, 16296, 119, 125, 10106, 10735, 10188, 169, 41226, 15844, 119, 121, 10106, 11112, 117, 19523, 11962, 11639, 13020, 53499, 16081, 83659, 10435, 10474, 28757, 92193, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Tre", "##asu", "##ries", "remain", "very", "sensitive", "to", "any", "indication", "of", "a", "strong", "economy", "and", "we", "'", "re", "still", "in", "that", "summer", "do", "##ld", "##rum", "period", "of", "light", "trading", ",", "\"", "said", "Alan", "A", "##cker", "##man", ",", "market", "str", "##ategi", "##st", "at", "Fa", "##hne", "##stock", "&", "Co", ".", "\"" ], "ids": [ 107, 30932, 62182, 15388, 25430, 12558, 73330, 10114, 11178, 102383, 10108, 169, 18093, 27570, 10111, 11951, 112, 11639, 12647, 10106, 10189, 17995, 10149, 12620, 12659, 13127, 10108, 15765, 46663, 117, 107, 12415, 14309, 138, 19153, 10589, 117, 17313, 17791, 82956, 10562, 10160, 44271, 37893, 73667, 111, 13098, 119, 107 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Con", "##sequently", ",", "stock", "##s", "and", "bonds", "are", "both", "subject", "to", "rapid", "swing", "##s", ".", "\"" ], "ids": [ 12845, 70117, 117, 20511, 10107, 10111, 93163, 10301, 11408, 20036, 10114, 39782, 74772, 10107, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Frankfurt", "was", "the", "one", "bright", "spot", "in", "Europe", "." ], "ids": [ 15226, 10134, 10105, 10464, 72041, 28504, 10106, 11767, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Floor", "trading", "ended", "up", "0", ".", "25", "percent", "and", "the", "computer", "##ised", "IB", "##IS", "index", "climb", "##ed", "nearly", "0", ".", "4", "percent", ",", "given", "a", "push", "by", "the", "performance", "of", "chemical", "shares", ".", "\"" ], "ids": [ 71336, 46663, 18428, 10741, 121, 119, 10258, 22362, 10111, 10105, 18765, 20666, 110503, 19088, 19776, 93274, 10336, 21377, 121, 119, 125, 22362, 117, 13507, 169, 68052, 10155, 10105, 14432, 10108, 29677, 45751, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "market", "is", "trading", "100", "percent", "on", "fundamental", "##s", "at", "the", "moment", "as", "interest", "rate", "fantasy", "disa", "##ppe", "##ars", "-", "-", "it", "'", "s", "all", "company", "news", ",", "\"", "said", "one", "trade", "##r", "." ], "ids": [ 10117, 17313, 10124, 46663, 10407, 22362, 10135, 27971, 10107, 10160, 10105, 14316, 10146, 17644, 18344, 39204, 36474, 21092, 21087, 118, 118, 10271, 112, 187, 10435, 12100, 14424, 117, 107, 12415, 10464, 18908, 10129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "shares", "ended", "slightly", "down", "ami", "##d", "growing", "une", "##ase", "about", "a", "difficult", "autumn", "for", "the", "government", "which", "also", "wei", "##ghed", "on", "the", "franc", ",", "deal", "##ers", "said", "." ], "ids": [ 11894, 45751, 18428, 31603, 12935, 16992, 10162, 25566, 10231, 16896, 10978, 169, 25232, 82240, 10142, 10105, 12047, 10319, 10379, 86981, 75395, 10135, 10105, 63184, 117, 19918, 10901, 12415, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bond", "prices", "were", "weak", "##er", "and", "the", "franc", "was", "quoted", "at", "3", ".", "421", "##0", "per", "mark", "for", "the", "first", "time", "since", "August", "13", "as", "wo", "##rries", "about", "the", "government", "'", "s", "autumn", "budget", "and", "a", "weak", "U", ".", "S", ".", "currency", "lift", "##ed", "the", "mark", "and", "sq", "##ue", "##eze", "##d", "French", "investment", "##s", "." ], "ids": [ 22670, 57476, 10309, 61285, 10165, 10111, 10105, 63184, 10134, 70676, 10160, 124, 119, 38648, 10929, 10178, 29221, 10142, 10105, 10422, 10635, 11764, 10735, 10249, 10146, 12796, 107788, 10978, 10105, 12047, 112, 187, 82240, 25293, 10111, 169, 61285, 158, 119, 156, 119, 83759, 63376, 10336, 10105, 29221, 10111, 27164, 12772, 41641, 10162, 11894, 37933, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "The", "dollar", ",", "which", "dropped", "sharp", "##ly", "on", "Monday", "because", "of", "ji", "##tter", "##s", "over", "the", "Japanese", "Tank", "##an", "survey", ",", "weak", "##ened", "further", "in", "quiet", "trading", "but", "re", "##gain", "##ed", "losses", "to", "end", "the", "day", "close", "to", "Monday", "'", "s", "levels", "." ], "ids": [ 10117, 34807, 117, 10319, 30241, 77348, 10454, 10135, 40714, 12373, 10108, 18028, 18413, 10107, 10491, 10105, 13847, 45010, 10206, 35035, 117, 61285, 27867, 14586, 10106, 104951, 46663, 10473, 11639, 85473, 10336, 45353, 10114, 11572, 10105, 11940, 16065, 10114, 40714, 112, 187, 21559, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Besides", "the", "Tank", "##an", ",", "there", "'", "s", "nothing", "really", "until", "the", "U", ".", "S", ".", "jobs", "numbers", "next", "week", ",", "\"", "said", "a", "UK", "bank", "corporate", "deal", "##er", ".", "\"" ], "ids": [ 107, 77054, 10105, 45010, 10206, 117, 11155, 112, 187, 33338, 30181, 11444, 10105, 158, 119, 156, 119, 45083, 20953, 13451, 16118, 117, 107, 12415, 169, 10523, 19423, 46666, 19918, 10165, 119, 107 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "is", "still", "the", "summer", "mala", "##ise", "hang", "##ing", "over", "the", "market", ".", "\"" ], "ids": [ 11723, 10124, 12647, 10105, 17995, 30785, 13041, 60083, 10230, 10491, 10105, 17313, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Foreign", "exchange", "markets", "regard", "the", "Tank", "##an", "report", "as", "an", "important", "indication", "of", "the", "country", "'", "s", "future", "monet", "##ary", "policy", "direction", "." ], "ids": [ 20277, 27714, 42893, 42047, 10105, 45010, 10206, 17553, 10146, 10151, 12452, 102383, 10108, 10105, 12723, 112, 187, 16711, 79139, 14926, 14368, 15599, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "it", "points", "to", "weak", "##ness", "in", "the", "economy", ",", "the", "report", "will", "help", "the", "dollar", "re", "##gain", "some", "lost", "ground", "as", "sp", "##ecu", "##lation", "of", "a", "near", "-", "term", "rise", "in", "Japanese", "interest", "rates", "will", "eva", "##pora", "##te", "." ], "ids": [ 14535, 10271, 12789, 10114, 61285, 14010, 10106, 10105, 27570, 117, 10105, 17553, 11337, 15217, 10105, 34807, 11639, 85473, 11152, 14172, 16912, 10146, 32650, 97038, 19718, 10108, 169, 12883, 118, 13719, 28710, 10106, 13847, 17644, 38200, 11337, 103730, 25130, 10216, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Japanese", "disco", "##unt", "rate", "is", "currently", "at", "a", "record", "low", "of", "0", ".", "5", "percent", "." ], "ids": [ 10117, 13847, 14884, 20631, 18344, 10124, 15313, 10160, 169, 12410, 15626, 10108, 121, 119, 126, 22362, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "dollar", "was", "also", "pressure", "##d", "by", "the", "mark", "'", "s", "strength", "against", "European", "cu", "##rren", "##cies", "ami", "##d", "renewed", "concerns", "over", "Europe", "'", "s", "economic", "and", "monet", "##ary", "union", "(", "EM", "##U", ")", "time", "##table", "." ], "ids": [ 10117, 34807, 10134, 10379, 23460, 10162, 10155, 10105, 29221, 112, 187, 33318, 11327, 11914, 10854, 46111, 18320, 16992, 10162, 81783, 42663, 10491, 11767, 112, 187, 13925, 10111, 79139, 14926, 20763, 113, 20569, 12022, 114, 10635, 30434, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##UR", "##RE", "##NC", "##IE", "##S" ], "ids": [ 140, 98348, 66014, 100230, 71655, 10731 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "dollar", "was", "at", "1", ".", "478", "##8", "marks", "and", "107", ".", "74", "ye", "##n", "at", "the", "close", "of", "European", "trading", "compared", "with", "1", ".", "478", "##9", "marks", "and", "107", ".", "55", "ye", "##n", "on", "Monday", "." ], "ids": [ 10117, 34807, 10134, 10160, 122, 119, 47107, 11396, 55112, 10111, 15844, 119, 12535, 11023, 10115, 10160, 10105, 16065, 10108, 11914, 46663, 25626, 10169, 122, 119, 47107, 11373, 55112, 10111, 15844, 119, 11358, 11023, 10115, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##OCK", "MA", "##R", "##K", "##ET", "##S" ], "ids": [ 53317, 96608, 27277, 11273, 11733, 52338, 10731 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Financial", "Times", "-", "Stock", "Exchange", "index", "of", "100", "leading", "British", "shares", "ended", "1", ".", "8", "points", "lower", "at", "3", ",", "905", ".", "7", "." ], "ids": [ 10117, 30738, 12020, 118, 31916, 32424, 19776, 10108, 10407, 16018, 11160, 45751, 18428, 122, 119, 129, 12789, 18165, 10160, 124, 117, 70781, 119, 128, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Paris", ",", "the", "CA", "##C", "-", "40", "share", "index", "finished", "down", "2", ".", "43", "at", "2", ",", "017", ".", "99", "." ], "ids": [ 10167, 10728, 117, 10105, 24707, 10858, 118, 10533, 23867, 19776, 15972, 12935, 123, 119, 11370, 10160, 123, 117, 90071, 119, 12187, 119 ], "entity": [ "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "30", "-", "share", "DA", "##X", "index", "in", "Frankfurt", "closed", "up", "6", ".", "48", "at", "2", ",", "558", ".", "84", "." ], "ids": [ 10117, 10244, 118, 23867, 47855, 12674, 19776, 10106, 15226, 18440, 10741, 127, 119, 11300, 10160, 123, 117, 54558, 119, 11761, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##EC", "##IO", "##US", "ME", "##TA", "##LS" ], "ids": [ 23837, 35826, 37174, 32612, 47430, 24951, 66934 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gold", "closed", "at", "$", "388", ".", "55", "an", "ou", "##nce", ",", "compared", "with", "Monday", "'", "s", "close", "of", "$", "388", ".", "75", "on", "international", "markets", "." ], "ids": [ 14363, 18440, 10160, 109, 38317, 119, 11358, 10151, 10431, 12150, 117, 25626, 10169, 40714, 112, 187, 16065, 10108, 109, 38317, 119, 11417, 10135, 12533, 42893, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Silver", "ended", "up", "one", "cent", "$", "5", ".", "24", "." ], "ids": [ 19020, 18428, 10741, 10464, 32882, 109, 126, 119, 10233, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "host", "##ages", "free", "##d", "from", "hija", "##cked", "Sudan", "##ese", "plane", "." ], "ids": [ 15946, 19317, 24115, 13961, 10162, 10188, 26429, 72333, 28407, 13565, 35007, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "ST", "##AN", "##ST", "##ED", ",", "England", "1996", "-", "08", "-", "27" ], "ids": [ 53317, 41275, 32995, 33809, 117, 11701, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Armed", "hija", "##cker", "##s", "believed", "to", "be", "Iraqi", "##s", "released", "between", "60", "and", "70", "people", "on", "Tuesday", "from", "a", "Sudan", "Airways", "plane", "carrying", "199", "passengers", "and", "crew", "that", "landed", "in", "London", "after", "being", "div", "##erted", "on", "a", "flight", "from", "K", "##hart", "##oum", "to", "Amman", ",", "authorities", "said", "." ], "ids": [ 51383, 26429, 19153, 10107, 20718, 10114, 10347, 57806, 10107, 11539, 10948, 10709, 10111, 10923, 11426, 10135, 70245, 10188, 169, 28407, 29791, 35007, 39157, 23366, 37008, 10111, 24032, 10189, 58961, 10106, 10829, 10662, 11223, 76486, 46949, 10135, 169, 23578, 10188, 148, 34567, 88314, 10114, 107098, 117, 28308, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "A", "spoke", "##sman", "for", "Stan", "##sted", "airport", "said", "that", "the", "uni", "##dent", "##ified", "hija", "##cker", "##s", "were", "demand", "##ing", "to", "see", "a", "British", "-", "based", "member", "of", "the", "Iraqi", "Community", "Association", ",", "called", "Mr", "Sad", "##iki", ",", "and", "that", "police", "were", "trying", "to", "trace", "him", "." ], "ids": [ 138, 50005, 24305, 10142, 26637, 36018, 28460, 12415, 10189, 10105, 69191, 21029, 31825, 26429, 19153, 10107, 10309, 34394, 10230, 10114, 12888, 169, 11160, 118, 11610, 12008, 10108, 10105, 57806, 18553, 11751, 117, 11552, 12916, 48691, 20897, 117, 10111, 10189, 15034, 10309, 32862, 10114, 59963, 10957, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 3, 7, 7, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "spoke", "##s", "##woman", "Kim", "White", "said", "police", "had", "already", "contacte", "##d", "Sad", "##iki", "and", "were", "trying", "to", "arra", "##nge", "to", "bring", "him", "to", "Stan", "##sted", ",", "30", "miles", "(", "48", "km", ")", "north", "-", "east", "of", "London", ",", "to", "talk", "to", "the", "hija", "##cker", "##s", "." ], "ids": [ 18051, 50005, 10107, 79999, 13539, 12136, 12415, 15034, 10374, 19034, 87471, 10162, 48691, 20897, 10111, 10309, 32862, 10114, 38192, 18180, 10114, 26092, 10957, 10114, 26637, 36018, 117, 10244, 14148, 113, 11300, 10204, 114, 12756, 118, 13827, 10108, 10829, 117, 10114, 31311, 10114, 10105, 26429, 19153, 10107, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "airport", "spoke", "##sman", "said", "the", "six", "hija", "##cker", "##s", ",", "who", "police", "said", "were", "armed", "with", "gr", "##ena", "##des", "and", "possibly", "other", "ex", "##plosive", "##s", ",", "were", "believed", "to", "be", "Iraqi", "national", "##s", "." ], "ids": [ 10117, 28460, 50005, 24305, 12415, 10105, 12449, 26429, 19153, 10107, 117, 10479, 15034, 12415, 10309, 34174, 10169, 30518, 13032, 10920, 10111, 33370, 10684, 11419, 83655, 10107, 117, 10309, 20718, 10114, 10347, 57806, 11844, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "The", "hija", "##cker", "##s", "started", "to", "release", "people", "for", "the", "Airbus", "plane", "in", "bat", "##ches", "of", "10", ",", "starting", "with", "women", "and", "children", ",", "in", "what", "police", "described", "as", "a", "\"", "controlled", "release", "\"", "." ], "ids": [ 10117, 26429, 19153, 10107, 13457, 10114, 14072, 11426, 10142, 10105, 35540, 35007, 10106, 11519, 16272, 10108, 10150, 117, 21868, 10169, 13190, 10111, 12694, 117, 10106, 12976, 15034, 13010, 10146, 169, 107, 29050, 14072, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "most", "of", "the", "passengers", "were", "Sudan", "##ese", "but", "that", "there", "were", "also", "an", "unknown", "number", "of", "Iraqi", "##s", ",", "Jordan", "##ians", ",", "Palestinian", "##s", ",", "Syrian", "##s", "and", "Saudi", "##s", "." ], "ids": [ 18051, 12415, 10992, 10108, 10105, 37008, 10309, 28407, 13565, 10473, 10189, 11155, 10309, 10379, 10151, 27306, 11487, 10108, 57806, 10107, 117, 16366, 34615, 117, 56119, 10107, 117, 44152, 10107, 10111, 26598, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 2, 6, 9, 2, 6, 9, 2, 6, 9, 2, 6, 9 ] }, { "tokens": [ "Later", "they", "said", "the", "number", "of", "passengers", "released", "from", "the", "plane", "had", "reached", "80", "." ], "ids": [ 16397, 10689, 12415, 10105, 11487, 10108, 37008, 11539, 10188, 10105, 35007, 10374, 17087, 10832, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##EA", "##T", "##UR", "##E", "-", "\"", "Eco", "terrorist", "##s", "\"", "target", "UK", "build", "##ers", "." ], "ids": [ 143, 36789, 11090, 98348, 11259, 118, 107, 85526, 76482, 10107, 107, 28564, 10523, 23332, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Edna", "Fernandes" ], "ids": [ 105174, 64178 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eco", "##logical", "warfare", "has", "broken", "out", "across", "the", "British", "construction", "industry", ",", "striking", "some", "of", "the", "biggest", "corporate", "##s", "as", "activists", "give", "up", "peace", "##ful", "protests", "and", "seek", "to", "hit", "build", "##ers", "where", "it", "hur", "##ts", "-", "-", "their", "profit", "margin", "##s", "." ], "ids": [ 85526, 32371, 74393, 10393, 36197, 10950, 15130, 10105, 11160, 13407, 17425, 117, 87894, 11152, 10108, 10105, 36304, 46666, 10107, 10146, 84024, 18090, 10741, 28101, 14446, 60931, 10111, 48394, 10114, 14946, 23332, 10901, 10940, 10271, 52824, 10806, 118, 118, 10455, 25081, 53388, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Des", "##cribed", "by", "one", "British", "company", "as", "\"", "e", "##co", "-", "terrorism", "\"", ",", "it", "is", "seen", "as", "the", "new", "business", "risk", "of", "the", "1990s", "." ], "ids": [ 13810, 66427, 10155, 10464, 11160, 12100, 10146, 107, 173, 10812, 118, 96969, 107, 117, 10271, 10124, 15652, 10146, 10105, 10751, 14155, 24179, 10108, 10105, 22829, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Famous", "names", "like", "Ta", "##rma", "##c", "Pl", "##c", ",", "Costa", "##in", "Group", "Pl", "##c", "and", "AR", "##C", ",", "a", "unit", "of", "con", "##glo", "##mera", "##te", "Hanson", "Pl", "##c", ",", "have", "all", "been", "targeted", "." ], "ids": [ 59540, 17978, 11850, 14248, 25248, 10350, 48932, 10350, 117, 13902, 10245, 12054, 48932, 10350, 10111, 50884, 10858, 117, 169, 16511, 10108, 10173, 77646, 35545, 10216, 72334, 48932, 10350, 117, 10529, 10435, 10590, 79837, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Act", "##ivi", "##st", "groups", "are", "no", "longer", "seen", "by", "British", "firms", "as", "a", "harm", "##less", ",", "badly", "organised", "ra", "##g", "##ba", "##g", "of", "students", "and", "hip", "##pies", "." ], "ids": [ 13968, 22317, 10562, 15647, 10301, 10192, 20165, 15652, 10155, 11160, 84459, 10146, 169, 105999, 14985, 117, 91810, 54200, 11859, 10240, 10537, 10240, 10108, 13501, 10111, 25377, 81513, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "You", "only", "have", "to", "see", "them", "in", "action", "at", "protests", ",", "\"", "said", "David", "Harding", ",", "spoke", "##sman", "at", "AR", "##C", ",", "Hanson", "'", "s", "aggregate", "##s", "company", ".", "\"" ], "ids": [ 107, 11065, 10893, 10529, 10114, 12888, 11345, 10106, 14204, 10160, 60931, 117, 107, 12415, 10804, 66102, 117, 50005, 24305, 10160, 50884, 10858, 117, 72334, 112, 187, 75063, 10107, 12100, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 3, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "walk", "around", "with", "mobile", "phone", "##s", "and", "camera", "equipment", ",", "they", "commun", "##icate", "and", "ga", "##ther", "support", "for", "demo", "##s", "via", "the", "Internet", "-", "-", "we", "'", "re", "talking", "about", "a", "highly", "so", "##phis", "##tica", "##ted", "organisation", ".", "\"" ], "ids": [ 11696, 33734, 12166, 10169, 24662, 41008, 10107, 10111, 26665, 24518, 117, 10689, 47605, 58621, 10111, 11887, 22623, 13145, 10142, 30776, 10107, 11406, 10105, 12416, 118, 118, 11951, 112, 11639, 78254, 10978, 169, 22625, 10380, 56395, 13640, 11912, 19688, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "road", "protest", "##or", "under", "the", "code", "##name", "St", "##eady", "Eddie", "told", "construction", "journal", "\"", "Building", "\"", "earlier", "this", "year", ",", "\"", "If", "it", "comes", "down", "to", "full", "-", "scale", "economic", "warfare", ",", "we", "will", "aim", "to", "drive", "them", "out", "of", "business", ".", "\"" ], "ids": [ 11340, 15485, 36627, 10667, 10571, 10105, 16964, 23920, 10838, 61973, 19414, 21937, 13407, 19061, 107, 21630, 107, 18905, 10531, 10924, 117, 107, 14535, 10271, 21405, 12935, 10114, 13375, 118, 19707, 13925, 74393, 117, 11951, 11337, 56048, 10114, 23806, 11345, 10950, 10108, 14155, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "well", "as", "financial", "threats", ",", "companies", "also", "emphasis", "##e", "the", "\"", "terror", "\"", "tactics", "used", "." ], "ids": [ 10882, 11206, 10146, 20570, 85186, 117, 18866, 10379, 60848, 10112, 10105, 107, 43143, 107, 101785, 11031, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Costa", "##in", "'", "s", "contract", "to", "build", "the", "controversial", "New", "##bury", "by", "##pass", ",", "which", "runs", "through", "a", "conservation", "area", ",", "has", "led", "to", "violent", "protests", "delay", "##ing", "building", ",", "bomb", "threats", ",", "staff", "int", "##imi", "##dati", "##on", "and", "pick", "##etin", "##g", "of", "chief", "executive", "Alan", "Love", "##ll", "'", "s", "home", "." ], "ids": [ 13902, 10245, 112, 187, 16108, 10114, 23332, 10105, 45475, 10287, 19218, 10155, 36388, 117, 10319, 17913, 11222, 169, 36378, 11168, 117, 10393, 12857, 10114, 43934, 60931, 76497, 10230, 12585, 117, 41654, 85186, 117, 18927, 26391, 20934, 62268, 10263, 10111, 36833, 77553, 10240, 10108, 19421, 22676, 14309, 11248, 11231, 112, 187, 11816, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Costa", "##in", "spoke", "##sman", "told", "Reuters", ":", "\"", "We", "'", "ve", "had", "all", "sort", "##s", "of", "protests", "at", "the", "head", "office", "and", "the", "chief", "executive", "'", "s", "house", "." ], "ids": [ 138, 13902, 10245, 50005, 24305, 21937, 46617, 131, 107, 12865, 112, 10323, 10374, 10435, 20363, 10107, 10108, 60931, 10160, 10105, 13578, 14301, 10111, 10105, 19421, 22676, 112, 187, 13215, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "it", "'", "s", "when", "it", "gets", "to", "the", "(", "employee", ")", "families", "-", "-", "that", "it", "goes", "across", "the", "line", ".", "\"" ], "ids": [ 16976, 10271, 112, 187, 10841, 10271, 30811, 10114, 10105, 113, 69312, 114, 15300, 118, 118, 10189, 10271, 25441, 15130, 10105, 12117, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##ctic", "##s", "used", "by", "some", "underground", "groups", "including", "the", "c", "##ry", "##ptic", "Berkshire", "Wood", "El", "##ves", ",", "which", "dis", "##tri", "##but", "##e", "leaf", "##lets", "with", "instructions", "on", "home", "-", "made", "ex", "##plosive", "##s", ",", "are", "now", "the", "subject", "of", "a", "police", "investigation", "." ], "ids": [ 14248, 35672, 10107, 11031, 10155, 11152, 37228, 15647, 11198, 10105, 171, 10908, 82842, 75690, 18315, 10224, 13136, 117, 10319, 27920, 21570, 23170, 10112, 52770, 36630, 10169, 68026, 10135, 11816, 118, 11019, 11419, 83655, 10107, 117, 10301, 11858, 10105, 20036, 10108, 169, 15034, 32719, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Other", "larger", "activist", "groups", "include", "Earth", "First", ",", "The", "Land", "is", "Our", "##s", ",", "Ala", "##rm", "UK", "and", "Road", "Ale", "##rt", "." ], "ids": [ 14490, 20434, 49024, 15647, 12363, 11012, 12128, 117, 10117, 12001, 10124, 18465, 10107, 117, 56500, 19341, 10523, 10111, 12648, 59340, 10976, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "groups", "have", "targeted", "specific", "projects", "like", "the", "New", "##bury", "by", "##pass", "and", "the", "M3", "motor", "##way", "through", "T", "##wy", "##ford", "Down", "in", "the", "southern", "county", "of", "Hampshire", "." ], "ids": [ 10117, 15647, 10529, 79837, 19182, 22846, 11850, 10105, 10287, 19218, 10155, 36388, 10111, 10105, 73909, 15257, 14132, 11222, 157, 12524, 13387, 16005, 10106, 10105, 17156, 17382, 10108, 26036, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "But", "they", "are", "also", "campaign", "##ing", "on", "broad", "##er", "issue", "such", "as", "stop", "##ping", "the", "government", "road", "building", "programme", "and", "out", "-", "of", "-", "town", "super", "##stor", "##es", "which", "they", "say", "create", "more", "traffic", ",", "pollution", "and", "damage", "local", "communities", "." ], "ids": [ 16976, 10689, 10301, 10379, 17323, 10230, 10135, 41848, 10165, 15557, 11049, 10146, 20517, 15398, 10105, 12047, 15485, 12585, 19611, 10111, 10950, 118, 10108, 118, 12221, 25212, 42396, 10171, 10319, 10689, 23763, 18842, 10798, 26482, 117, 68280, 10111, 26115, 11436, 25240, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "has", "sl", "##ash", "##ed", "its", "road", "-", "building", "spending", "." ], "ids": [ 10117, 12047, 10393, 38523, 73491, 10336, 10474, 15485, 118, 12585, 51163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Although", "protests", "may", "have", "contributed", "to", "the", "decision", "it", "has", "been", "seen", "primarily", "as", "economic", "rather", "than", "e", "##cological", "." ], "ids": [ 15785, 60931, 11387, 10529, 32128, 10114, 10105, 19231, 10271, 10393, 10590, 15652, 22426, 10146, 13925, 16863, 11084, 173, 68238, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Graham", "Watts", ",", "chief", "executive", "of", "the", "Construction", "Industry", "Council", ",", "said", ":", "\"", "I", "do", "n", "'", "t", "think", "many", "firms", "involved", "in", "tender", "##ing", "for", "sensitive", "projects", "real", "##ise", "the", "impact", "environmental", "activity", "has", "on", "the", "cost", "of", "running", "a", "project", "." ], "ids": [ 16928, 52376, 117, 19421, 22676, 10108, 10105, 33268, 25539, 12821, 117, 12415, 131, 107, 146, 10149, 182, 112, 188, 27874, 11299, 84459, 16247, 10106, 96486, 10230, 10142, 73330, 22846, 13486, 13041, 10105, 21316, 32704, 22205, 10393, 10135, 10105, 18849, 10108, 18020, 169, 13920, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "But", "they", "are", "more", "ale", "##rt", "than", "they", "were", "3", "-", "4", "years", "ago", "." ], "ids": [ 107, 16976, 10689, 10301, 10798, 11372, 10976, 11084, 10689, 10309, 124, 118, 125, 10855, 36390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "'", "s", "no", "doubt", "it", "'", "s", "a", "big", "issue", "now", ".", "\"" ], "ids": [ 11723, 112, 187, 10192, 86697, 10271, 112, 187, 169, 22185, 15557, 11858, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "says", "the", "damage", "comes", "in", "two", "forms", ":", "\"", "Tang", "##ible", "-", "-", "in", "the", "form", "of", "extra", "costs", ",", "additional", "security", ",", "threats", "to", "staff", "and", "the", "more", "int", "##ang", "##ible", "damage", "caused", "by", "negative", "public", "##ity", ".", "\"" ], "ids": [ 10357, 22153, 10105, 26115, 21405, 10106, 10551, 19639, 131, 107, 26603, 22529, 118, 118, 10106, 10105, 12188, 10108, 19868, 34495, 117, 18568, 21849, 117, 85186, 10114, 18927, 10111, 10105, 10798, 26391, 11889, 22529, 26115, 19513, 10155, 25785, 11683, 11949, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Watts", "said", "the", "cost", "of", "protest", "##ing", "can", "be", "heavy", "once", "the", "company", "is", "lock", "##ed", "into", "a", "contract", "." ], "ids": [ 52376, 12415, 10105, 18849, 10108, 36627, 10230, 10944, 10347, 18296, 14907, 10105, 12100, 10124, 79601, 10336, 10708, 169, 16108, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "often", "hear", "on", "the", "industry", "circuit", "of", "tales", "where", "the", "company", "tender", "##s", "at", "low", "margin", "##s", "and", "the", "demonstration", "##s", "which", "follow", "means", "they", "are", "running", "the", "project", "at", "a", "loss", ".", "\"" ], "ids": [ 107, 146, 10149, 12899, 62064, 10135, 10105, 17425, 24897, 10108, 24464, 10940, 10105, 12100, 96486, 10107, 10160, 15626, 53388, 10107, 10111, 10105, 97929, 10107, 10319, 28086, 17574, 10689, 10301, 18020, 10105, 13920, 10160, 169, 18576, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AR", "##C", "says", "it", "'", "s", "not", "just", "contract", "##ors", "in", "the", "front", "line", "but", "also", "su", "##pp", "##liers", "like", "itself", "." ], "ids": [ 50884, 10858, 22153, 10271, 112, 187, 10472, 12820, 16108, 16379, 10106, 10105, 14589, 12117, 10473, 10379, 10198, 16587, 79687, 11850, 17587, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Its", "own", "qua", "##rries", "came", "under", "attack", "after", "it", "emerged", "that", "it", "may", "be", "a", "su", "##pp", "##lier", "for", "the", "New", "##bury", "by", "##pass", "." ], "ids": [ 14864, 12542, 14517, 107788, 13383, 10571, 16342, 10662, 10271, 50658, 10189, 10271, 11387, 10347, 169, 10198, 16587, 30161, 10142, 10105, 10287, 19218, 10155, 36388, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "was", "called", "the", "\"", "First", "Battle", "of", "the", "New", "##bury", "by", "##pass", "'", ",", "\"", "said", "AR", "##C", "'", "s", "Harding", "." ], "ids": [ 107, 10377, 10134, 11552, 10105, 107, 12128, 14810, 10108, 10105, 10287, 19218, 10155, 36388, 112, 117, 107, 12415, 50884, 10858, 112, 187, 66102, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 3, 7, 9, 9, 4, 9 ] }, { "tokens": [ "\"", "We", "had", "300", "Earth", "First", "protest", "##ors", "in", "##vade", "and", "o", "##ccupy", "our", "site", "." ], "ids": [ 107, 12865, 10374, 11093, 11012, 12128, 36627, 16379, 10106, 106240, 10111, 183, 104560, 17446, 11920, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hundred", "##s", "of", "thousands", "of", "pounds", "(", "dollars", ")", "of", "damage", "was", "done", "in", "one", "day", "." ], "ids": [ 73415, 10107, 10108, 39966, 10108, 61982, 113, 27953, 114, 10108, 26115, 10134, 20378, 10106, 10464, 11940, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Plus", "there", "was", "the", "kn", "##ock", "-", "on", "cost", "of", "lost", "production", "and", "extra", "security", "in", "future", ".", "\"" ], "ids": [ 19258, 11155, 10134, 10105, 96820, 21863, 118, 10135, 18849, 10108, 14172, 12116, 10111, 19868, 21849, 10106, 16711, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Simon", "Brown", ",", "anal", "##yst", "at", "in", "##vest", "##ement", "bank", "UB", "##S", ",", "said", "this", "new", "phenomenon", "has", "led", "to", "a", "change", "in", "the", "way", "the", "industry", "eva", "##luat", "##es", "project", "risk", "." ], "ids": [ 12237, 12623, 117, 106615, 62769, 10160, 10106, 34592, 13748, 19423, 106005, 10731, 117, 12415, 10531, 10751, 79409, 10393, 12857, 10114, 169, 15453, 10106, 10105, 13170, 10105, 17425, 103730, 107114, 10171, 13920, 24179, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "When", "talking", "to", "Ta", "##rma", "##c", "about", "the", "M3", "link", "(", "through", "T", "##wy", "##ford", "Down", ")", "they", "made", "it", "fairly", "clear", "that", "their", "risk", "assessment", "methods", "have", "been", "changed", "and", "now", "involve", "a", "very", "clear", "environmental", "risk", "analysis", ".", "\"" ], "ids": [ 107, 12242, 78254, 10114, 14248, 25248, 10350, 10978, 10105, 73909, 26192, 113, 11222, 157, 12524, 13387, 16005, 114, 10689, 11019, 10271, 76281, 24866, 10189, 10455, 24179, 62492, 27413, 10529, 10590, 17695, 10111, 11858, 85232, 169, 12558, 24866, 32704, 24179, 19129, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 1, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Harding", "says", "others", "have", "done", "the", "same", ".", "\"" ], "ids": [ 66102, 22153, 14633, 10529, 20378, 10105, 11561, 119, 107 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "a", "result", "of", "e", "##co", "-", "terrorism", "we", "are", "looking", "at", "controversial", "jobs", "more", "closely", "to", "see", "if", "the", "profit", "margin", "##s", "are", "wide", "enough", "to", "cover", "things", "like", "extra", "security", ".", "\"" ], "ids": [ 10882, 169, 14493, 10108, 173, 10812, 118, 96969, 11951, 10301, 34279, 10160, 45475, 45083, 10798, 34331, 10114, 12888, 12277, 10105, 25081, 53388, 10107, 10301, 18064, 21408, 10114, 16068, 24682, 11850, 19868, 21849, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "an", "industry", "already", "suffering", "from", "raz", "##or", "-", "thin", "margin", "##s", ",", "over", "##cap", "##aci", "##ty", "and", "sta", "##gnant", "demand", ",", "e", "##co", "-", "terrorism", "is", "the", "latest", "biz", "##arre", "t", "##wis", "##t", "in", "the", "construction", "sector", "'", "s", "tale", "of", "wo", "##e", "." ], "ids": [ 11399, 10151, 17425, 19034, 49552, 10188, 20710, 10667, 118, 61470, 53388, 10107, 117, 10491, 93103, 28841, 11195, 10111, 16527, 51485, 34394, 117, 173, 10812, 118, 96969, 10124, 10105, 50908, 94912, 35460, 188, 83648, 10123, 10106, 10105, 13407, 17417, 112, 187, 17307, 10108, 12796, 10112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "Carnival", "ends", "in", "high", "spirit", "##s", "." ], "ids": [ 10829, 71138, 29047, 10106, 11846, 41576, 10107, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "26" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "'", "s", "annual", "Not", "##ting", "Hill", "Carnival", ",", "the", "largest", "in", "Europe", "and", "second", "in", "the", "world", "only", "to", "Rio", ",", "ended", "peace", "##fully", "on", "Monday", "with", "an", "estimated", "800", ",", "000", "rev", "##eller", "##s", "singing", "and", "dancing", "the", "day", "away", "in", "high", "spirit", "##s", "." ], "ids": [ 10829, 112, 187, 19246, 16040, 12141, 12289, 71138, 117, 10105, 15363, 10106, 11767, 10111, 11132, 10106, 10105, 11356, 10893, 10114, 12109, 117, 18428, 28101, 42920, 10135, 40714, 10169, 10151, 25267, 11900, 117, 10259, 86095, 35303, 10107, 34746, 10111, 69463, 10105, 11940, 14942, 10106, 11846, 41576, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "they", "made", "30", "arrest", "##s", "and", "there", "were", "two", "sta", "##bbi", "##ngs", "." ], "ids": [ 18051, 12415, 10689, 11019, 10244, 45165, 10107, 10111, 11155, 10309, 10551, 16527, 37801, 34876, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "there", "was", "no", "repeat", "of", "the", "ug", "##ly", "scenes", "that", "used", "to", "s", "##car", "the", "street", "festival", ",", "and", "police", "praised", "the", "crowd", "##s", "over", "the", "two", "days", "of", "fest", "##ivi", "##ties", "as", "good", "-", "nature", "##d", "." ], "ids": [ 16976, 11155, 10134, 10192, 107832, 10108, 10105, 11678, 10454, 32483, 10189, 11031, 10114, 187, 15983, 10105, 23840, 15242, 117, 10111, 15034, 38394, 10105, 50059, 10107, 10491, 10105, 10551, 13990, 10108, 34519, 22317, 14197, 10146, 15198, 118, 16613, 10162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Around", "400", "police", "were", "wounded", "in", "rio", "##ts", "in", "1976", "when", "the", "car", "##ni", "##val", ",", "now", "in", "its", "31", "##st", "year", ",", "acquired", "its", "dark", "##er", "reputation", "from", "which", "it", "is", "now", "only", "slowly", "recover", "##ing", "." ], "ids": [ 25801, 11176, 15034, 10309, 39127, 10106, 27244, 10806, 10106, 10705, 10841, 10105, 13000, 10342, 12234, 117, 11858, 10106, 10474, 10413, 10562, 10924, 117, 21011, 10474, 25100, 10165, 44214, 10188, 10319, 10271, 10124, 11858, 10893, 63088, 94962, 10230, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shop", "##keeper", "##s", "still", "board", "up", "their", "windows", "and", "many", "residents", "leave", "town", "for", "the", "weekend", ",", "but", "for", "four", "or", "five", "years", "there", "has", "been", "no", "disorder", "and", "relatively", "little", "crime", "." ], "ids": [ 44132, 98767, 10107, 12647, 17936, 10741, 10455, 40115, 10111, 11299, 22058, 21964, 12221, 10142, 10105, 43440, 117, 10473, 10142, 11598, 10345, 12403, 10855, 11155, 10393, 10590, 10192, 55405, 10111, 28436, 16745, 22564, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OF", "##F", "##IC", "##IA", "##L", "J", "##O", "##UR", "##NA", "##L", "CO", "##NT", "##EN", "##TS", "-", "O", "##J", "C", "248", "OF", "AU", "##G", "##US", "##T", "26", ",", "1996", "." ], "ids": [ 23240, 11565, 30889, 35976, 11369, 147, 11403, 98348, 36742, 11369, 32992, 77261, 50655, 36545, 118, 152, 15417, 140, 24889, 23240, 29088, 11447, 32612, 11090, 10314, 117, 10389, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*" ], "ids": [ 115 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "(", "Note", "-", "contents", "are", "displayed", "in", "reverse", "order", "to", "that", "in", "the", "printed", "Journal", ")" ], "ids": [ 113, 20231, 118, 97831, 10301, 52991, 10106, 60971, 12990, 10114, 10189, 10106, 10105, 44632, 11929, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "*" ], "ids": [ 115 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "AN", "##NE", "##X" ], "ids": [ 50972, 93280, 12674 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "ST", "##AT", "##EM", "##EN", "##T", "OF", "THE", "CO", "##UN", "##CI", "##L", "'", "S", "RE", "##AS", "##ON", "##S" ], "ids": [ 53317, 32071, 67753, 50655, 11090, 23240, 17443, 32992, 69849, 89955, 11369, 112, 156, 71033, 38025, 30118, 10731 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##NE", "##X", "I" ], "ids": [ 50972, 93280, 12674, 146 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##NE", "##X", "A" ], "ids": [ 50972, 93280, 12674, 138 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##AT", "##EM", "##EN", "##T", "OF", "THE", "CO", "##UN", "##CI", "##L", "'", "S", "RE", "##AS", "##ON", "##S", "EN", "##D", "OF", "DO", "##C", "##UM", "##EN", "##T", "." ], "ids": [ 53317, 32071, 67753, 50655, 11090, 23240, 17443, 32992, 69849, 89955, 11369, 112, 156, 71033, 38025, 30118, 10731, 31278, 11490, 23240, 99843, 10858, 72679, 50655, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indonesia", "newspaper", "reports", "central", "bank", "scandal", "." ], "ids": [ 11658, 22047, 26610, 12397, 19423, 83458, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "JA", "##KA", "##RT", "##A", "1996", "-", "08", "-", "27" ], "ids": [ 53399, 67813, 46935, 10738, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indonesia", "'", "s", "central", "bank", "suffered", "seven", "billion", "ru", "##pia", "##h", "(", "$", "2", ".", "9", "million", ")", "in", "losses", "resulting", "from", "fa", "##ke", "transaction", "##s", ",", "the", "Jakarta", "Post", "reported", "on", "Tuesday", "." ], "ids": [ 11658, 112, 187, 12397, 19423, 26090, 15767, 25848, 13483, 17837, 10237, 113, 109, 123, 119, 130, 12473, 114, 10106, 45353, 26746, 10188, 12211, 10550, 105042, 10107, 117, 10105, 14164, 14539, 15943, 10135, 70245, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Bank", "Indonesia", "spoke", "##s", "##woman", "confirmed", "the", "newspaper", "report", "but", "declined", "to", "give", "further", "details", "." ], "ids": [ 138, 13533, 11658, 50005, 10107, 79999, 27347, 10105, 22047, 17553, 10473, 44948, 10114, 18090, 14586, 29500, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "bank", "'", "s", "governor", "Sud", "##rad", "##jat", "D", "##ji", "##wand", "##ono", "was", "quoted", "as", "saying", "on", "Monday", "about", "5", ".", "4", "billion", "ru", "##pia", "##h", "of", "the", "seven", "billion", "ru", "##pia", "##h", "had", "been", "recovered", "." ], "ids": [ 10117, 19423, 112, 187, 28795, 13352, 18599, 21757, 141, 10775, 31389, 12507, 10134, 70676, 10146, 22807, 10135, 40714, 10978, 126, 119, 125, 25848, 13483, 17837, 10237, 10108, 10105, 15767, 25848, 13483, 17837, 10237, 10374, 10590, 55051, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "newspaper", "said", "it", "was", "the", "central", "bank", "'", "s", "first", "public", "scandal", "in", "its", "43", "-", "year", "history", "." ], "ids": [ 10117, 22047, 12415, 10271, 10134, 10105, 12397, 19423, 112, 187, 10422, 11683, 83458, 10106, 10474, 11370, 118, 10924, 11486, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "paper", "said", "five", "people", "had", "been", "arrested", "and", "police", "were", "looking", "for", "two", "more", "suspect", "##s", "." ], "ids": [ 10117, 17895, 12415, 12403, 11426, 10374, 10590, 29479, 10111, 15034, 10309, 34279, 10142, 10551, 10798, 97881, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "$", "1", "=", "2", ",", "341", "ru", "##pia", "##h", ")" ], "ids": [ 113, 109, 122, 134, 123, 117, 35957, 13483, 17837, 10237, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "PL", "##A", "##Y", "##ER", "##S", "DI", "##VI", "##DE", "##D", "ON", "CA", "##RT", "RE", "##Q", "##UE", "##ST", "FOR", "OL", "##A", "##ZA", "##BA", "##L", "." ], "ids": [ 41525, 11369, 11565, 118, 71341, 10738, 14703, 24093, 10731, 110014, 90939, 60675, 11490, 49339, 24707, 46935, 71033, 19282, 62674, 32995, 109544, 19768, 10738, 105512, 35999, 11369, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "NO", "##RT", "##HA", "##MP", "##TO", "##N", ",", "England", "1996", "-", "08", "-", "27" ], "ids": [ 49307, 46935, 58132, 79936, 60493, 11537, 117, 11701, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Se", "##ve", "Ball", "##ester", "##os", "and", "Colin", "Mont", "##gom", "##erie", "are", "divided", "on", "whether", "Jose", "Maria", "Ola", "##zaba", "##l", "should", "be", "allowed", "to", "return", "to", "the", "European", "PGA", "Tour", "using", "a", "motori", "##sed", "car", "##t", "to", "transport", "him", "around", "the", "course", "." ], "ids": [ 11045, 10612, 19479, 39807, 10310, 10111, 20766, 19472, 72757, 25433, 10301, 23439, 10135, 21883, 23029, 11066, 66039, 83850, 10161, 14819, 10347, 18162, 10114, 15079, 10114, 10105, 11914, 59115, 11595, 13382, 169, 62424, 16219, 13000, 10123, 10114, 16024, 10957, 12166, 10105, 15348, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Spania", "##rd", "has", "not", "played", "for", "nearly", "a", "year", "because", "of", "r", "##he", "##uma", "##toi", "##d", "art", "##hri", "##tis", "in", "both", "his", "feet", ",", "and", "organiser", "##s", "of", "a", "pairs", "event", "to", "be", "staged", "in", "Bordeaux", ",", "France", "from", "October", "17", "to", "20", "have", "been", "asked", "to", "provide", "him", "with", "a", "bug", "##gy", "." ], "ids": [ 10117, 42751, 12023, 10393, 10472, 11553, 10142, 21377, 169, 10924, 12373, 10108, 186, 11643, 16746, 40331, 10162, 11938, 53743, 13434, 10106, 11408, 10226, 17296, 117, 10111, 93446, 10107, 10108, 169, 55736, 14416, 10114, 10347, 84310, 10106, 25169, 117, 10688, 10188, 11212, 10273, 10114, 10197, 10529, 10590, 22151, 10114, 16871, 10957, 10169, 169, 14460, 17113, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "the", "(", "Tour", "'", "s", "tournament", ")", "committee", "decides", "to", "change", "the", "rule", "I", "would", "not", "be", "against", "it", ",", "\"", "said", "Ball", "##ester", "##os", ",", "Ola", "##zaba", "##l", "'", "s", "com", "##pat", "##riot", "and", "Ryder", "Cup", "captain", "." ], "ids": [ 107, 14535, 10105, 113, 11595, 112, 187, 17390, 114, 27634, 56253, 10114, 15453, 10105, 21983, 146, 10894, 10472, 10347, 11327, 10271, 117, 107, 12415, 19479, 39807, 10310, 117, 66039, 83850, 10161, 112, 187, 10212, 18115, 92113, 10111, 71379, 11544, 28157, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "But", "com", "##mite", "##e", "member", "Mont", "##gom", "##erie", "said", "it", "could", "set", "an", "un", "##hel", "##pf", "##ul", "pre", "##cedent", ".", "\"" ], "ids": [ 16976, 10212, 34095, 10112, 12008, 19472, 72757, 25433, 12415, 10271, 12174, 11847, 10151, 10119, 31572, 55942, 10604, 12229, 104101, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "know", "Ol", "##ly", "'", "s", "situation", "is", "very", "un", "##fort", "##una", "##te", ",", "but", "I", "do", "n", "'", "t", "think", "we", "can", "start", "giving", "dis", "##pensa", "##tions", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 146, 21852, 60160, 10454, 112, 187, 18586, 10124, 12558, 10119, 23044, 14212, 10216, 117, 10473, 146, 10149, 182, 112, 188, 27874, 11951, 10944, 15148, 24426, 27920, 74599, 15024, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "You", "'", "ve", "got", "to", "have", "a", "rule", "for", "every", "##body", "and", "I", "do", "n", "'", "t", "think", "it", "'", "s", "fe", "##asi", "##ble", ".", "\"" ], "ids": [ 11065, 112, 10323, 19556, 10114, 10529, 169, 21983, 10142, 14234, 38078, 10111, 146, 10149, 182, 112, 188, 27874, 10271, 112, 187, 34778, 15525, 11203, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "use", "of", "car", "##ts", "is", "generally", "prohibited", "in", "the", "professional", "game", ",", "and", "if", "Ola", "##zaba", "##l", "is", "allowed", "to", "use", "one", "in", "Bordeaux", ",", "he", "might", "then", "request", "one", "for", "the", "qualifying", "tournaments", "for", "next", "year", "'", "s", "Ryder", "Cup", "." ], "ids": [ 10117, 11760, 10108, 13000, 10806, 10124, 18081, 99210, 10106, 10105, 14054, 11661, 117, 10111, 12277, 66039, 83850, 10161, 10124, 18162, 10114, 11760, 10464, 10106, 25169, 117, 10261, 20970, 11059, 37449, 10464, 10142, 10105, 43631, 67330, 10142, 13451, 10924, 112, 187, 71379, 11544, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "P", "##OL", "##AN", "##D", "T", "##IE", "##S", "C", "##YP", "##R", "##US", "2", "-", "2", "IN", "FR", "##IE", "##ND", "##L", "##Y", "MA", "##TC", "##H", "." ], "ids": [ 71020, 65622, 24093, 118, 153, 39272, 41275, 11490, 157, 71655, 10731, 140, 98904, 11273, 32612, 123, 118, 123, 36351, 64655, 71655, 58521, 11369, 14703, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##LC", "##HA", "##TO", "##W", ",", "Poland", "1996", "-", "08", "-", "27" ], "ids": [ 46291, 84906, 58132, 60493, 13034, 117, 17879, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Poland", "and", "Cyprus", "drew" ], "ids": [ 17879, 10111, 45639, 49098 ], "entity": [ "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 1, 9 ] }, { "tokens": [ "2", "-", "2", "(", "half", "##time", "0", "-", "0", ")", "in", "a", "friendly", "soccer", "international", "on" ], "ids": [ 123, 118, 123, 113, 13877, 18086, 121, 118, 121, 114, 10106, 169, 43941, 41356, 12533, 10135 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tuesday", "." ], "ids": [ 70245, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Poland", "-", "Krzysztof", "War", "##zych", "##a", "(", "46", "##th", "minute", ")", ",", "Marcin", "Mi", "##ecie", "##l" ], "ids": [ 17879, 118, 43295, 11277, 44329, 10113, 113, 11528, 11143, 21760, 114, 117, 69116, 19803, 69495, 10161 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "57", "##th", ")" ], "ids": [ 113, 11817, 11143, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Cyprus", "-", "K", "##limi", "##s", "Alexa", "##ndro", "##u", "(", "75", "##th", ")", ",", "Ko", "##stas", "Male", "##kos", "(", "80", "##th", ")" ], "ids": [ 45639, 118, 148, 89337, 10107, 94720, 78908, 10138, 113, 11417, 11143, 114, 117, 30186, 21898, 36172, 18845, 113, 10832, 11143, 114 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "3", ",", "000" ], "ids": [ 46080, 124, 117, 10259 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "T", "##H", "##OM", "##S", "##ON", "RE", "##SI", "##G", "##NS", "AS", "MAN", "##AG", "##ER", "OF", "RAI", "##TH", "R", "##O", "##VE", "##RS", "." ], "ids": [ 71020, 65622, 24093, 118, 157, 12396, 37079, 10731, 30118, 71033, 44802, 11447, 69196, 17421, 73020, 109865, 24093, 23240, 91194, 109166, 155, 11403, 68560, 39469, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "K", "##IR", "##K", "##CA", "##LD", "##Y", ",", "Scotland", "1996", "-", "08", "-", "27" ], "ids": [ 148, 73522, 11733, 46900, 62943, 14703, 117, 16901, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jimmy", "Thomson", "became", "Scotland", "'", "s", "first", "manager", "##ial", "casu", "##alt", "##y", "of", "the", "season", "on", "Tuesday", "when", "he", "quit", "Rai", "##th", "Rovers", ",", "bottom", "of", "the", "premier", "division", "." ], "ids": [ 16226, 25045, 11179, 16901, 112, 187, 10422, 16935, 15619, 34236, 22897, 10157, 10108, 10105, 11226, 10135, 70245, 10841, 10261, 101237, 31249, 11143, 44311, 117, 34787, 10108, 10105, 11913, 13751, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thomson", "resigned", "after", "the", "club", "'", "s", "directors", "asked", "him", "to", "return", "to", "his", "previous", "position", "as", "youth", "team", "coach", "." ], "ids": [ 25045, 34784, 10662, 10105, 11111, 112, 187, 44416, 22151, 10957, 10114, 15079, 10114, 10226, 16741, 12956, 10146, 24215, 11121, 15701, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "had", "been", "in", "charge", "for", "six", "months", "." ], "ids": [ 10357, 10374, 10590, 10106, 18163, 10142, 12449, 15555, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rai", "##th", "lost", "their", "first", "two", "games", "of", "the", "season", "away", "to", "Rangers", "and", "Celtic", ",", "then", "crashed", "3", "-", "0", "at", "home", "to", "Mother", "##well", "on", "Saturday", "." ], "ids": [ 31249, 11143, 14172, 10455, 10422, 10551, 13332, 10108, 10105, 11226, 14942, 10114, 23042, 10111, 30948, 117, 11059, 91126, 124, 118, 121, 10160, 11816, 10114, 23625, 15862, 10135, 24848, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "A", "club", "statement", "said", ":", "\"", "The", "directors", "of", "Rai", "##th", "Rovers", "FC", "invited", "Jimmy", "Thomson", "to", "re", "##lin", "##quis", "##h", "the", "post", "of", "manager", "and", "to", "res", "##ume", "his", "former", "position", "as", "youth", "team", "coach", "." ], "ids": [ 138, 11111, 33311, 12415, 131, 107, 10117, 44416, 10108, 31249, 11143, 44311, 11529, 33392, 16226, 25045, 10114, 11639, 13020, 53499, 10237, 10105, 11841, 10108, 16935, 10111, 10114, 39429, 20467, 10226, 11775, 12956, 10146, 24215, 11121, 15701, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Reg", "##retta", "##bly", "Jimmy", "has", "felt", "unable", "to", "accept", "that", "offer", ",", "and", "has", "according", "##ly", "left", "the", "club", ".", "\"" ], "ids": [ 107, 107990, 54128, 31748, 16226, 10393, 24666, 30553, 10114, 45218, 10189, 24443, 117, 10111, 10393, 18071, 10454, 12153, 10105, 11111, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thomson", "said", ":", "\"", "I", "am", "leaving", "with", "my", "dig", "##nity", "and", "my", "pride", "intact", ",", "and", "that", "is", "very", "important", "to", "me", "." ], "ids": [ 25045, 12415, 131, 107, 146, 10392, 21005, 10169, 15127, 80592, 96585, 10111, 15127, 74837, 87364, 117, 10111, 10189, 10124, 12558, 12452, 10114, 10911, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "While", "not", "agree", "##ing", "with", "the", "directors", "'", "decision", ",", "I", "respect", "their", "reasons", "for", "making", "it", ".", "\"" ], "ids": [ 107, 14600, 10472, 68312, 10230, 10169, 10105, 44416, 112, 19231, 117, 146, 28944, 10455, 31725, 10142, 14293, 10271, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "UN", "##ION", "-", "GR", "##I", "##Q", "##U", "##AL", "##AN", "##D", "W", "##ES", "##T", "AND", "NE", "##W", "Z", "##EA", "##LA", "##ND", "DR", "##A", "##W", "IN", "TOUR", "MA", "##TC", "##H", "." ], "ids": [ 155, 12022, 32469, 14703, 26578, 52980, 118, 58787, 11281, 19282, 12022, 32002, 41275, 11490, 160, 25054, 11090, 52428, 86607, 13034, 163, 36789, 44376, 58521, 45457, 10738, 13034, 36351, 86526, 27277, 55671, 12396, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5, 5, 5, 5, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##IM", "##B", "##ER", "##LE", "##Y", ",", "South", "Africa", "1996", "-", "08", "-", "27" ], "ids": [ 148, 42031, 11274, 24093, 51036, 14703, 117, 11056, 12880, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##ri", "##qual", "##and", "West" ], "ids": [ 144, 10401, 102260, 14752, 11164 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5, 5 ] }, { "tokens": [ "and", "New", "Zealand", "drew", "18", "-", "18", "(", "half", "##time", "6", "-", "10", ")", "in", "their", "rugby", "union" ], "ids": [ 10111, 10287, 14451, 49098, 10218, 118, 10218, 113, 13877, 18086, 127, 118, 10150, 114, 10106, 10455, 19812, 20763 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "tour", "mal", "##tch", "on", "Tuesday", "." ], "ids": [ 12842, 15189, 38732, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "G", "##ri", "##qual", "##and", "West", "-", "Tri", "##es", ":", "Andre", "Cl", "##oe", "##te", ",", "Leon", "van", "der", "Wat", "##h", "." ], "ids": [ 144, 10401, 102260, 14752, 11164, 118, 36642, 10171, 131, 25188, 101989, 20085, 10216, 117, 19409, 10145, 10118, 51082, 10237, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Con", "##version", ":", "Bo", "##eta", "Wes", "##sels", "." ], "ids": [ 12845, 44404, 131, 27622, 14724, 48055, 47082, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Penal", "##ties", ":", "Wes", "##sels", "2", "." ], "ids": [ 104976, 14197, 131, 48055, 47082, 123, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "New", "Zealand", "-", "Tri", "##es", ":", "Scott", "M", "##c", "##Leod", ",", "Glen", "Osborne", "." ], "ids": [ 10287, 14451, 118, 36642, 10171, 131, 12812, 150, 10350, 80856, 117, 30729, 65888, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "Con", "##version", ":" ], "ids": [ 12845, 44404, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Jon", "Preston", "." ], "ids": [ 17749, 35119, 119 ], "entity": [ "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 9 ] }, { "tokens": [ "Penal", "##ties", ":", "Preston", "2", "." ], "ids": [ 104976, 14197, 131, 35119, 123, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "BA", "##LL", "RE", "##SI", "##G", "##NS", "AS", "MAN", "##CH", "##ES", "##TER", "C", "##IT", "##Y", "MAN", "##AG", "##ER", "." ], "ids": [ 71020, 65622, 24093, 118, 39999, 82834, 71033, 44802, 11447, 69196, 17421, 73020, 86448, 25054, 99552, 140, 37611, 14703, 73020, 109865, 24093, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "27" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "England", "midfielder", "Alan", "Ball", "resigned", "as", "manager", "of", "first", "division", "side", "Manchester", "City", "on", "Monday", "night", ",", "the", "club", "said", "." ], "ids": [ 42355, 11701, 68049, 14309, 19479, 34784, 10146, 16935, 10108, 10422, 13751, 12250, 15349, 10773, 10135, 40714, 16903, 117, 10105, 11111, 12415, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ball", ",", "appointed", "in", "July", "1995", ",", "was", "unable", "to", "prevent", "City", "being", "relegated", "from", "the", "premier", "league", "last", "season", "and", "his", "record", "read", "13", "wins", ",", "14", "draws", "and", "22", "losses", "in", "49", "games", "." ], "ids": [ 19479, 117, 14896, 10106, 11112, 10436, 117, 10134, 30553, 10114, 29320, 10773, 11223, 62212, 10188, 10105, 11913, 15616, 12469, 11226, 10111, 10226, 12410, 24944, 10249, 27279, 117, 10247, 77517, 10111, 10306, 45353, 10106, 11580, 13332, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "have", "lost", "two", "of", "their", "three", "matches", "so", "far", "this", "season", "." ], "ids": [ 11696, 10529, 14172, 10551, 10108, 10455, 11003, 18258, 10380, 13301, 10531, 11226, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Club", "secretary", "Bernard", "Half", "##ord", "said", "in", "a", "statement", ":", "\"", "The", "chairman", "and", "Board", "would", "like", "to", "place", "on", "record", "their", "app", "##rec", "##iation", "of", "his", "ende", "##avour", "##s", "and", "efforts", "whilst", "in", "his", "period", "of", "office", "and", "wish", "him", "well", "in", "the", "future", ".", "\"" ], "ids": [ 11316, 37664, 14450, 33100, 17392, 12415, 10106, 169, 33311, 131, 107, 10117, 27627, 10111, 14743, 10894, 11850, 10114, 11192, 10135, 12410, 10455, 72894, 74755, 32767, 10108, 10226, 47842, 99749, 10107, 10111, 22116, 48303, 10106, 10226, 13127, 10108, 14301, 10111, 66069, 10957, 11206, 10106, 10105, 16711, 119, 107 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "English", "league", "soccer", "standing", "##s" ], "ids": [ 11616, 15616, 41356, 32173, 10107 ], "entity": [ "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9 ] }, { "tokens": [ "after", "Tuesday", "'", "s", "matches", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", "," ], "ids": [ 10662, 70245, 112, 187, 18258, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "goals", "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 14172, 117, 18173, 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Division", "one" ], "ids": [ 11987, 10464 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Tra", "##n", "##mere", "3", "2", "1", "0", "6", "3", "7" ], "ids": [ 21469, 10115, 32732, 124, 123, 122, 121, 127, 124, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bolton", "3", "2", "1", "0", "5", "2", "7" ], "ids": [ 34462, 124, 123, 122, 121, 126, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barn", "##sley", "2", "2", "0", "0", "5", "2", "6" ], "ids": [ 61802, 28428, 123, 123, 121, 121, 126, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wolverhampton", "2", "2", "0", "0", "4", "1", "6" ], "ids": [ 98739, 123, 123, 121, 121, 125, 122, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Queens", "Park", "Rangers", "2", "2", "0", "0", "4", "2", "6" ], "ids": [ 34140, 11239, 23042, 123, 123, 121, 121, 125, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stoke", "2", "2", "0", "0", "4", "2", "6" ], "ids": [ 60824, 123, 123, 121, 121, 125, 123, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Norwich", "3", "2", "0", "1", "4", "3", "6" ], "ids": [ 51816, 124, 123, 121, 122, 125, 124, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ipswich", "3", "1", "1", "1", "6", "4", "4" ], "ids": [ 86146, 124, 122, 122, 122, 127, 125, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Birmingham", "2", "1", "1", "0", "5", "4", "4" ], "ids": [ 22712, 123, 122, 122, 121, 126, 125, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Crystal", "Palace", "3", "1", "1", "1", "3", "2", "4" ], "ids": [ 28459, 22015, 124, 122, 122, 122, 124, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oxford", "3", "1", "0", "2", "6", "3", "3" ], "ids": [ 11109, 124, 122, 121, 123, 127, 124, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bradford", "2", "1", "0", "1", "3", "2", "3" ], "ids": [ 40141, 123, 122, 121, 122, 124, 123, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hu", "##dder", "##sfield", "2", "1", "0", "1", "3", "3", "3" ], "ids": [ 43707, 42113, 53495, 123, 122, 121, 122, 124, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portsmouth", "3", "1", "0", "2", "3", "5", "3" ], "ids": [ 46933, 124, 122, 121, 123, 124, 126, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reading", "2", "1", "0", "1", "3", "5", "3" ], "ids": [ 10629, 123, 122, 121, 122, 124, 126, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Manchester", "City", "3", "1", "0", "2", "2", "3", "3" ], "ids": [ 15349, 10773, 124, 122, 121, 123, 123, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "West", "Bro", "##m", "##wich", "3", "0", "2", "1", "2", "3", "2" ], "ids": [ 11164, 32470, 10147, 33544, 124, 121, 123, 122, 123, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Port", "Vale", "3", "0", "2", "1", "2", "4", "2" ], "ids": [ 14734, 32286, 124, 121, 123, 122, 123, 125, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", "United", "2", "0", "1", "1", "4", "5", "1" ], "ids": [ 31695, 10609, 123, 121, 122, 122, 125, 126, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##rim", "##sby", "3", "0", "1", "2", "4", "7", "1" ], "ids": [ 144, 23760, 38243, 124, 121, 122, 123, 125, 128, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Charlton", "2", "0", "1", "1", "1", "3", "1" ], "ids": [ 68730, 123, 121, 122, 122, 122, 124, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##wind", "##on", "2", "0", "1", "1", "1", "3", "1" ], "ids": [ 156, 47673, 10263, 123, 121, 122, 122, 122, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "##end", "3", "0", "1", "2", "1", "7", "1" ], "ids": [ 11056, 19342, 124, 121, 122, 123, 122, 128, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oldham", "2", "0", "0", "2", "2", "5", "0" ], "ids": [ 109860, 123, 121, 121, 123, 123, 126, 121 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Division", "##n", "two" ], "ids": [ 11987, 10115, 10551 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Plymouth", "3", "2", "1", "0", "8", "5", "7" ], "ids": [ 40814, 124, 123, 122, 121, 129, 126, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brent", "##ford", "3", "2", "1", "0", "6", "3", "7" ], "ids": [ 56333, 13387, 124, 123, 122, 121, 127, 124, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shrewsbury", "3", "2", "1", "0", "6", "3", "7" ], "ids": [ 109224, 124, 123, 122, 121, 127, 124, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bury", "3", "2", "1", "0", "4", "2", "7" ], "ids": [ 84780, 124, 123, 122, 121, 125, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Burn", "##ley", "3", "2", "0", "1", "5", "5", "6" ], "ids": [ 49331, 12105, 124, 123, 121, 122, 126, 126, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bourne", "##mouth", "3", "2", "0", "1", "4", "3", "6" ], "ids": [ 80776, 56873, 124, 123, 121, 122, 125, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Blackpool", "3", "2", "0", "1", "3", "2", "6" ], "ids": [ 102917, 124, 123, 121, 122, 124, 123, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chester", "##field", "3", "2", "0", "1", "3", "2", "6" ], "ids": [ 32729, 13408, 124, 123, 121, 122, 124, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mill", "##wall", "3", "1", "1", "1", "5", "4", "4" ], "ids": [ 28639, 33743, 124, 122, 122, 122, 126, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Crew", "##e", "3", "1", "1", "1", "4", "4", "4" ], "ids": [ 45170, 10112, 124, 122, 122, 122, 125, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gill", "##ingham", "3", "1", "1", "1", "4", "5", "4" ], "ids": [ 33787, 57076, 124, 122, 122, 122, 125, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Preston", "3", "1", "1", "1", "3", "3", "4" ], "ids": [ 35119, 124, 122, 122, 122, 124, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Not", "##ts", "County", "2", "1", "1", "0", "2", "1", "4" ], "ids": [ 16040, 10806, 10886, 123, 122, 122, 121, 123, 122, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bristol", "Rovers", "2", "1", "1", "0", "1", "0", "4" ], "ids": [ 24732, 44311, 123, 122, 122, 121, 122, 121, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bristol", "City", "3", "1", "0", "2", "7", "4", "3" ], "ids": [ 24732, 10773, 124, 122, 121, 123, 128, 125, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "York", "3", "1", "0", "2", "5", "6", "3" ], "ids": [ 10482, 124, 122, 121, 123, 126, 127, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wat", "##ford", "3", "1", "0", "2", "2", "5", "3" ], "ids": [ 51082, 13387, 124, 122, 121, 123, 123, 126, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##re", "##x", "##ham", "2", "0", "2", "0", "5", "5", "2" ], "ids": [ 160, 10246, 10686, 13196, 123, 121, 123, 121, 126, 126, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##y", "##combe", "3", "0", "2", "1", "2", "3", "2" ], "ids": [ 160, 10157, 87041, 124, 121, 123, 122, 123, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Roth", "##er", "##ham", "3", "0", "1", "2", "3", "5", "1" ], "ids": [ 32925, 10165, 13196, 124, 121, 122, 123, 124, 126, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peterborough", "2", "0", "1", "1", "2", "3", "1" ], "ids": [ 104232, 123, 121, 122, 122, 123, 124, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##als", "##all", "3", "0", "1", "2", "2", "4", "1" ], "ids": [ 160, 20162, 18995, 124, 121, 122, 123, 123, 125, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stock", "##port", "3", "0", "1", "2", "0", "2", "1" ], "ids": [ 31916, 15520, 124, 121, 122, 123, 121, 123, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lu", "##ton", "3", "0", "0", "3", "3", "10", "0" ], "ids": [ 23859, 11183, 124, 121, 121, 124, 124, 10150, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Division", "three" ], "ids": [ 11987, 11003 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Hart", "##le", "##pool", "3", "2", "1", "0", "6", "3", "7" ], "ids": [ 22346, 10284, 61571, 124, 123, 122, 121, 127, 124, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wigan", "3", "2", "1", "0", "5", "2", "7" ], "ids": [ 85593, 124, 123, 122, 121, 126, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hull", "3", "2", "1", "0", "4", "2", "7" ], "ids": [ 37465, 124, 123, 122, 121, 125, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Carlisle", "3", "2", "1", "0", "2", "0", "7" ], "ids": [ 65204, 124, 123, 122, 121, 123, 121, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fulham", "3", "2", "0", "1", "4", "3", "6" ], "ids": [ 84725, 124, 123, 121, 122, 125, 124, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sc", "##unt", "##hor", "##pe", "3", "2", "0", "1", "2", "2", "6" ], "ids": [ 55260, 20631, 39854, 11355, 124, 123, 121, 122, 123, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sc", "##ar", "##borough", "3", "1", "2", "0", "4", "2", "5" ], "ids": [ 55260, 10354, 33057, 124, 122, 123, 121, 125, 123, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Exeter", "3", "1", "2", "0", "4", "3", "5" ], "ids": [ 61436, 124, 122, 123, 121, 125, 124, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cambridge", "3", "1", "2", "0", "3", "2", "5" ], "ids": [ 11697, 124, 122, 123, 121, 124, 123, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Darling", "##ton", "3", "1", "1", "1", "7", "5", "4" ], "ids": [ 59597, 11183, 124, 122, 122, 122, 128, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Northampton", "3", "1", "1", "1", "5", "3", "4" ], "ids": [ 79445, 124, 122, 122, 122, 126, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barn", "##et", "3", "1", "1", "1", "4", "2", "4" ], "ids": [ 61802, 10308, 124, 122, 122, 122, 125, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chester", "3", "1", "1", "1", "4", "3", "4" ], "ids": [ 32729, 124, 122, 122, 122, 125, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tor", "##qua", "##y", "3", "1", "1", "1", "3", "3", "4" ], "ids": [ 24446, 32973, 10157, 124, 122, 122, 122, 124, 124, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cardiff", "3", "1", "1", "1", "1", "2", "4" ], "ids": [ 39136, 124, 122, 122, 122, 122, 123, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swansea", "3", "1", "0", "2", "3", "7", "3" ], "ids": [ 73425, 124, 122, 121, 123, 124, 128, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brighton", "3", "1", "0", "2", "2", "5", "3" ], "ids": [ 44142, 124, 122, 121, 123, 123, 126, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Here", "##ford", "3", "1", "0", "2", "1", "2", "3" ], "ids": [ 18249, 13387, 124, 122, 121, 123, 122, 123, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lincoln", "3", "0", "2", "1", "3", "4", "2" ], "ids": [ 16944, 124, 121, 123, 122, 124, 125, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Col", "##chester", "3", "0", "2", "1", "1", "3", "2" ], "ids": [ 24927, 38540, 124, 121, 123, 122, 122, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Roc", "##hda", "##le", "3", "0", "1", "2", "2", "4", "1" ], "ids": [ 90273, 109788, 10284, 124, 121, 122, 123, 123, 125, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mansfield", "3", "0", "1", "2", "2", "6", "1" ], "ids": [ 73416, 124, 121, 122, 123, 123, 127, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Don", "##caster", "3", "0", "1", "2", "1", "3", "1" ], "ids": [ 11740, 74934, 124, 121, 122, 123, 122, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ley", "##ton", "Orient", "3", "0", "1", "2", "1", "3", "1" ], "ids": [ 34121, 11183, 26743, 124, 121, 122, 123, 122, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "English", "league", "soccer" ], "ids": [ 33036, 10108, 11616, 15616, 41356 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "on", "Tuesday", ":" ], "ids": [ 18258, 10135, 70245, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Division", "one" ], "ids": [ 11987, 10464 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Crystal", "Palace", "0", "West", "Bro", "##m", "##wich", "0" ], "ids": [ 28459, 22015, 121, 11164, 32470, 10147, 33544, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Ipswich", "1", "G", "##rim", "##sby", "1" ], "ids": [ 86146, 122, 144, 23760, 38243, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Oxford", "0", "Norwich", "1" ], "ids": [ 11109, 121, 51816, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Portsmouth", "1", "South", "##end", "0" ], "ids": [ 46933, 122, 11056, 19342, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Tra", "##n", "##mere", "2", "Port", "Vale", "0" ], "ids": [ 21469, 10115, 32732, 123, 14734, 32286, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Post", "##pone", "##d", ":", "Charlton", "v", "Birmingham", ",", "Sheffield", "United", "v" ], "ids": [ 14539, 35741, 10162, 131, 68730, 190, 22712, 117, 31695, 10609, 190 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 3, 9, 3, 7, 9 ] }, { "tokens": [ "Hu", "##dder", "##sfield" ], "ids": [ 43707, 42113, 53495 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "Division", "two" ], "ids": [ 11987, 10551 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Brent", "##ford", "2", "Gill", "##ingham", "0" ], "ids": [ 56333, 13387, 123, 33787, 57076, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Bristol", "City", "5", "Lu", "##ton", "0" ], "ids": [ 24732, 10773, 126, 23859, 11183, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Burn", "##ley", "1", "Shrewsbury", "3" ], "ids": [ 49331, 12105, 122, 109224, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Chester", "##field", "1", "W", "##als", "##all", "0" ], "ids": [ 32729, 13408, 122, 160, 20162, 18995, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Preston", "2", "Crew", "##e", "1" ], "ids": [ 35119, 123, 45170, 10112, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Roth", "##er", "##ham", "1", "Blackpool", "2" ], "ids": [ 32925, 10165, 13196, 122, 102917, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Stock", "##port", "0", "Bourne", "##mouth", "1" ], "ids": [ 31916, 15520, 121, 80776, 56873, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Wat", "##ford", "0", "Plymouth", "2" ], "ids": [ 51082, 13387, 121, 40814, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "W", "##y", "##combe", "0", "Bury", "1" ], "ids": [ 160, 10157, 87041, 121, 84780, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "York", "3", "Mill", "##wall", "2" ], "ids": [ 10482, 124, 28639, 33743, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Post", "##pone", "##d", ":", "Peterborough", "v", "Not", "##ts", "County", ",", "W", "##re", "##x", "##ham", "v", "Bristol" ], "ids": [ 14539, 35741, 10162, 131, 104232, 190, 16040, 10806, 10886, 117, 160, 10246, 10686, 13196, 190, 24732 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 3, 7, 7, 9, 3, 7, 7, 7, 9, 3 ] }, { "tokens": [ "Rovers" ], "ids": [ 44311 ], "entity": [ "B-ORG" ], "entity_ids": [ 3 ] }, { "tokens": [ "Division", "three" ], "ids": [ 11987, 11003 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Barn", "##et", "3", "Brighton", "0" ], "ids": [ 61802, 10308, 124, 44142, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Cardiff", "0", "Wigan", "2" ], "ids": [ 39136, 121, 85593, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Carlisle", "1", "Ley", "##ton", "Orient", "0" ], "ids": [ 65204, 122, 34121, 11183, 26743, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Chester", "2", "Swansea", "0" ], "ids": [ 32729, 123, 73425, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Darling", "##ton", "1", "Col", "##chester", "1" ], "ids": [ 59597, 11183, 122, 24927, 38540, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Exeter", "1", "Don", "##caster", "1" ], "ids": [ 61436, 122, 11740, 74934, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Hart", "##le", "##pool", "2", "Mansfield", "2" ], "ids": [ 22346, 10284, 61571, 123, 73416, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Here", "##ford", "0", "Hull", "1" ], "ids": [ 18249, 13387, 121, 37465, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Lincoln", "1", "Cambridge", "1" ], "ids": [ 16944, 122, 11697, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Northampton", "1", "Tor", "##qua", "##y", "1" ], "ids": [ 79445, 122, 24446, 32973, 10157, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Roc", "##hda", "##le", "1", "Fulham", "2" ], "ids": [ 90273, 109788, 10284, 122, 84725, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Sc", "##unt", "##hor", "##pe", "0", "Sc", "##ar", "##borough", "2" ], "ids": [ 55260, 20631, 39854, 11355, 121, 55260, 10354, 33057, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "AND", "PA", "##KI", "##ST", "##AN", "T", "##ES", "##T", "AV", "##ER", "##AG", "##ES", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 52428, 32349, 59879, 32995, 41275, 157, 25054, 11090, 49932, 24093, 109865, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "and", "Pakistan", "Test", "average", "##s" ], "ids": [ 11701, 10111, 15437, 22495, 13551, 10107 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9 ] }, { "tokens": [ "after", "their", "three", "-", "match", "series", "which", "ended", "on", "Monday", ":" ], "ids": [ 10662, 10455, 11003, 118, 12356, 11366, 10319, 18428, 10135, 40714, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England" ], "ids": [ 11701 ], "entity": [ "B-LOC" ], "entity_ids": [ 1 ] }, { "tokens": [ "Bat", "##ting", "(", "tab", "##ulated", "under", "matches", ",", "innings", ",", "not", "out", "##s", ",", "runs", "," ], "ids": [ 62949, 12141, 113, 100781, 37725, 10571, 18258, 117, 48974, 117, 10472, 10950, 10107, 117, 17913, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "highest", "score", ",", "average", ")", ":" ], "ids": [ 18134, 17704, 117, 13551, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alec", "Stewart", "3", "5", "0", "396", "170", "79", ".", "20" ], "ids": [ 61961, 17493, 124, 126, 121, 40295, 15410, 12791, 119, 10197 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "John", "C", "##ra", "##wley", "2", "3", "0", "178", "106", "59", ".", "33" ], "ids": [ 10421, 140, 10288, 62381, 123, 124, 121, 22475, 16084, 11867, 119, 11000 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nick", "Knight", "3", "5", "0", "190", "113", "38", ".", "00" ], "ids": [ 16126, 19848, 124, 126, 121, 16664, 16990, 11171, 119, 11025 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nasser", "Hus", "##sain", "2", "3", "0", "111", "51", "37", ".", "00" ], "ids": [ 98823, 109022, 82083, 123, 124, 121, 15821, 11524, 11204, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mike", "At", "##hert", "##on", "3", "5", "0", "162", "64", "32", ".", "40" ], "ids": [ 13270, 11699, 102855, 10263, 124, 126, 121, 21638, 11295, 10842, 119, 10533 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Graham", "Thorpe", "3", "5", "0", "159", "77", "31", ".", "80" ], "ids": [ 16928, 84855, 124, 126, 121, 20406, 12527, 10413, 119, 10832 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jack", "Russell", "2", "3", "1", "51", "41", "##no", "25", ".", "50" ], "ids": [ 12342, 13481, 123, 124, 122, 11524, 11349, 10343, 10258, 119, 10462 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ian", "Salisbury", "2", "4", "1", "50", "40", "16", ".", "66" ], "ids": [ 16582, 55933, 123, 125, 122, 10462, 10533, 10250, 119, 12215 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Ea", "##lha", "##m", "1", "2", "0", "30", "25", "15", ".", "00" ], "ids": [ 11997, 47132, 42182, 10147, 122, 123, 121, 10244, 10258, 10208, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dominic", "Cork", "3", "5", "0", "58", "26", "11", ".", "60" ], "ids": [ 50806, 42049, 124, 126, 121, 11824, 10314, 10193, 119, 10709 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Robert", "C", "##roft", "1", "2", "1", "11", "6", "11", ".", "00" ], "ids": [ 10820, 140, 101860, 122, 123, 122, 10193, 127, 10193, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Simon", "Brown", "1", "2", "1", "11", "10", "##no", "11", ".", "00" ], "ids": [ 12237, 12623, 122, 123, 122, 10193, 10150, 10343, 10193, 119, 11025 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alan", "Mu", "##lla", "##lly", "3", "5", "1", "39", "24", "9", ".", "75" ], "ids": [ 14309, 49056, 11083, 17903, 124, 126, 122, 11303, 10233, 130, 119, 11417 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chris", "Lewis", "2", "3", "0", "18", "9", "6", ".", "00" ], "ids": [ 13151, 13759, 123, 124, 121, 10218, 130, 127, 119, 11025 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Andy", "Ca", "##ddi", "##ck", "1", "1", "0", "4", "4", "4", ".", "00" ], "ids": [ 16802, 26037, 37226, 11263, 122, 122, 121, 125, 125, 125, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##rae", "##me", "Hi", "##ck", "1", "2", "0", "8", "4", "4", ".", "00" ], "ids": [ 144, 73803, 10627, 20065, 11263, 122, 123, 121, 129, 125, 125, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bowling", "(", "tab", "##ulated", "under", "over", "##s", ",", "maiden", "##s", ",", "runs", ",", "wickets", "," ], "ids": [ 100017, 113, 100781, 37725, 10571, 10491, 10107, 117, 87761, 10107, 117, 17913, 117, 83839, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "average", ")", ":" ], "ids": [ 13551, 114, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "At", "##hert", "##on", "7", "1", "20", "1", "20", ".", "00" ], "ids": [ 11699, 102855, 10263, 128, 122, 10197, 122, 10197, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ca", "##ddi", "##ck", "57", ".", "2", "10", "165", "6", "27", ".", "50" ], "ids": [ 26037, 37226, 11263, 11817, 119, 123, 10150, 19233, 127, 10365, 119, 10462 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cork", "131", "23", "434", "12", "36", ".", "16" ], "ids": [ 42049, 18372, 10328, 44726, 10186, 11055, 119, 10250 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mu", "##lla", "##lly", "150", ".", "3", "36", "377", "10", "37", ".", "70" ], "ids": [ 49056, 11083, 17903, 11766, 119, 124, 11055, 38605, 10150, 11204, 119, 10923 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hi", "##ck", "13", "2", "42", "1", "42", ".", "00" ], "ids": [ 20065, 11263, 10249, 123, 11276, 122, 11276, 119, 11025 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##roft", "47", ".", "4", "10", "125", "2", "62", ".", "50" ], "ids": [ 140, 101860, 11413, 119, 125, 10150, 14048, 123, 12066, 119, 10462 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brown", "33", "4", "138", "2", "69", ".", "00" ], "ids": [ 12623, 11000, 125, 19462, 123, 12573, 119, 11025 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ea", "##lha", "##m", "37", "8", "81", "1", "81", ".", "00" ], "ids": [ 47132, 42182, 10147, 11204, 129, 12324, 122, 12324, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Salisbury", "61", ".", "2", "8", "221", "2", "110", ".", "50" ], "ids": [ 55933, 12314, 119, 123, 129, 23360, 123, 13057, 119, 10462 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lewis", "71", "10", "264", "1", "264", ".", "00" ], "ids": [ 13759, 12513, 10150, 25356, 122, 25356, 119, 11025 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thorpe", "13", "4", "19", "0", "-" ], "ids": [ 84855, 10249, 125, 10270, 121, 118 ], "entity": [ "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan" ], "ids": [ 15437 ], "entity": [ "B-LOC" ], "entity_ids": [ 1 ] }, { "tokens": [ "Bat", "##ting", ":" ], "ids": [ 62949, 12141, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Moi", "##n", "Khan", "2", "3", "1", "158", "105", "79", ".", "00" ], "ids": [ 82447, 10115, 16324, 123, 124, 122, 21240, 14519, 12791, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "##ja", "##z", "Ahmed", "3", "6", "1", "344", "141", "68", ".", "80" ], "ids": [ 146, 10320, 10305, 25530, 124, 127, 122, 34107, 19578, 12370, 119, 10832 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Salim", "Malik", "3", "5", "2", "195", "100", "##no", "65", ".", "00" ], "ids": [ 98284, 45783, 124, 126, 123, 21825, 10407, 10343, 10843, 119, 11025 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", "3", "5", "0", "320", "148", "64", ".", "00" ], "ids": [ 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 124, 126, 121, 18920, 19506, 11295, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sa", "##eed", "Anwar", "3", "6", "0", "362", "176", "60", ".", "33" ], "ids": [ 12404, 40154, 92168, 124, 127, 121, 37257, 21613, 10709, 119, 11000 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rashid", "La", "##tif", "1", "1", "0", "45", "45", "45", ".", "00" ], "ids": [ 93828, 10159, 23631, 122, 122, 121, 10827, 10827, 10827, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "2", "3", "1", "77", "46", "38", ".", "50" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 123, 124, 122, 12527, 11528, 11171, 119, 10462 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "##if", "Mu", "##jta", "##ba", "2", "3", "0", "90", "51", "30", ".", "00" ], "ids": [ 10882, 13918, 49056, 51465, 10537, 123, 124, 121, 10919, 11524, 10244, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Was", "##im", "Ak", "##ram", "3", "5", "1", "98", "40", "24", ".", "50" ], "ids": [ 22034, 11759, 71275, 13845, 124, 126, 122, 12327, 10533, 10233, 119, 10462 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##dab", "Ka", "##bir", "2", "4", "0", "87", "35", "21", ".", "75" ], "ids": [ 106583, 46889, 25444, 29241, 123, 125, 121, 12581, 10803, 10296, 119, 11417 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mus", "##hta", "##q", "Ahmed", "3", "5", "1", "44", "20", "11", ".", "00" ], "ids": [ 31013, 32493, 11703, 25530, 124, 126, 122, 11126, 10197, 10193, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##aq", "##ar", "You", "##nis", "3", "3", "1", "11", "7", "5", ".", "50" ], "ids": [ 160, 49277, 10354, 11065, 12597, 124, 124, 122, 10193, 128, 126, 119, 10462 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ata", "-", "ur", "-", "Re", "##hman", "2", "2", "2", "10", "10", "##no", "-" ], "ids": [ 68795, 118, 10399, 118, 20304, 49811, 123, 123, 123, 10150, 10150, 10343, 118 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mohammad", "Ak", "##ram", "1", "0", "0", "0", "0", "-" ], "ids": [ 40036, 71275, 13845, 122, 121, 121, 121, 121, 118 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bowling", ":" ], "ids": [ 100017, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Mus", "##hta", "##q", "Ahmed", "195", "52", "447", "17", "26", ".", "29" ], "ids": [ 31013, 32493, 11703, 25530, 21825, 11525, 42873, 10273, 10314, 119, 10386 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##aq", "##ar", "You", "##nis", "125", "25", "431", "16", "26", ".", "93" ], "ids": [ 160, 49277, 10354, 11065, 12597, 14048, 10258, 36191, 10250, 10314, 119, 12479 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Was", "##im", "Ak", "##ram", "128", "29", "350", "11", "31", ".", "81" ], "ids": [ 22034, 11759, 71275, 13845, 16196, 10386, 14992, 10193, 10413, 119, 12324 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ata", "-", "ur", "-", "Re", "##hman", "48", ".", "4", "6", "173", "5", "34", ".", "60" ], "ids": [ 68795, 118, 10399, 118, 20304, 49811, 11300, 119, 125, 127, 22816, 126, 11069, 119, 10709 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mohammad", "Ak", "##ram", "22", "4", "71", "1", "71", ".", "00" ], "ids": [ 40036, 71275, 13845, 10306, 125, 12513, 122, 12513, 119, 11025 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "11", "3", "24", "0", "-" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 10193, 124, 10233, 121, 118 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "##if", "Mu", "##jta", "##ba", "7", "5", "6", "0", "-" ], "ids": [ 10882, 13918, 49056, 51465, 10537, 128, 126, 127, 121, 118 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Salim", "Malik", "1", "0", "1", "0", "-" ], "ids": [ 98284, 45783, 122, 121, 122, 121, 118 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##dab", "Ka", "##bir", "1", "0", "9", "0", "-" ], "ids": [ 106583, 46889, 25444, 29241, 122, 121, 130, 121, 118 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "GO", "##OC", "##H", "TO", "PL", "##A", "##Y", "AN", "##OT", "##H", "##ER", "SE", "##AS", "##ON", "FOR", "ES", "##SE", "##X", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 41525, 49378, 12396, 58573, 71341, 10738, 14703, 50972, 62146, 12396, 24093, 23056, 38025, 30118, 109544, 49004, 39039, 12674, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Graham", "Go", "##och", ",", "the", "43", "-", "year", "-", "old", "former", "England", "captain", ",", "is", "to", "continue", "playing", "county", "cricket", "for", "at", "least", "another", "season", ",", "his", "club", "Essex", "announced", "on", "Tuesday", "." ], "ids": [ 16928, 14439, 16908, 117, 10105, 11370, 118, 10924, 118, 12898, 11775, 11701, 28157, 117, 10124, 10114, 17734, 14879, 17382, 32289, 10142, 10160, 16298, 12864, 11226, 117, 10226, 11111, 33634, 13854, 10135, 70245, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Open", "##er", "Go", "##och", "'", "s", "decision", "comes", "towards", "the", "end", "of", "a", "season", "in", "which", "he", "has", "under", "##lined", "his", "consiste", "##ncy", "by", "becoming", "the", "leading", "scorer", "in", "Essex", "'", "s", "history", ",", "beating", "Keith", "Fletcher", "'", "s", "aggregate", "of", "29", ",", "434", "." ], "ids": [ 11919, 10165, 14439, 16908, 112, 187, 19231, 21405, 18095, 10105, 11572, 10108, 169, 11226, 10106, 10319, 10261, 10393, 10571, 75066, 10226, 22242, 24166, 10155, 19881, 10105, 16018, 99782, 10106, 33634, 112, 187, 11486, 117, 58081, 16685, 38933, 112, 187, 75063, 10108, 10386, 117, 44726, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Go", "##och", ",", "who", "retired", "from", "test", "cricket", "after", "the", "1994", "-", "95", "tour", "of", "Australia", "but", "is", "now", "an", "England", "select", "##or", ",", "is", "seventh", "in", "this", "season", "'", "s", "first", "-", "class", "average", "##s", "with", "1", ",", "429", "runs", "at", "64", ".", "95", ",", "having", "hit", "five", "centuries", "and", "one", "double", "century", "." ], "ids": [ 14439, 16908, 117, 10479, 18675, 10188, 15839, 32289, 10662, 10105, 10444, 118, 11978, 12842, 10108, 11729, 10473, 10124, 11858, 10151, 11701, 47054, 10667, 117, 10124, 37192, 10106, 10531, 11226, 112, 187, 10422, 118, 13596, 13551, 10107, 10169, 122, 117, 37624, 17913, 10160, 11295, 119, 11978, 117, 13677, 14946, 12403, 29994, 10111, 10464, 15790, 11943, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Essex", "secretary", "-", "general", "manager", "Peter", "Edwards", "said", ":", "\"", "He", "is", "a", "remarkable", "bat", "##sman", "and", "still", "the", "best", "in", "this", "country", "." ], "ids": [ 33634, 37664, 118, 11389, 16935, 10979, 17263, 12415, 131, 107, 10357, 10124, 169, 88916, 11519, 24305, 10111, 12647, 10105, 12504, 10106, 10531, 12723, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "-", "one", "will", "argue", "with", "that", "." ], "ids": [ 10657, 118, 10464, 11337, 93517, 10169, 10189, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "You", "just", "have", "to", "look", "at", "his", "record", "to", "app", "##rec", "##iate", "that", "fact", ".", "\"" ], "ids": [ 11065, 12820, 10529, 10114, 25157, 10160, 10226, 12410, 10114, 72894, 74755, 45788, 10189, 18638, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "ROM", "##AN", "##IA", "CL", "##UB", "B", "##OS", "##S", "BA", "##N", "##NE", "##D", "FOR", "H", "##EA", "##DB", "##UT", "##T", "." ], "ids": [ 71020, 65622, 24093, 118, 41068, 41275, 35976, 75151, 82439, 139, 21793, 10731, 39999, 11537, 93280, 11490, 109544, 145, 36789, 51327, 65729, 11090, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UC", "##HA", "##RE", "##ST", "1996", "-", "08", "-", "27" ], "ids": [ 139, 93089, 58132, 66014, 32995, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Romanian", "Soccer", "Federation", "has", "banned", "first", "division", "club", "Ji", "##ul", "Petro", "##san", "##i", "'", "s", "president", "Mir", "##on", "Co", "##zma", "for", "two", "years", "for", "head", "##but", "##ting", "a", "visiting", "team", "player", ",", "a", "fede", "##ration", "statement", "said", "." ], "ids": [ 10117, 29543, 25914, 18975, 10393, 58587, 10422, 13751, 11111, 30822, 10604, 82470, 14434, 10116, 112, 187, 12931, 43209, 10263, 13098, 32022, 10142, 10551, 10855, 10142, 13578, 23170, 12141, 169, 48780, 11121, 12928, 117, 169, 83482, 19466, 33311, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Romania", "'", "s", "soccer", "boss", "##es", "also", "fine", "##d", "Co", "##zma", ",", "a", "well", "-", "known", "mine", "##rs", "'", "union", "leader", ",", "10", "million", "lei", "(", "$", "3000", ")", "for", "the", "half", "-", "time", "attack", "on", "Dinamo", "Bucharest", "'", "s", "Dan", "##ut", "Lu", "##pu", "last", "Sunday", "." ], "ids": [ 13927, 112, 187, 41356, 48246, 10171, 10379, 13435, 10162, 13098, 32022, 117, 169, 11206, 118, 11053, 27546, 10943, 112, 20763, 15014, 117, 10150, 12473, 15339, 113, 109, 15335, 114, 10142, 10105, 13877, 118, 10635, 16342, 10135, 35011, 100824, 112, 187, 14261, 11159, 23859, 17490, 12469, 19731, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Mine", "##rs", "led", "by", "Co", "##zma", "rio", "##ted", "in", "Bucharest", "in", "1990", "and", "1991", ",", "bringing", "down", "the", "reform", "##ist", "government", "of", "premier", "Petr", "##e", "Roman", "." ], "ids": [ 26166, 10943, 12857, 10155, 13098, 32022, 27244, 11912, 10106, 100824, 10106, 10420, 10111, 10442, 117, 45749, 12935, 10105, 34800, 11293, 12047, 10108, 11913, 40986, 10112, 12359, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Co", "##zma", "is", "aw", "##ait", "##ing", "trial", "for", "assault", "and", "criminal", "damage", "in", "a", "bar", "in", "his", "home", "town", "of", "Petro", "##san", ",", "300", "km", "##s", "west", "of", "Bucharest", "." ], "ids": [ 13098, 32022, 10124, 56237, 14598, 10230, 23626, 10142, 50150, 10111, 30931, 26115, 10106, 169, 18121, 10106, 10226, 11816, 12221, 10108, 82470, 14434, 117, 11093, 10204, 10107, 13735, 10108, 100824, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "attack", "on", "Lu", "##pu", "came", "during", "a", "tunnel", "ski", "##rmi", "##sh", "between", "opposing", "players", "as", "they", "left", "the", "field", "." ], "ids": [ 10117, 16342, 10135, 23859, 17490, 13383, 10939, 169, 31449, 40122, 76936, 13264, 10948, 93780, 16021, 10146, 10689, 12153, 10105, 13939, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Co", "##zma", "'", "s", "blow", "was", "not", "too", "pain", "##ful", "because", "I", "'", "m", "a", "tall", "man", ",", "\"", "Lu", "##pu", "told", "Reuters", "on", "Tuesday", "." ], "ids": [ 107, 13098, 32022, 112, 187, 106194, 10134, 10472, 16683, 38576, 14446, 12373, 146, 112, 181, 169, 36243, 10817, 117, 107, 23859, 17490, 21937, 46617, 10135, 70245, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 3, 9, 9, 9 ] }, { "tokens": [ "Lu", "##pu", "is", "one", "of", "the", "talle", "##st", "players", "in", "Romania", "'", "s", "first", "division", ",", "tower", "##ing", "over", "Co", "##zma", "by", "some", "17", "cm", "##s", "," ], "ids": [ 23859, 17490, 10124, 10464, 10108, 10105, 63818, 10562, 16021, 10106, 13927, 112, 187, 10422, 13751, 117, 27795, 10230, 10491, 13098, 32022, 10155, 11152, 10273, 11207, 10107, 117 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ji", "##ul", "Petro", "##san", "##i", ",", "promoted", "to", "the", "first", "division", "this", "year", ",", "won", "the", "league", "game", "1", "-", "0", "." ], "ids": [ 30822, 10604, 82470, 14434, 10116, 117, 22312, 10114, 10105, 10422, 13751, 10531, 10924, 117, 11367, 10105, 15616, 11661, 122, 118, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Co", "##zma", "is", "barre", "##d", "from", "taking", "part", "in", "any", "official", "soccer", "activity", "during", "the", "ban", "." ], "ids": [ 13098, 32022, 10124, 107553, 10162, 10188, 18084, 10668, 10106, 11178, 14731, 41356, 22205, 10939, 10105, 11915, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Q", "##U", "##AS", "##H", "-", "H", "##ON", "##G", "KO", "##NG", "OP", "##EN", "F", "##IR", "##ST", "R", "##O", "##UN", "##D", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 156, 19282, 12022, 38025, 12396, 118, 145, 30118, 11447, 67422, 34065, 55355, 50655, 143, 73522, 32995, 155, 11403, 69849, 11490, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "27" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "round", "results", "in", "the", "Hong" ], "ids": [ 12128, 13569, 17466, 10106, 10105, 15078 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "Kong", "Open", "sq", "##uas", "##h", "tournament", "on", "Tuesday", "(", "pre", "##fix", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 14577, 11919, 27164, 66682, 10237, 17390, 10135, 70245, 113, 12229, 57014, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "Jan", "##sher", "Khan", "(", "Pak", "##ist", "##nn", ")", "beat", "Jackie", "Lee", "(", "Hong", "Kong", ")", "15", "-", "8", "15", "-", "8" ], "ids": [ 122, 118, 11806, 94001, 16324, 113, 48465, 11293, 13538, 114, 27868, 30567, 12006, 113, 15078, 14577, 114, 10208, 118, 129, 10208, 118, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "6" ], "ids": [ 10208, 118, 127 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "3", "-", "Brett", "Martin", "(", "Australia", ")", "beat", "David", "Evans", "(", "Wales", ")", "14", "-", "17", "15", "-", "1" ], "ids": [ 124, 118, 43719, 11235, 113, 11729, 114, 27868, 10804, 18402, 113, 14137, 114, 10247, 118, 10273, 10208, 118, 122 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "13", "-", "15", "17", "-", "14", "15", "-", "12" ], "ids": [ 10249, 118, 10208, 10273, 118, 10247, 10208, 118, 10186 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Cai", "##rns", "(", "England", ")", "beat", "6", "-", "Del", "Harris", "(", "England", ")", "15", "-", "12", "7", "-", "15" ], "ids": [ 11997, 90152, 42481, 113, 11701, 114, 27868, 127, 118, 15973, 16667, 113, 11701, 114, 10208, 118, 10186, 128, 118, 10208 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "6", "15", "-", "12" ], "ids": [ 10208, 118, 127, 10208, 118, 10186 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anthony", "Hill", "(", "Australia", ")", "beat", "8", "-", "Mark", "Cha", "##lone", "##r", "(", "England", ")", "15", "-", "11" ], "ids": [ 14751, 12289, 113, 11729, 114, 27868, 129, 118, 11997, 53453, 32840, 10129, 113, 11701, 114, 10208, 118, 10193 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "17", "-", "16", "17", "-", "16" ], "ids": [ 10273, 118, 10250, 10273, 118, 10250 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Simon", "Fr", "##enz", "(", "Germany", ")", "beat", "Martin", "Heath", "(", "Scotland", ")", "12", "-", "15", "15", "-", "6" ], "ids": [ 12237, 33884, 29925, 113, 12775, 114, 27868, 11235, 42676, 113, 16901, 114, 10186, 118, 10208, 10208, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "4", "12", "-", "15", "15", "-", "14" ], "ids": [ 10208, 118, 125, 10186, 118, 10208, 10208, 118, 10247 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Joseph", "K", "##nei", "##pp", "(", "Australia", ")", "beat", "Ahmed", "Fa", "##iz", "##y", "(", "Egypt", ")", "15", "-", "8", "12", "-", "15" ], "ids": [ 11379, 148, 34773, 16587, 113, 11729, 114, 27868, 25530, 44271, 15834, 10157, 113, 20440, 114, 10208, 118, 129, 10186, 118, 10208 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "14", "15", "-", "9" ], "ids": [ 10208, 118, 10247, 10208, 118, 130 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mir", "Zaman", "G", "##ul", "(", "Pakistan", ")", "beat", "Stephen", "Mead", "##s", "(", "England", ")", "10", "-", "15" ], "ids": [ 43209, 71374, 144, 10604, 113, 15437, 114, 27868, 13866, 93740, 10107, 113, 11701, 114, 10150, 118, 10208 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "12", "15", "-", "10", "15", "-", "3" ], "ids": [ 10208, 118, 10186, 10208, 118, 10150, 10208, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dan", "Jensen", "(", "Australia", ")", "beat", "Anders", "Thor", "##en", "(", "Sweden", ")", "8", "-", "15", "15", "-", "12" ], "ids": [ 14261, 28663, 113, 11729, 114, 27868, 20751, 36524, 10136, 113, 20937, 114, 129, 118, 10208, 10208, 118, 10186 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", "-", "15", "15", "-", "5", "15", "-", "11" ], "ids": [ 10150, 118, 10208, 10208, 118, 126, 10208, 118, 10193 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "ED", "##B", "##ER", "##G", "EX", "##TE", "##ND", "##S", "GR", "##AN", "##D", "SL", "##AM", "R", "##UN", ",", "TOP", "##P", "##LE", "##S", "W", "##IM", "##BL", "##ED", "##ON", "CH", "##AM", "##P", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 74053, 11274, 24093, 11447, 80426, 29833, 58521, 10731, 58787, 41275, 11490, 52671, 36535, 155, 69849, 117, 98151, 11127, 51036, 10731, 160, 42031, 94701, 33809, 30118, 39774, 36535, 11127, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Larry", "Fine" ], "ids": [ 19629, 24846 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stefan", "Ed", "##berg", "produced", "some", "of", "his", "vinta", "##ge", "best", "on", "Tuesday", "to", "extend", "his", "grand", "run", "at", "the", "Grand", "Slam", "##s", "by", "top", "##pling", "Wimbledon", "champion", "Richard", "Kraj", "##ice", "##k", "in", "straight", "sets", "at", "the", "U", ".", "S", ".", "Open", "." ], "ids": [ 17399, 13114, 11348, 13433, 11152, 10108, 10226, 87597, 10525, 12504, 10135, 70245, 10114, 62504, 10226, 13023, 14095, 10160, 10105, 11319, 33445, 10107, 10155, 12364, 51741, 37932, 17689, 11118, 98619, 11918, 10174, 10106, 31214, 23597, 10160, 10105, 158, 119, 156, 119, 11919, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "Ed", "##berg", ",", "competing", "in", "the", "54", "##th", "consecutive", "and", "final", "Grand", "Slam", "event", "of", "his", "ill", "##ust", "##rious", "career", ",", "turned", "back", "the", "clock", "at", "Stadium", "Court", "with", "a", "flowing", "6", "-", "3", "6", "-", "3", "6", "-", "3", "serve", "-", "and", "-", "volley", "victory", "over", "the", "fifth", "-", "seed", "##ed", "Dutch", "##man", "." ], "ids": [ 13114, 11348, 117, 48641, 10106, 10105, 11653, 11143, 29864, 10111, 11070, 11319, 33445, 14416, 10108, 10226, 32941, 19265, 37789, 13021, 117, 21031, 12014, 10105, 52843, 10160, 16632, 14100, 10169, 169, 109769, 127, 118, 124, 127, 118, 124, 127, 118, 124, 19430, 118, 10111, 118, 104717, 19735, 10491, 10105, 22237, 118, 49282, 10336, 17693, 10589, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "a", "win", "that", "I", "can", "be", "proud", "of", ",", "\"", "said", "the", "30", "-", "year", "-", "old", "S", "##wed", "##e", ",", "winner", "of", "two", "U", ".", "S", ".", "Open", "##s", "and", "six", "Grand", "Slam", "titles", "in", "all", ".", "\"" ], "ids": [ 107, 10377, 112, 187, 169, 14125, 10189, 146, 10944, 10347, 97801, 10108, 117, 107, 12415, 10105, 10244, 118, 10924, 118, 12898, 156, 48854, 10112, 117, 20826, 10108, 10551, 158, 119, 156, 119, 11919, 10107, 10111, 12449, 11319, 33445, 26492, 10106, 10435, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "never", "easy", "to", "beat", "the", "Wimbledon", "champion", ".", "\"" ], "ids": [ 10377, 112, 187, 14794, 44346, 10114, 27868, 10105, 37932, 17689, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Ed", "##berg", ",", "who", "has", "said", "he", "will", "retire", "at", "season", "'", "s", "end", ",", "made", "it", "look", "easy", "under", "gray", "ski", "##es", "at", "the", "National", "Tennis", "Centre", "." ], "ids": [ 13114, 11348, 117, 10479, 10393, 12415, 10261, 11337, 30753, 10160, 11226, 112, 187, 11572, 117, 11019, 10271, 25157, 44346, 10571, 103758, 40122, 10171, 10160, 10105, 10655, 27380, 12838, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "uns", "##eed", "##ed", "S", "##wed", "##e", "struck", "quickly", ",", "breaking", "Kraj", "##ice", "##k", "in", "the", "first", "game", "and", "never", "let", "loose", "his", "gr", "##ip", "on", "the", "one", "hour", "44", "minute", "match", "as", "he", "served", "and", "volley", "##ed", "with", "the", "gra", "##ce", "that", "made", "him", "one", "of", "the", "dominant", "players", "of", "his", "time", "." ], "ids": [ 10117, 15826, 40154, 10336, 156, 48854, 10112, 45622, 23590, 117, 47105, 98619, 11918, 10174, 10106, 10105, 10422, 11661, 10111, 14794, 13595, 102920, 10226, 30518, 17437, 10135, 10105, 10464, 24730, 11126, 21760, 12356, 10146, 10261, 12325, 10111, 104717, 10336, 10169, 10105, 63706, 10419, 10189, 11019, 10957, 10464, 10108, 10105, 36705, 16021, 10108, 10226, 10635, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "'", "s", "not", "doubt", "about", "it", ",", "Richard", "was", "def", "##inite", "##ly", "off", "his", "game", "and", "I", "took", "advantage", ",", "\"", "said", "Ed", "##berg", "." ], "ids": [ 107, 11723, 112, 187, 10472, 86697, 10978, 10271, 117, 11118, 10134, 100745, 100240, 10454, 11898, 10226, 11661, 10111, 146, 12149, 38119, 117, 107, 12415, 13114, 11348, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "\"", "I", "still", "have", "my", "days", "where", "I", "feel", "great", "out", "there", ".", "\"" ], "ids": [ 107, 146, 12647, 10529, 15127, 13990, 10940, 146, 38008, 14772, 10950, 11155, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Also", "reaching", "the", "second", "round", "were", "top", "-", "seed", "##ed", "defending", "champion", "Pete", "Sam", "##pra", "##s", ",", "a", "6", "-", "2", "6", "-", "2", "6", "-", "1", "winner", "over", "last", "minute", "replacement", "Jim", "##y", "S", "##zym", "##anski", "of", "Venezuela", ",", "called", "on", "after", "Adrian", "Vo", "##inea", "of", "Romania", "withdrew", "because", "of", "a", "sp", "##rain", "##ed", "an", "##kle", "." ], "ids": [ 20593, 34186, 10105, 11132, 13569, 10309, 12364, 118, 49282, 10336, 53730, 17689, 23107, 14268, 30631, 10107, 117, 169, 127, 118, 123, 127, 118, 123, 127, 118, 122, 20826, 10491, 12469, 21760, 41636, 14178, 10157, 156, 37863, 70175, 10108, 15693, 117, 11552, 10135, 10662, 23928, 59482, 78209, 10108, 13927, 56226, 12373, 10108, 169, 32650, 32782, 10336, 10151, 24006, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Third", "seed", "Thomas", "Must", "##er", "of", "Austria", "also", "charged", "into", "the", "second", "round", "with", "a", "6", "-", "1", "7", "-", "6", "(", "7", "-", "2", ")", "6", "-", "2", "rom", "##p", "over", "Javier", "Fran", "##a", "of", "Argentina", "." ], "ids": [ 16788, 49282, 11096, 54690, 10165, 10108, 14479, 10379, 38253, 10708, 10105, 11132, 13569, 10169, 169, 127, 118, 122, 128, 118, 127, 113, 128, 118, 123, 114, 127, 118, 123, 86945, 10410, 10491, 22856, 89447, 10113, 10108, 12853, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Marcelo", "Rio", "##s", "of", "Chile", ",", "the", "10th", "seed", ",", "also", "advanced", "." ], "ids": [ 38165, 12109, 10107, 10108, 13218, 117, 10105, 31004, 49282, 117, 10379, 27072, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rio", "##s", "claimed", "a", "4", "-", "6", "6", "-", "1", "6", "-", "4", "6", "-", "2", "victory", "over", "Romania", "'", "s", "Andrei", "Pavel", "." ], "ids": [ 12109, 10107, 20737, 169, 125, 118, 127, 127, 118, 122, 127, 118, 125, 127, 118, 123, 19735, 10491, 13927, 112, 187, 40594, 28628, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9 ] }, { "tokens": [ "On", "the", "women", "'", "s", "side", ",", "second", "seed", "Monica", "Se", "##les", "got", "off", "to", "a", "strong", "start", "by", "beating", "fellow", "-", "American", "Anne", "Miller", "6", "-", "0", "6", "-", "1", "and", "was", "joined", "in", "the", "second", "round", "by", "Spain", "'", "s", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", "(", "seed", "##ed", "third", ")", ",", "Olympic", "champion", "Lindsay", "Davenport", "(", "8", ")", "and", "Karin", "##a", "Ha", "##bs", "##udo", "##va", "of", "Slovakia", "(", "17", ")", "." ], "ids": [ 10576, 10105, 13190, 112, 187, 12250, 117, 11132, 49282, 29242, 11045, 11268, 19556, 11898, 10114, 169, 18093, 15148, 10155, 58081, 24619, 118, 10536, 13490, 14615, 127, 118, 121, 127, 118, 122, 10111, 10134, 13914, 10106, 10105, 11132, 13569, 10155, 16149, 112, 187, 54789, 10368, 14220, 66007, 39574, 16780, 113, 49282, 10336, 12628, 114, 117, 17952, 17689, 42228, 74533, 113, 129, 114, 10111, 41633, 10113, 13740, 19528, 33498, 10362, 10108, 43031, 113, 10273, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "women", "'", "s", "draw", "lost", "another", "seed", "when", "Austrian", "Judith", "Wie", "##sne", "##r", "over", "##cam", "##e", "I", "##va", "Maj", "##oli", "of", "Croatia", "2", "-", "6", "6", "-", "3", "6", "-", "1", "." ], "ids": [ 10117, 13190, 112, 187, 25974, 14172, 12864, 49282, 10841, 32201, 35043, 23789, 28395, 10129, 10491, 67354, 10112, 146, 10362, 72180, 15847, 10108, 34993, 123, 118, 127, 127, 118, 124, 127, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fifth", "-", "seed", "##ed", "Maj", "##oli", "joined", "An", "##ke", "Huber", "(", "5", ")", "and", "Magdalena", "Male", "##eva", "(", "12", ")", "on", "the", "side", "##lines", "." ], "ids": [ 10117, 22237, 118, 49282, 10336, 72180, 15847, 13914, 10313, 10550, 46398, 113, 126, 114, 10111, 27166, 36172, 18085, 113, 10186, 114, 10135, 10105, 12250, 31782, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "TU", "##ES", "##DA", "##Y", "'", "S", "RE", "##SU", "##L", "##TS", "FR", "##OM", "U", ".", "S", ".", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 94747, 25054, 36382, 14703, 112, 156, 71033, 88592, 11369, 36545, 64655, 37079, 158, 119, 156, 119, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "first", "round", "matches", "on", "Tuesday", "in", "the", "U", ".", "S", ".", "Open", "tennis", "championships", "at", "the", "National", "Tennis", "Centre", "(", "pre", "##fix", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 33036, 10108, 10422, 13569, 18258, 10135, 70245, 10106, 10105, 158, 119, 156, 119, 11919, 20944, 47211, 10160, 10105, 10655, 27380, 12838, 113, 12229, 57014, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "Monica", "Se", "##les", "(", "U", ".", "S", ".", ")", "beat", "Anne", "Miller", "(", "U", ".", "S", ".", ")", "6", "-", "0", "6", "-", "1" ], "ids": [ 123, 118, 29242, 11045, 11268, 113, 158, 119, 156, 119, 114, 27868, 13490, 14615, 113, 158, 119, 156, 119, 114, 127, 118, 121, 127, 118, 122 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rita", "Grande", "(", "Italy", ")", "beat", "Alex", "##ia", "Dec", "##hau", "##me", "-", "Ball", "##eret", "(", "France", ")", "6", "-", "3", "6", "-", "0" ], "ids": [ 25105, 12800, 113, 11619, 114, 27868, 14728, 10280, 46147, 52332, 10627, 118, 19479, 29073, 113, 10688, 114, 127, 118, 124, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Judith", "Wie", "##sne", "##r", "(", "Austria", ")", "beat", "5", "-", "I", "##va", "Maj", "##oli", "(", "Croatia", ")", "2", "-", "6", "6", "-", "3", "6", "-", "1" ], "ids": [ 35043, 23789, 28395, 10129, 113, 14479, 114, 27868, 126, 118, 146, 10362, 72180, 15847, 113, 34993, 114, 123, 118, 127, 127, 118, 124, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "Thomas", "Must", "##er", "(", "Austria", ")", "beat", "Javier", "Fran", "##a", "(", "Argentina", ")", "6", "-", "1", "7", "-", "6", "(", "7", "-", "2", ")", "6", "-", "2" ], "ids": [ 124, 118, 11096, 54690, 10165, 113, 14479, 114, 27868, 22856, 89447, 10113, 113, 12853, 114, 127, 118, 122, 128, 118, 127, 113, 128, 118, 123, 114, 127, 118, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "Pete", "Sam", "##pra", "##s", "(", "U", ".", "S", ".", ")", "beat", "Jim", "##y", "S", "##zym", "##anski", "(", "Venezuela", ")", "6", "-", "2", "6", "-", "2", "6", "-", "1" ], "ids": [ 122, 118, 23107, 14268, 30631, 10107, 113, 158, 119, 156, 119, 114, 27868, 14178, 10157, 156, 37863, 70175, 113, 15693, 114, 127, 118, 123, 127, 118, 123, 127, 118, 122 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ji", "##ri", "Novak", "(", "Czech", "Republic", ")", "beat", "Ben", "El", "##l", "##wood", "(", "Australia", ")", "6", "-", "2", "6", "-", "4", "6", "-", "3" ], "ids": [ 30822, 10401, 63458, 113, 22148, 13681, 114, 27868, 13304, 10224, 10161, 14759, 113, 11729, 114, 127, 118, 123, 127, 118, 125, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Maria", "##an", "de", "S", "##ward", "##t", "(", "South", "Africa", ")", "beat", "Dominique", "Van", "R", "##oos", "##t", "(", "Belgium", ")", "1", "-", "6", "6", "-", "2", "7", "-", "6", "(", "7", "-", "4", ")" ], "ids": [ 11066, 10206, 10104, 156, 16988, 10123, 113, 11056, 12880, 114, 27868, 28256, 11474, 155, 49770, 10123, 113, 26519, 114, 122, 118, 127, 127, 118, 123, 128, 118, 127, 113, 128, 118, 125, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Florencia", "Laba", "##t", "(", "Argentina", ")", "beat", "Kathy", "Rin", "##aldi", "St", "##unk", "##el", "(", "U", ".", "S", ".", ")", "6", "-", "2", "6", "-", "2" ], "ids": [ 80221, 88739, 10123, 113, 12853, 114, 27868, 67888, 63409, 99771, 10838, 33551, 10570, 113, 158, 119, 156, 119, 114, 127, 118, 123, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nathalie", "Tau", "##zia", "##t", "(", "France", ")", "beat", "Angelica", "Ga", "##vald", "##on", "(", "Mexico", ")", "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "2" ], "ids": [ 64682, 88233, 14767, 10123, 113, 10688, 114, 27868, 93979, 69699, 60999, 10263, 113, 10490, 114, 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paola", "Sua", "##rez", "(", "Argentina", ")", "beat", "Marianne", "Wer", "##del", "Wit", "##meyer", "(", "U", ".", "S", ".", ")", "6", "-", "4", "6", "-", "3" ], "ids": [ 57699, 24157, 34305, 113, 12853, 114, 27868, 36245, 70061, 14494, 83735, 62410, 113, 158, 119, 156, 119, 114, 127, 118, 125, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ann", "Gross", "##man", "(", "U", ".", "S", ".", ")", "beat", "Silvia", "Far", "##ina", "(", "Italy", ")", "6", "-", "4", "6", "-", "3" ], "ids": [ 15879, 50557, 10589, 113, 158, 119, 156, 119, 114, 27868, 44205, 26747, 11067, 113, 11619, 114, 127, 118, 125, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Alex", "Cor", "##ret", "##ja", "(", "Spain", ")", "beat", "Byron", "Black", "(", "Zimbabwe", ")", "7", "-", "6", "(", "8", "-", "6", ")", "3", "-", "6", "6", "-", "2", "6", "-", "2" ], "ids": [ 14728, 93495, 12785, 10320, 113, 16149, 114, 27868, 42657, 11750, 113, 34577, 114, 128, 118, 127, 113, 129, 118, 127, 114, 124, 118, 127, 127, 118, 123, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Scott", "Dr", "##aper", "(", "Australia", ")", "beat", "Gal", "##o", "Blanco", "(", "Spain", ")", "6", "-", "3", "7", "-", "5", "6", "-", "3" ], "ids": [ 12812, 11612, 59445, 113, 11729, 114, 27868, 66676, 10133, 30235, 113, 16149, 114, 127, 118, 124, 128, 118, 126, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Petr", "Ko", "##rda", "(", "Czech", "Republic", ")", "beat", "David", "Caldwell", "(", "U", ".", "S", ".", ")", "6", "-", "3", "3", "-", "6", "6", "-", "3", "7", "-", "5" ], "ids": [ 40986, 30186, 21285, 113, 22148, 13681, 114, 27868, 10804, 69296, 113, 158, 119, 156, 119, 114, 127, 118, 124, 124, 118, 127, 127, 118, 124, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bo", "##hda", "##n", "U", "##lih", "##rach", "(", "Czech", "Republic", ")", "beat", "14", "-", "Alberto", "Costa", "(", "Spain", ")", "2", "-", "6", "6", "-", "4", "7", "-", "6", "(", "7", "-", "2", ")", "3", "-", "6", "6", "-", "1" ], "ids": [ 27622, 109788, 10115, 158, 53614, 36185, 113, 22148, 13681, 114, 27868, 10247, 118, 15796, 13902, 113, 16149, 114, 123, 118, 127, 127, 118, 125, 128, 118, 127, 113, 128, 118, 123, 114, 124, 118, 127, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bernd", "Kar", "##bacher", "(", "Germany", ")", "beat", "Jonathan", "Stark", "(", "U", ".", "S", ".", ")", "7", "-", "5", "6", "-", "3", "5", "-", "7", "7", "-", "5" ], "ids": [ 49554, 90233, 75544, 113, 12775, 114, 27868, 16395, 39923, 113, 158, 119, 156, 119, 114, 128, 118, 126, 127, 118, 124, 126, 118, 128, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "8", "-", "Lindsay", "Davenport", "(", "U", ".", "S", ".", ")", "beat", "Adriana", "Serra", "-", "Za", "##nett", "##i", "(", "Italy", ")", "6", "-", "2", "6", "-", "1" ], "ids": [ 129, 118, 42228, 74533, 113, 158, 119, 156, 119, 114, 27868, 57424, 23682, 118, 14074, 80710, 10116, 113, 11619, 114, 127, 118, 123, 127, 118, 122 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Elena", "Wagner", "(", "Germany", ")", "beat", "Gigi", "Fernandez", "(", "U", ".", "S", ".", ")", "6", "-", "1", "6", "-", "4" ], "ids": [ 22342, 19821, 113, 12775, 114, 27868, 75339, 71566, 113, 158, 119, 156, 119, 114, 127, 118, 122, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kris", "##tie", "Boo", "##gert", "(", "Netherlands", ")", "beat", "Joanne", "##tte", "Kruger", "(", "South", "Africa", ")", "6", "-", "1", "6", "-", "0" ], "ids": [ 69041, 14859, 102498, 57241, 113, 22043, 114, 27868, 77786, 12131, 96234, 113, 11056, 12880, 114, 127, 118, 122, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Stefan", "Ed", "##berg", "(", "Sweden", ")", "beat", "5", "-", "Richard", "Kraj", "##ice", "##k", "(", "Netherlands", ")", "6", "-", "3", "6", "-", "3", "6", "-", "3" ], "ids": [ 17399, 13114, 11348, 113, 20937, 114, 27868, 126, 118, 11118, 98619, 11918, 10174, 113, 22043, 114, 127, 118, 124, 127, 118, 124, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", "-", "Marcelo", "Rio", "##s", "(", "Chile", ")", "beat", "Andrei", "Pavel", "(", "Romania", ")", "4", "-", "6", "6", "-", "1", "6", "-", "4", "6", "-", "2" ], "ids": [ 10150, 118, 38165, 12109, 10107, 113, 13218, 114, 27868, 40594, 28628, 113, 13927, 114, 125, 118, 127, 127, 118, 122, 127, 118, 125, 127, 118, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", "(", "Spain", ")", "beat", "La", "##x", "##mi", "Por", "##uri", "(", "U", ".", "S", ".", ")", "6", "-", "2", "6", "-", "1" ], "ids": [ 124, 118, 54789, 10368, 14220, 66007, 39574, 16780, 113, 16149, 114, 27868, 10159, 10686, 10500, 12399, 13091, 113, 158, 119, 156, 119, 114, 127, 118, 123, 127, 118, 122 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Andrei", "Ol", "##hov", "##ski", "##y", "(", "Russia", ")", "beat", "Pat", "Cash", "(", "Australia", ")", "6", "-", "4", "6", "-", "3", "6", "-", "2" ], "ids": [ 40594, 60160, 67238, 11401, 10157, 113, 14664, 114, 27868, 24714, 41286, 113, 11729, 114, 127, 118, 125, 127, 118, 124, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Filippo", "Ve", "##glio", "(", "Switzerland", ")", "beat", "Christian", "R", "##uu", "##d", "(", "Norway", ")", "1", "-", "6", "6" ], "ids": [ 28413, 19561, 28503, 113, 26002, 114, 27868, 11757, 155, 23804, 10162, 113, 22582, 114, 122, 118, 127, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "2", "6", "-", "4", "6", "-", "4" ], "ids": [ 118, 123, 127, 118, 125, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tim", "Hen", "##man", "(", "Britain", ")", "beat", "Roberto", "Jabal", "##i", "(", "Brazil", ")", "6", "-", "2", "6", "-", "3", "6", "-", "4" ], "ids": [ 15318, 86362, 10589, 113, 16032, 114, 27868, 14948, 41288, 10116, 113, 16765, 114, 127, 118, 123, 127, 118, 124, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pablo", "Camp", "##ana", "(", "Ecuador", ")", "beat", "Todd", "Wood", "##bridge", "(", "Australia", ")", "6", "-", "2", "4", "-" ], "ids": [ 17199, 20020, 11631, 113, 20475, 114, 27868, 24708, 18315, 29273, 113, 11729, 114, 127, 118, 123, 125, 118 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "6", "-", "2", "6", "-", "4" ], "ids": [ 127, 127, 118, 123, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Herman", "G", "##um", "##y", "(", "Argentina", ")", "beat", "Martin", "Damm", "(", "Czech", "Republic", ")", "7", "-", "5", "6" ], "ids": [ 22303, 144, 10465, 10157, 113, 12853, 114, 27868, 11235, 104698, 113, 22148, 13681, 114, 128, 118, 126, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "4", "7", "-", "5" ], "ids": [ 118, 125, 128, 118, 126 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jacob", "H", "##lase", "##k", "(", "Switzerland", ")", "beat", "Nick", "##las", "Ku", "##lti", "(", "Sweden", ")", "6", "-", "3", "6", "-", "4" ], "ids": [ 16493, 145, 77031, 10174, 113, 26002, 114, 27868, 16126, 13983, 49869, 45505, 113, 20937, 114, 127, 118, 124, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "6", "6", "-", "4" ], "ids": [ 125, 118, 127, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "17", "-", "Karin", "##a", "Ha", "##bs", "##udo", "##va", "(", "Slovakia", ")", "beat", "Rad", "##ka", "Bob", "##kova", "(", "Czech" ], "ids": [ 10273, 118, 41633, 10113, 13740, 19528, 33498, 10362, 113, 43031, 114, 27868, 71204, 10371, 13583, 61653, 113, 22148 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1 ] }, { "tokens": [ "Republic", ")", "6", "-", "4", "6", "-", "1" ], "ids": [ 13681, 114, 127, 118, 125, 127, 118, 122 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karin", "K", "##sch", "##wen", "##dt", "(", "Austria", ")", "beat", "Sandra" ], "ids": [ 41633, 148, 12044, 19584, 14892, 113, 14479, 114, 27868, 31433 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4 ] }, { "tokens": [ "Klein", "##ova", "(", "Czech", "Republic", ")", "6", "-", "3", "6", "-", "4" ], "ids": [ 22874, 12804, 113, 22148, 13681, 114, 127, 118, 124, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anna", "##bel", "El", "##l", "##wood", "(", "Australia", ")", "beat", "Jennifer", "Cap", "##riat", "##i", "(", "U", ".", "S", ".", ")", "6", "-", "4", "6" ], "ids": [ 12300, 13770, 10224, 10161, 14759, 113, 11729, 114, 27868, 21362, 24069, 65441, 10116, 113, 158, 119, 156, 119, 114, 127, 118, 125, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "4" ], "ids": [ 118, 125 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Nicole", "Are", "##ndt", "(", "U", ".", "S", ".", ")", "beat", "Sandra", "Ca", "##ci", "##c", "(", "U", ".", "S", ".", ")", "6", "-", "2", "7", "-", "6", "(", "8", "-", "6", ")" ], "ids": [ 27142, 13491, 33096, 113, 158, 119, 156, 119, 114, 27868, 31433, 26037, 10598, 10350, 113, 158, 119, 156, 119, 114, 127, 118, 123, 128, 118, 127, 113, 129, 118, 127, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Elena", "Li", "##kh", "##ov", "##tse", "##va", "(", "Russia", ")", "beat", "Ky", "##oko", "Naga", "##tsu", "##ka", "(", "Japan", ")", "7", "-", "6", "(", "7", "-" ], "ids": [ 22342, 13258, 48502, 11024, 45507, 10362, 113, 14664, 114, 27868, 60082, 20954, 103869, 36296, 10371, 113, 11891, 114, 128, 118, 127, 113, 128, 118 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ")", "6", "-", "1" ], "ids": [ 126, 114, 127, 118, 122 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sand", "##rine", "Test", "##ud", "(", "France", ")", "beat", "Pam", "Shri", "##ver", "(", "U", ".", "S", ".", ")", "7", "-", "5", "6", "-", "2" ], "ids": [ 35071, 28728, 22495, 11679, 113, 10688, 114, 27868, 95101, 93628, 12563, 113, 158, 119, 156, 119, 114, 128, 118, 126, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Kimberly", "Po", "(", "U", ".", "S", ".", ")", "beat", "10", "-", "Kimi", "##ko", "Date", "(", "Japan", ")", "6", "-", "2", "7", "-", "5" ], "ids": [ 106840, 11255, 113, 158, 119, 156, 119, 114, 27868, 10150, 118, 63038, 10440, 29897, 113, 11891, 114, 127, 118, 123, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Natasha", "Z", "##vere", "##va", "(", "Belarus", ")", "beat", "Virginia", "Rua", "##no", "-", "Pascual", "(", "Spain", ")", "6" ], "ids": [ 79827, 163, 29282, 10362, 113, 55131, 114, 27868, 13634, 48218, 10343, 118, 67582, 113, 16149, 114, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "-", "2", "6", "-", "7", "(", "5", "-", "7", ")", "6", "-", "2", "Tina", "Ki", "##rza", "##n", "(", "Slovakia", ")", "beat", "R", "##ika", "Hi", "##rak", "##i", "(", "Japan", ")" ], "ids": [ 118, 123, 127, 118, 128, 113, 126, 118, 128, 114, 127, 118, 123, 34225, 28941, 28768, 10115, 113, 43031, 114, 27868, 155, 13060, 20065, 15793, 10116, 113, 11891, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "7", "-", "6", "(", "7", "-", "4", ")", "7", "-", "5" ], "ids": [ 128, 118, 127, 113, 128, 118, 125, 114, 128, 118, 126 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Petra", "Lang", "##rova", "(", "Czech", "Republic", ")", "beat", "Karin", "##a", "Adams", "(", "U", ".", "S", ".", ")", "6", "-", "4", "6", "-", "2" ], "ids": [ 27357, 23798, 36657, 113, 22148, 13681, 114, 27868, 41633, 10113, 16955, 113, 158, 119, 156, 119, 114, 127, 118, 125, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tam", "##i", "W", "##hit", "##linger", "Jones", "(", "U", ".", "S", ".", ")", "beat", "Sandra", "Ce", "##cchi", "##ni", "(", "Italy", ")", "6", "-", "2", "6", "-", "0" ], "ids": [ 27324, 10116, 160, 40762, 51099, 12298, 113, 158, 119, 156, 119, 114, 27868, 31433, 13338, 24555, 10342, 113, 11619, 114, 127, 118, 123, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "Jana", "Novo", "##tna", "(", "Czech", "Republic", ")", "beat", "Francesca", "Lu", "##bian", "##i", "(", "Italy", ")" ], "ids": [ 128, 118, 18909, 28649, 34247, 113, 22148, 13681, 114, 27868, 43571, 23859, 42041, 10116, 113, 11619, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", "-", "1", "7", "-", "5" ], "ids": [ 127, 118, 122, 128, 118, 126 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "13", "-", "Thomas", "En", "##qvist", "(", "Sweden", ")", "beat", "Stephan", "##e", "Sim", "##ian", "(", "France", ")", "6", "-", "3", "6", "-", "1", "6", "-", "4" ], "ids": [ 10249, 118, 11096, 10243, 47780, 113, 20937, 114, 27868, 31556, 10112, 103695, 11630, 113, 10688, 114, 127, 118, 124, 127, 118, 122, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Mikael", "Till", "##strom", "(", "Sweden", ")", "beat", "Tam", "##er", "El", "Saw", "##y", "(", "Egypt", ")", "1", "-", "6", "7", "-", "6", "(", "9" ], "ids": [ 54671, 32259, 83474, 113, 20937, 114, 27868, 27324, 10165, 10224, 74666, 10157, 113, 20440, 114, 122, 118, 127, 128, 118, 127, 113, 130 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "7", ")", "6", "-", "1", "3", "-", "6", "6", "-", "4" ], "ids": [ 118, 128, 114, 127, 118, 122, 124, 118, 127, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Roberto", "Carr", "##eter", "##o", "(", "Spain", ")", "beat", "Jordi", "Bu", "##rillo", "(", "Spain", ")", "6", "-", "3", "4", "-", "6", "6", "-" ], "ids": [ 14948, 45332, 28647, 10133, 113, 16149, 114, 27868, 40928, 11916, 96382, 113, 16149, 114, 127, 118, 124, 125, 118, 127, 127, 118 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "0", "1", "-", "0", "Retired", "(", "an", "##kle", "injury", ")" ], "ids": [ 121, 122, 118, 121, 109698, 113, 10151, 24006, 27443, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thomas", "Johansson", "(", "Sweden", ")", "beat", "Renzo", "Fu", "##rla", "##n", "(", "Italy", ")", "4", "-", "6", "2", "-", "6", "7", "-", "5" ], "ids": [ 11096, 40211, 113, 20937, 114, 27868, 103493, 17056, 28050, 10115, 113, 11619, 114, 125, 118, 127, 123, 118, 127, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "1", "7", "-", "5" ], "ids": [ 127, 118, 122, 128, 118, 126 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Knowles", "(", "Bahamas", ")", "beat", "Marcelo", "Filip", "##pini", "(", "Uruguay", ")", "6", "-", "3", "7", "-", "5" ], "ids": [ 11997, 69382, 113, 64534, 114, 27868, 38165, 31445, 103479, 113, 20541, 114, 127, 118, 124, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "1" ], "ids": [ 127, 118, 122 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Jared", "Palmer", "(", "U", ".", "S", ".", ")", "beat", "15", "-", "Marc", "Ross", "##et", "(", "Switzerland", ")", "6", "-", "7", "(", "7", "-", "9", ")" ], "ids": [ 77741, 26161, 113, 158, 119, 156, 119, 114, 27868, 10208, 118, 15254, 16690, 10308, 113, 26002, 114, 127, 118, 128, 113, 128, 118, 130, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "4", "6", "-", "4", "6", "-", "3" ], "ids": [ 127, 118, 125, 127, 118, 125, 127, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Amy", "Fra", "##zier", "(", "U", ".", "S", ".", ")", "beat", "La", "##ris", "##a", "Neil", "##and", "(", "Latvia", ")", "6", "-", "1", "6", "-", "3" ], "ids": [ 23149, 18633, 43815, 113, 158, 119, 156, 119, 114, 27868, 10159, 12125, 10113, 19687, 14752, 113, 55926, 114, 127, 118, 122, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Lisa", "Raymond", "(", "U", ".", "S", ".", ")", "beat", "Lori", "M", "##c", "##N", "##eil", "(", "U", ".", "S", ".", ")", "7", "-", "6", "(", "8", "-", "6", ")", "6", "-", "3" ], "ids": [ 19589, 17326, 113, 158, 119, 156, 119, 114, 27868, 91738, 150, 10350, 11537, 41420, 113, 158, 119, 156, 119, 114, 128, 118, 127, 113, 129, 118, 127, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sandra", "Do", "##pfer", "(", "Austria", ")", "beat", "Zi", "##na", "Garrison", "Jackson", "(", "U", ".", "S", ".", ")", "2", "-", "6", "6", "-", "3", "7", "-", "5" ], "ids": [ 31433, 11791, 69828, 113, 14479, 114, 27868, 99890, 10219, 87412, 13169, 113, 158, 119, 156, 119, 114, 123, 118, 127, 127, 118, 124, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Con", "##chi", "##ta", "Martinez", "(", "Spain", ")", "beat", "R", "##ux", "##andra", "Drago", "##mir", "(", "Romania", ")", "6", "-", "2", "6", "-", "0" ], "ids": [ 125, 118, 12845, 12806, 10213, 50203, 113, 16149, 114, 27868, 155, 11855, 90332, 98650, 20825, 113, 13927, 114, 127, 118, 123, 127, 118, 121 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Na", "##oko", "Saw", "##amat", "##su", "(", "Japan", ")", "beat", "Ren", "##nae", "St", "##ub", "##bs", "(", "Australia", ")", "6", "-", "4", "6", "-", "3" ], "ids": [ 10685, 20954, 74666, 49158, 12892, 113, 11891, 114, 27868, 52712, 25589, 10838, 20664, 19528, 113, 11729, 114, 127, 118, 125, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Miriam", "Or", "##eman", "##s", "(", "Netherlands", ")", "beat", "Rad", "##ka", "Z", "##rub", "##akov", "##a", "(", "Slovakia", ")", "6", "-", "2", "4", "-", "6", "6", "-", "1" ], "ids": [ 60176, 19372, 31087, 10107, 113, 22043, 114, 27868, 71204, 10371, 163, 71376, 106573, 10113, 113, 43031, 114, 127, 118, 123, 125, 118, 127, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Doug", "Fl", "##ach", "(", "U", ".", "S", ".", ")", "beat", "Gian", "##luca", "Po", "##zzi", "(", "Italy", ")", "7", "-", "5", "7", "-", "6", "(", "7", "-", "5", ")", "2", "-", "6", "7", "-", "6", "(", "8", "-", "6", ")" ], "ids": [ 34008, 29981, 11587, 113, 158, 119, 156, 119, 114, 27868, 57243, 99839, 11255, 22125, 113, 11619, 114, 128, 118, 126, 128, 118, 127, 113, 128, 118, 126, 114, 123, 118, 127, 128, 118, 127, 113, 129, 118, 127, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "16", "-", "Cedric", "Pio", "##line", "(", "France", ")", "beat", "Francisco", "Cl", "##ave", "##t", "(", "Spain", ")", "6", "-", "4", "7", "-", "6", "(", "7", "-", "3", ")", "6", "-", "4" ], "ids": [ 10250, 118, 107799, 42712, 12953, 113, 10688, 114, 27868, 11798, 101989, 23641, 10123, 113, 16149, 114, 127, 118, 125, 128, 118, 127, 113, 128, 118, 124, 114, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Javier", "Sanchez", "(", "Spain", ")", "beat", "David", "S", "##ko", "##ch", "(", "Czech", "Republic", ")", "6", "-", "2", "7", "-", "6", "(", "7", "-", "0", ")", "6", "-", "3" ], "ids": [ 22856, 66007, 113, 16149, 114, 27868, 10804, 156, 10440, 10269, 113, 22148, 13681, 114, 127, 118, 123, 128, 118, 127, 113, 128, 118, 121, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "first", "round", "1", "-", "St", "##ef", "##fi", "Graf", "(", "Germany", ")", "beat", "Ya", "##yu", "##k", "Bas", "##uki", "(", "Indonesia", ")", "6", "-", "3", "7", "-", "6", "(", "7", "-", "4", ")" ], "ids": [ 13536, 112, 187, 20527, 117, 10422, 13569, 122, 118, 10838, 16822, 14403, 20617, 113, 12775, 114, 27868, 25148, 25285, 10174, 21237, 39821, 113, 11658, 114, 127, 118, 124, 128, 118, 127, 113, 128, 118, 125, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "AF", "##TER", "MO", "##ND", "##A", "##Y", "'", "S", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 55640, 99552, 102059, 58521, 10738, 14703, 112, 156, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "League", "Baseball" ], "ids": [ 14988, 11074, 27084 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "standing", "##s", "after", "games", "played", "on", "Monday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 32173, 10107, 10662, 13332, 11553, 10135, 40714, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "winning", "percentage", "and", "games", "behind", ")", ":" ], "ids": [ 14172, 117, 16542, 46971, 10111, 13332, 17155, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ER", "##IC", "##AN", "LE", "##AG", "##UE" ], "ids": [ 24339, 24093, 30889, 41275, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "74", "56", ".", "569", "-" ], "ids": [ 86607, 13034, 162, 42622, 11733, 12535, 11628, 119, 53670, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "69", "61", ".", "531", "5" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 12573, 12314, 119, 49041, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "67", "65", ".", "508", "8" ], "ids": [ 139, 21793, 60493, 11537, 12316, 10843, 119, 40003, 129 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "62", "70", ".", "470", "13" ], "ids": [ 58573, 35066, 77261, 11403, 12066, 10923, 119, 29231, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "47", "84", ".", "359", "27", "1", "/", "2" ], "ids": [ 25067, 11090, 35066, 37611, 11413, 11761, 119, 35403, 10365, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "78", "53", ".", "595", "-" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 12492, 11756, 119, 53584, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "70", "63", ".", "526", "9" ], "ids": [ 39774, 30889, 109865, 11403, 10923, 12256, 119, 51559, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "65", "66", ".", "496", "13" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 10843, 12215, 119, 42498, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "63", "69", ".", "477", "15", "1", "/", "2" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 12256, 12573, 119, 46621, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "59", "73", ".", "447", "19", "1", "/", "2" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 11867, 12545, 119, 42873, 10270, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "75", "56", ".", "573", "-" ], "ids": [ 157, 11259, 12674, 38025, 11417, 11628, 119, 46491, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "67", "63", ".", "515", "7", "1", "/", "2" ], "ids": [ 23056, 32071, 11090, 51036, 12316, 12256, 119, 41211, 128, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "63", "71", ".", "470", "13", "1", "/", "2" ], "ids": [ 152, 10738, 11733, 44376, 58521, 12256, 12513, 119, 29231, 10249, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "61", "70", ".", "466", "14" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 12314, 10923, 119, 48443, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##ES", "##DA", "##Y", ",", "AU", "##G", "##US", "##T", "27", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 94747, 25054, 36382, 14703, 117, 29088, 11447, 32612, 11090, 10365, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "AT", "DE", "##T", "##RO", "##IT" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 30554, 25067, 11090, 35066, 37611 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "AT", "BA", "##L", "##TI", "##M", "##OR", "##E" ], "ids": [ 152, 10738, 11733, 44376, 58521, 30554, 39999, 11369, 72286, 11517, 42622, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "AT", "TO", "##RO", "##NT", "##O" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 30554, 58573, 35066, 77261, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "AT", "CH", "##IC", "##AG", "##O" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 30554, 39774, 30889, 109865, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "AT", "KA", "##NS", "##AS", "C", "##IT", "##Y" ], "ids": [ 157, 11259, 12674, 38025, 30554, 85314, 69196, 38025, 140, 37611, 14703 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "AT", "CA", "##L", "##IF", "##OR", "##NI", "##A" ], "ids": [ 139, 21793, 60493, 11537, 30554, 24707, 11369, 53668, 42622, 52898, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "AT", "SE", "##AT", "##T", "##LE" ], "ids": [ 86607, 13034, 162, 42622, 11733, 30554, 23056, 32071, 11090, 51036 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "NA", "##TION", "##AL", "LE", "##AG", "##UE" ], "ids": [ 56586, 98207, 32002, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "81", "48", ".", "628", "-" ], "ids": [ 30554, 44376, 77261, 10738, 12324, 11300, 119, 52888, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "70", "59", ".", "543", "11" ], "ids": [ 102059, 77261, 66014, 32002, 10923, 11867, 119, 50268, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "61", "70", ".", "466", "21" ], "ids": [ 83243, 42622, 28895, 10738, 12314, 10923, 119, 48443, 10296 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "59", "72", ".", "450", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 11867, 12120, 119, 16718, 10328 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "53", "79", ".", "402", "29", "1", "/", "2" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 11756, 12791, 119, 36427, 10386, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "70", "62", ".", "530", "-" ], "ids": [ 145, 11403, 32612, 60493, 11537, 10923, 12066, 119, 31977, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "69", "62", ".", "527", "1", "/", "2" ], "ids": [ 53317, 149, 11403, 83259, 10731, 12573, 12066, 119, 43963, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "64", "64", ".", "500", "4" ], "ids": [ 39774, 30889, 109865, 11403, 11295, 11295, 119, 10757, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "64", "66", ".", "492", "5" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 11295, 12215, 119, 44609, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "55", "75", ".", "423", "14" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 11358, 11417, 119, 36504, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "72", "60", ".", "545", "-" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 12120, 10709, 119, 49589, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "70", "60", ".", "538", "1" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 10923, 10709, 119, 45677, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "69", "63", ".", "523", "3" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 12573, 12256, 119, 50564, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "56", "73", ".", "434", "14", "1", "/", "2" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 11628, 12545, 119, 44726, 10247, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##ES", "##DA", "##Y", ",", "AU", "##G", "##US", "##T", "27", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 94747, 25054, 36382, 14703, 117, 29088, 11447, 32612, 11090, 10365, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "AT", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 30554, 21318, 11537, 64655, 41275, 89955, 36175, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "AT", "MO", "##NT", "##RE", "##AL" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 30554, 102059, 77261, 66014, 32002 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "AT", "P", "##IT", "##TS", "##BU", "##R", "##G", "##H" ], "ids": [ 30554, 44376, 77261, 10738, 30554, 153, 37611, 36545, 108865, 11273, 11447, 12396 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "AT", "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 30554, 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "AT", "H", "##O", "##US", "##TO", "##N" ], "ids": [ 39774, 30889, 109865, 11403, 30554, 145, 11403, 32612, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "AT", "ST", "L", "##O", "##UI", "##S" ], "ids": [ 83243, 42622, 28895, 10738, 30554, 53317, 149, 11403, 83259, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "AT", "CO", "##L", "##OR", "##AD", "##O" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 30554, 32992, 11369, 42622, 55538, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "G", "##IA", "##NT", "##S", "ED", "##GE", "P", "##HI", "##LL", "##IE", "##S", "1", "-", "0", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 144, 35976, 77261, 10731, 74053, 58719, 153, 108880, 82834, 71655, 10731, 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "William", "Van", "##L", "##andi", "##ng", "##ham", "pitched", "eight", "score", "##less", "innings", "and", "Glen", "##allen", "Hill", "drove", "in", "the", "game", "'", "s", "only", "run", "with", "a", "first", "-", "inning", "single", "as", "the", "San", "Francisco", "Giants", "claimed", "a", "1", "-", "0", "victory", "over", "the", "Philadelphia", "Phil", "##lies", "on", "Monday", "." ], "ids": [ 10694, 11474, 11369, 62004, 10376, 13196, 80525, 16222, 17704, 14985, 48974, 10111, 30729, 92874, 12289, 72256, 10106, 10105, 11661, 112, 187, 10893, 14095, 10169, 169, 10422, 118, 110505, 11376, 10146, 10105, 10469, 11798, 36658, 20737, 169, 122, 118, 121, 19735, 10491, 10105, 15979, 18144, 22201, 10135, 40714, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Van", "##L", "##andi", "##ng", "##ham", "(", "8", "-", "13", ")", ",", "who", "entered", "the", "game", "with", "one", "complete", "game", "in", "the", "first", "56", "starts", "of", "his", "career", ",", "limited", "the", "Phil", "##lies", "to", "two", "hits", "and", "two", "walks", "with", "four", "strike", "##outs", "." ], "ids": [ 11474, 11369, 62004, 10376, 13196, 113, 129, 118, 10249, 114, 117, 10479, 19226, 10105, 11661, 10169, 10464, 17876, 11661, 10106, 10105, 10422, 11628, 33039, 10108, 10226, 13021, 117, 19264, 10105, 18144, 22201, 10114, 10551, 27922, 10111, 10551, 106216, 10169, 11598, 37456, 72199, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "'", "ve", "been", "working", "all", "year", "on", "my", "follow", "-", "through", ",", "and", "I", "really", "concentrated", "on", "that", ",", "\"", "Van", "##L", "##andi", "##ng", "##ham", "said", ".", "\"" ], "ids": [ 107, 12865, 112, 10323, 10590, 14616, 10435, 10924, 10135, 15127, 28086, 118, 11222, 117, 10111, 146, 30181, 80018, 10135, 10189, 117, 107, 11474, 11369, 62004, 10376, 13196, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "It", "gave", "me", "more", "life", "in", "all", "of", "my", "pitch", "##es", ",", "so", "the", "ball", "moved", "more", ".", "\"" ], "ids": [ 10377, 15362, 10911, 10798, 12103, 10106, 10435, 10108, 15127, 50892, 10171, 117, 10380, 10105, 20724, 13059, 10798, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Colorado", ",", "Andres", "Gala", "##rra", "##ga", "home", "##red", "and", "drove", "in", "three", "runs", "as", "the", "Colorado", "Rock", "##ies", "had", "10", "extra", "-", "base", "hits", "and", "Billy", "Swift", "won", "his", "first", "game", "in", "almost", "a", "year", "in", "a", "9", "-", "5", "rain", "-", "short", "##ened", "seven", "-", "inning", "victory", "over", "the", "Cincinnati", "Reds", "." ], "ids": [ 11699, 17111, 117, 71485, 60231, 21084, 10483, 11816, 15711, 10111, 72256, 10106, 11003, 17913, 10146, 10105, 17111, 12158, 11624, 10374, 10150, 19868, 118, 11404, 27922, 10111, 15894, 30372, 11367, 10226, 10422, 11661, 10106, 17122, 169, 10924, 10106, 169, 130, 118, 126, 50939, 118, 13716, 27867, 15767, 118, 110505, 19735, 10491, 10105, 31257, 74652, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Swift", "(", "1", "-", "0", ")", ",", "who", "made", "his", "first", "start", "since", "June", "3rd", "and", "underwent", "art", "##hro", "##sco", "##pic", "surgery", "on", "his", "right", "shoulder", "earlier", "in", "the", "season", ",", "allowed", "five", "runs", "and", "six", "hits", "in", "five", "innings", "." ], "ids": [ 30372, 113, 122, 118, 121, 114, 117, 10479, 11019, 10226, 10422, 15148, 11764, 11120, 16800, 10111, 78074, 11938, 106543, 22402, 34891, 44811, 10135, 10226, 13448, 78681, 18905, 10106, 10105, 11226, 117, 18162, 12403, 17913, 10111, 12449, 27922, 10106, 12403, 48974, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Houston", ",", "Andy", "Ben", "##es", "allowed", "two", "runs", "over", "seven", "innings", "and", "Royce", "Clayton", "had", "a", "run", "-", "scoring", "single", "in", "the", "seventh", "to", "lift", "the", "St", ".", "Louis", "Cardinals", "to", "a", "3", "-", "2", "victory", "over", "the", "Houston", "Astro", "##s", "." ], "ids": [ 10167, 18551, 117, 16802, 13304, 10171, 18162, 10551, 17913, 10491, 15767, 48974, 10111, 46753, 43687, 10374, 169, 14095, 118, 27346, 11376, 10106, 10105, 37192, 10114, 63376, 10105, 10838, 119, 11334, 57877, 10114, 169, 124, 118, 123, 19735, 10491, 10105, 18551, 87075, 10107, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Ben", "##es", "(", "14", "-", "9", ")", "allowed", "five", "hits", ",", "walk", "##ed", "five", "and", "struck", "out", "10", "for", "his", "11th", "win", "in", "12", "decisions", "." ], "ids": [ 13304, 10171, 113, 10247, 118, 130, 114, 18162, 12403, 27922, 117, 33734, 10336, 12403, 10111, 45622, 10950, 10150, 10142, 10226, 34062, 14125, 10106, 10186, 48126, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Cardinals", "moved", "within", "one", "-", "half", "game", "of", "first", "-", "place", "Houston", "in", "the", "National", "League", "Central", "Division", "." ], "ids": [ 10117, 57877, 13059, 12381, 10464, 118, 13877, 11661, 10108, 10422, 118, 11192, 18551, 10106, 10105, 10655, 11074, 11885, 11987, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "OR", "##IO", "##LE", "##S", "W", "##IN", ",", "Y", "##AN", "##K", "##EE", "##S", "L", "##OS", "##E", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 69308, 37174, 51036, 10731, 160, 27128, 117, 162, 41275, 11733, 95825, 10731, 149, 21793, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "1996", "-", "08", "-", "27" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cal", "R", "##ip", "##ken", "'", "s", "bases", "-", "loaded", "walk", "scored", "Brady", "Anderson", "with", "the", "winning", "run", "in", "the", "bottom", "of", "the", "10th", "as", "the", "Baltimore", "Or", "##iol", "##es", "re", "##gain", "##ed", "control", "of", "the", "top", "spot", "in", "the", "wild", "-", "card", "race", "with", "a", "wild", "12", "-", "11", "victory", "over", "the", "Oakland", "Athletics", "." ], "ids": [ 41280, 155, 17437, 11062, 112, 187, 23213, 118, 103927, 33734, 17233, 45982, 15007, 10169, 10105, 16542, 14095, 10106, 10105, 34787, 10108, 10105, 31004, 10146, 10105, 21413, 19372, 35493, 10171, 11639, 85473, 10336, 12608, 10108, 10105, 12364, 28504, 10106, 10105, 32290, 118, 23050, 14025, 10169, 169, 32290, 10186, 118, 10193, 19735, 10491, 10105, 38340, 46800, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Trail", "##ing", "by", "a", "run", "entering", "the", "11th", ",", "the", "Or", "##iol", "##es", "ra", "##lli", "##ed", "against", "Oakland", "relieve", "##r", "Mark", "Acre", "(", "0", "-", "2", ")", "with", "a", "walk", "and", "a", "triple", "by", "Brady", "Anderson", "to", "tie", "the", "game", "." ], "ids": [ 29890, 10230, 10155, 169, 14095, 44824, 10105, 34062, 117, 10105, 19372, 35493, 10171, 11859, 14088, 10336, 11327, 38340, 85440, 10129, 11997, 86200, 113, 121, 118, 123, 114, 10169, 169, 33734, 10111, 169, 40159, 10155, 45982, 15007, 10114, 27916, 10105, 11661, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Then", "Oakland", "manager", "Art", "Howe", "decided", "to", "intention", "##ally", "walk", "Rafael", "Palm", "##eiro", "and", "Bobby", "Bon", "##illa", "to", "load", "the", "bases", "but", "Acre", "was", "now", "##here", "near", "the", "plate", "to", "R", "##ip", "##ken", "." ], "ids": [ 26467, 38340, 16935, 11397, 46739, 17270, 10114, 41241, 19777, 33734, 17673, 35158, 25868, 10111, 19371, 30120, 14250, 10114, 58490, 10105, 23213, 10473, 86200, 10134, 11858, 57204, 12883, 10105, 35932, 10114, 155, 17437, 11062, 119 ], "entity": [ "O", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 3, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "The", "de", "##cisive", "pitch", "nearly", "hit", "R", "##ip", "##ken", "and", "gave", "the", "Or", "##iol", "##es", "a", "one", "-", "half", "game", "lead", "over", "the", "Chicago", "White", "Sox", "in", "the", "wild", "-", "card", "race", "." ], "ids": [ 10117, 10104, 79533, 50892, 21377, 14946, 155, 17437, 11062, 10111, 15362, 10105, 19372, 35493, 10171, 169, 10464, 118, 13877, 11661, 14107, 10491, 10105, 12317, 12136, 55687, 10106, 10105, 32290, 118, 23050, 14025, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Seattle", ",", "Jay", "Bu", "##hner", "'", "s", "eighth", "-", "inning", "single", "sna", "##pped", "a", "tie", "as", "the", "Seattle", "Marine", "##rs", "edge", "##d", "the", "New", "York", "Yankees", "2", "-", "1", "in", "the", "open", "##er", "of", "a", "three", "-", "game", "series", "." ], "ids": [ 10167, 20902, 117, 18559, 11916, 45930, 112, 187, 46758, 118, 110505, 11376, 62541, 44357, 169, 27916, 10146, 10105, 20902, 12425, 10943, 30599, 10162, 10105, 10287, 10482, 60799, 123, 118, 122, 10106, 10105, 14087, 10165, 10108, 169, 11003, 118, 11661, 11366, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "York", "starter", "Jimmy", "Key", "left", "the", "game", "in", "the", "first", "inning", "after", "Seattle", "short", "##stop", "Alex", "Rodriguez", "line", "##d", "a", "shot", "off", "his", "left", "el", "##bow", "." ], "ids": [ 10287, 10482, 59099, 16226, 21663, 12153, 10105, 11661, 10106, 10105, 10422, 110505, 10662, 20902, 13716, 78881, 14728, 41778, 12117, 10162, 169, 19508, 11898, 10226, 12153, 10125, 63081, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Yankees", "have", "lost", "12", "of", "their", "last", "19", "games", "and", "their", "lead", "in", "the", "AL", "East", "over", "Baltimore", "fell", "to", "five", "games", "." ], "ids": [ 10117, 60799, 10529, 14172, 10186, 10108, 10455, 12469, 10270, 13332, 10111, 10455, 14107, 10106, 10105, 47271, 11830, 10491, 21413, 25194, 10114, 12403, 13332, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-MISC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 2, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "California", ",", "Tim", "Wakefield", "pitched", "a", "six", "-", "hit", "##ter", "for", "his", "third", "complete", "game", "of", "the", "season", "and", "Mo", "Vaughn", "and", "Troy", "O", "'", "Leary", "hit", "solo", "home", "runs", "in", "the", "second", "inning", "as", "the", "sur", "##ging", "Boston", "Red", "Sox", "won", "their", "third", "straight", "4", "-", "1", "over", "the", "California", "Angels", "." ], "ids": [ 11699, 11621, 117, 15318, 88155, 80525, 169, 12449, 118, 14946, 10877, 10142, 10226, 12628, 17876, 11661, 10108, 10105, 11226, 10111, 34987, 102117, 10111, 40777, 152, 112, 110601, 14946, 11395, 11816, 17913, 10106, 10105, 11132, 110505, 10146, 10105, 10326, 13808, 13683, 11641, 55687, 11367, 10455, 12628, 31214, 125, 118, 122, 10491, 10105, 11621, 28132, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Boston", "has", "won", "seven", "of", "eight", "and", "is", "20", "-", "6", "since", "August", "2nd", "." ], "ids": [ 13683, 10393, 11367, 15767, 10108, 16222, 10111, 10124, 10197, 118, 127, 11764, 10735, 14105, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Red", "Sox", "are", "two", "games", "over", ".", "500", "for", "the", "first", "time", "this", "season", "." ], "ids": [ 10117, 11641, 55687, 10301, 10551, 13332, 10491, 119, 10757, 10142, 10105, 10422, 10635, 10531, 11226, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Chicago", ",", "Cal", "El", "##dre", "##d", "pitched", "5", "-", "1", "/", "3", "score", "##less", "innings", "and", "John", "Ja", "##ha", "scored", "one", "run", "and", "double", "##d", "in", "another", "as", "the", "Milwaukee", "Brewer", "##s", "held", "off", "the", "sl", "##ump", "##ing", "Chicago", "White", "Sox", ",", "3", "-", "2", "." ], "ids": [ 10167, 12317, 117, 41280, 10224, 16419, 10162, 80525, 126, 118, 122, 120, 124, 17704, 14985, 48974, 10111, 10421, 28248, 10921, 17233, 10464, 14095, 10111, 15790, 10162, 10106, 12864, 10146, 10105, 36413, 109040, 10107, 11991, 11898, 10105, 38523, 67299, 10230, 12317, 12136, 55687, 117, 124, 118, 123, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "El", "##dre", "##d", "(", "6", "-", "5", ")", "walk", "##ed", "one", "and", "struck", "out", "three", "." ], "ids": [ 10224, 16419, 10162, 113, 127, 118, 126, 114, 33734, 10336, 10464, 10111, 45622, 10950, 11003, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Angel", "Miranda", "retired", "one", "bat", "##ter", "and", "Bob", "Wi", "##ckman", "retired", "the", "next", "four", "but", "loaded", "the", "bases", "in", "the", "eighth", "." ], "ids": [ 17567, 25841, 18675, 10464, 11519, 10877, 10111, 13583, 52742, 79391, 18675, 10105, 13451, 11598, 10473, 103927, 10105, 23213, 10106, 10105, 46758, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Detroit", ",", "Jim", "Thom", "##e", "'", "s", "solo", "home", "##r", "in", "the", "ninth", "inning", "sna", "##pped", "a", "tie", "and", "Charles", "Nagy", "pitched", "a", "three", "-", "hit", "##ter", "for", "his", "first", "win", "in", "over", "a", "month", ",", "leading", "the", "Cleveland", "Indians", "to", "their", "11th", "straight", "victory", "over", "the", "Detroit", "Tigers", ",", "2", "-", "1", "." ], "ids": [ 10167, 19727, 117, 14178, 93759, 10112, 112, 187, 11395, 11816, 10129, 10106, 10105, 54905, 110505, 62541, 44357, 169, 27916, 10111, 10925, 26551, 80525, 169, 11003, 118, 14946, 10877, 10142, 10226, 10422, 14125, 10106, 10491, 169, 14064, 117, 16018, 10105, 21342, 33032, 10114, 10455, 34062, 31214, 19735, 10491, 10105, 19727, 38640, 117, 123, 118, 122, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "the", "score", "tied", "1", "-", "1", "in", "the", "ninth", ",", "Thom", "##e", "hit", "a", "2", "-", "2", "pitch", "from", "starter", "Felipe", "Li", "##ra", "(", "6", "-", "11", ")", "over", "the", "left", "-", "field", "fe", "##nce", "for", "his", "29", "##th", "home", "##r", "." ], "ids": [ 12613, 10105, 17704, 42780, 122, 118, 122, 10106, 10105, 54905, 117, 93759, 10112, 14946, 169, 123, 118, 123, 50892, 10188, 59099, 20473, 13258, 10288, 113, 127, 118, 10193, 114, 10491, 10105, 12153, 118, 13939, 34778, 12150, 10142, 10226, 10386, 11143, 11816, 10129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Toronto", ",", "Juan", "G", "##uz", "##man", "allowed", "three", "runs", "over", "seven", "innings", "to", "make", "home", "##rs", "by", "Joe", "Carter", "and", "Carlos", "Delgado", "stand", "up", "as", "the", "sur", "##ging", "Toronto", "Blue", "Jay", "##s", "held", "off", "the", "Minnesota", "Twins", ",", "5", "-", "3", "." ], "ids": [ 10167, 15256, 117, 11686, 144, 20498, 10589, 18162, 11003, 17913, 10491, 15767, 48974, 10114, 13086, 11816, 10943, 10155, 13062, 18047, 10111, 12050, 52715, 14603, 10741, 10146, 10105, 10326, 13808, 15256, 12972, 18559, 10107, 11991, 11898, 10105, 16306, 68084, 117, 126, 118, 124, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Toronto", "returned", "home", "from", "a", "10", "-", "game", "road", "trip", "and", "won", "for", "the", "eighth", "time", "in", "nine", "games", "as", "G", "##uz", "##man", "(", "11", "-", "8", ")", "allowed", "nine", "hits", "and", "struck", "out", "eight", "without", "a", "walk", "." ], "ids": [ 15256, 14030, 11816, 10188, 169, 10150, 118, 11661, 15485, 37307, 10111, 11367, 10142, 10105, 46758, 10635, 10106, 19964, 13332, 10146, 144, 20498, 10589, 113, 10193, 118, 129, 114, 18162, 19964, 27922, 10111, 45622, 10950, 16222, 13663, 169, 33734, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "MO", "##ND", "##A", "##Y", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 102059, 58521, 10738, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5, 5 ] }, { "tokens": [ "Results", "of", "Major", "League", "Baseball", "games" ], "ids": [ 33036, 10108, 14988, 11074, 27084, 13332 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "played", "on", "Monday", "(", "home", "team", "in", "CA", "##PS", ")", ":" ], "ids": [ 11553, 10135, 40714, 113, 11816, 11121, 10106, 24707, 46983, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "American", "League" ], "ids": [ 10536, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "Cleveland", "2", "DE", "##T", "##RO", "##IT", "1" ], "ids": [ 21342, 123, 25067, 11090, 35066, 37611, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "12", "Oakland", "11", "(", "10", "innings", ")" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 10186, 38340, 10193, 113, 10150, 48974, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "5", "Minnesota", "3" ], "ids": [ 58573, 35066, 77261, 11403, 126, 16306, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Milwaukee", "3", "CH", "##IC", "##AG", "##O", "2" ], "ids": [ 36413, 124, 39774, 30889, 109865, 11403, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Boston", "4", "CA", "##L", "##IF", "##OR", "##NI", "##A", "1" ], "ids": [ 13683, 125, 24707, 11369, 53668, 42622, 52898, 10738, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "2", "New", "York", "1" ], "ids": [ 23056, 32071, 11090, 51036, 123, 10287, 10482, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "National", "League" ], "ids": [ 10655, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "1", "Philadelphia", "0" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 122, 15979, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "St", "Louis", "3", "H", "##O", "##US", "##TO", "##N", "2" ], "ids": [ 10838, 11334, 124, 145, 11403, 32612, 60493, 11537, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "9", "Cincinnati", "5" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 130, 31257, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "CH", "##AN", "##G", ",", "W", "##AS", "##HI", "##NG", "##TO", "##N", "AD", "##VA", "##NC", "##E", ",", "T", "##W", "##O", "W", "##OM", "##EN", "'", "S", "SE", "##ED", "##S", "FA", "##LL", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 39774, 41275, 11447, 117, 160, 38025, 108880, 34065, 60493, 11537, 22992, 47172, 100230, 11259, 117, 157, 13034, 11403, 160, 37079, 50655, 112, 156, 23056, 33809, 10731, 20794, 82834, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Larry", "Fine" ], "ids": [ 19629, 24846 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "26" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "Chang", "is", "playing", "in", "his", "10th", "U", ".", "S", ".", "Open", "and", "enjoy", "##ing", "his", "highest", "seed", "##ing", "ever", ",", "but", "the", "24", "-", "year", "-", "old", "American", "had", "to", "overcome", "a", "case", "of", "the", "ji", "##tter", "##s", "Monday", "before", "winning", "his", "first", "-", "round", "match", "on", "opening", "day", "." ], "ids": [ 10631, 28545, 10124, 14879, 10106, 10226, 31004, 158, 119, 156, 119, 11919, 10111, 84874, 10230, 10226, 18134, 49282, 10230, 17038, 117, 10473, 10105, 10233, 118, 10924, 118, 12898, 10536, 10374, 10114, 105445, 169, 13474, 10108, 10105, 18028, 18413, 10107, 40714, 11360, 16542, 10226, 10422, 118, 13569, 12356, 10135, 17975, 11940, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chang", ",", "seed", "##ed", "second", "behind", "defending", "champion", "Pete", "Sam", "##pra", "##s", ",", "took", "two", "hours", "40", "minutes", "to", "defeat", "186", "##th", "-", "ranked", "Jaime", "On", "##cin", "##s", "of", "Brazil", "3", "-", "6", "6", "-", "1", "6", "-", "0", "7", "-", "6", ",", "8", "-", "6", "in", "the", "tie", "##break", "##er", "." ], "ids": [ 28545, 117, 49282, 10336, 11132, 17155, 53730, 17689, 23107, 14268, 30631, 10107, 117, 12149, 10551, 19573, 10533, 15304, 10114, 24800, 23298, 11143, 118, 25250, 30454, 10576, 43093, 10107, 10108, 16765, 124, 118, 127, 127, 118, 122, 127, 118, 121, 128, 118, 127, 117, 129, 118, 127, 10106, 10105, 27916, 83065, 10165, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "was", "pretty", "tight", "the", "whole", "match", ",", "\"", "con", "##ceded", "Chang", ",", "one", "of", "the", "hot", "##test", "players", "on", "tour", "this", "summer", "with", "a", "16", "-", "2", "record", "on", "hard", "##court", "##s", "that", "included", "two", "titles", "and", "a", "runner", "-", "up", "finish", "." ], "ids": [ 107, 146, 10134, 108361, 85202, 10105, 21047, 12356, 117, 107, 10173, 75214, 28545, 117, 10464, 10108, 10105, 29698, 42615, 16021, 10135, 12842, 10531, 17995, 10169, 169, 10250, 118, 123, 12410, 10135, 19118, 40496, 10107, 10189, 12742, 10551, 26492, 10111, 169, 43037, 118, 10741, 26282, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Every", "##one", "has", "moments", "when", "they", "get", "tight", "." ], "ids": [ 107, 30929, 12926, 10393, 47641, 10841, 10689, 15329, 85202, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hope", "##fully", ",", "this", "will", "have", "been", "my", "nerve", "##s", "for", "the", "whole", "tournament", ".", "\"" ], "ids": [ 22091, 42920, 117, 10531, 11337, 10529, 10590, 15127, 95252, 10107, 10142, 10105, 21047, 17390, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jo", "##ining", "Chang", "into", "the", "second", "round", "was", "Wimbledon", "runner", "-", "up", "Mali", "##V", "##ai", "Washington", ",", "the", "11th", "seed", ",", "who", "also", "needed", "four", "sets", "to", "get", "past", "talent", "##ed", "Moro", "##cca", "##n", "Karim", "Alam", "##i", "6", "-", "4", "2", "-", "6", "7", "-", "6", "(", "7", "-", "5", ")", "6", "-", "1", "." ], "ids": [ 20977, 23025, 28545, 10708, 10105, 11132, 13569, 10134, 37932, 43037, 118, 10741, 24427, 11779, 11542, 11586, 117, 10105, 34062, 49282, 117, 10479, 10379, 23794, 11598, 23597, 10114, 15329, 17781, 27411, 10336, 66832, 20057, 10115, 71139, 51255, 10116, 127, 118, 125, 123, 118, 127, 128, 118, 127, 113, 128, 118, 126, 114, 127, 118, 122, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Washington", "'", "s", "win", "was", "not", "com", "##fortable", ",", "either", "." ], "ids": [ 11586, 112, 187, 14125, 10134, 10472, 10212, 81587, 117, 16106, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "27", "-", "year", "-", "old", "American", "hur", "##ried", "off", "the", "Stadium", "Court", "for", "treatment", "of", "an", "upset", "sto", "##mach", "after", "his", "two", "and", "a", "half", "hour", "struggle", "against", "Alam", "##i", "." ], "ids": [ 10117, 10365, 118, 10924, 118, 12898, 10536, 52824, 46714, 11898, 10105, 16632, 14100, 10142, 21379, 10108, 10151, 96213, 47264, 68388, 10662, 10226, 10551, 10111, 169, 13877, 24730, 48919, 11327, 51255, 10116, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "\"", "Towards", "the", "end", "of", "my", "match", "my", "sto", "##mach", "felt", "like", "week", "-", "old", "sus", "##hi", ",", "\"", "said", "Washington", ".", "\"" ], "ids": [ 107, 79491, 10105, 11572, 10108, 15127, 12356, 15127, 47264, 68388, 24666, 11850, 16118, 118, 12898, 10846, 11924, 117, 107, 12415, 11586, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Maybe", "it", "was", "a", "combination", "of", "the", "heat", "and", "something", "I", "at", "##e", ".", "\"" ], "ids": [ 107561, 10271, 10134, 169, 35103, 10108, 10105, 33955, 10111, 26133, 146, 10160, 10112, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chang", "and", "Washington", "were", "the", "only", "men", "'", "s", "seeds", "in", "action", "on", "a", "day", "that", "saw", "two", "seed", "##ed", "women", "'", "s", "players", "fall", "." ], "ids": [ 28545, 10111, 11586, 10309, 10105, 10893, 10588, 112, 187, 68488, 10106, 14204, 10135, 169, 11940, 10189, 17112, 10551, 49282, 10336, 13190, 112, 187, 16021, 18042, 119 ], "entity": [ "B-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australian", "Open", "runner", "-", "up", "An", "##ke", "Huber", "of", "Germany", ",", "the", "sixth", "seed", ",", "was", "und", "##one", "by", "an", "un", "##lu", "##cky", "draw", "that", "put", "her", "against", "17th", "ranked", "South", "African", "Amanda", "Co", "##etz", "##er", "in", "her", "opening", "match", "." ], "ids": [ 12829, 11919, 43037, 118, 10741, 10313, 10550, 46398, 10108, 12775, 117, 10105, 28913, 49282, 117, 10134, 10130, 12926, 10155, 10151, 10119, 11435, 30742, 25974, 10189, 14499, 10485, 11327, 32331, 25250, 11056, 13839, 30380, 13098, 75065, 10165, 10106, 10485, 17975, 12356, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Co", "##etz", "##er", "claimed", "revenge", "for", "the", "semifinal", "defeat", "she", "suffered", "to", "Huber", "in", "Melbourne", "by", "taking", "a", "6", "-", "1", "2", "-", "6", "6", "-", "2", "victory", "." ], "ids": [ 13098, 75065, 10165, 20737, 84932, 10142, 10105, 65085, 24800, 10833, 26090, 10114, 46398, 10106, 17784, 10155, 18084, 169, 127, 118, 122, 123, 118, 127, 127, 118, 123, 19735, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "year", "'", "s", "Wimbledon", "junior", "champion", ",", "Aleksandra", "Ol", "##sza", "of", "Poland", ",", "removed", "another", "seed", "from", "the", "draw", "by", "eli", "##minat", "##ing", "number", "12", "Magdalena", "Male", "##eva", "of", "Bulgaria", "6", "-", "4", "6", "-", "2", "." ], "ids": [ 14812, 10924, 112, 187, 37932, 21854, 17689, 117, 39537, 60160, 22555, 10108, 17879, 117, 23898, 12864, 49282, 10188, 10105, 25974, 10155, 18166, 104130, 10230, 11487, 10186, 27166, 36172, 18085, 10108, 21935, 127, 118, 125, 127, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Other", "men", "'", "s", "winners", "included", "a", "pair", "of", "former", "Grand", "Slam", "tournament", "champions", "whose", "victories", "set", "up", "a", "show", "##down", "in", "the", "second", "round", "." ], "ids": [ 14490, 10588, 112, 187, 33525, 12742, 169, 27643, 10108, 11775, 11319, 33445, 17390, 27745, 16879, 62664, 11847, 10741, 169, 11897, 27160, 10106, 10105, 11132, 13569, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Germany", "'", "s", "Michael", "St", "##ich", ",", "the", "1991", "Wimbledon", "champion", ",", "and", "two", "-", "time", "French", "Open", "winner", "Ser", "##gi", "Br", "##ugu", "##era", "of", "Spain", "will", "face", "each", "other", "next", "after", "beating", "German", "Tommy", "Haas", "6", "-", "3", "1", "-", "6", "6", "-", "1", "7", "-", "5", ",", "and", "Belgian", "Kris", "Go", "##ossen", "##s", "6", "-", "2", "6", "-", "0", "7", "-", "6", "(", "7", "-", "1", ")", ",", "respectively", "." ], "ids": [ 12775, 112, 187, 10631, 10838, 14401, 117, 10105, 10442, 37932, 17689, 117, 10111, 10551, 118, 10635, 11894, 11919, 20826, 39759, 11210, 38508, 47630, 12015, 10108, 16149, 11337, 13295, 11948, 10684, 13451, 10662, 58081, 12026, 20136, 54347, 127, 118, 124, 122, 118, 127, 127, 118, 122, 128, 118, 126, 117, 10111, 36652, 69041, 14439, 65614, 10107, 127, 118, 123, 127, 118, 121, 128, 118, 127, 113, 128, 118, 122, 114, 117, 25179, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 6, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alex", "O", "'", "Brien", ",", "who", "scored", "his", "first", "professional", "title", "eight", "days", "ago", "in", "New", "Haven", ",", "advanced", "to", "the", "second", "round", "with", "a", "6", "-", "4", "1", "-", "6", "6", "-", "4", "6", "-", "3", "win", "over", "Ecuador", "'", "s", "Nicolas", "La", "##pent", "##ti", "." ], "ids": [ 14728, 152, 112, 33629, 117, 10479, 17233, 10226, 10422, 14054, 12887, 16222, 13990, 36390, 10106, 10287, 31842, 117, 27072, 10114, 10105, 11132, 13569, 10169, 169, 127, 118, 125, 122, 118, 127, 127, 118, 125, 127, 118, 124, 14125, 10491, 20475, 112, 187, 16443, 10159, 55939, 10325, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Wimbledon", "bad", "boy", "Jeff", "Tara", "##ngo", "caught", "a", "break", "Monday", "when", "he", "advanced", "after", "the", "retirement", "of", "German", "Alex", "Radu", "##les", "##cu", "due", "to", "heat", "ex", "##haus", "##tion", "." ], "ids": [ 37932, 15838, 26905, 17218, 51806, 32448, 39797, 169, 24194, 40714, 10841, 10261, 27072, 10662, 10105, 32185, 10108, 12026, 14728, 75583, 11268, 12352, 10850, 10114, 33955, 11419, 14465, 10822, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tara", "##ngo", "was", "leading", "6", "-", "7", "(", "5", "-", "7", ")", "6", "-", "4", "6", "-", "1", "3", "-", "1", "." ], "ids": [ 51806, 32448, 10134, 16018, 127, 118, 128, 113, 126, 118, 128, 114, 127, 118, 125, 127, 118, 122, 124, 118, 122, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chang", "bl", "##amed", "br", "##ee", "##zy", "conditions", "for", "some", "of", "the", "er", "##rati", "##c", "play", "in", "his", "match", "with", "On", "##cin", "##s", ",", "who", "had", "beaten", "him", "in", "the", "round", "of", "32", "at", "the", "1992", "Barcelona", "Olympics", "." ], "ids": [ 28545, 21484, 83865, 33989, 13321, 12547, 17315, 10142, 11152, 10108, 10105, 10163, 22425, 10350, 12253, 10106, 10226, 12356, 10169, 10576, 43093, 10107, 117, 10479, 10374, 74075, 10957, 10106, 10105, 13569, 10108, 10842, 10160, 10105, 10450, 12113, 19185, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "B-MISC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 2, 9 ] }, { "tokens": [ "Chang", "committed", "an", "un", "##tid", "##y", "53", "un", "##forced", "errors", ",", "though", "he", "made", "seven", "fewer", "than", "the", "Brazilian", ",", "who", "also", "wall", "##ope", "##d", "a", "wo", "##ef", "##ul", "24", "double", "fault", "##s", "." ], "ids": [ 28545, 38184, 10151, 10119, 30991, 10157, 11756, 10119, 69794, 76269, 117, 15102, 10261, 11019, 15767, 74139, 11084, 10105, 32818, 117, 10479, 10379, 26699, 38978, 10162, 169, 12796, 16822, 10604, 10233, 15790, 110640, 10107, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "most", "def", "##lating", "double", "fault", "came", "when", "On", "##cin", "##s", "was", "serving", "to", "force", "a", "fifth", "set", ",", "leading", "6", "-", "4", "in", "the", "tie", "##break", "##er", "." ], "ids": [ 10117, 10992, 100745, 80527, 15790, 110640, 13383, 10841, 10576, 43093, 10107, 10134, 20252, 10114, 15031, 169, 22237, 11847, 117, 16018, 127, 118, 125, 10106, 10105, 27916, 83065, 10165, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "set", "point", "came", "after", "confusion", "at", "the", "net", "on", "the", "point", "previous", ",", "which", "was", "awarded", "to", "On", "##cin", "##s", "after", "the", "two", "exchange", "##d", "shots", "at", "close", "quarters", "at", "the", "net", "." ], "ids": [ 10117, 11847, 12331, 13383, 10662, 61318, 10160, 10105, 11988, 10135, 10105, 12331, 16741, 117, 10319, 10134, 16150, 10114, 10576, 43093, 10107, 10662, 10105, 10551, 27714, 10162, 74437, 10160, 16065, 79322, 10160, 10105, 11988, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "Chang", "approached", "the", "um", "##pire", ",", "then", "On", "##cin", "##s", ",", "then", "Chang", "again", "before", "play", "finally", "resumed", "." ], "ids": [ 12128, 28545, 63548, 10105, 10293, 72079, 117, 11059, 10576, 43093, 10107, 117, 11059, 28545, 13123, 11360, 12253, 21256, 68655, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Those", "little", "seconds", "were", "like", "an", "hour", "to", "me", ",", "\"", "said", "On", "##cin", "##s", ",", "who", "pro", "##mpt", "##ly", "fired", "two", "serves", "bare", "##ly", "contained", "by", "the", "base", "##line", "as", "he", "fri", "##tter", "##ed", "away", "his", "best", "chance", "." ], "ids": [ 107, 43027, 16745, 34290, 10309, 11850, 10151, 24730, 10114, 10911, 117, 107, 12415, 10576, 43093, 10107, 117, 10479, 11284, 109361, 10454, 38903, 10551, 24474, 21766, 10454, 31763, 10155, 10105, 11404, 12953, 10146, 10261, 35350, 18413, 10336, 14942, 10226, 12504, 27893, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chang", "ran", "off", "the", "next", "three", "points", "to", "close", "out", "the", "match", "but", "for", "On", "##cin", "##s", ",", "the", "contest", "was", "a", "personal", "victory", "." ], "ids": [ 28545, 17044, 11898, 10105, 13451, 11003, 12789, 10114, 16065, 10950, 10105, 12356, 10473, 10142, 10576, 43093, 10107, 117, 10105, 37596, 10134, 169, 14927, 19735, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "26", "-", "year", "-", "old", "Brazilian", "had", "rise", "##n", "into", "the", "top", "30", "in", "1992", "." ], "ids": [ 10117, 10314, 118, 10924, 118, 12898, 32818, 10374, 28710, 10115, 10708, 10105, 12364, 10244, 10106, 10450, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "next", "year", "a", "close", "friend", "was", "struck", "by", "a", "str", "##ay", "bu", "##llet", "while", "riding", "home", "in", "a", "car", "from", "a", "soccer", "game", "in", "Sao", "Paulo", "." ], "ids": [ 10117, 13451, 10924, 169, 16065, 20104, 10134, 45622, 10155, 169, 17791, 13998, 11499, 47803, 11371, 56629, 11816, 10106, 169, 13000, 10188, 169, 41356, 11661, 10106, 51645, 13360, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "He", "died", "sl", "##ump", "##ed", "against", "On", "##cin", "##s", ",", "who", "subsequently", "lost", "interest", "in", "tennis", "." ], "ids": [ 10357, 12482, 38523, 67299, 10336, 11327, 10576, 43093, 10107, 117, 10479, 20961, 14172, 17644, 10106, 20944, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Two", "months", "ago", "I", "started", "talking", "about", "quit", "##ting", ",", "\"", "said", "On", "##cin", "##s", ",", "who", "decided", "to", "give", "it", "one", "last", "try", "and", "made", "it", "through", "the", "Open", "qualifying", "tournament", "last", "weekend", "." ], "ids": [ 107, 13214, 15555, 36390, 146, 13457, 78254, 10978, 101237, 12141, 117, 107, 12415, 10576, 43093, 10107, 117, 10479, 17270, 10114, 18090, 10271, 10464, 12469, 31638, 10111, 11019, 10271, 11222, 10105, 11919, 43631, 17390, 12469, 43440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "believe", "in", "my", "game", "again", ",", "\"", "he", "said", "." ], "ids": [ 107, 146, 30587, 10106, 15127, 11661, 13123, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "the", "end", "of", "the", "day", ",", "a", "sp", "##ate", "of", "withdrawal", "##s", "from", "the", "tournament", "were", "announced", "." ], "ids": [ 11699, 10105, 11572, 10108, 10105, 11940, 117, 169, 32650, 12436, 10108, 94192, 10107, 10188, 10105, 17390, 10309, 13854, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eight", "##h", "seed", "Jim", "Cour", "##ier", "withdrew", "because", "of", "a", "br", "##uise", "##d", "right", "knee", ",", "and", "1988", "Open", "champion", "Mats", "Wi", "##lander", "bow", "##ed", "out", "due", "to", "a", "gr", "##oin", "pull", ",", "organiser", "##s", "said", "." ], "ids": [ 43788, 10237, 49282, 14178, 44347, 11709, 56226, 12373, 10108, 169, 33989, 100976, 10162, 13448, 75217, 117, 10111, 10548, 11919, 17689, 86768, 52742, 73795, 98073, 10336, 10950, 10850, 10114, 169, 30518, 64512, 80870, 117, 93446, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "ninth", "seed", "Mary", "Joe", "Fernandez", "pulled", "out", "because", "of", "tend", "##ini", "##tis", "in", "her", "right", "w", "##rist", "." ], "ids": [ 13536, 112, 187, 54905, 49282, 12176, 13062, 71566, 65884, 10950, 12373, 10108, 45415, 11778, 13434, 10106, 10485, 13448, 191, 24953, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "27" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "a", "French", "first", "division", "soccer", "match", "on", "Tuesday", ":" ], "ids": [ 42027, 10108, 169, 11894, 10422, 13751, 41356, 12356, 10135, 70245, 131 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Auxerre", "0", "Marseille", "0", "." ], "ids": [ 86186, 121, 25016, 121, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 9, 3, 9, 9 ] }, { "tokens": [ "Attendance", ":", "20", ",", "000" ], "ids": [ 46080, 131, 10197, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "MA", "##RS", "##E", "##IL", "##LE", "H", "##OL", "##D", "AU", "##X", "##ER", "##RE", "TO", "GO", "##AL", "##LE", "##SS", "DR", "##A", "##W", "." ], "ids": [ 71020, 65622, 24093, 118, 27277, 39469, 11259, 38850, 51036, 145, 39272, 11490, 29088, 12674, 24093, 66014, 58573, 41525, 32002, 51036, 49248, 45457, 10738, 13034, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "27" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "European", "champions", "Marseille", "held", "French", "champions", "Auxerre", "to", "a", "goal", "##less", "draw", "in", "a", "lack", "##lust", "##re", "league", "match", "on", "Tuesday", "." ], "ids": [ 42355, 11914, 27745, 25016, 11991, 11894, 27745, 86186, 10114, 169, 16586, 14985, 25974, 10106, 169, 23582, 75358, 10246, 15616, 12356, 10135, 70245, 119 ], "entity": [ "O", "B-MISC", "O", "B-ORG", "O", "B-MISC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 3, 9, 2, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "bill", "looked", "pro", "##mising", "but", "both", "sides", ",", "str", "##uggling", "to", "find", "their", "form", "early", "in", "the", "season", ",", "were", "disa", "##ppo", "##inti", "##ng", "." ], "ids": [ 10117, 34497, 59822, 11284, 81654, 10473, 11408, 27263, 117, 17791, 85808, 10114, 17860, 10455, 12188, 11732, 10106, 10105, 11226, 117, 10309, 36474, 45565, 49886, 10376, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Auxerre", ",", "who", "start", "their", "European", "Cup", "campaign", "next", "week", "against", "Ajax", "Amsterdam", ",", "dominated", "the", "match", "but", "were", "unable", "to", "score", "." ], "ids": [ 86186, 117, 10479, 15148, 10455, 11914, 11544, 17323, 13451, 16118, 11327, 37057, 14017, 117, 49365, 10105, 12356, 10473, 10309, 30553, 10114, 17704, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Un", "##beat", "##en", "in", "four", "matches", ",", "they", "still", "trail", "leaders", "Lens", "by", "one", "point", "." ], "ids": [ 11038, 68939, 10136, 10106, 11598, 18258, 117, 10689, 12647, 56559, 24155, 72008, 10155, 10464, 12331, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Lens", ",", "who", "have", "won", "all", "their", "three", "league", "matches", "so", "far", ",", "host", "Montpellier", "on", "Wednesday", "night", "." ], "ids": [ 72008, 117, 10479, 10529, 11367, 10435, 10455, 11003, 15616, 18258, 10380, 13301, 117, 19317, 38069, 10135, 57611, 16903, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Despite", "another", "dis", "##mal", "performance", ",", "especially", "in", "defence", ",", "Marseille", "restored", "some", "pride", "by", "keeping", "the", "reign", "##ing", "champions", "at", "bay", "after", "losing", "2", "-", "1", "at", "home", "to", "Metz", "last", "Saturday", "." ], "ids": [ 21230, 12864, 27920, 16120, 14432, 117, 17491, 10106, 47245, 117, 25016, 39256, 11152, 74837, 10155, 51318, 10105, 38587, 10230, 27745, 10160, 16184, 10662, 27817, 123, 118, 122, 10160, 11816, 10114, 32434, 12469, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "After", "two", "seasons", "in", "the", "second", "division", "and", "after", "taking", "on", "half", "a", "dozen", "new", "re", "##c", "##ruit", "##s", "this", "season", ",", "some", "of", "whom", "do", "not", "speak", "a", "word", "of", "French", ",", "Marseille", "are", "not", "playing", "with", "any", "fluid", "##ity", "." ], "ids": [ 11301, 10551, 21396, 10106, 10105, 11132, 13751, 10111, 10662, 18084, 10135, 13877, 169, 84956, 10751, 11639, 10350, 91788, 10107, 10531, 11226, 117, 11152, 10108, 18104, 10149, 10472, 41541, 169, 12307, 10108, 11894, 117, 25016, 10301, 10472, 14879, 10169, 11178, 59848, 11949, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "German", "international", "goalkeeper", "Andreas", "Ko", "##ep", "##ke", "again", "proved", "a", "sound", "investment", "when", "under", "pressure", "from", "the", "Auxerre", "striker", "##s", ",", "saving", "his", "team", "with", "a", "number", "of", "fine", "par", "##ries", "." ], "ids": [ 16976, 12026, 12533, 84159, 17336, 30186, 19986, 10550, 13123, 33213, 169, 19302, 37933, 10841, 10571, 23460, 10188, 10105, 86186, 103325, 10107, 117, 90682, 10226, 11121, 10169, 169, 11487, 10108, 13435, 10248, 15388, 119 ], "entity": [ "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Marseille", "now", "lie", "seventh", "in", "the", "league", "on", "five", "points", "." ], "ids": [ 25016, 11858, 56147, 37192, 10106, 10105, 15616, 10135, 12403, 12789, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##T", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "27" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "French", "first", "division" ], "ids": [ 32070, 16203, 10108, 169, 11894, 10422, 13751 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "match", "played", "on", "Tuesday", ":" ], "ids": [ 41356, 12356, 11553, 10135, 70245, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Auxerre", "0", "Marseille", "0" ], "ids": [ 86186, 121, 25016, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##IE", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 71655, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##mmar", "##ies", "of", "Bundesliga", "matches" ], "ids": [ 12271, 100620, 11624, 10108, 21436, 18258 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "played", "on", "Tuesday", ":" ], "ids": [ 11553, 10135, 70245, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Dortmund", "3", "(", "R", "##ied", "##le", "8th", "minute", ",", "Heinrich", "29", "##th", "," ], "ids": [ 48007, 33962, 124, 113, 155, 24140, 10284, 32074, 21760, 117, 13373, 10386, 11143, 117 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "Tre", "##tsch", "##ok", "77", "##th", ")", "Freiburg", "1", "(", "Dec", "##hei", "##ver", "51", "##st", "penalty", ")", "." ], "ids": [ 30932, 41290, 11140, 12527, 11143, 114, 29283, 122, 113, 46147, 89508, 12563, 11524, 10562, 40924, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time" ], "ids": [ 33100, 18086 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "2", "-", "0", "." ], "ids": [ 123, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "48", ",", "800", "." ], "ids": [ 46080, 11300, 117, 11900, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hamburg", "0", "VfB", "Stuttgart", "4", "(", "Bala", "##kov", "29", "##th", ",", "Bob", "##ic", "47", "##th", "and", "60", "##th", "," ], "ids": [ 15021, 121, 76227, 16048, 125, 113, 101370, 16433, 10386, 11143, 117, 13583, 11130, 11413, 11143, 10111, 10709, 11143, 117 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ha", "##gner", "85", "##th", ")", "." ], "ids": [ 13740, 31272, 12017, 11143, 114, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "1", "." ], "ids": [ 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "31", ",", "139", "." ], "ids": [ 10413, 117, 19615, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Werder", "Bremen", "1", "(", "Schulz", "31", "##st", ")", "Borussia", "Moe", "##nche", "##ng", "##lad", "##bach", "0", "." ], "ids": [ 89919, 21360, 122, 113, 57033, 10413, 10562, 114, 48007, 80790, 49457, 10376, 19505, 14135, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "24", ",", "800", "." ], "ids": [ 10233, 117, 11900, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Schalke", "1", "(", "Th", "##on", "2nd", ")", "Bochum", "1", "(", "Don", "##kow", "86", "##th", ")", "." ], "ids": [ 87909, 122, 113, 51635, 10263, 14105, 114, 63359, 122, 113, 11740, 72275, 12224, 11143, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "33", ",", "230", "." ], "ids": [ 11000, 117, 16888, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Bundesliga", "matches" ], "ids": [ 33036, 10108, 21436, 18258 ], "entity": [ "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 2, 9 ] }, { "tokens": [ "played", "on", "Tuesday", ":" ], "ids": [ 11553, 10135, 70245, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Dortmund", "3", "Freiburg", "1" ], "ids": [ 48007, 33962, 124, 29283, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Hamburg", "0", "VfB", "Stuttgart", "4" ], "ids": [ 15021, 121, 76227, 16048, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Werder", "Bremen", "1", "Borussia", "Moe", "##nche", "##ng", "##lad", "##bach", "0" ], "ids": [ 89919, 21360, 122, 48007, 80790, 49457, 10376, 19505, 14135, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Schalke", "1", "Bochum", "1" ], "ids": [ 87909, 122, 63359, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Bundesliga", "standing", "##s", "after", "Tuesday", "'", "s", "games", "(", "tab", "##ulate", "under" ], "ids": [ 21436, 32173, 10107, 10662, 70245, 112, 187, 13332, 113, 100781, 70863, 10571 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals", "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VfB", "Stuttgart", "3", "3", "0", "0", "10", "1", "9" ], "ids": [ 76227, 16048, 124, 124, 121, 121, 10150, 122, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Dortmund", "4", "3", "0", "1", "12", "6", "9" ], "ids": [ 48007, 33962, 125, 124, 121, 122, 10186, 127, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cologne", "3", "3", "0", "0", "7", "1", "9" ], "ids": [ 52577, 124, 124, 121, 121, 128, 122, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayern", "Munich", "3", "2", "1", "0", "7", "2", "7" ], "ids": [ 17200, 27349, 124, 123, 122, 121, 128, 123, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayer", "Leverkusen", "3", "2", "0", "1", "7", "4", "6" ], "ids": [ 42806, 84961, 124, 123, 121, 122, 128, 125, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VfL", "Bochum", "4", "1", "3", "0", "4", "3", "6" ], "ids": [ 77307, 63359, 125, 122, 124, 121, 125, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hamburg", "4", "2", "0", "2", "7", "7", "6" ], "ids": [ 15021, 125, 123, 121, 123, 128, 128, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karlsruhe", "2", "1", "1", "0", "5", "3", "4" ], "ids": [ 36954, 123, 122, 122, 121, 126, 124, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "3", "1", "1", "1", "7", "7", "4" ], "ids": [ 10838, 54583, 124, 122, 122, 122, 128, 128, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Werder", "Bremen", "4", "1", "1", "2", "5", "6", "4" ], "ids": [ 89919, 21360, 125, 122, 122, 123, 126, 127, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1860", "Munich", "3", "1", "0", "2", "3", "5", "3" ], "ids": [ 13336, 27349, 124, 122, 121, 123, 124, 126, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Schalke", "4", "0", "3", "1", "5", "9", "3" ], "ids": [ 87909, 125, 121, 124, 122, 126, 130, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Due", "##ssel", "##dorf", "3", "1", "0", "2", "1", "7", "3" ], "ids": [ 59890, 20896, 49235, 16631, 124, 122, 121, 123, 122, 128, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Freiburg", "4", "1", "0", "3", "6", "13", "3" ], "ids": [ 29283, 125, 122, 121, 124, 127, 10249, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hansa", "Rostock", "3", "0", "2", "1", "3", "4", "2" ], "ids": [ 77740, 47090, 124, 121, 123, 122, 124, 125, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Armin", "##ia", "Bielefeld", "3", "0", "2", "1", "2", "3", "2" ], "ids": [ 78283, 10280, 67943, 124, 121, 123, 122, 123, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Moe", "##nche", "##ng", "##lad", "##bach", "4", "0", "2", "2", "1", "4", "2" ], "ids": [ 48007, 80790, 49457, 10376, 19505, 14135, 125, 121, 123, 123, 122, 125, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MS", "##V", "Duisburg", "3", "0", "0", "3", "1", "8", "0" ], "ids": [ 21018, 11779, 65064, 124, 121, 121, 124, 122, 129, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "27" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "first", "division", "summary", "on" ], "ids": [ 17693, 10422, 13751, 70585, 10135 ], "entity": [ "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9 ] }, { "tokens": [ "Tuesday", ":" ], "ids": [ 70245, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Fortuna", "Sitt", "##ard", "2", "(", "Jeffrey", "7", ",", "R", "##oes", "##t", "33", ")", "Heer", "##en", "##veen", "4", "(", "Korn", "##ee", "##v" ], "ids": [ 59890, 105987, 13167, 123, 113, 29323, 128, 117, 155, 47125, 10123, 11000, 114, 49764, 10136, 53467, 125, 113, 96287, 13321, 10477 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 9, 9, 4, 8, 8, 9, 9, 3, 7, 7, 9, 9, 4, 8, 8 ] }, { "tokens": [ "15", ",", "Hans", "##ma", "24", ",", "Wo", "##uden", "70", ",", "90", ")", "." ], "ids": [ 10208, 117, 11768, 10369, 10233, 117, 102204, 23280, 10923, 117, 10919, 114, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "2", "-", "2", "." ], "ids": [ 33100, 18086, 123, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##T", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 11090, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "27" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "Dutch", "first" ], "ids": [ 32070, 16203, 10108, 169, 17693, 10422 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "match", "played", "on", "Tuesday", ":" ], "ids": [ 13751, 41356, 12356, 11553, 10135, 70245, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Sitt", "##ard", "2", "Heer", "##en", "##veen", "4" ], "ids": [ 59890, 105987, 13167, 123, 49764, 10136, 53467, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "ICE", "H", "##OCK", "##E", "##Y", "-", "F", "##IN", "##LA", "##ND", "BE", "##AT", "C", "##Z", "##EC", "##H", "RE", "##P", "##UB", "##L", "##IC", "IN", "WORLD", "C", "##UP", "MA", "##TC", "##H", "." ], "ids": [ 87822, 145, 96608, 11259, 14703, 118, 143, 27128, 44376, 58521, 46291, 32071, 140, 13966, 35826, 12396, 71033, 11127, 82439, 11369, 30889, 36351, 67376, 140, 57487, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 5, 5, 5, 5, 5, 5, 5, 5, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##EL", "##SI", "##NK", "##I", "1996", "-", "08", "-", "27" ], "ids": [ 145, 68999, 44802, 78043, 11281, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finland", "beat", "the", "Czech", "Republic" ], "ids": [ 15497, 27868, 10105, 22148, 13681 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "I-LOC" ], "entity_ids": [ 1, 9, 9, 1, 5 ] }, { "tokens": [ "7", "-", "3", "(", "period", "scores", "4", "-", "1", "1", "-", "1", "2", "-", "1", ")", "in", "their", "ice", "hockey", "World", "Cup", "," ], "ids": [ 128, 118, 124, 113, 13127, 49931, 125, 118, 122, 122, 118, 122, 123, 118, 122, 114, 10106, 10455, 24642, 21044, 10315, 11544, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "European", "group", "match", "on", "Tuesday", "." ], "ids": [ 11914, 11795, 12356, 10135, 70245, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Finland", "-", "Ville", "Pel", "##tone", "##n", "(", "10th", "minute", ")", ",", "Juha", "Y", "##lone", "##n", "(", "10th", ")", "," ], "ids": [ 15497, 118, 24772, 75056, 20124, 10115, 113, 31004, 21760, 114, 117, 99441, 162, 32840, 10115, 113, 31004, 114, 117 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Tee", "##mu", "Se", "##lan", "##ne", "(", "11th", ")", ",", "J", "##yr", "##ki", "Lu", "##mme", "(", "13th", "and", "51", "##st", ")", ",", "Janne", "O", "##jan", "##en" ], "ids": [ 97287, 11717, 11045, 12055, 10238, 113, 34062, 114, 117, 147, 20728, 10506, 23859, 21209, 113, 33937, 10111, 11524, 10562, 114, 117, 94312, 152, 14376, 10136 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "23", "##rd", ")", ",", "Christian", "R", "##uut", "##tu", "(", "45", "##th", ")" ], "ids": [ 113, 10328, 12023, 114, 117, 11757, 155, 61645, 10991, 113, 10827, 11143, 114 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Czech", "Republic", "-", "Rad", "##ek", "Bon", "##k", "(", "7th", ")", ",", "Robert", "Reich", "##el", "(", "33", "##rd", "," ], "ids": [ 22148, 13681, 118, 71204, 10707, 30120, 10174, 113, 15582, 114, 117, 10820, 19396, 10570, 113, 11000, 12023, 117 ], "entity": [ "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "penalty", ")", ",", "Ji", "##ri", "Do", "##pita", "(", "57", "##th", ")" ], "ids": [ 40924, 114, 117, 30822, 10401, 11791, 55207, 113, 11817, 11143, 114 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sweden", "1", "1", "0", "0", "6", "1", "2" ], "ids": [ 20937, 122, 122, 121, 121, 127, 122, 123 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finland", "1", "1", "0", "0", "7", "3", "2" ], "ids": [ 15497, 122, 122, 121, 121, 128, 124, 123 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Czech", "Republic", "1", "0", "0", "1", "3", "7", "0" ], "ids": [ 22148, 13681, 122, 121, 121, 122, 124, 128, 121 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Germany", "1", "0", "0", "1", "1", "6", "0" ], "ids": [ 12775, 122, 121, 121, 122, 122, 127, 121 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "NE", "##UC", "##HA", "##TE", "##L", "TO", "AP", "##P", "##EA", "##L", "AG", "##A", "##IN", "##ST", "C", "##YP", "##RI", "##EN", "'", "S", "N", "##INE", "-", "MO", "##NT", "##H", "BA", "##N", "." ], "ids": [ 71020, 65622, 24093, 118, 86607, 93089, 58132, 29833, 11369, 58573, 30909, 11127, 36789, 11369, 17935, 10738, 27128, 32995, 140, 98904, 46876, 50655, 112, 156, 151, 83198, 118, 102059, 77261, 12396, 39999, 11537, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GE", "##NE", "##VA", "1996", "-", "08", "-", "27" ], "ids": [ 62997, 93280, 47172, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "league", "leaders", "Neu", "##chat", "##el", "X", "##ama", "##x", "said", "on", "Tuesday", "they", "would", "appeal", "against", "a", "nine", "-", "month", "ban", "imposed", "on", "French", "international", "defender", "Jean", "-", "Pierre", "C", "##y", "##pri", "##en", "for", "his", "part", "in", "a", "post", "-", "match", "bra", "##wl", "." ], "ids": [ 22984, 15616, 24155, 46437, 73267, 10570, 161, 15149, 10686, 12415, 10135, 70245, 10689, 10894, 44861, 11327, 169, 19964, 118, 14064, 11915, 83358, 10135, 11894, 12533, 36426, 10766, 118, 11609, 140, 10157, 101319, 10136, 10142, 10226, 10668, 10106, 169, 11841, 118, 12356, 67603, 37676, 119 ], "entity": [ "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##y", "##pri", "##en", ",", "also", "fine", "##d", "10", ",", "000", "Swiss", "francs", "(", "$", "8", ",", "400", ")", ",", "traded", "pun", "##ches", "with", "St", "Gallen", "'", "s", "Brazilian", "player", "Claudio", "Mo", "##ura", "after", "a", "match", "on", "Saturday", "." ], "ids": [ 140, 10157, 101319, 10136, 117, 10379, 13435, 10162, 10150, 117, 10259, 22984, 49303, 113, 109, 129, 117, 11176, 114, 117, 52696, 32310, 16272, 10169, 10838, 62472, 112, 187, 32818, 12928, 26400, 34987, 11465, 10662, 169, 12356, 10135, 24848, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "officials", "and", "coaching", "staff", "tried", "to", "inter", "##vene", ",", "C", "##y", "##pri", "##en", "launched", "a", "flying", "kick", "at", "Mo", "##ura", ",", "but", "only", "succeeded", "in", "knee", "##ing", "St", "Gallen", "coach", "Roger", "He", "##gi", "in", "the", "sto", "##mach", "." ], "ids": [ 12242, 27730, 10111, 57714, 18927, 27156, 10114, 22021, 61190, 117, 140, 10157, 101319, 10136, 18850, 169, 34676, 55321, 10160, 34987, 11465, 117, 10473, 10893, 28126, 10106, 75217, 10230, 10838, 62472, 15701, 13513, 10357, 11210, 10106, 10105, 47264, 68388, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mo", "##ura", ",", "who", "appeared", "to", "have", "el", "##bow", "##ed", "C", "##y", "##pri", "##en", "in", "the", "final", "minutes", "of", "the", "3", "-", "0", "win", "by", "Neu", "##chat", "##el", ",", "was", "suspended", "for", "seven", "matches", "and", "fine", "##d", "1", ",", "000", "francs", "(", "$", "840", ")", "by", "the", "Swiss", "league", "disciplina", "##ry", "committee", "." ], "ids": [ 34987, 11465, 117, 10479, 14565, 10114, 10529, 10125, 63081, 10336, 140, 10157, 101319, 10136, 10106, 10105, 11070, 15304, 10108, 10105, 124, 118, 121, 14125, 10155, 46437, 73267, 10570, 117, 10134, 49799, 10142, 15767, 18258, 10111, 13435, 10162, 122, 117, 10259, 49303, 113, 109, 42935, 114, 10155, 10105, 22984, 15616, 40104, 10908, 27634, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Club", "president", "Gilbert", "Fa", "##cchi", "##nett", "##i", "said", "he", "was", "as", "##toni", "##shed", "the", "committee", "had", "arrived", "at", "its", "decision", "so", "quickly", "and", "vo", "##wed", "the", "club", "would", "appeal", "." ], "ids": [ 11316, 12931, 18608, 44271, 24555, 80710, 10116, 12415, 10261, 10134, 10146, 54193, 42253, 10105, 27634, 10374, 22584, 10160, 10474, 19231, 10380, 23590, 10111, 12556, 48854, 10105, 11111, 10894, 44861, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Neu", "##chat", "##el", "coach", "Gilbert", "G", "##ress", "described", "the", "incident", "as", "\"", "shock", "##ing", "\"", ",", "but", "said", "Mo", "##ura", "was", "also", "to", "bl", "##ame", "." ], "ids": [ 46437, 73267, 10570, 15701, 18608, 144, 30743, 13010, 10105, 28005, 10146, 107, 62868, 10230, 107, 117, 10473, 12415, 34987, 11465, 10134, 10379, 10114, 21484, 18969, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Mo", "##ura", "physically", "and", "verbal", "##ly", "pro", "##vo", "##ked", "C", "##y", "##pri", "##en", "during", "the", "match", "." ], "ids": [ 107, 34987, 11465, 94274, 10111, 70850, 10454, 11284, 11244, 30511, 140, 10157, 101319, 10136, 10939, 10105, 12356, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "The", "referee", "could", "not", "have", "seen", "it", "or", "he", "would", "have", "pun", "##ished", "him", ",", "\"", "G", "##ress", "said", "." ], "ids": [ 10117, 102479, 12174, 10472, 10529, 15652, 10271, 10345, 10261, 10894, 10529, 32310, 54438, 10957, 117, 107, 144, 30743, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "During", "the", "s", "##cu", "##ffle", ",", "Mo", "##ura", "threw", "the", "first", "pun", "##ch", "." ], "ids": [ 107, 12550, 10105, 187, 12352, 66267, 117, 34987, 11465, 80516, 10105, 10422, 32310, 10269, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tomorrow", ",", "if", "someone", "pun", "##ches", "me", ",", "I", "would", "not", "know", "how", "to", "re", "##act", ".", "\"" ], "ids": [ 37670, 117, 12277, 30455, 32310, 16272, 10911, 117, 146, 10894, 10472, 21852, 14796, 10114, 11639, 98974, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##y", "##pri", "##en", ",", "who", "won", "his", "one", "French", "cap", "against", "Italy", "in", "February", "1994", ",", "cannot", "play", "in", "Switzerland", "or", "elsewhere", "until", "May", "next", "year", "." ], "ids": [ 140, 10157, 101319, 10136, 117, 10479, 11367, 10226, 10464, 11894, 13337, 11327, 11619, 10106, 11508, 10444, 117, 25259, 12253, 10106, 26002, 10345, 60249, 11444, 10725, 13451, 10924, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "B", "##U", "##G", "##NO", "CL", "##EA", "##RE", "##D", "OF", "DO", "##P", "##ING", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 139, 12022, 11447, 67292, 75151, 36789, 66014, 11490, 23240, 99843, 11127, 50183, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##LA", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 75416, 44376, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ve", "##teran", "Italian", "Gianni", "Bug", "##no", "has", "been", "cleared", "of", "do", "##ping", "after", "testing", "positive", "for", "high", "levels", "of", "testo", "##ster", "##one", "during", "the", "Tour", "of", "Switzerland", "in", "June", ",", "the", "Italian", "c", "##ycling", "fede", "##ration", "said", "on", "Tuesday", "." ], "ids": [ 19561, 81057, 11667, 43750, 80272, 10343, 10393, 10590, 90076, 10108, 10149, 15398, 10662, 38306, 19737, 10142, 11846, 21559, 10108, 29346, 12765, 12926, 10939, 10105, 11595, 10108, 26002, 10106, 11120, 117, 10105, 11667, 171, 87497, 83482, 19466, 12415, 10135, 70245, 119 ], "entity": [ "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "has", "been", "cleared", "." ], "ids": [ 107, 10357, 10393, 10590, 90076, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "case", "is", "closed", ",", "\"", "a", "spoke", "##sman", "said", "." ], "ids": [ 10117, 13474, 10124, 18440, 117, 107, 169, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bug", "##no", "tested", "positive", "for", "the", "banned", "hormone", "after", "the", "fifth", "stage", "of", "the", "Tour", ",", "in", "which", "he", "finished", "third", "overall", "." ], "ids": [ 80272, 10343, 65984, 19737, 10142, 10105, 58587, 105377, 10662, 10105, 22237, 15365, 10108, 10105, 11595, 117, 10106, 10319, 10261, 15972, 12628, 20947, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "spoke", "##sman", "said", "subsequent", "tests", "in", "Cologne", "proved", "his", "body", "produced", "higher", "-", "than", "-", "average", "testo", "##ster", "##one", "levels", "naturally", "." ], "ids": [ 16976, 10105, 50005, 24305, 12415, 30335, 34926, 10106, 52577, 33213, 10226, 14333, 13433, 17981, 118, 11084, 118, 13551, 29346, 12765, 12926, 21559, 91799, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bug", "##no", ",", "who", "won", "the", "Giro", "d", "'", "Italia", "in", "1990", "and", "two", "successive", "world", "titles", ",", "was", "banned", "for", "three", "months", "in", "1994", "after", "testing", "positive", "for", "the", "st", "##imu", "##lant", "ca", "##ffe", "##ine", "." ], "ids": [ 80272, 10343, 117, 10479, 11367, 10105, 27962, 172, 112, 11555, 10106, 10420, 10111, 10551, 47525, 11356, 26492, 117, 10134, 58587, 10142, 11003, 15555, 10106, 10444, 10662, 38306, 19737, 10142, 10105, 28780, 43197, 29329, 11135, 27008, 11088, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "CO", "##L", "##ON", "##NA", "W", "##IN", "##S", "F", "##IR", "##ST", "ST", "##AG", "##E", "OF", "TOUR", "OF", "NET", "##H", "##ER", "##LA", "##ND", "##S", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 32992, 11369, 30118, 36742, 160, 27128, 10731, 143, 73522, 32995, 53317, 109865, 11259, 23240, 86526, 23240, 41645, 12396, 24093, 44376, 58521, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "H", "##AA", "##R", "##LE", "##M", ",", "Netherlands", "1996", "-", "08", "-", "27" ], "ids": [ 145, 62281, 11273, 51036, 11517, 117, 22043, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "and", "overall", "standing", "##s", "after", "the", "161", "kilometre", "first", "stage", "of", "the", "Tour", "of", "the", "Netherlands", "between", "Go", "##uda", "and", "Haarlem", "on", "Tuesday", "." ], "ids": [ 100085, 17466, 10111, 20947, 32173, 10107, 10662, 10105, 21163, 84485, 10422, 15365, 10108, 10105, 11595, 10108, 10105, 22043, 10948, 14439, 18497, 10111, 62467, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 1, 5, 9, 1, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Federico", "Colonna", "(", "Italy", ")", "Map", "##ei", "three", "hours", "43", "min", "##s", "five", "sec", "##s" ], "ids": [ 122, 119, 20809, 78709, 113, 11619, 114, 24847, 11998, 11003, 19573, 11370, 13484, 10107, 12403, 37913, 10107 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Robbie", "M", "##c", "##E", "##wen", "(", "Australia", ")", "Ra", "##bo", "##bank" ], "ids": [ 123, 119, 43355, 150, 10350, 11259, 19584, 113, 11729, 114, 38571, 11790, 20583 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "3", ".", "Jan", "##s", "Ko", "##erts", "(", "Netherlands", ")", "Palma", "##ns" ], "ids": [ 124, 119, 11806, 10107, 30186, 64115, 113, 22043, 114, 28138, 10891 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "4", ".", "Sven", "Te", "##uten", "##berg", "(", "Germany", ")", "US", "Postal" ], "ids": [ 125, 119, 33559, 21452, 30315, 11348, 113, 12775, 114, 10808, 89208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "5", ".", "Tom", "Steel", "##s", "(", "Belgium", ")", "Map", "##ei" ], "ids": [ 126, 119, 12275, 27450, 10107, 113, 26519, 114, 24847, 11998 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "6", ".", "End", "##rio", "Leon", "##i", "(", "Italy", ")", "Aki" ], "ids": [ 127, 119, 16777, 12013, 19409, 10116, 113, 11619, 114, 93026 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 4 ] }, { "tokens": [ "7", ".", "Johan", "Cap", "##iot", "(", "Belgium", ")", "Coll", "##stro", "##p" ], "ids": [ 128, 119, 15706, 24069, 69325, 113, 26519, 114, 65689, 34582, 10410 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "8", ".", "John", "den", "Br", "##abe", "##r", "(", "Net", "##hs", ")", "Coll", "##stro", "##p" ], "ids": [ 129, 119, 10421, 10140, 38508, 40929, 10129, 113, 32577, 22394, 114, 65689, 34582, 10410 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 9, 3, 7, 7 ] }, { "tokens": [ "9", ".", "Je", "##roen", "B", "##li", "##jle", "##vens", "(", "Net", "##hs", ")", "TV", "##M" ], "ids": [ 130, 119, 13796, 77321, 139, 10390, 98969, 54086, 113, 32577, 22394, 114, 10813, 11517 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 5, 9, 3, 7 ] }, { "tokens": [ "10", ".", "Michael", "van", "der", "Wolf", "(", "Net", "##hs", ")", "Forel", "##dora", "##do", "all", "same", "time", "." ], "ids": [ 10150, 119, 10631, 10145, 10118, 17970, 113, 32577, 22394, 114, 92550, 22885, 10317, 10435, 11561, 10635, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "overall", "standing", "##s", "after", "first", "stage", "." ], "ids": [ 100085, 20947, 32173, 10107, 10662, 10422, 15365, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Colonna", "three", "hours", "42", "min", "##s", "55", "seconds" ], "ids": [ 122, 119, 78709, 11003, 19573, 11276, 13484, 10107, 11358, 34290 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "M", "##c", "##E", "##wen", "0", ":", "04", "seconds", "behind" ], "ids": [ 123, 119, 150, 10350, 11259, 19584, 121, 131, 10814, 34290, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Ko", "##erts", "0", ":", "06" ], "ids": [ 124, 119, 30186, 64115, 121, 131, 10719 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Gian", "##luca", "Cor", "##ini", "(", "Italy", ")", "Aki", "0", ":", "07" ], "ids": [ 125, 119, 57243, 99839, 93495, 11778, 113, 11619, 114, 93026, 121, 131, 10878 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Wim", "Om", "##loop", "(", "Belgium", ")", "Coll", "##stro", "##p", "same", "time" ], "ids": [ 126, 119, 73760, 18864, 63330, 113, 26519, 114, 65689, 34582, 10410, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "6", ".", "Lance", "Armstrong", "(", "USA", ")", "Motorola", "0", ":", "08" ], "ids": [ 127, 119, 45013, 24472, 113, 11061, 114, 67289, 121, 131, 11052 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Tristan", "Hoffman", "(", "Net", "##hs", ")", "TV", "##M", "same", "time" ], "ids": [ 128, 119, 52728, 40910, 113, 32577, 22394, 114, 10813, 11517, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 3, 7, 9, 9 ] }, { "tokens": [ "8", ".", "George", "Hi", "##nca", "##pie", "(", "USA", ")", "Motorola", "0", ":", "09" ], "ids": [ 129, 119, 10955, 20065, 27480, 19237, 113, 11061, 114, 67289, 121, 131, 11035 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9 ] }, { "tokens": [ "9", ".", "John", "Tale", "##n", "(", "Net", "##hs", ")", "Forel", "##dora", "##do", "same", "time" ], "ids": [ 130, 119, 10421, 27632, 10115, 113, 32577, 22394, 114, 92550, 22885, 10317, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "10", ".", "Te", "##uten", "##berg", "0", ":", "10" ], "ids": [ 10150, 119, 21452, 30315, 11348, 121, 131, 10150 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "CO", "##F", "##INE", "##C", "SL", "##IP", "##S", "ON", "B", "##UD", "##AP", "##ES", "##T", "B", "##O", "##UR", "##SE", "B", "##UT", "F", "##UT", "##UR", "##E", "ST", "##RO", "##NG", "." ], "ids": [ 32992, 11565, 83198, 10858, 52671, 30331, 10731, 49339, 139, 86888, 38423, 25054, 11090, 139, 11403, 98348, 39039, 139, 65729, 143, 65729, 98348, 11259, 53317, 35066, 34065, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Em", "##ese", "Barth", "##a" ], "ids": [ 11289, 13565, 92590, 10113 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "B", "##UD", "##AP", "##ES", "##T", "1996", "-", "08", "-", "27" ], "ids": [ 139, 86888, 38423, 25054, 11090, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##pectations", "that", "Co", "##fine", "##c", "S", ".", "A", ".", ",", "the", "Hungarian", "bou", "##rse", "'", "s", "first", "foreign", "listing", ",", "will", "report", "a", "disa", "##ppo", "##inti", "##ng", "first", "half", "have", "de", "##pressed", "the", "stock", "below", "its", "issue", "price", ",", "but", "anal", "##yst", "##s", "ex", "##pect", "a", "re", "##bound", "in", "the", "long", "term", "." ], "ids": [ 27746, 96815, 10189, 13098, 100456, 10350, 156, 119, 138, 119, 117, 10105, 24364, 94335, 16239, 112, 187, 10422, 20796, 84481, 117, 11337, 17553, 169, 36474, 45565, 49886, 10376, 10422, 13877, 10529, 10104, 96616, 10105, 20511, 17544, 10474, 15557, 30839, 117, 10473, 106615, 62769, 10107, 11419, 51511, 169, 11639, 47755, 10106, 10105, 11695, 13719, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "first", "half", "of", "the", "year", "is", "unlikely", "to", "be", "as", "strong", "as", "expected", "so", "the", "company", "will", "probably", "be", "unable", "to", "reach", "its", "annual", "plan", "in", "1996", ",", "\"", "said", "Ga", "##bor", "Sit", "##any", "##i", ",", "a", "London", "-", "based", "anal", "##yst", "for", "IN", "##G", "Bari", "##ngs", "." ], "ids": [ 107, 10117, 10422, 13877, 10108, 10105, 10924, 10124, 107914, 10114, 10347, 10146, 18093, 10146, 25973, 10380, 10105, 12100, 11337, 23282, 10347, 30553, 10114, 24278, 10474, 19246, 13065, 10106, 10389, 117, 107, 12415, 69699, 16368, 43690, 17415, 10116, 117, 169, 10829, 118, 11610, 106615, 62769, 10142, 36351, 11447, 35536, 34876, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "The", "French", "-", "registered", "pack", "##aging", "materials", "company", ",", "which", "fl", "##oat", "##ed", "its", "shares", "in", "Hungary", "in", "July", ",", "for", "most", "of", "the", "past", "two", "weeks", "ho", "##vere", "##d", "below", "the", "6", ",", "425", "for", "##ints", "/", "Global", "De", "##posit", "##ary", "Rec", "##ei", "##pts", "price", "of", "its", "initial", "offering", ",", "which", "was", "over", "##su", "##bs", "##cribed", "." ], "ids": [ 10117, 11894, 118, 33712, 78978, 43569, 23193, 12100, 117, 10319, 58768, 51330, 10336, 10474, 45751, 10106, 24601, 10106, 11112, 117, 10142, 10992, 10108, 10105, 17781, 10551, 20750, 13173, 29282, 10162, 17544, 10105, 127, 117, 33437, 10142, 71772, 120, 13037, 10190, 106185, 14926, 97200, 11998, 83609, 30839, 10108, 10474, 21713, 42281, 117, 10319, 10134, 10491, 12892, 19528, 66427, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", ",", "which", "asked", "for", "a", "two", "-", "week", "delay", "from", "the", "usual", "August", "15", "dead", "##line", "for", "reporting", "first", "-", "half", "results", ",", "closed", "on", "Tuesday", "at", "5", ",", "800", "for", "##ints", ",", "down", "300", "." ], "ids": [ 10117, 12100, 117, 10319, 22151, 10142, 169, 10551, 118, 16118, 76497, 10188, 10105, 49176, 10735, 10208, 23457, 12953, 10142, 60524, 10422, 118, 13877, 17466, 117, 18440, 10135, 70245, 10160, 126, 117, 11900, 10142, 71772, 117, 12935, 11093, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Co", "##fine", "##c", "'", "s", "first", "-", "half", "figures", "will", "be", ".", ".", "." ], "ids": [ 107, 13098, 100456, 10350, 112, 187, 10422, 118, 13877, 21068, 11337, 10347, 119, 119, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "between", "one", "-", "third", "of", "two", "-", "fifth", "##s", "of", "its", "annual", "plan", ",", "\"", "said", "Tam", "##as", "Erde", "##i", ",", "a", "Budapest", "-", "based", "anal", "##yst", "for", "AB", "##N", "-", "AM", "##RO", "Hoa", "##re", "Go", "##vet", "##t", "." ], "ids": [ 10948, 10464, 118, 12628, 10108, 10551, 118, 22237, 10107, 10108, 10474, 19246, 13065, 117, 107, 12415, 27324, 10403, 40389, 10116, 117, 169, 14745, 118, 11610, 106615, 62769, 10142, 21644, 11537, 118, 24339, 35066, 15475, 10246, 14439, 15028, 10123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 2, 6, 6, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Ana", "##lys", "##ts", "bl", "##ame", ",", "at", "least", "partly", ",", "Hungary", "'", "s", "mac", "##roe", "##cono", "##mic", "environment", "for", "the", "weak", "##er", "figures", "for", "Co", "##fine", "##c", "which", ",", "operating", "in", "Hungary", ",", "Poland", "and", "the", "Czech", "Republic", ",", "now", "generate", "##s", "about", "55", "to", "60", "percent", "of", "its", "annual", "sales", "from", "Hungary", "." ], "ids": [ 16377, 52176, 10806, 21484, 18969, 117, 10160, 16298, 50686, 117, 24601, 112, 187, 57251, 86564, 27447, 27057, 26069, 10142, 10105, 61285, 10165, 21068, 10142, 13098, 100456, 10350, 10319, 117, 24210, 10106, 24601, 117, 17879, 10111, 10105, 22148, 13681, 117, 11858, 74195, 10107, 10978, 11358, 10114, 10709, 22362, 10108, 10474, 19246, 23857, 10188, 24601, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Hungary", "'", "s", "Gross", "Dome", "##stic", "Product", "fell", "one", "percentage", "point", "in", "the", "first", "quarter", "while", "real", "wa", "##ges", "plu", "##nge", "##d", "7", ".", "2", "percentage", "points", "in", "the", "first", "half", "of", "1996", "." ], "ids": [ 24601, 112, 187, 50557, 63722, 26666, 93218, 25194, 10464, 46971, 12331, 10106, 10105, 10422, 28330, 11371, 13486, 11471, 13156, 13651, 18180, 10162, 128, 119, 123, 46971, 12789, 10106, 10105, 10422, 13877, 10108, 10389, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "will", "have", "their", "impact", "on", "Co", "##fine", "##c", "'", "s", "figures", ",", "the", "anal", "##yst", "##s", "said", "." ], "ids": [ 20973, 11337, 10529, 10455, 21316, 10135, 13098, 100456, 10350, 112, 187, 21068, 117, 10105, 106615, 62769, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Despite", "the", "current", "difficulties", ",", "however", ",", "anal", "##yst", "##s", "were", "convinced", "that", "Co", "##fine", "##c", "'", "s", "out", "##lo", "##ok", "was", "strong", "." ], "ids": [ 21230, 10105, 14978, 64557, 117, 13800, 117, 106615, 62769, 10107, 10309, 71869, 10189, 13098, 100456, 10350, 112, 187, 10950, 10715, 11140, 10134, 18093, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "eastern", "European", "market", "offers", "good", "chances", ",", "\"", "said", "Erde", "##i", ".", "\"" ], "ids": [ 107, 10117, 18677, 11914, 17313, 23818, 15198, 84632, 117, 107, 12415, 40389, 10116, 119, 107 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Just", "like", "many", "other", "companies", "on", "the", "bou", "##rse", ",", "Co", "##fine", "##c", "has", "big", "growth", "opportunities", ".", "\"" ], "ids": [ 17116, 11850, 11299, 10684, 18866, 10135, 10105, 94335, 16239, 117, 13098, 100456, 10350, 10393, 22185, 14609, 49337, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "At", "the", "same", "time", ",", "it", "'", "s", "an", "advantage", "for", "Co", "##fine", "##c", "that", "it", "has", "a", "foreign", "management", "which", "perhaps", "understand", "##s", "the", "market", "better", ",", "\"", "Erde", "##i", "added", "." ], "ids": [ 107, 11699, 10105, 11561, 10635, 117, 10271, 112, 187, 10151, 38119, 10142, 13098, 100456, 10350, 10189, 10271, 10393, 169, 20796, 17150, 10319, 36981, 49151, 10107, 10105, 17313, 18322, 117, 107, 40389, 10116, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "Co", "##fine", "##c", "is", "a", "very", "good", "story", "in", "the", "long", "-", "term", "as", "the", "per", "capita", "pack", "##aging", "consumption", "is", "still", "so", "low", "in", "east", "Europe", "that", "a", "very", "strong", "increase", "can", "be", "expected", "(", "long", "-", "term", ")", ",", "\"", "Sit", "##any", "##i", "said", ",", "saying", "that", "several", "recent", "moves", "by", "Co", "##fine", "##c", "bo", "##oste", "##d", "its", "position", "." ], "ids": [ 107, 13098, 100456, 10350, 10124, 169, 12558, 15198, 13617, 10106, 10105, 11695, 118, 13719, 10146, 10105, 10178, 18459, 78978, 43569, 62556, 10124, 12647, 10380, 15626, 10106, 13827, 11767, 10189, 169, 12558, 18093, 20299, 10944, 10347, 25973, 113, 11695, 118, 13719, 114, 117, 107, 43690, 17415, 10116, 12415, 117, 22807, 10189, 11736, 19037, 49157, 10155, 13098, 100456, 10350, 20506, 45722, 10162, 10474, 12956, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Among", "them", ",", "he", "noted", "that", "Co", "##fine", "##c", "had", "acquired", "the", "outstanding", "stake", "in", "its", "Czech", "f", "##old", "##ing", "company", "Kr", "##pac", "##o", "a", ".", "s", ".", ",", "increasing", "its", "ownership", "to", "100", "percent", ",", "so", "in", "the", "second", "half", "the", "whole", "of", "Kr", "##pac", "##o", "'", "s", "figures", "will", "be", "con", "##solidated", "." ], "ids": [ 24470, 11345, 117, 10261, 18575, 10189, 13098, 100456, 10350, 10374, 21011, 10105, 53933, 90081, 10106, 10474, 22148, 174, 33860, 10230, 12100, 17640, 78560, 10133, 169, 119, 187, 119, 117, 30816, 10474, 41354, 10114, 10407, 22362, 117, 10380, 10106, 10105, 11132, 13877, 10105, 21047, 10108, 17640, 78560, 10133, 112, 187, 21068, 11337, 10347, 10173, 69302, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "also", "rep", "##aid", "some", "$", "21", "million", "of", "debt", ",", "well", "above", "the", "originally", "planned", "$", "8", "million", "to", "$", "9", "million", "." ], "ids": [ 10117, 12100, 10379, 76456, 39522, 11152, 109, 10296, 12473, 10108, 55869, 117, 11206, 16038, 10105, 15556, 24292, 109, 129, 12473, 10114, 109, 130, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "addition", ",", "its", "Polish", "operation", "began", "with", "some", "six", "weeks", "of", "delay", "due", "to", "cold", "winter", "weather", "and", "the", "test", "run", "was", "also", "longer", "than", "planned", "." ], "ids": [ 10167, 14763, 117, 10474, 19870, 20080, 11941, 10169, 11152, 12449, 20750, 10108, 76497, 10850, 10114, 41626, 25977, 35660, 10111, 10105, 15839, 14095, 10134, 10379, 20165, 11084, 24292, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Budapest", "news", "##room", "(", "36", "1", ")", "266", "241", "##0" ], "ids": [ 118, 118, 14745, 14424, 25525, 113, 11055, 122, 114, 28477, 23536, 10929 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DI", "##RE", "##CT", "E", "##Q", "##UI", "##T", "##Y", "TR", "##AD", "##ES", "ON", "THE", "C", "##Z", "##EC", "##H", "PS", "##E", "-", "AU", "##G", "27", "." ], "ids": [ 110014, 66014, 91995, 142, 19282, 83259, 11090, 14703, 80047, 55538, 25054, 49339, 17443, 140, 13966, 35826, 12396, 21290, 11259, 118, 29088, 11447, 10365, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##AG", "##UE", "1996", "-", "08", "-", "27" ], "ids": [ 23837, 109865, 62674, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "following", "is", "a", "list", "of" ], "ids": [ 10117, 11901, 10124, 169, 13416, 10108 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "direct", "equity", "trade", "##s", "made", "on", "the", "Prague", "Stock", "Exchange", ":" ], "ids": [ 16934, 102686, 18908, 10107, 11019, 10135, 10105, 33745, 31916, 32424, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "ISS", "##UE", "Min", "." ], "ids": [ 58915, 62674, 28291, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Price", "Max", "." ], "ids": [ 23002, 12854, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Price", "Volume", "Turn", "##over" ], "ids": [ 23002, 15239, 36750, 16666 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "(", "C", "##Z", "##K", ")", "(", "C", "##Z", "##K", ")", "(", "shares", ")", "(", "C", "##Z", "##K", "000", "'", "s", ")" ], "ids": [ 113, 140, 13966, 11733, 114, 113, 140, 13966, 11733, 114, 113, 45751, 114, 113, 140, 13966, 11733, 10259, 112, 187, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AG", "##RO", "##TO", "##N", "##Z", "T", "##L", "##UM", "##AC", "##O", "##V", "336", ".", "47", "336", ".", "47", "594", "##40", "1999", "##9", ".", "777" ], "ids": [ 17935, 35066, 60493, 11537, 13966, 157, 11369, 72679, 30340, 11403, 11779, 29823, 119, 11413, 29823, 119, 11413, 59962, 38109, 10324, 11373, 119, 45773 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AV", "##IA", "290", ".", "00", "290", ".", "00", "700", "203", ".", "000" ], "ids": [ 49932, 35976, 21138, 119, 11025, 21138, 119, 11025, 12367, 20235, 119, 10259 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##R", "##UM", "H", "##OL", "##DI", "##NG", "171", ".", "00", "171", ".", "00", "1443", "##2", "246", "##7", ".", "872" ], "ids": [ 39999, 11273, 72679, 145, 39272, 58730, 34065, 22478, 119, 11025, 22478, 119, 11025, 89799, 10729, 26439, 11305, 119, 77107 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##S", "##KA", "SP", "##OR", "##IT", "##EL", "##NA", "335", ".", "00", "375", ".", "00", "533", "##15", "##3", "1983", "##5", "##4", ".", "941" ], "ids": [ 31078, 10731, 67813, 22570, 42622, 37611, 68999, 36742, 30269, 119, 11025, 25403, 119, 11025, 45524, 37462, 10884, 10643, 11166, 11011, 119, 82944 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CK", "##D", "PR", "##A", "##HA", "H", "##OL", "##DI", "##NG", "369", ".", "66", "384", ".", "00", "556", "##5", "206", "##5", ".", "260" ], "ids": [ 100789, 11490, 23837, 10738, 58132, 145, 39272, 58730, 34065, 31577, 119, 12215, 32466, 119, 11025, 54919, 11166, 21717, 11166, 119, 17948 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EM", "##KA", "##M", "25", ".", "00", "25", ".", "00", "346", "##8", "##4", "867", ".", "100" ], "ids": [ 20569, 67813, 11517, 10258, 119, 11025, 10258, 119, 11025, 36972, 11396, 11011, 68389, 119, 10407 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##BL", "##O", "K", "##LA", "##D", "##NO", "960", ".", "00", "960", ".", "00", "223", "##0", "214", "##0", ".", "800" ], "ids": [ 85314, 94701, 11403, 148, 44376, 11490, 67292, 36832, 119, 11025, 36832, 119, 11025, 24415, 10929, 23759, 10929, 119, 11900 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KO", "##ME", "##RC", "##NI", "BA", "##NK", "##A", "232", "##0", ".", "00", "237", "##0", ".", "00", "7000", "1640", "##8", ".", "700" ], "ids": [ 67422, 42424, 52932, 52898, 39999, 78043, 10738, 23944, 10929, 119, 11025, 27173, 10929, 119, 11025, 37671, 30485, 11396, 119, 12367 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LE", "##CI", "##VA", "PR", "##A", "##HA", "247", "##0", ".", "00", "247", "##0", ".", "00", "1360", "335", "##9", ".", "200" ], "ids": [ 84977, 89955, 47172, 23837, 10738, 58132, 27994, 10929, 119, 11025, 27994, 10929, 119, 11025, 62419, 30269, 11373, 119, 10777 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##T", "##RO", "##ST", "##AV", "302", "##4", ".", "95", "302", "##4", ".", "95", "3000", "907", "##4", ".", "850" ], "ids": [ 47430, 11090, 35066, 32995, 99903, 28614, 11011, 119, 11978, 28614, 11011, 119, 11978, 15335, 59463, 11011, 119, 24934 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##RA", "##V", ".", "CH", "##EM", "##IC", ".", "Z", "##AV", "." ], "ids": [ 102059, 29990, 11779, 119, 39774, 67753, 30889, 119, 163, 99903, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "637", ".", "50", "637", ".", "50", "1626", "103", "##6", ".", "575" ], "ids": [ 58966, 119, 10462, 58966, 119, 10462, 43198, 15553, 11211, 119, 42813 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OK", "##D", "111", ".", "50", "112", ".", "56", "959", "##7", "##5", "1075", "##2", ".", "09", "##2" ], "ids": [ 47168, 11490, 15821, 119, 10462, 16129, 119, 11628, 73586, 11305, 11166, 105877, 10729, 119, 11035, 10729 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##F", "IK", "##S", "KB", "PL", "##US", "156", ".", "00", "156", ".", "00", "6000", "936", ".", "000" ], "ids": [ 153, 11565, 53182, 10731, 47971, 71341, 32612, 20410, 119, 11025, 20410, 119, 11025, 28672, 70167, 119, 10259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RI", "##F", "900", ".", "00", "900", ".", "00", "5500", "495", "##0", ".", "000" ], "ids": [ 56658, 11565, 13545, 119, 11025, 13545, 119, 11025, 103851, 44309, 10929, 119, 10259 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##L", "##I", "##KO", "4000", ".", "00", "2000", "##0", ".", "00", "356", "##5", "326", "##0", "##7", ".", "500" ], "ids": [ 23056, 11369, 11281, 57277, 21655, 119, 11025, 10180, 10929, 119, 11025, 33303, 11166, 32558, 10929, 11305, 119, 10757 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##KO", "##L", "##O", "##V", "##S", "##KA", "U", "##H", "##EL", "##NA", "785", ".", "00", "785", ".", "00", "6000", "471", "##0", ".", "000" ], "ids": [ 71020, 57277, 11369, 11403, 11779, 10731, 67813, 158, 12396, 68999, 36742, 55281, 119, 11025, 55281, 119, 11025, 28672, 31614, 10929, 119, 10259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SP", "##IF", "CE", "##S", "##K", "##Y", "339", ".", "00", "340", ".", "00", "754", "##6", "256", "##2", ".", "094" ], "ids": [ 22570, 53668, 31078, 10731, 11733, 14703, 34753, 119, 11025, 22405, 119, 11025, 58534, 11211, 21475, 10729, 119, 110550 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SP", "##T", "T", "##EL", "##EC", "##OM", "335", "##5", ".", "00", "340", "##4", ".", "71", "1070", "##0", "363", "##3", "##7", ".", "137" ], "ids": [ 22570, 11090, 157, 68999, 35826, 37079, 30269, 11166, 119, 11025, 22405, 11011, 119, 12513, 85466, 10929, 35611, 10884, 11305, 119, 18948 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SK", "##OD", "##A", "PL", "##Z", "##EN", "104", "##5", ".", "56", "1060", ".", "00", "107", "##7", "##2", "1136", "##1", ".", "330" ], "ids": [ 21275, 77836, 10738, 71341, 13966, 50655, 15115, 11166, 119, 11628, 94142, 119, 11025, 15844, 11305, 10729, 78373, 10759, 119, 20564 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TA", "##BA", "##K", "670", "##0", ".", "00", "670", "##0", ".", "00", "1000", "670", "##0", ".", "000" ], "ids": [ 91075, 35999, 11733, 37059, 10929, 119, 11025, 37059, 10929, 119, 11025, 12186, 37059, 10929, 119, 10259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TR", "##INE", "##C", "##K", "##E", "Z", "##EL", "##E", "##ZA", "##RN", "##Y", "210", ".", "00", "210", ".", "00", "3000", "630", ".", "000" ], "ids": [ 80047, 83198, 10858, 11733, 11259, 163, 68999, 11259, 105512, 90412, 14703, 17131, 119, 11025, 17131, 119, 11025, 15335, 34038, 119, 10259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "V", "##OD", "##NI", "ST", "##AV", "##B", "##Y", "PR", "##A", "##HA", "1915", ".", "00", "1915", ".", "00", "2000", "383", "##0", ".", "000" ], "ids": [ 159, 77836, 52898, 53317, 99903, 11274, 14703, 23837, 10738, 58132, 11682, 119, 11025, 11682, 119, 11025, 10180, 35663, 10929, 119, 10259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Prague", "News", "##room", ",", "42", "-", "2", "-", "242", "##3", "-", "000", "##3" ], "ids": [ 118, 118, 33745, 12219, 25525, 117, 11276, 118, 123, 118, 27297, 10884, 118, 10259, 10884 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AF", "##TER", "THE", "BE", "##LL", "-", "After", "hours", "slow", "##s", "in", "light", "volume", "." ], "ids": [ 55640, 99552, 17443, 46291, 82834, 118, 11301, 19573, 41573, 10107, 10106, 15765, 15901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "said", "on", "Tuesday", "after", "-", "hours", "activity", "was", "light", "." ], "ids": [ 15006, 10943, 12415, 10135, 70245, 10662, 118, 19573, 22205, 10134, 15765, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "World", "##C", "##om", "Inc", "and", "MF", "##S", "Communications", "Co", "Inc", "were", "trading", "but", "they", "moved", "in", "line", "with", "their", "close", "." ], "ids": [ 20973, 10315, 10858, 10692, 13604, 10111, 73443, 10731, 27428, 13098, 13604, 10309, 46663, 10473, 10689, 13059, 10106, 12117, 10169, 10455, 16065, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "World", "##C", "##om", ",", "which", "said", "it", "will", "buy", "MF", "##S", ",", "shed", "1", "-", "3", "/", "4", "to", "close", "at", "21", "while", "MF", "##S", "lost", "3", "-", "8", "/", "16", "to", "close", "at", "41", "-", "5", "/", "16", "." ], "ids": [ 10315, 10858, 10692, 117, 10319, 12415, 10271, 11337, 47715, 73443, 10731, 117, 106942, 122, 118, 124, 120, 125, 10114, 16065, 10160, 10296, 11371, 73443, 10731, 14172, 124, 118, 129, 120, 10250, 10114, 16065, 10160, 11349, 118, 126, 120, 10250, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "New", "York", "Stock", "Exchange", "said", "its", "session", "one", "volume", "was", "5", ",", "700", "shares", "compared", "to", "53", ",", "400", "shares", "Monday", "." ], "ids": [ 10117, 10287, 10482, 31916, 32424, 12415, 10474, 30066, 10464, 15901, 10134, 126, 117, 12367, 45751, 25626, 10114, 11756, 117, 11176, 45751, 40714, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Session", "two", "volume", "was", "4", ",", "153", ",", "800", "shares", "compared", "to", "no", "volume", "Monday", "." ], "ids": [ 61278, 10551, 15901, 10134, 125, 117, 19032, 117, 11900, 45751, 25626, 10114, 10192, 15901, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "American", "Stock", "Exchange", "said", "there", "was", "no", "after", "-", "hours", "activity", "." ], "ids": [ 10117, 10536, 31916, 32424, 12415, 11155, 10134, 10192, 10662, 118, 19573, 22205, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CB", "##O", "##E", "in", "routine", "review", "of", "MF", "##S", "options", "." ], "ids": [ 59791, 11403, 11259, 10106, 94650, 17030, 10108, 73443, 10731, 53121, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Chicago", "Board", "Op", "##tions", "Exchange", "(", "CB", "##O", "##E", ")", "said", "on", "Tuesday", "it", "was", "doing", "a", "routine", "investigation", "into", "trading", "in", "options", "on", "MF", "##S", "Communications", "Co", "Inc", "shares", "." ], "ids": [ 10117, 12317, 14743, 12160, 15024, 32424, 113, 59791, 11403, 11259, 114, 12415, 10135, 70245, 10271, 10134, 30918, 169, 94650, 32719, 10708, 46663, 10106, 53121, 10135, 73443, 10731, 27428, 13098, 13604, 45751, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "On", "Monday", ",", "the", "company", "said", "it", "had", "agreed", "to", "be", "acquired", "by", "World", "##C", "##om", "Inc", "in", "a", "deal", "valued", "at", "$", "14", "billion", "." ], "ids": [ 10576, 40714, 117, 10105, 12100, 12415, 10271, 10374, 25577, 10114, 10347, 21011, 10155, 10315, 10858, 10692, 13604, 10106, 169, 19918, 106867, 10160, 109, 10247, 25848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MF", "##S", "shares", "surge", "##d", "on", "the", "news", "while", "World", "##C", "##om", "fell", "on", "fear", "##s", "of", "dil", "##ution", "." ], "ids": [ 73443, 10731, 45751, 69824, 10162, 10135, 10105, 14424, 11371, 10315, 10858, 10692, 25194, 10135, 44929, 10107, 10108, 36031, 30861, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "New", "York", "Times", "said", "on", "Tuesday", "some", "of", "the", "options", "trading", "in", "MF", "##S", "last", "Friday", "may", "suggest", "inside", "##r", "trading", "." ], "ids": [ 10117, 10287, 10482, 12020, 12415, 10135, 70245, 11152, 10108, 10105, 53121, 46663, 10106, 73443, 10731, 12469, 30767, 11387, 56874, 22978, 10129, 46663, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MF", "##S", "options", "also", "trade", "on", "the", "American", "Stock", "Exchange", "and", "the", "Pacific", "Stock", "Exchange", "." ], "ids": [ 73443, 10731, 53121, 10379, 18908, 10135, 10105, 10536, 31916, 32424, 10111, 10105, 14597, 31916, 32424, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "A", "spoke", "##sman", "for", "the", "American", "Stock", "Exchange", "would", "neither", "con", "##fir", "##m", "or", "den", "##y", "whether", "the", "exchange", "was", "looking", "into", "trading", "." ], "ids": [ 138, 50005, 24305, 10142, 10105, 10536, 31916, 32424, 10894, 51148, 10173, 61644, 10147, 10345, 10140, 10157, 21883, 10105, 27714, 10134, 34279, 10708, 46663, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "there", "is", "unusual", "activity", ",", "certainly", "we", "look", "at", "it", ",", "but", "that", "'", "s", "not", "to", "say", "we", "'", "re", "doing", "anything", "official", ",", "\"", "he", "said", "." ], "ids": [ 107, 14535, 11155, 10124, 46941, 22205, 117, 88134, 11951, 25157, 10160, 10271, 117, 10473, 10189, 112, 187, 10472, 10114, 23763, 11951, 112, 11639, 30918, 42819, 14731, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pacific", "Stock", "Exchange", "officials", "were", "not", "available", "." ], "ids": [ 14597, 31916, 32424, 27730, 10309, 10472, 14579, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "trade", "##r", "said", "trading", "in", "MF", "##S", "options", "had", "increased", "st", "##ead", "##ily", "from", "about", "mid", "-", "August", ",", "and", "doubt", "##ed", "whether", "any", "of", "last", "Friday", "'", "s", "activity", "was", "inside", "##r", "trading", "." ], "ids": [ 11340, 18908, 10129, 12415, 46663, 10106, 73443, 10731, 53121, 10374, 19299, 28780, 30297, 32464, 10188, 10978, 15607, 118, 10735, 117, 10111, 86697, 10336, 21883, 11178, 10108, 12469, 30767, 112, 187, 22205, 10134, 22978, 10129, 46663, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Der", "##ivat", "##ives", "des", "##k", ",", "312", "408", "-", "875", "##0", "/", "E", "-", "mail", ":", "deriva", "##tives", "@", "re", "##uter", "##s", ".", "com" ], "ids": [ 118, 10445, 34620, 24407, 10139, 10174, 117, 25104, 36899, 118, 45949, 10929, 120, 142, 118, 30049, 131, 24778, 37588, 137, 11639, 54092, 10107, 119, 10212 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fa", "##uld", "##ing", "target", "of", "patent", "lawsuit", "." ], "ids": [ 44271, 43165, 10230, 28564, 10108, 45352, 83706, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EL", "##I", "##ZA", "##B", "##ET", "##H", ",", "N", ".", "J", ".", "1996", "-", "08", "-", "27" ], "ids": [ 69765, 11281, 105512, 11274, 52338, 12396, 117, 151, 119, 147, 119, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fa", "##uld", "##ing", "Inc", "said", "on", "Tuesday", "P", "##urd", "##ue", "Frederick", "Co", "filed", "a", "patent", "in", "##fr", "##inge", "##ment", "lawsuit", "against", "Fa", "##uld", "##ing", "and", "its", "Pure", "##pac", "Ph", "##aram", "##ceu", "##tical", "unit", "." ], "ids": [ 44271, 43165, 10230, 13604, 12415, 10135, 70245, 153, 62933, 12772, 17132, 13098, 45959, 169, 45352, 10106, 71843, 35604, 10426, 83706, 11327, 44271, 43165, 10230, 10111, 10474, 51611, 78560, 29343, 50647, 28458, 60783, 16511, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "The", "suit", "was", "filed", "because", "of", "Pure", "##pac", "'", "s", "manufacture", "of", "Kad", "##ian", ",", "a", "sustained", "release", "mor", "##phine", "product", ",", "Fa", "##uld", "##ing", "said", "." ], "ids": [ 10117, 26315, 10134, 45959, 12373, 10108, 51611, 78560, 112, 187, 72022, 10108, 49680, 11630, 117, 169, 72241, 14072, 24984, 62862, 21535, 117, 44271, 43165, 10230, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Fa", "##uld", "##ing", "said", "the", "claims", "in", "the", "lawsuit", "are", "without", "meri", "##t", "and", "will", "not", "impact", "upon", "the", "launch", "of", "Kad", "##ian", "in", "the", "United", "States", "." ], "ids": [ 44271, 43165, 10230, 12415, 10105, 25880, 10106, 10105, 83706, 10301, 13663, 94992, 10123, 10111, 11337, 10472, 21316, 15378, 10105, 29227, 10108, 49680, 11630, 10106, 10105, 10609, 10859, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Kad", "##ian", "was", "approved", "for", "sale", "in", "the", "United", "States", "last", "month", ",", "Fa", "##uld", "##ing", "said", "." ], "ids": [ 49680, 11630, 10134, 29855, 10142, 15488, 10106, 10105, 10609, 10859, 12469, 14064, 117, 44271, 43165, 10230, 12415, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Zen", "##eca", "Group", "Pl", "##c", ",", "which", "will", "market", "Kad", "##ian", ",", "was", "named", "in", "the", "lawsuit", "with", "F", ".", "H", ".", "Fa", "##uld", "##ing", "&", "Co", ",", "the", "majority", "share", "##holder", "of", "Fa", "##uld", "##ing", "Inc", ",", "the", "company", "said", "." ], "ids": [ 61916, 33588, 12054, 48932, 10350, 117, 10319, 11337, 17313, 49680, 11630, 117, 10134, 12038, 10106, 10105, 83706, 10169, 143, 119, 145, 119, 44271, 43165, 10230, 111, 13098, 117, 10105, 19471, 23867, 54535, 10108, 44271, 43165, 10230, 13604, 117, 10105, 12100, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M", "##c", "##G", "##rath", "left", "out", "of", "Ireland", "World", "Cup", "squad", "." ], "ids": [ 150, 10350, 11447, 42724, 12153, 10950, 10108, 14637, 10315, 11544, 30580, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 1, 2, 6, 9, 9 ] }, { "tokens": [ "D", "##UB", "##L", "##IN", "1996", "-", "08", "-", "27" ], "ids": [ 141, 82439, 11369, 27128, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ireland", "'", "s", "most", "experienced", "player", ",", "defender", "Paul", "M", "##c", "##G", "##rath", ",", "was", "left", "out", "of", "the", "national", "squad", "for", "the", "first", "time", "in", "11", "years", "on", "Tuesday", "when", "new", "manager", "Mick", "McCarthy", "named", "his", "side", "to", "face", "Liechtenstein", "in", "a", "World", "Cup", "qualifier", "." ], "ids": [ 14637, 112, 187, 10992, 40727, 12928, 117, 36426, 10772, 150, 10350, 11447, 42724, 117, 10134, 12153, 10950, 10108, 10105, 11844, 30580, 10142, 10105, 10422, 10635, 10106, 10193, 10855, 10135, 70245, 10841, 10751, 16935, 34847, 42816, 12038, 10226, 12250, 10114, 13295, 49693, 10106, 169, 10315, 11544, 96076, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "The", "36", "-", "year", "-", "old", "Aston", "Villa", "player", "won", "the", "last", "of", "his", "Irish", "record", "of", "82", "international", "caps", "against", "the", "Czech", "Republic", "in", "Prague", "in", "April", "." ], "ids": [ 10117, 11055, 118, 10924, 118, 12898, 40757, 13875, 12928, 11367, 10105, 12469, 10108, 10226, 15624, 12410, 10108, 12180, 12533, 52036, 11327, 10105, 22148, 13681, 10106, 33745, 10106, 10780, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9 ] }, { "tokens": [ "\"", "Paul", "accepted", "the", "situation", "." ], "ids": [ 107, 10772, 24926, 10105, 18586, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "He", "has", "n", "'", "t", "played", "any", "first", "-", "team", "games", "for", "Villa", "this", "season", "and", "he", "'", "s", "not", "the", "type", "of", "player", "I", "would", "have", "brought", "on", "as", "a", "substitute", ",", "\"", "McCarthy", "said", ".", "\"" ], "ids": [ 10357, 10393, 182, 112, 188, 11553, 11178, 10422, 118, 11121, 13332, 10142, 13875, 10531, 11226, 10111, 10261, 112, 187, 10472, 10105, 12807, 10108, 12928, 146, 10894, 10529, 17327, 10135, 10146, 169, 58808, 117, 107, 42816, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "But", "he", "surprise", "##d", "me", "in", "training", "over", "the", "last", "two", "days", "because", "of", "his", "involvement", "." ], "ids": [ 16976, 10261, 48886, 10162, 10911, 10106, 15722, 10491, 10105, 12469, 10551, 13990, 12373, 10108, 10226, 47167, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "'", "s", "certainly", "is", "still", "very", "much", "part", "of", "my", "plans", "for", "the", "future", "." ], "ids": [ 10357, 112, 187, 88134, 10124, 12647, 12558, 13172, 10668, 10108, 15127, 18195, 10142, 10105, 16711, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "At", "24", ",", "25", "or", "26", "you", "could", "get", "away", "with", "it", ",", "not", "having", "played", "first", "-", "team", "games", "." ], "ids": [ 107, 11699, 10233, 117, 10258, 10345, 10314, 13028, 12174, 15329, 14942, 10169, 10271, 117, 10472, 13677, 11553, 10422, 118, 11121, 13332, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "at", "36", "it", "would", "be", "asking", "too", "much", "of", "Paul", ",", "\"", "he", "said", "." ], "ids": [ 16976, 10160, 11055, 10271, 10894, 10347, 72082, 16683, 13172, 10108, 10772, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Also", "om", "##itted", "from", "the", "20", "-", "man", "squad", "which", "will", "travel", "to", "Va", "##duz", "for", "Saturday", "'", "s", "group", "eight", "match", "are", "central", "defender", "##s", "Alan", "Kern", "##agh", "##an", "and", "Liam", "Dai", "##sh", "." ], "ids": [ 20593, 10209, 107456, 10188, 10105, 10197, 118, 10817, 30580, 10319, 11337, 23595, 10114, 14723, 79546, 10142, 24848, 112, 187, 11795, 16222, 12356, 10301, 12397, 36426, 10107, 14309, 47918, 83619, 10206, 10111, 48437, 57019, 13264, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Leeds", "United", "defender", "Gary", "Kelly", "is", "unable", "to", "travel", "because", "of", "a", "knee", "injury", "picked", "up", "in", "Monday", "'", "s", "1", "-", "0", "victory", "over", "Wimbledon", "at", "Ella", "##nd", "Road", "." ], "ids": [ 28654, 10609, 36426, 15516, 15787, 10124, 30553, 10114, 23595, 12373, 10108, 169, 75217, 27443, 52289, 10741, 10106, 40714, 112, 187, 122, 118, 121, 19735, 10491, 37932, 10160, 26450, 11534, 12648, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Since", "taking", "over", "from", "Jack", "Charlton", "in", "February", ",", "McCarthy", "has", "played", "largely", "experimental", "sides", "and", "seen", "them", "lose", "five", "times", ",", "draw", "twice", "and", "win", "just", "once", "." ], "ids": [ 15591, 18084, 10491, 10188, 12342, 68730, 10106, 11508, 117, 42816, 10393, 11553, 25340, 34176, 27263, 10111, 15652, 11345, 48742, 12403, 13465, 117, 25974, 26261, 10111, 14125, 12820, 14907, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Squad", ":", "Alan", "Kelly", ",", "Sha", "##y", "Given", ",", "Denis", "Irwin", ",", "Phil", "Bab", "##b", ",", "Jeff", "Ken", "##na", ",", "Curtis", "Fleming", ",", "Gary", "Br", "##een", ",", "Ian", "Hart", "##e", ",", "Kenny", "Cunningham", ",", "Steve", "St", "##aun", "##ton", ",", "Andy", "Townsend", ",", "Ray", "Houghton", ",", "Gareth", "Farrell", "##y", ",", "Alan", "M", "##c", "##L", "##ough", "##lin", ",", "Jason", "M", "##c", "##A", "##tee", "##r", ",", "Alan", "Moore", ",", "Keith", "O", "'", "Neill", ",", "Tony", "Ca", "##sca", "##rino", ",", "Ni", "##all", "Quinn", ",", "David", "Kelly", "." ], "ids": [ 53150, 131, 14309, 15787, 117, 106583, 10157, 90491, 117, 18454, 50471, 117, 18144, 79015, 10457, 117, 17218, 19355, 10219, 117, 25658, 38283, 117, 15516, 38508, 13129, 117, 16582, 22346, 10112, 117, 30002, 51475, 117, 13308, 10838, 104596, 11183, 117, 16802, 62427, 117, 13871, 62697, 117, 51820, 69241, 10157, 117, 14309, 150, 10350, 11369, 73603, 13020, 117, 16796, 150, 10350, 10738, 47738, 10129, 117, 14309, 15373, 117, 16685, 152, 112, 38269, 117, 13749, 26037, 28849, 28540, 117, 30409, 18995, 34674, 117, 10804, 15787, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "-", "-", "Dublin", "News", "##room", "+", "661", "##33", "##7", "##7" ], "ids": [ 118, 118, 20495, 12219, 25525, 116, 58876, 69646, 11305, 11305 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", ".", "African", "apartheid", "killer", "convicted", "of", "six", "murders", "." ], "ids": [ 156, 119, 13839, 84330, 61976, 61487, 10108, 12449, 110165, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ET", "##OR", "##IA", "1996", "-", "08", "-", "27" ], "ids": [ 23837, 52338, 42622, 35976, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "African", "apartheid", "killer", "Eugene", "de", "Ko", "##ck", "was", "found", "guilty", "of", "murder", "and", "attempted", "murder", "on", "Tuesday", ",", "a", "day", "after", "he", "was", "convicted", "of", "five", "other", "murders", "." ], "ids": [ 11056, 13839, 84330, 61976, 26831, 10104, 30186, 11263, 10134, 11823, 56044, 10108, 29448, 10111, 30881, 29448, 10135, 70245, 117, 169, 11940, 10662, 10261, 10134, 61487, 10108, 12403, 10684, 110165, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "De", "Ko", "##ck", ",", "48", ",", "a", "former", "police", "colonel", "who", "commanded", "a", "hit", "-", "squad", "that", "wi", "##ped", "out", "opponents", "of", "apartheid", ",", "is", "the", "most", "senior", "servant", "of", "white", "rule", "yet", "to", "face", "justice", "." ], "ids": [ 10190, 30186, 11263, 117, 11300, 117, 169, 11775, 15034, 31456, 10479, 51195, 169, 14946, 118, 30580, 10189, 23040, 16898, 10950, 63568, 10108, 84330, 117, 10124, 10105, 10992, 17843, 53211, 10108, 15263, 21983, 21833, 10114, 13295, 25791, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sudan", "##ese", "rebels", "say", "mission", "##aries", "should", "be", "free", "##d", "." ], "ids": [ 28407, 13565, 57545, 23763, 17032, 26445, 14819, 10347, 13961, 10162, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peter", "Sm", "##erd", "##on" ], "ids": [ 10979, 41922, 13819, 10263 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "NA", "##IR", "##O", "##B", "##I", "1996", "-", "08", "-", "27" ], "ids": [ 56586, 73522, 11403, 11274, 11281, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "main", "rebel", "group", "in", "south", "Sudan", "said", "on", "Tuesday", "it", "was", "trying", "to", "arra", "##nge", "the", "release", "of", "six", "Roman", "Catholic", "mission", "##aries", ",", "including", "three", "Australian", "nun", "##s", ",", "held", "for", "nearly", "two", "weeks", "." ], "ids": [ 10117, 12126, 56696, 11795, 10106, 13144, 28407, 12415, 10135, 70245, 10271, 10134, 32862, 10114, 38192, 18180, 10105, 14072, 10108, 12449, 12359, 15473, 17032, 26445, 117, 11198, 11003, 12829, 11715, 10107, 117, 11991, 10142, 21377, 10551, 20750, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "George", "Gara", "##ng", ",", "Nairobi", "spoke", "##sman", "for", "the", "Sudan", "People", "'", "s", "Liberation", "Army", "(", "SP", "##LA", ")", ",", "said", "it", "was", "ur", "##gent", "##ly", "trying", "to", "contact", "SP", "##LA", "commander", "Nuo", "##ur", "Maria", "##l", "at", "Map", "##our", "##dit", "in", "the", "south", "to", "free", "the", "six", "." ], "ids": [ 10955, 81929, 10376, 117, 63493, 50005, 24305, 10142, 10105, 28407, 14235, 112, 187, 54766, 12762, 113, 22570, 44376, 114, 117, 12415, 10271, 10134, 10399, 22500, 10454, 32862, 10114, 20637, 22570, 44376, 27703, 24875, 10546, 11066, 10161, 10160, 24847, 17964, 19201, 10106, 10105, 13144, 10114, 13961, 10105, 12449, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 8, 8, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "movement", "is", "making", "arrangements", "for", "them", "to", "be", "set", "free", "." ], "ids": [ 107, 10117, 17123, 10124, 14293, 56449, 10142, 11345, 10114, 10347, 11847, 13961, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "is", "a", "decision", "of", "the", "leadership", ",", "\"", "Gara", "##ng", "said", "." ], "ids": [ 10747, 10124, 169, 19231, 10108, 10105, 25121, 117, 107, 81929, 10376, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "Commander", "Nuo", "##ur", "Maria", "##l", "is", "a", "soldier", "so", "he", "must", "accept", "the", "leadership", "'", "s", "decision", "." ], "ids": [ 107, 25783, 24875, 10546, 11066, 10161, 10124, 169, 50803, 10380, 10261, 14982, 45218, 10105, 25121, 112, 187, 19231, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "communications", "at", "this", "time", "of", "year", "are", "very", "difficult", "because", "of", "rain", "##s", "and", "a", "lack", "of", "power", ",", "\"", "he", "added", "." ], "ids": [ 16976, 42919, 10160, 10531, 10635, 10108, 10924, 10301, 12558, 25232, 12373, 10108, 50939, 10107, 10111, 169, 23582, 10108, 13183, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Catholic", "Information", "Office", "in", "Nairobi", "said", "on", "Monday", "that", "four", "of", "the", "six", "had", "been", "charged", "by", "the", "SP", "##LA", "with", "sp", "##ying", ",", "spread", "##ing", "Islam", "and", "hin", "##dering", "re", "##c", "##ruit", "##ment", "into", "the", "rebel", "group", "." ], "ids": [ 10117, 15473, 12145, 13348, 10106, 63493, 12415, 10135, 40714, 10189, 11598, 10108, 10105, 12449, 10374, 10590, 38253, 10155, 10105, 22570, 44376, 10169, 32650, 40018, 117, 25609, 10230, 14727, 10111, 19911, 54406, 11639, 10350, 91788, 10426, 10708, 10105, 56696, 11795, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "These", "charges", "are", "the", "interpretation", "of", "the", "church", ",", "\"", "Gara", "##ng", "said", "on", "Tuesday", ".", "\"" ], "ids": [ 107, 13252, 31128, 10301, 10105, 55760, 10108, 10105, 14201, 117, 107, 81929, 10376, 12415, 10135, 70245, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "have", "no", "idea", "why", "they", "are", "being", "held", "." ], "ids": [ 12865, 10529, 10192, 14932, 31237, 10689, 10301, 11223, 11991, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "are", "still", "trying", "to", "establish", "contact", "with", "the", "local", "commander", ".", "\"" ], "ids": [ 12865, 10301, 12647, 32862, 10114, 33623, 20637, 10169, 10105, 11436, 27703, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ask", "##ed", "whether", "this", "meant", "the", "commander", "was", "out", "of", "control", ",", "Gara", "##ng", "said", "the", "rebel", "movement", "was", "working", "on", "the", "problem", "." ], "ids": [ 93919, 10336, 21883, 10531, 31580, 10105, 27703, 10134, 10950, 10108, 12608, 117, 81929, 10376, 12415, 10105, 56696, 17123, 10134, 14616, 10135, 10105, 18077, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "he", "believed", "all", "six", "were", "being", "held", "in", "the", "mission", "compound", "at", "Map", "##our", "##dit", "and", "were", "reported", "to", "be", "in", "good", "health", "." ], "ids": [ 10357, 12415, 10261, 20718, 10435, 12449, 10309, 11223, 11991, 10106, 10105, 17032, 59550, 10160, 24847, 17964, 19201, 10111, 10309, 15943, 10114, 10347, 10106, 15198, 17004, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Catholic", "Information", "office", "in", "Nairobi", "said", "on", "Monday", "that", "Australian", "Sisters", "Moi", "##ra", "Lynch", ",", "73", ",", "and", "Mary", "Bat", "##chel", "##or", ",", "68", ",", "American", "Father", "Michael", "Barton", ",", "48", ",", "and", "Sudan", "##ese", "Father", "Raphael", "R", "##iel", ",", "48", ",", "were", "held", "in", "a", "prison", "in", "south", "Sudan", "by", "the", "SP", "##LA", "." ], "ids": [ 10117, 15473, 12145, 14301, 10106, 63493, 12415, 10135, 40714, 10189, 12829, 38838, 82447, 10288, 32703, 117, 12545, 117, 10111, 12176, 62949, 58407, 10667, 117, 12370, 117, 10536, 26350, 10631, 48849, 117, 11300, 117, 10111, 28407, 13565, 26350, 58514, 155, 19428, 117, 11300, 117, 10309, 11991, 10106, 169, 20538, 10106, 13144, 28407, 10155, 10105, 22570, 44376, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 1, 9, 9, 9, 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 2, 9, 4, 8, 9, 9, 9, 9, 2, 6, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 9 ] }, { "tokens": [ "It", "said", "Australian", "Sister", "Maureen", "Carey", ",", "52", ",", "and", "Italian", "Brother", "Ranier", "##o", "Ia", "##come", "##lla", ",", "28", ",", "were", "held", "inside", "the", "compound", "." ], "ids": [ 10377, 12415, 12829, 36302, 85403, 32669, 117, 11525, 117, 10111, 11667, 33381, 50926, 10133, 13959, 61643, 11083, 117, 10348, 117, 10309, 11991, 22978, 10105, 59550, 119 ], "entity": [ "O", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 4, 8, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "church", "in", "Australia", "said", "on", "Monday", "Lynch", ",", "Bat", "##chel", "##or", ",", "Barton", "and", "R", "##iel", "were", "held", "in", "a", "prison", "until", "the", "weekend", ",", "when", "they", "were", "moved", "to", "join", "the", "other", "cap", "##tives", "at", "the", "compound", "." ], "ids": [ 10117, 14201, 10106, 11729, 12415, 10135, 40714, 32703, 117, 62949, 58407, 10667, 117, 48849, 10111, 155, 19428, 10309, 11991, 10106, 169, 20538, 11444, 10105, 43440, 117, 10841, 10689, 10309, 13059, 10114, 23707, 10105, 10684, 13337, 37588, 10160, 10105, 59550, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 4, 9, 4, 8, 8, 9, 4, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Catholic", "Information", "Office", "said", "the", "SP", "##LA", "in", "the", "Kenya", "##n", "capital", "had", "attributed", "the", "det", "##ention", "##s", "of", "the", "six", "to", "a", "local", "commander", "and", "had", "promised", "they", "would", "be", "free", "##d", "by", "August", "23", "." ], "ids": [ 10117, 15473, 12145, 13348, 12415, 10105, 22570, 44376, 10106, 10105, 19686, 10115, 12185, 10374, 50199, 10105, 10349, 90372, 10107, 10108, 10105, 12449, 10114, 169, 11436, 27703, 10111, 10374, 77137, 10689, 10894, 10347, 13961, 10162, 10155, 10735, 10328, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 3, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "church", "learned", "in", "a", "recent", "meeting", "with", "the", "local", "commander", "that", "no", "instructions", "to", "release", "the", "prisoners", "were", "received", "and", "they", "would", "be", "held", "until", "investigations", "were", "completed", "." ], "ids": [ 16976, 10105, 14201, 39496, 10106, 169, 19037, 19822, 10169, 10105, 11436, 27703, 10189, 10192, 68026, 10114, 14072, 10105, 44094, 10309, 12296, 10111, 10689, 10894, 10347, 11991, 11444, 87748, 10309, 15782, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "last", "Friday", "they", "were", "visited", "by", "Mons", "##ign", "##or", "Caesar", "Ma", "##zzo", "##lari", ",", "apo", "##stol", "##ic", "administrator", "of", "the", "diocese", "of", "Rum", "##bek", "in", "southern", "Sudan", ",", "and", "an", "SP", "##LA", "administrator", "and", "appeared", "in", "good", "condition", "." ], "ids": [ 10377, 12415, 12469, 30767, 10689, 10309, 30270, 10155, 37870, 58445, 10667, 30159, 13744, 26417, 15187, 117, 34768, 50559, 11130, 67190, 10108, 10105, 59084, 10108, 101664, 25047, 10106, 17156, 28407, 117, 10111, 10151, 22570, 44376, 67190, 10111, 14565, 10106, 15198, 24713, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "On", "August", "17", "the", "mission", "was", "surrounded", "(", "by", "the", "SP", "##LA", ")", "and", "seal", "##ed", "off", "." ], "ids": [ 107, 10576, 10735, 10273, 10105, 17032, 10134, 45785, 113, 10155, 10105, 22570, 44376, 114, 10111, 37985, 10336, 11898, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "evening", "of", "the", "same", "day", "the", "mission", "##aries", "were", "put", "in", "prison", "or", "isolation", "." ], "ids": [ 10117, 42135, 10108, 10105, 11561, 11940, 10105, 17032, 26445, 10309, 14499, 10106, 20538, 10345, 106750, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Later", "the", "mission", "was", "lo", "##ote", "##d", ",", "\"", "it", "added", "." ], "ids": [ 16397, 10105, 17032, 10134, 10406, 24831, 10162, 117, 107, 10271, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Australian", "foreign", "ministry", "official", "said", "the", "charges", "against", "them", "were", "\"", "fairly", "biz", "##arre", "\"", "and", "a", "matter", "for", "concern", "." ], "ids": [ 10313, 12829, 20796, 65338, 14731, 12415, 10105, 31128, 11327, 11345, 10309, 107, 76281, 94912, 35460, 107, 10111, 169, 27904, 10142, 43607, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "Australian", "diplomat", "##s", "in", "Nairobi", "were", "working", "with", "the", "Roman", "Catholic", "church", "in", "southern", "Sudan", "and", "with", "U", ".", "S", ".", "and", "Italian", "diplomat", "##s", "in", "the", "region", "to", "help", "free", "the", "mission", "##aries", "." ], "ids": [ 10357, 12415, 12829, 45652, 10107, 10106, 63493, 10309, 14616, 10169, 10105, 12359, 15473, 14201, 10106, 17156, 28407, 10111, 10169, 158, 119, 156, 119, 10111, 11667, 45652, 10107, 10106, 10105, 12220, 10114, 15217, 13961, 10105, 17032, 26445, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 9, 9, 1, 5, 5, 5, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "SP", "##LA", "has", "fought", "K", "##hart", "##oum", "'", "s", "government", "forces", "in", "the", "south", "since", "1983", "for", "greater", "auto", "##nomy", "or", "independence", "of", "the", "mainly", "Christian", "and", "ani", "##mist", "region", "from", "the", "Mo", "##sle", "##m", ",", "Arab", "##ised", "north", "." ], "ids": [ 10117, 22570, 44376, 10393, 29766, 148, 34567, 88314, 112, 187, 12047, 13729, 10106, 10105, 13144, 11764, 10643, 10142, 25722, 18257, 100395, 10345, 31412, 10108, 10105, 20827, 11757, 10111, 15444, 24987, 12220, 10188, 10105, 34987, 42176, 10147, 117, 17365, 20666, 12756, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 1, 5, 5, 9 ] }, { "tokens": [ "OS", "##CE", "post", "##pone", "##s", "Bosnia", "##n", "municipal", "elections", "." ], "ids": [ 18398, 43161, 11841, 35741, 10107, 29634, 10115, 14935, 22054, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "SAR", "##A", "##J", "##E", "##VO", "1996", "-", "08", "-", "27" ], "ids": [ 97404, 10738, 15417, 11259, 70325, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "U", ".", "S", ".", "diplomat", "in", "charge", "of", "elections", "in", "Bosnia", "announced", "on", "Tuesday", "that", "voting", "for", "municipal", "ass", "##em", "##bli", "##es", "would", "be", "post", "##pone", "##d", "because", "of", "irregular", "##ities", "by", "the", "Ser", "##bs", "in", "register", "##ing", "voters", "." ], "ids": [ 10117, 158, 119, 156, 119, 45652, 10106, 18163, 10108, 22054, 10106, 29634, 13854, 10135, 70245, 10189, 48814, 10142, 14935, 13935, 10451, 48850, 10171, 10894, 10347, 11841, 35741, 10162, 12373, 10108, 55143, 17285, 10155, 10105, 39759, 19528, 10106, 47424, 10230, 55450, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ambassador", "Robert", "Fr", "##owi", "##ck", ",", "representing", "the", "Organisation", "for", "Security", "and", "Cooperation", "in", "Europe", "(", "OS", "##CE", ")", ",", "told", "reporter", "##s", "that", "municipal", "poll", "##s", "due", "on", "September", "14", "with", "other", "Bosnia", "##n", "elections", "would", "be", "put", "off", "." ], "ids": [ 55060, 10820, 33884, 22578, 11263, 117, 31221, 10105, 22223, 10142, 20924, 10111, 97225, 10106, 11767, 113, 18398, 43161, 114, 117, 21937, 41408, 10107, 10189, 14935, 70156, 10107, 10850, 10135, 10596, 10247, 10169, 10684, 29634, 10115, 22054, 10894, 10347, 14499, 11898, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "have", "made", "a", "chairman", "'", "s", "decision", "that", "it", "is", "not", "fe", "##asi", "##ble", "to", "hold", "municipal", "elections", "on", "September", "14", ",", "\"", "said", "Fr", "##owi", "##ck", "." ], "ids": [ 107, 146, 10529, 11019, 169, 27627, 112, 187, 19231, 10189, 10271, 10124, 10472, 34778, 15525, 11203, 10114, 18500, 14935, 22054, 10135, 10596, 10247, 117, 107, 12415, 33884, 22578, 11263, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "He", "said", "no", "exact", "date", "had", "been", "set", "but", "it", "was", "possible", "the", "local", "elections", "would", "take", "place", "in", "the", "spring", "of", "1997", "." ], "ids": [ 10357, 12415, 10192, 45809, 13664, 10374, 10590, 11847, 10473, 10271, 10134, 14128, 10105, 11436, 22054, 10894, 13574, 11192, 10106, 10105, 26053, 10108, 10391, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "According", "to", "OS", "##CE", "officials", ",", "Ser", "##b", "authorities", "have", "presse", "##d", "their", "refugees", "to", "register", "to", "vote", "in", "towns", "now", "under", "Ser", "##b", "control", ",", "but", "which", "used", "to", "have", "Mo", "##sle", "##m", "major", "##ities", "." ], "ids": [ 14156, 10114, 18398, 43161, 27730, 117, 39759, 10457, 28308, 10529, 33834, 10162, 10455, 71797, 10114, 47424, 10114, 18926, 10106, 26656, 11858, 10571, 39759, 10457, 12608, 117, 10473, 10319, 11031, 10114, 10529, 34987, 42176, 10147, 11922, 17285, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Human", "rights", "workers", "say", "authorities", "in", "Serbia", "and", "Bosnia", "##n", "Ser", "##b", "territory", "have", "conducted", "a", "well", "-", "organised", "campaign", "to", "co", "##er", "##ce", "refugees", "into", "register", "##ing", "only", "on", "Ser", "##b", "territory", "and", "failed", "to", "info", "##rm", "them", "of", "their", "rights", "under", "the", "Dayton", "peace", "agreement", "." ], "ids": [ 15426, 16691, 23829, 23763, 28308, 10106, 20141, 10111, 29634, 10115, 39759, 10457, 24399, 10529, 23736, 169, 11206, 118, 54200, 17323, 10114, 11170, 10165, 10419, 71797, 10708, 47424, 10230, 10893, 10135, 39759, 10457, 24399, 10111, 20775, 10114, 26978, 19341, 11345, 10108, 10455, 16691, 10571, 10105, 74767, 28101, 25432, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Diplomat", "##s", "say", "the", "effect", "of", "the", "electoral", "engineering", "would", "be", "to", "establish", "political", "control", "over", "districts", "they", "conquered", "and", "ethnic", "##ally", "clean", "##sed", "in", "war", "." ], "ids": [ 101849, 10107, 23763, 10105, 18514, 10108, 10105, 29125, 25008, 10894, 10347, 10114, 33623, 13736, 12608, 10491, 24412, 10689, 108028, 10111, 34216, 19777, 55911, 16219, 10106, 10338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "response", "of", "the", "Bosnia", "##n", "Ser", "##bs", "to", "the", "OS", "##CE", "'", "s", "announcement", "was", "not", "immediately", "clear", "." ], "ids": [ 10117, 21001, 10108, 10105, 29634, 10115, 39759, 19528, 10114, 10105, 18398, 43161, 112, 187, 76557, 10134, 10472, 24029, 24866, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Bosnia", "##n", "Ser", "##b", "leaders", "have", "hin", "##ted", "they", "would", "boy", "##cott", "the", "poll", "if", "the", "municipal", "elections", "were", "post", "##pone", "##d", ",", "or", "go", "ahead", "with", "their", "own", "." ], "ids": [ 16976, 29634, 10115, 39759, 10457, 24155, 10529, 19911, 11912, 10689, 10894, 26905, 48426, 10105, 70156, 12277, 10105, 14935, 22054, 10309, 11841, 35741, 10162, 117, 10345, 11783, 35629, 10169, 10455, 12542, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Bosnia", "##n", "Ser", "##b", "cabinet", ",", "in", "a", "letter", "to", "the", "OS", "##CE", ",", "said", "on", "Monday", "that", "any", "delay", "of", "local", "elections", "would", "be", "\"", "a", "direct", "and", "flag", "##rant", "violation", "f", "##o", "the", "Dayton", "agreement", "\"", "." ], "ids": [ 10117, 29634, 10115, 39759, 10457, 33801, 117, 10106, 169, 19310, 10114, 10105, 18398, 43161, 117, 12415, 10135, 40714, 10189, 11178, 76497, 10108, 11436, 22054, 10894, 10347, 107, 169, 16934, 10111, 31773, 18348, 88993, 174, 10133, 10105, 74767, 25432, 107, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "The", "Ser", "##bs", ",", "who", "ad", "##minister", "half", "of", "Bosnia", "in", "a", "Ser", "##b", "republic", ",", "said", "they", "had", "met", "all", "conditions", "for", "holding", "the", "September", "elections", "." ], "ids": [ 10117, 39759, 19528, 117, 10479, 10840, 25957, 13877, 10108, 29634, 10106, 169, 39759, 10457, 108499, 117, 12415, 10689, 10374, 10428, 10435, 17315, 10142, 29008, 10105, 10596, 22054, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Diplomat", "##s", "fear", "that", "the", "crisis", "could", "cast", "doubt", "over", "the", "entire", "election", "process", ",", "which", "already", "appears", "set", "to", "con", "##fir", "##m", "Bosnia", "'", "s", "ethnic", "partition", "rather", "than", "its", "rein", "##teg", "##ration", "as", "the", "Dayton", "peace", "agreement", "had", "planned", "." ], "ids": [ 101849, 10107, 44929, 10189, 10105, 22859, 12174, 18922, 86697, 10491, 10105, 19192, 13685, 15138, 117, 10319, 19034, 20296, 11847, 10114, 10173, 61644, 10147, 29634, 112, 187, 34216, 96787, 16863, 11084, 10474, 74720, 102318, 19466, 10146, 10105, 74767, 28101, 25432, 10374, 24292, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "talks", "in", "Che", "##chny", "##a", "as", "Le", "##bed", "wait", "##s", "for", "Ye", "##lts", "##in", "." ], "ids": [ 10287, 56672, 10106, 44131, 95063, 10113, 10146, 10281, 33627, 83279, 10107, 10142, 20567, 72847, 10245, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "D", "##mit", "##ry", "Ku", "##zne", "##ts" ], "ids": [ 141, 15772, 10908, 49869, 23186, 10806 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "NO", "##V", "##Y", "##E", "AT", "##AG", "##I", ",", "Russia", "1996", "-", "08", "-", "27" ], "ids": [ 49307, 11779, 14703, 11259, 30554, 109865, 11281, 117, 14664, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "and", "rebel", "military", "commander", "##s", "finally", "met", "in", "Che", "##chny", "##a", "on", "Tuesday", "for", "delayed", "talks", "aimed", "at", "finali", "##sing", "a", "cea", "##sef", "##ire", "arranged", "last", "week", "by", "President", "Boris", "Ye", "##lts", "##in", "'", "s", "en", "##voy", "Alexander", "Le", "##bed", "." ], "ids": [ 13463, 10111, 56696, 14041, 27703, 10107, 21256, 10428, 10106, 44131, 95063, 10113, 10135, 70245, 10142, 67058, 56672, 53004, 10160, 83046, 16357, 169, 25578, 107749, 11627, 39591, 12469, 16118, 10155, 12811, 21463, 20567, 72847, 10245, 112, 187, 10110, 81843, 12063, 10281, 33627, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "The", "Russian", "army", "commander", "in", "the", "region", ",", "General", "V", "##ya", "##ches", "##lav", "Ti", "##kh", "##omir", "##ov", ",", "arrived", "at", "the", "rebel", "-", "held", "village", "of", "Nov", "##ye", "Ata", "##gi", ",", "some", "20", "km", "(", "12", "miles", ")", "south", "of", "the", "Che", "##chen", "capital", "G", "##ro", "##zny", "for", "discussions", "with", "rebel", "chief", "-", "of", "-", "staff", "As", "##lan", "Mask", "##hado", "##v", "." ], "ids": [ 10117, 13463, 17977, 27703, 10106, 10105, 12220, 117, 11220, 159, 10679, 16272, 25768, 29033, 48502, 77516, 11024, 117, 22584, 10160, 10105, 56696, 118, 11991, 11607, 10108, 36779, 12871, 68795, 11210, 117, 11152, 10197, 10204, 113, 10186, 14148, 114, 13144, 10108, 10105, 44131, 11909, 12185, 144, 10567, 25424, 10142, 66608, 10169, 56696, 19421, 118, 10108, 118, 18927, 10882, 12055, 69189, 54719, 10477, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "But", "Le", "##bed", "himself", ",", "the", "Kr", "##emlin", "security", "chief", ",", "is", "still", "waiting", "back", "in", "Moscow", "to", "meet", "Ye", "##lts", "##in", "over", "his", "plans", "for", "a", "lasting", "political", "settlement", "in", "Che", "##chny", "##a", "." ], "ids": [ 16976, 10281, 33627, 14764, 117, 10105, 17640, 110169, 21849, 19421, 117, 10124, 12647, 62052, 12014, 10106, 18744, 10114, 23267, 20567, 72847, 10245, 10491, 10226, 18195, 10142, 169, 88428, 13736, 23931, 10106, 44131, 95063, 10113, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "It", "##ar", "-", "Tas", "##s", "news", "agency", "quoted", "the", "Kr", "##emlin", "press", "service", "as", "saying", "Ye", "##lts", "##in", ",", "who", "left", "for", "a", "state", "holiday", "home", "near", "Moscow", "on", "Monday", ",", "would", "hold", "no", "working", "meetings", "on", "Tuesday", "." ], "ids": [ 10377, 10354, 118, 57387, 10107, 14424, 34649, 70676, 10105, 17640, 110169, 21040, 11989, 10146, 22807, 20567, 72847, 10245, 117, 10479, 12153, 10142, 169, 11388, 71806, 11816, 12883, 18744, 10135, 40714, 117, 10894, 18500, 10192, 14616, 47307, 10135, 70245, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Le", "##bed", "inter", "##rupted", "talks", "with", "Che", "##chny", "##a", "'", "s", "separat", "##ists", "on", "a", "political", "deal", "on", "Sunday", ",", "saying", "he", "had", "to", "consul", "##t", "with", "Ye", "##lts", "##in", "." ], "ids": [ 10281, 33627, 22021, 63133, 56672, 10169, 44131, 95063, 10113, 112, 187, 81806, 18206, 10135, 169, 13736, 19918, 10135, 19731, 117, 22807, 10261, 10374, 10114, 53704, 10123, 10169, 20567, 72847, 10245, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "After", "a", "meeting", "failed", "to", "materiali", "##se", "on", "Monday", ",", "Le", "##bed", "'", "s", "spoke", "##sman", "said", "he", "might", "meet", "the", "president", "on", "Tuesday", "." ], "ids": [ 11301, 169, 19822, 20775, 10114, 66407, 10341, 10135, 40714, 117, 10281, 33627, 112, 187, 50005, 24305, 12415, 10261, 20970, 23267, 10105, 12931, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Ye", "##lts", "##in", "'", "s", "spoke", "##sman", "re", "##bu", "##ffe", "##d", "the", "suggest", "##ion", ",", "saying", "the", "president", "had", "left", "Moscow", "for", "a", "holiday", "near", "the", "capital", "." ], "ids": [ 16976, 20567, 72847, 10245, 112, 187, 50005, 24305, 11639, 12177, 27008, 10162, 10105, 56874, 11046, 117, 22807, 10105, 12931, 10374, 12153, 18744, 10142, 169, 71806, 12883, 10105, 12185, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Russian", "##s", "post", "##pone", "##d", "the", "talks", "after", "a", "Che", "##chen", "band", "disa", "##rmed", "a", "column", "of", "interior", "ministry", "troops", "on", "Sunday", "." ], "ids": [ 10117, 13463, 10107, 11841, 35741, 10162, 10105, 56672, 10662, 169, 44131, 11909, 11570, 36474, 98119, 169, 41278, 10108, 14806, 65338, 20836, 10135, 19731, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Che", "##chen", "##s", "said", "a", "ren", "##ega", "##de", "group", "seized", "the", "weapons", "and", "said", "on", "Monday", "they", "had", "all", "been", "returned", "." ], "ids": [ 10117, 44131, 11909, 10107, 12415, 169, 63256, 19172, 10253, 11795, 80176, 10105, 31881, 10111, 12415, 10135, 40714, 10689, 10374, 10435, 10590, 14030, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Russian", "command", "insisted", "that", "not", "all", "the", "weapons", "were", "the", "same", "as", "those", "taken", "." ], "ids": [ 10117, 13463, 20818, 110660, 10189, 10472, 10435, 10105, 31881, 10309, 10105, 11561, 10146, 12676, 15109, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tas", "##s", "said", "the", "weapons", "and", "the", "practical", "implementation", "of", "the", "cea", "##sef", "##ire", "signed", "by", "Le", "##bed", "and", "Mask", "##hado", "##v", "last", "Thursday", "would", "be", "on", "the", "agenda", "of", "today", "'", "s", "talks", "." ], "ids": [ 57387, 10107, 12415, 10105, 31881, 10111, 10105, 52940, 53187, 10108, 10105, 25578, 107749, 11627, 14775, 10155, 10281, 33627, 10111, 69189, 54719, 10477, 12469, 67067, 10894, 10347, 10135, 10105, 70231, 10108, 18745, 112, 187, 56672, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nei", "##ther", "spoke", "to", "reporter", "##s", "before", "the", "meeting", ",", "which", "started", "around", "10", ".", "45", "a", ".", "m", ".", "(", "06", "##45", "GMT", ")", "." ], "ids": [ 25822, 22623, 50005, 10114, 41408, 10107, 11360, 10105, 19822, 117, 10319, 13457, 12166, 10150, 119, 10827, 169, 119, 181, 119, 113, 10719, 76977, 20362, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Also", "in", "Nov", "##ye", "Ata", "##gi", "on", "Tuesday", "morning", ",", "was", "Tim", "G", "##uld", "##iman", "##n", ",", "the", "Swiss", "diplomat", "who", "heads", "the", "Che", "##chny", "##a", "mission", "of", "the", "Organisation", "for", "Security", "and", "Cooperation", "in", "Europe", "(", "OS", "##CE", ")", "." ], "ids": [ 20593, 10106, 36779, 12871, 68795, 11210, 10135, 70245, 28757, 117, 10134, 15318, 144, 43165, 45357, 10115, 117, 10105, 22984, 45652, 10479, 42399, 10105, 44131, 95063, 10113, 17032, 10108, 10105, 22223, 10142, 20924, 10111, 97225, 10106, 11767, 113, 18398, 43161, 114, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 2, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "G", "##uld", "##iman", "##n", ",", "who", "helped", "broke", "##r", "an", "earlier", "tr", "##uce", "in", "May", ",", "was", "not", "taking", "part", "in", "the", "Ti", "##kh", "##omir", "##ov", "-", "Mask", "##hado", "##v", "talks", "." ], "ids": [ 144, 43165, 45357, 10115, 117, 10479, 20890, 30500, 10129, 10151, 18905, 32221, 24075, 10106, 10725, 117, 10134, 10472, 18084, 10668, 10106, 10105, 29033, 48502, 77516, 11024, 118, 69189, 54719, 10477, 56672, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9, 9 ] }, { "tokens": [ "Le", "##bed", "'", "s", "peace", "mission", "this", "month", "has", "stopped", "some", "of", "the", "worst", "fighting", "of", "the", "20", "-", "month", "-", "old", "conflict", "." ], "ids": [ 10281, 33627, 112, 187, 28101, 17032, 10531, 14064, 10393, 40949, 11152, 10108, 10105, 62006, 27535, 10108, 10105, 10197, 118, 14064, 118, 12898, 24620, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "However", ",", "tension", "on", "the", "ground", "indicates", "that", "it", "could", "falt", "##er", "if", "the", "momentum", "for", "a", "settlement", "is", "not", "maintained", "." ], "ids": [ 12209, 117, 55027, 10135, 10105, 16912, 50239, 10189, 10271, 12174, 100865, 10165, 12277, 10105, 89635, 10142, 169, 23931, 10124, 10472, 32974, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Three", "Russian", "service", "##men", "were", "wounded", "in", "a", "total", "of", "six", "shooting", "incidents", "over", "##night", ",", "It", "##ar", "-", "Tas", "##s", "news", "agency", "quoted", "the", "Russian", "military", "as", "saying", "on", "Tuesday", "morning", "." ], "ids": [ 15139, 13463, 11989, 11418, 10309, 39127, 10106, 169, 11339, 10108, 12449, 38969, 73451, 10491, 45217, 117, 10377, 10354, 118, 57387, 10107, 14424, 34649, 70676, 10105, 13463, 14041, 10146, 22807, 10135, 70245, 28757, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RI", "##A", "news", "agency", "quoted", "an", "army", "source", "ac", "##cus", "##ing", "rebel", "fighters", "of", "failing", "to", "turn", "up", "for", "joint", "Russian", "-", "Che", "##chen", "police", "patrol", "##s", "in", "some", "districts", "of", "the", "capital", "G", "##ro", "##zny", "on", "Tuesday", "." ], "ids": [ 56658, 10738, 14424, 34649, 70676, 10151, 17977, 15247, 13621, 14319, 10230, 56696, 62450, 10108, 72103, 10114, 18923, 10741, 10142, 25680, 13463, 118, 44131, 11909, 15034, 62976, 10107, 10106, 11152, 24412, 10108, 10105, 12185, 144, 10567, 25424, 10135, 70245, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "But", "the", "separat", "##ist", "command", "told", "Inter", "##fa", "##x", "news", "agency", "the", "patrol", "##s", ",", "part", "of", "the", "tr", "##uce", "broke", "##red", "by", "Le", "##bed", "last", "week", ",", "would", "begin", "on", "Tuesday", "after", "delay", "##s", "for", "\"", "technical", "reasons", "\"", "." ], "ids": [ 16976, 10105, 81806, 11293, 20818, 21937, 24362, 13369, 10686, 14424, 34649, 10105, 62976, 10107, 117, 10668, 10108, 10105, 32221, 24075, 30500, 15711, 10155, 10281, 33627, 12469, 16118, 117, 10894, 16135, 10135, 70245, 10662, 76497, 10107, 10142, 107, 29914, 31725, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", "'", "s", "spoke", "##sman", "said", "he", "might", "meet", "officials", "during", "his", "break", ",", "but", "indicated", "Le", "##bed", "was", "low", "on", "the", "list", "by", "saying", "Ye", "##lts", "##in", "would", "need", "time", "to", "study", "the", "proposals", "before", "talking", "to", "him", "." ], "ids": [ 20567, 72847, 10245, 112, 187, 50005, 24305, 12415, 10261, 20970, 23267, 27730, 10939, 10226, 24194, 117, 10473, 37944, 10281, 33627, 10134, 15626, 10135, 10105, 13416, 10155, 22807, 20567, 72847, 10245, 10894, 17367, 10635, 10114, 14687, 10105, 93646, 11360, 78254, 10114, 10957, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "news", "agencies", "also", "quoted", "the", "Kr", "##emlin", "spoke", "##sman", "as", "saying", "that", "Le", "##bed", "'", "s", "representatives", "had", "not", "sought", "a", "meeting", ",", "hin", "##ting", "at", "an", "attempt", "by", "the", "president", "to", "put", "his", "popular", "and", "out", "##sp", "##oken", "pro", "##teg", "##e", "in", "his", "place", "with", "a", "less", "##on", "on", "protocol", "." ], "ids": [ 13463, 14424, 49198, 10379, 70676, 10105, 17640, 110169, 50005, 24305, 10146, 22807, 10189, 10281, 33627, 112, 187, 49959, 10374, 10472, 32570, 169, 19822, 117, 19911, 12141, 10160, 10151, 21395, 10155, 10105, 12931, 10114, 14499, 10226, 12600, 10111, 10950, 54609, 91556, 11284, 102318, 10112, 10106, 10226, 11192, 10169, 169, 15306, 10263, 10135, 69937, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", ",", "65", ",", "has", "kept", "a", "low", "profile", "since", "he", "was", "re", "##ele", "##cted", "in", "July", ",", "pro", "##mpt", "##ing", "new", "sp", "##ecu", "##lation", "that", "the", "two", "heart", "attacks", "he", "suffered", "last", "year", "and", "a", "rum", "##oured", "drinking", "problem", "could", "be", "taking", "their", "toll", ",", "weak", "##ening", "his", "gr", "##ip", "on", "affairs", "of", "state", "." ], "ids": [ 20567, 72847, 10245, 117, 10843, 117, 10393, 26546, 169, 15626, 29549, 11764, 10261, 10134, 11639, 12739, 27756, 10106, 11112, 117, 11284, 109361, 10230, 10751, 32650, 97038, 19718, 10189, 10105, 10551, 21736, 26483, 10261, 26090, 12469, 10924, 10111, 169, 52522, 73499, 68351, 18077, 12174, 10347, 18084, 10455, 81754, 117, 61285, 24428, 10226, 30518, 17437, 10135, 43417, 10108, 11388, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aid", "##es", "have", "dismissed", "such", "sp", "##ecu", "##lation", ",", "ins", "##isti", "##ng", "that", "he", "simply", "needs", "a", "rest", "after", "his", "ene", "##rge", "##tic", "election", "campaign", "." ], "ids": [ 68407, 10171, 10529, 59379, 11049, 32650, 97038, 19718, 117, 15498, 23620, 10376, 10189, 10261, 26097, 28615, 169, 17333, 10662, 10226, 33723, 28163, 13275, 13685, 17323, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "anal", "##yst", "##s", "say", "the", "Kr", "##emlin", "leader", ",", "whose", "order", "sending", "troops", "and", "tanks", "into", "Che", "##chny", "##a", "in", "1994", "started", "Russia", "'", "s", "ill", "-", "fate", "##d", "military", "campaign", ",", "could", "merely", "be", "re", "##lu", "##cta", "##nt", "to", "put", "his", "name", "to", "a", "peace", "process", "which", "might", "fall", "apart", "." ], "ids": [ 13885, 106615, 62769, 10107, 23763, 10105, 17640, 110169, 15014, 117, 16879, 12990, 67306, 20836, 10111, 46731, 10708, 44131, 95063, 10113, 10106, 10444, 13457, 14664, 112, 187, 32941, 118, 75633, 10162, 14041, 17323, 117, 12174, 70807, 10347, 11639, 11435, 24290, 10368, 10114, 14499, 10226, 11324, 10114, 169, 28101, 15138, 10319, 20970, 18042, 43084, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Le", "##bed", ",", "who", "has", "no", "real", "power", "without", "his", "boss", "and", "has", "hin", "##ted", "at", "dark", "forces", "in", "Moscow", "working", "against", "him", ",", "appears", "to", "think", "a", "deal", "will", "not", "stick", "without", "strong", "backing", "from", "Ye", "##lts", "##in", "." ], "ids": [ 16976, 10281, 33627, 117, 10479, 10393, 10192, 13486, 13183, 13663, 10226, 48246, 10111, 10393, 19911, 11912, 10160, 25100, 13729, 10106, 18744, 14616, 11327, 10957, 117, 20296, 10114, 27874, 169, 19918, 11337, 10472, 84081, 13663, 18093, 31962, 10188, 20567, 72847, 10245, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "His", "proposals", "have", "not", "been", "spelled", "out", "but", "are", "expected", "to", "involve", "a", "com", "##pro", "##mise", "between", "the", "separat", "##ists", "'", "demand", "for", "independence", "and", "Moscow", "'", "s", "ins", "##isten", "##ce", "that", "Che", "##chny", "##a", "remain", "part", "of", "the", "Russian", "Federation", "." ], "ids": [ 11597, 93646, 10529, 10472, 10590, 107825, 10950, 10473, 10301, 25973, 10114, 85232, 169, 10212, 73099, 19738, 10948, 10105, 81806, 18206, 112, 34394, 10142, 31412, 10111, 18744, 112, 187, 15498, 17146, 10419, 10189, 44131, 95063, 10113, 25430, 10668, 10108, 10105, 13463, 18975, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Slovenia", "and", "Poland", "target", "EU", ",", "NATO", "membership", "." ], "ids": [ 34583, 10111, 17879, 28564, 17751, 117, 21662, 39689, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "B-ORG", "O", "B-ORG", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 3, 9, 3, 9, 9 ] }, { "tokens": [ "L", "##J", "##UB", "##L", "##J", "##AN", "##A", "1996", "-", "08", "-", "27" ], "ids": [ 149, 15417, 82439, 11369, 15417, 41275, 10738, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Slovenia", "and", "Poland", "pl", "##ed", "##ged", "to", "inte", "##nsi", "##fy", "cooperation", "on", "Tuesday", "and", "rein", "##forced", "their", "determination", "to", "join", "the", "European", "Union", "and", "NATO", "at", "the", "earliest", "possible", "date", "." ], "ids": [ 34583, 10111, 17879, 20648, 10336, 18832, 10114, 14168, 22726, 24203, 56547, 10135, 70245, 10111, 74720, 69794, 10455, 96461, 10114, 23707, 10105, 11914, 11457, 10111, 21662, 10160, 10105, 34913, 14128, 13664, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Polish", "President", "Aleksander", "Kwa", "##sni", "##ewski", "and", "his", "Slovenia", "##n", "counter", "##part", ",", "Milan", "Ku", "##can", ",", "met", "for", "talks", "at", "the", "start", "of", "a", "two", "-", "day", "visit", "to", "Slovenia", "by", "Kwa", "##sni", "##ewski", "." ], "ids": [ 19870, 12811, 30960, 48511, 67826, 64363, 10111, 10226, 34583, 10115, 46298, 48433, 117, 15807, 49869, 24154, 117, 10428, 10142, 56672, 10160, 10105, 15148, 10108, 169, 10551, 118, 11940, 27541, 10114, 34583, 10155, 48511, 67826, 64363, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 9, 9, 2, 6, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 8, 9 ] }, { "tokens": [ "It", "was", "their", "fourth", "meeting", "this", "year", "." ], "ids": [ 10377, 10134, 10455, 16918, 19822, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "in", "a", "statement", "they", "agreed", "to", "have", "regular", "telephone", "contact", "to", "discuss", "progress", "in", "strength", "##ening", "ties", "with", "the", "West", "." ], "ids": [ 11696, 12415, 10106, 169, 33311, 10689, 25577, 10114, 10529, 15670, 69009, 20637, 10114, 71695, 40316, 10106, 33318, 24428, 45169, 10169, 10105, 11164, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "We", "ex", "##pect", "our", "cooperation", "will", "help", "both", "countries", "towards", "entering", "the", "European", "Union", "and", "NATO", ",", "\"", "Kwa", "##sni", "##ewski", "said", "." ], "ids": [ 107, 12865, 11419, 51511, 17446, 56547, 11337, 15217, 11408, 15911, 18095, 44824, 10105, 11914, 11457, 10111, 21662, 117, 107, 48511, 67826, 64363, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "similar", "amb", "##itions", "as", "far", "as", "our", "internal", "development", "and", "international", "life", "is", "concerned", ",", "\"", "Ku", "##can", "said", "." ], "ids": [ 107, 12865, 10529, 13213, 10559, 52213, 10146, 13301, 10146, 17446, 29868, 13405, 10111, 12533, 12103, 10124, 47451, 117, 107, 49869, 24154, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Poland", "and", "Slovenia", "are", "hop", "##ing", "to", "be", "among", "the", "first", "group", "of", "former", "eastern", "bloc", "countries", "to", "join", "the", "European", "Union", "and", "NATO", "." ], "ids": [ 17879, 10111, 34583, 10301, 26369, 10230, 10114, 10347, 13328, 10105, 10422, 11795, 10108, 11775, 18677, 65360, 15911, 10114, 23707, 10105, 11914, 11457, 10111, 21662, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 9 ] }, { "tokens": [ "They", "have", "already", "signed", "an", "association", "agreement", "with", "the", "European", "Union", "and", "are", "both", "part", "of", "the", "Central", "European", "Free", "Trade", "Area", ",", "which", "also", "comprises", "Hungary", ",", "Slovakia", "and", "the", "Czech", "Republic", "." ], "ids": [ 11696, 10529, 19034, 14775, 10151, 18061, 25432, 10169, 10105, 11914, 11457, 10111, 10301, 11408, 10668, 10108, 10105, 11885, 11914, 16122, 15006, 17815, 117, 10319, 10379, 58633, 24601, 117, 43031, 10111, 10105, 22148, 13681, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Slovenia", "'", "s", "trade", "with", "Poland", "rose", "to", "$", "142", ".", "3", "million", "in", "1995", "from", "$", "118", ".", "8", "million", "in", "1994", "." ], "ids": [ 34583, 112, 187, 18908, 10169, 17879, 29467, 10114, 109, 19893, 119, 124, 12473, 10106, 10436, 10188, 109, 17515, 119, 129, 12473, 10106, 10444, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "During", "his", "visit", "to", "Slovenia", ",", "Kwa", "##sni", "##ewski", "is", "also", "scheduled", "to", "meet", "Prime", "Minister", "Janez", "Dr", "##nov", "##sek", ",", "representatives", "of", "Slovenia", "##n", "political", "parties", "and", "representatives", "of", "the", "Chamber", "of", "Economy", "." ], "ids": [ 12550, 10226, 27541, 10114, 34583, 117, 48511, 67826, 64363, 10124, 10379, 34081, 10114, 23267, 19924, 14355, 110227, 11612, 32422, 57070, 117, 49959, 10108, 34583, 10115, 13736, 18708, 10111, 49959, 10108, 10105, 32419, 10108, 37493, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "National", "##ists", "want", "Il", "##ies", "##cu", "ou", "##sted", "for", "Hungary", "pa", "##ct", "." ], "ids": [ 10655, 18206, 21528, 10282, 11624, 12352, 10431, 36018, 10142, 24601, 10931, 14526, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "B", "##UC", "##HA", "##RE", "##ST", "1996", "-", "08", "-", "27" ], "ids": [ 139, 93089, 58132, 66014, 32995, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Junior", "National", "##ist", "members", "of", "Romania", "'", "s", "ruling", "coalition", "called", "on", "Tuesday", "for", "the", "im", "##pea", "##ch", "##ment", "of", "President", "Ion", "Il", "##ies", "##cu", "for", "backing", "a", "friendship", "treaty", "with", "neighbouring", "Hungary", "." ], "ids": [ 16414, 10655, 11293, 12464, 10108, 13927, 112, 187, 50788, 41028, 11552, 10135, 70245, 10142, 10105, 10211, 76484, 10269, 10426, 10108, 12811, 30132, 10282, 11624, 12352, 10142, 31962, 169, 74447, 56353, 10169, 79475, 24601, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Il", "##ies", "##cu", "'", "s", "Party", "of", "Social", "Democracy", ",", "the", "senior", "coalition", "partner", ",", "immediately", "dismissed", "the", "National", "Unity", "Party", "(", "P", "##UN", "##R", ")", "demand", "as", "c", "##rude", "election", "##eering", "." ], "ids": [ 10282, 11624, 12352, 112, 187, 12529, 10108, 12824, 45762, 117, 10105, 17843, 41028, 22825, 117, 24029, 59379, 10105, 10655, 62947, 12529, 113, 153, 69849, 11273, 114, 34394, 10146, 171, 97417, 13685, 81065, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "a", "des", "##perate", "move", "by", "the", "P", "##UN", "##R", ",", "which", "is", "losing", "its", "only", "reason", "for", "existing", "ahead", "of", "the", "electoral", "campaign", ",", "\"", "said", "PD", "##SR", "executive", "president", "Adrian", "Nas", "##tase", "." ], "ids": [ 107, 10377, 10124, 169, 10139, 71470, 18577, 10155, 10105, 153, 69849, 11273, 117, 10319, 10124, 27817, 10474, 10893, 27949, 10142, 26636, 35629, 10108, 10105, 29125, 17323, 117, 107, 12415, 65535, 52238, 22676, 12931, 23928, 40751, 60095, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "\"", "This", "treaty", "is", "both", "necessary", "and", "good", ",", "\"", "Nas", "##tase", "said", ",", "adding", "that", "the", "P", "##UN", "##R", "'", "s", "stan", "##ce", "was", "threat", "##ening", "its", "position", "in", "the", "government", "." ], "ids": [ 107, 10747, 56353, 10124, 11408, 27039, 10111, 15198, 117, 107, 40751, 60095, 12415, 117, 44841, 10189, 10105, 153, 69849, 11273, 112, 187, 45244, 10419, 10134, 41256, 24428, 10474, 12956, 10106, 10105, 12047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "treaty", "agreed", "une", "##xpected", "##ly", "two", "weeks", "ago", "will", "end", "years", "of", "disputes", "over", "the", "status", "of", "Romania", "'", "s", "large", "ethnic", "Hungarian", "minority", "." ], "ids": [ 10117, 56353, 25577, 10231, 101239, 10454, 10551, 20750, 36390, 11337, 11572, 10855, 10108, 89357, 10491, 10105, 14042, 10108, 13927, 112, 187, 12077, 34216, 24364, 54147, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "It", "will", "also", "bo", "##ost", "both", "countries", "'", "chances", "of", "admission", "to", "NATO", "and", "the", "European", "Union", "." ], "ids": [ 10377, 11337, 10379, 20506, 18239, 11408, 15911, 112, 84632, 10108, 84153, 10114, 21662, 10111, 10105, 11914, 11457, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 3, 7, 9 ] }, { "tokens": [ "\"", "If", "they", "(", "the", "P", "##UN", "##R", ")", "are", "so", "ve", "##xe", "##d", ",", "they", "could", "leave", "the", "government", ".", ".", "." ], "ids": [ 107, 14535, 10689, 113, 10105, 153, 69849, 11273, 114, 10301, 10380, 10323, 16074, 10162, 117, 10689, 12174, 21964, 10105, 12047, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "might", "also", "help", "them", "to", "do", "it", ",", "if", "they", "go", "on", "like", "this", ",", "\"", "he", "said", "." ], "ids": [ 12865, 20970, 10379, 15217, 11345, 10114, 10149, 10271, 117, 12277, 10689, 11783, 10135, 11850, 10531, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "P", "##UN", "##R", "holds", "four", "key", "mini", "##stri", "##es", "-", "-", "justice", ",", "transport", ",", "agriculture", "and", "communications", "." ], "ids": [ 10117, 153, 69849, 11273, 28278, 11598, 18444, 25103, 34393, 10171, 118, 118, 25791, 117, 16024, 117, 29309, 10111, 42919, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##UN", "##R", "leader", "Gheorghe", "Fun", "##ar", "said", "in", "a", "statement", "Il", "##ies", "##cu", ",", "in", "power", "since", "the", "fall", "of", "communis", "##m", "in", "1989", ",", "should", "be", "im", "##pea", "##ched", "for", "tre", "##ason", "for", "com", "##pro", "##mising", "on", "the", "issue", "of", "ethnic", "Hungarian", "minority", "rights", "in", "the", "treaty", "due", "to", "be", "signed", "next", "month", "." ], "ids": [ 153, 69849, 11273, 15014, 46907, 47989, 10354, 12415, 10106, 169, 33311, 10282, 11624, 12352, 117, 10106, 13183, 11764, 10105, 18042, 10108, 75095, 10147, 10106, 10524, 117, 14819, 10347, 10211, 76484, 35456, 10142, 11617, 64064, 10142, 10212, 73099, 81654, 10135, 10105, 15557, 10108, 34216, 24364, 54147, 16691, 10106, 10105, 56353, 10850, 10114, 10347, 14775, 13451, 14064, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fun", "##ar", "'", "s", "call", "came", "on", "the", "ev", "##e", "of", "the", "official", "launch", "of", "Il", "##ies", "##cu", "'", "s", "campaign", "for", "a", "new", "term", "at", "November", "3", "poll", "##s", "." ], "ids": [ 47989, 10354, 112, 187, 20575, 13383, 10135, 10105, 38034, 10112, 10108, 10105, 14731, 29227, 10108, 10282, 11624, 12352, 112, 187, 17323, 10142, 169, 10751, 13719, 10160, 10819, 124, 70156, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "appeal", "to", "the", "opposition", "to", "back", "his", "attempt", "to", "ou", "##st", "Il", "##ies", "##cu", "was", "unlikely", "to", "succeed", ",", "anal", "##yst", "##s", "said", "." ], "ids": [ 11597, 44861, 10114, 10105, 21227, 10114, 12014, 10226, 21395, 10114, 10431, 10562, 10282, 11624, 12352, 10134, 107914, 10114, 94615, 117, 106615, 62769, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Il", "##ies", "##cu", "has", "invited", "political", "leaders", "to", "a", "meeting", "on", "Thursday", "to", "discuss", "the", "final", "form", "of", "the", "pa", "##ct", "which", "both", "Romanian", "and", "Hungarian", "nationalist", "##s", "oppose", "for", "different", "reasons", "." ], "ids": [ 10282, 11624, 12352, 10393, 33392, 13736, 24155, 10114, 169, 19822, 10135, 67067, 10114, 71695, 10105, 11070, 12188, 10108, 10105, 10931, 14526, 10319, 11408, 29543, 10111, 24364, 99451, 10107, 53037, 10142, 12902, 31725, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Presidential", "officials", "were", "not", "available", "to", "comment", "on", "the", "call", "for", "Il", "##ies", "##cu", "'", "s", "im", "##pea", "##ch", "##ment", "." ], "ids": [ 55505, 27730, 10309, 10472, 14579, 10114, 49641, 10135, 10105, 20575, 10142, 10282, 11624, 12352, 112, 187, 10211, 76484, 10269, 10426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Estonian", "MP", "##S", "see", "little", "hope", "of", "elect", "##ing", "president", "." ], "ids": [ 73638, 27211, 10731, 12888, 16745, 50725, 10108, 106095, 10230, 12931, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bel", "##inda", "Gold", "##smith" ], "ids": [ 47197, 30291, 14363, 36837 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "TA", "##LL", "##IN", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 91075, 82834, 27128, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Estonia", "'", "s", "parliament", "failed", "for", "a", "second", "time", "to", "elect", "a", "president", "on", "Tuesday", ",", "dealing", "a", "blow", "to", "incumbent", "Lennart", "Mer", "##i", "and", "push", "##ing", "the", "country", "towards", "stal", "##ema", "##te", "in", "its", "choice", "of", "a", "new", "head", "of", "state", "." ], "ids": [ 31475, 112, 187, 40519, 20775, 10142, 169, 11132, 10635, 10114, 106095, 169, 12931, 10135, 70245, 117, 73082, 169, 106194, 10114, 63122, 102034, 10734, 10116, 10111, 68052, 10230, 10105, 12723, 18095, 17844, 18089, 10216, 10106, 10474, 30865, 10108, 169, 10751, 13578, 10108, 11388, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nei", "##ther", "Mer", "##i", ",", "who", "over", "##saw", "Estonia", "'", "s", "first", "steps", "into", "state", "##hood", "after", "the", "collapse", "of", "the", "Soviet", "Union", ",", "nor", "his", "arch", "-", "rival", ",", "former", "communist", "Arnold", "R", "##uut", "##el", ",", "have", "secured", "the", "68", "votes", "necessary", "from", "the", "101", "-", "member", "parliament", "." ], "ids": [ 25822, 22623, 10734, 10116, 117, 10479, 10491, 82978, 31475, 112, 187, 10422, 50879, 10708, 11388, 30123, 10662, 10105, 64306, 10108, 10105, 15277, 11457, 117, 31515, 10226, 69154, 118, 24792, 117, 11775, 64574, 17733, 155, 61645, 10570, 117, 10529, 57202, 10105, 12370, 24659, 27039, 10188, 10105, 14123, 118, 12008, 40519, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mer", "##i", "gar", "##nere", "##d", "49", "votes", "and", "Mer", "##i", "34", "in", "Tuesday", "'", "s", "ballot", "for", "the", "five", "-", "year", "presidency", "of", "Estonia", "." ], "ids": [ 10734, 10116, 47243, 45313, 10162, 11580, 24659, 10111, 10734, 10116, 11069, 10106, 70245, 112, 187, 93339, 10142, 10105, 12403, 118, 10924, 97059, 10108, 31475, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "A", "third", "and", "final", "vote", "was", "due", "to", "be", "held", "when", "parliament", "re", "##con", "##vene", "##d", "on", "Tuesday", "but", "legi", "##sla", "##tors", "were", "not", "ex", "##pect", "##ing", "a", "clear", "result", "." ], "ids": [ 138, 12628, 10111, 11070, 18926, 10134, 10850, 10114, 10347, 11991, 10841, 40519, 11639, 23486, 61190, 10162, 10135, 70245, 10473, 78198, 61432, 24324, 10309, 10472, 11419, 51511, 10230, 169, 24866, 14493, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "there", "is", "no", "result", "the", "decision", "will", "be", "ce", "##ded", "to", "an", "electoral", "college", "." ], "ids": [ 14535, 11155, 10124, 10192, 14493, 10105, 19231, 11337, 10347, 10794, 21597, 10114, 10151, 29125, 16083, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "votes", "are", "a", "strong", "message", "to", "Mer", "##i", "that", "he", "is", "not", "favour", "##ed", "by", "some", "politicians", "any", "more", ",", "\"", "Reform", "Party", "head", "He", "##iki", "Kr", "##anic", "##h", "told", "Reuters", "." ], "ids": [ 107, 10117, 24659, 10301, 169, 18093, 30514, 10114, 10734, 10116, 10189, 10261, 10124, 10472, 61264, 10336, 10155, 11152, 75284, 11178, 10798, 117, 107, 42204, 12529, 13578, 10357, 20897, 17640, 57052, 10237, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 8, 8, 8, 9, 3, 9 ] }, { "tokens": [ "Under", "a", "constitution", "agreed", "in", "1992", ",", "a", "year", "after", "independence", ",", "the", "president", "has", "no", "executive", "powers", "." ], "ids": [ 12594, 169, 34953, 25577, 10106, 10450, 117, 169, 10924, 10662, 31412, 117, 10105, 12931, 10393, 10192, 22676, 32043, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "only", "political", "role", "is", "to", "smooth", "##e", "the", "function", "##ing", "of", "government", "in", "periods", "of", "crisis", "." ], "ids": [ 11597, 10893, 13736, 12971, 10124, 10114, 67601, 10112, 10105, 19367, 10230, 10108, 12047, 10106, 45439, 10108, 22859, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Mer", "##i", ",", "67", ",", "has", "been", "accused", "in", "parliament", "of", "taking", "too", "much", "power", "and", "not", "always", "consul", "##ting", "parliament", "##arian", "##s", "before", "making", "decisions", "." ], "ids": [ 16976, 10734, 10116, 117, 12316, 117, 10393, 10590, 37303, 10106, 40519, 10108, 18084, 16683, 13172, 13183, 10111, 10472, 19540, 53704, 12141, 40519, 57078, 10107, 11360, 14293, 48126, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "relations", "with", "a", "left", "##ist", "-", "led", "government", "have", "sometimes", "been", "ten", "##se", "." ], "ids": [ 11597, 19824, 10169, 169, 12153, 11293, 118, 12857, 12047, 10529, 17611, 10590, 11769, 10341, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "support", "in", "the", "first", "round", "of", "voting", "on", "Monday", "was", "much", "lower", "than", "expected", ",", "scoring", "only", "45", "votes", ",", "which", "political", "anal", "##yst", "##s", "put", "down", "as", "a", "vote", "of", "no", "confidence", "in", "his", "performance", "." ], "ids": [ 11597, 13145, 10106, 10105, 10422, 13569, 10108, 48814, 10135, 40714, 10134, 13172, 18165, 11084, 25973, 117, 27346, 10893, 10827, 24659, 117, 10319, 13736, 106615, 62769, 10107, 14499, 12935, 10146, 169, 18926, 10108, 10192, 74187, 10106, 10226, 14432, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "support", "only", "inch", "##ed", "up", "to", "49", "in", "the", "second", "vote", "." ], "ids": [ 10747, 13145, 10893, 34397, 10336, 10741, 10114, 11580, 10106, 10105, 11132, 18926, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Support", "for", "R", "##uut", "##el", ",", "68", ",", "remained", "constant", "at", "34", "votes", "." ], "ids": [ 39007, 10142, 155, 61645, 10570, 117, 12370, 117, 15980, 29152, 10160, 11069, 24659, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "the", "third", "vote", "fail", "##s", "to", "give", "either", "Mer", "##i", "or", "R", "##uut", "##el", "68", "votes", ",", "the", "parliamentary", "speaker", "will", "con", "##vene", "an", "electoral", "college", "of", "101", "MP", "##s", "and", "273", "local", "gov", "##erm", "##ent", "representatives", "to", "hold", "a", "new", "poll", "that", "could", "include", "new", "nominations", "." ], "ids": [ 14535, 10105, 12628, 18926, 84891, 10107, 10114, 18090, 16106, 10734, 10116, 10345, 155, 61645, 10570, 12370, 24659, 117, 10105, 50485, 57738, 11337, 10173, 61190, 10151, 29125, 16083, 10108, 14123, 27211, 10107, 10111, 28414, 11436, 13585, 91724, 11405, 49959, 10114, 18500, 169, 10751, 70156, 10189, 12174, 12363, 10751, 66408, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "would", "be", "the", "first", "time", "that", "the", "former", "Soviet", "republic", "has", "had", "to", "call", "together", "an", "electoral", "college", "." ], "ids": [ 10747, 10894, 10347, 10105, 10422, 10635, 10189, 10105, 11775, 15277, 108499, 10393, 10374, 10114, 20575, 14229, 10151, 29125, 16083, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "its", "first", "presidential", "election", "in", "1992", "Mer", "##i", "won", "the", "necessary", "votes", "in", "in", "a", "parliamentary", "election", "against", "R", "##uut", "##el", "." ], "ids": [ 10167, 10474, 10422, 36476, 13685, 10106, 10450, 10734, 10116, 11367, 10105, 27039, 24659, 10106, 10106, 169, 50485, 13685, 11327, 155, 61645, 10570, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Parliamentary", "organiser", "##s", "said", "the", "exact", "time", "##table", "remained", "unclear", "but", "it", "would", "probably", "take", "about", "a", "month", "to", "organise", "an", "electoral", "college", "which", "could", "also", "hold", "several", "rounds", "of", "voting", "before", "a", "clear", "winner", "emerge", "##s", "." ], "ids": [ 65671, 93446, 10107, 12415, 10105, 45809, 10635, 30434, 15980, 94475, 10473, 10271, 10894, 23282, 13574, 10978, 169, 14064, 10114, 55081, 10151, 29125, 16083, 10319, 12174, 10379, 18500, 11736, 44759, 10108, 48814, 11360, 169, 24866, 20826, 99467, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Estonia", "assembly", "fail", "##s", "to", "elect", "state", "president", "." ], "ids": [ 31475, 38946, 84891, 10107, 10114, 106095, 11388, 12931, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TA", "##LL", "##IN", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 91075, 82834, 27128, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Estonian", "parliament", "failed", "for", "a", "third", "and", "final", "time", "to", "elect", "a", "new", "state", "president", "on", "Tuesday", ",", "ref", "##using", "a", "second", "mandate", "for", "incumbent", "Lennart", "Mer", "##i", "." ], "ids": [ 10117, 73638, 40519, 20775, 10142, 169, 12628, 10111, 11070, 10635, 10114, 106095, 169, 10751, 11388, 12931, 10135, 70245, 117, 48056, 95179, 169, 11132, 106424, 10142, 63122, 102034, 10734, 10116, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Nei", "##ther", "Mer", "##i", "nor", "his", "rival", "Arnold", "R", "##uut", "##el", "could", "gar", "##ner", "the", "68", "votes", "needed", "from", "the", "101", "members", "of", "parliament", "to", "become", "president", "." ], "ids": [ 25822, 22623, 10734, 10116, 31515, 10226, 24792, 17733, 155, 61645, 10570, 12174, 47243, 11129, 10105, 12370, 24659, 23794, 10188, 10105, 14123, 12464, 10108, 40519, 10114, 13461, 12931, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "third", "vote", "Mer", "##i", "won", "52", "and", "R", "##uut", "##el", "won", "32", "votes", "." ], "ids": [ 10167, 10105, 12628, 18926, 10734, 10116, 11367, 11525, 10111, 155, 61645, 10570, 11367, 10842, 24659, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "The", "final", "decision", "will", "now", "be", "made", "by", "a", "larger", "assembly", "." ], "ids": [ 10117, 11070, 19231, 11337, 11858, 10347, 11019, 10155, 169, 20434, 38946, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mer", "##i", "won", "49", "in", "a", "second", "vote", "earlier", "on", "Tuesday", "and", "45", "in", "the", "first", "on", "Monday", "." ], "ids": [ 10734, 10116, 11367, 11580, 10106, 169, 11132, 18926, 18905, 10135, 70245, 10111, 10827, 10106, 10105, 10422, 10135, 40714, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##uut", "##el", "won", "34", "votes", "in", "the", "first", "two", "secret", "ballot", "##s", "." ], "ids": [ 155, 61645, 10570, 11367, 11069, 24659, 10106, 10105, 10422, 10551, 23658, 93339, 10107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Enn", "Mark", "##vart", ",", "chairman", "of", "the", "National", "Election", "Commission", "said", "96", "members", "of", "parliament", "cast", "votes", ",", "with", "one", "ballot", "paper", "in", "##vali", "##d", "and", "11", "ab", "##stent", "##ions", "." ], "ids": [ 65047, 11997, 73492, 117, 27627, 10108, 10105, 10655, 36512, 14941, 12415, 12308, 12464, 10108, 40519, 18922, 24659, 117, 10169, 10464, 93339, 17895, 10106, 22263, 10162, 10111, 10193, 11357, 104077, 15880, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "election", "will", "now", "go", "before", "an", "electoral", "college", "involving", "MP", "##s", "and", "local", "government", "representatives", "that", "will", "be", "con", "##vene", "##d", "by", "the", "parliamentary", "Speaker", "in", "the", "next", "day", "or", "so", "." ], "ids": [ 10117, 13685, 11337, 11858, 11783, 11360, 10151, 29125, 16083, 40368, 27211, 10107, 10111, 11436, 12047, 49959, 10189, 11337, 10347, 10173, 61190, 10162, 10155, 10105, 50485, 64844, 10106, 10105, 13451, 11940, 10345, 10380, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "could", "take", "up", "to", "a", "month", "before", "a", "new", "vote", "but", "the", "time", "##table", "is", "not", "yet", "clear", "." ], "ids": [ 10377, 12174, 13574, 10741, 10114, 169, 14064, 11360, 169, 10751, 18926, 10473, 10105, 10635, 30434, 10124, 10472, 21833, 24866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "is", "the", "first", "time", "the", "former", "Soviet", "republic", "has", "had", "to", "con", "##vene", "such", "a", "group", "." ], "ids": [ 10747, 10124, 10105, 10422, 10635, 10105, 11775, 15277, 108499, 10393, 10374, 10114, 10173, 61190, 11049, 169, 11795, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Albania", "charges", "Brit", "##on", "with", "child", "sex", "abuse", "." ], "ids": [ 28931, 31128, 68447, 10263, 10169, 18048, 18549, 51401, 119 ], "entity": [ "B-LOC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##IR", "##AN", "##A", "1996", "-", "08", "-", "27" ], "ids": [ 157, 73522, 41275, 10738, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Albanian", "authorities", "have", "arrested", "and", "charged", "a", "British", "man", "for", "sexual", "##ly", "abu", "##sing", "two", "young", "boys", ",", "a", "Tirana", "prose", "##cutor", "said", "on", "Tuesday", "." ], "ids": [ 54257, 28308, 10529, 29479, 10111, 38253, 169, 11160, 10817, 10142, 19616, 10454, 104735, 16357, 10551, 14739, 32647, 117, 169, 59272, 84145, 98957, 12415, 10135, 70245, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "arrested", "him", "and", "charged", "him", "with", "these", "sh", "##ame", "##ful", "acts", "of", "sex", "abuse", "of", "little", "children", ",", "\"", "prose", "##cutor", "Ad", "##nan", "X", "##hel", "##ili", "told", "Reuters", "." ], "ids": [ 107, 12865, 10529, 29479, 10957, 10111, 38253, 10957, 10169, 11762, 48201, 18969, 14446, 29253, 10108, 18549, 51401, 10108, 16745, 12694, 117, 107, 84145, 98957, 25474, 13470, 161, 31572, 13784, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 3, 9 ] }, { "tokens": [ "X", "##hel", "##ili", "said", "Paul", "Thompson", ",", "34", ",", "from", "Wiltshire", ",", "was", "arrested", "on", "Sunday", "in", "a", "hotel", "in", "the", "Ad", "##riat", "##ic", "resort", "of", "Dur", "##res", ",", "45", "km", "(", "30", "miles", ")", "west", "of", "Tirana", "." ], "ids": [ 161, 31572, 13784, 12415, 10772, 13288, 117, 11069, 117, 10188, 81782, 117, 10134, 29479, 10135, 19731, 10106, 169, 19157, 10106, 10105, 25474, 65441, 11130, 60637, 10108, 66545, 11234, 117, 10827, 10204, 113, 10244, 14148, 114, 13735, 10108, 59272, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Thompson", "has", "denied", "the", "charges", "." ], "ids": [ 13288, 10393, 47467, 10105, 31128, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "could", "face", "up", "to", "five", "years", "in", "jail", "if", "convicted", "." ], "ids": [ 10357, 12174, 13295, 10741, 10114, 12403, 10855, 10106, 75934, 12277, 61487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "X", "##hel", "##ili", "said", "Thompson", ",", "who", "is", "divorced", ",", "said", "he", "be", "##friend", "##ed", "the", "boys", ",", "both", "aged", "under", "10", ",", "because", "they", "re", "##min", "##ded", "him", "of", "his", "own", "children", "who", "live", "with", "his", "former", "wife", "in", "London", "." ], "ids": [ 161, 31572, 13784, 12415, 13288, 117, 10479, 10124, 81440, 117, 12415, 10261, 10347, 97856, 10336, 10105, 32647, 117, 11408, 30262, 10571, 10150, 117, 12373, 10689, 11639, 14956, 21597, 10957, 10108, 10226, 12542, 12694, 10479, 12962, 10169, 10226, 11775, 14384, 10106, 10829, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "prose", "##cutor", "'", "s", "office", "said", "no", "date", "had", "yet", "been", "set", "for", "a", "trial", "to", "begin", "as", "investigations", "had", "first", "to", "be", "completed", "." ], "ids": [ 10117, 84145, 98957, 112, 187, 14301, 12415, 10192, 13664, 10374, 21833, 10590, 11847, 10142, 169, 23626, 10114, 16135, 10146, 87748, 10374, 10422, 10114, 10347, 15782, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "British", "em", "##bas", "##sy", "in", "Tirana", "said", "it", "had", "sent", "an", "em", "##bas", "##sy", "official", "to", "talk", "to", "Thompson", "who", "is", "being", "held", "in", "jail", "." ], "ids": [ 10117, 11160, 10266, 21322, 16105, 10106, 59272, 12415, 10271, 10374, 14541, 10151, 10266, 21322, 16105, 14731, 10114, 31311, 10114, 13288, 10479, 10124, 11223, 11991, 10106, 75934, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "age", "of", "consent", "for", "heter", "##ose", "##xu", "##al", "and", "homosexual", "sex", "in", "Albania", "is", "14", "." ], "ids": [ 10117, 12089, 10108, 84278, 10142, 75382, 14569, 39234, 10415, 10111, 91175, 18549, 10106, 28931, 10124, 10247, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "A", "large", "number", "of", "des", "##titut", "##e", "children", "can", "be", "seen", "be", "##gging", "in", "the", "streets", "of", "im", "##po", "##veri", "##shed", "Albania", ",", "especially", "in", "towns", "and", "resort", "##s", "visited", "by", "foreign", "##ers", "." ], "ids": [ 138, 12077, 11487, 10108, 10139, 102083, 10112, 12694, 10944, 10347, 15652, 10347, 54468, 10106, 10105, 41969, 10108, 10211, 13520, 52019, 42253, 28931, 117, 17491, 10106, 26656, 10111, 60637, 10107, 30270, 10155, 20796, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Estonia", "assembly", "again", "fail", "##s", "to", "elect", "president", "." ], "ids": [ 31475, 38946, 13123, 84891, 10107, 10114, 106095, 12931, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TA", "##LL", "##IN", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 91075, 82834, 27128, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Estonia", "'", "s", "parliament", "again", "failed", "to", "elect", "a", "new", "state", "president", "on", "Tuesday", "when", "neither", "of", "two", "candidates", "secured", "a", "majority", "in", "second", "-", "round", "voting", "." ], "ids": [ 31475, 112, 187, 40519, 13123, 20775, 10114, 106095, 169, 10751, 11388, 12931, 10135, 70245, 10841, 51148, 10108, 10551, 33439, 57202, 169, 19471, 10106, 11132, 118, 13569, 48814, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inc", "##um", "##bent", "president", "Lennart", "Mer", "##i", "won", "49", "votes", "compared", "to", "34", "won", "by", "his", "rival", ",", "deputy", "Parliamentary", "Speaker", "Arnold", "R", "##uut", "##el", "." ], "ids": [ 13604, 10465, 76890, 12931, 102034, 10734, 10116, 11367, 11580, 24659, 25626, 10114, 11069, 11367, 10155, 10226, 24792, 117, 45404, 65671, 64844, 17733, 155, 61645, 10570, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "But", "Mer", "##i", "'", "s", "support", "was", "not", "enough", "for", "the", "68", "needed", "for", "election", "and", "a", "third", "secret", "ballot", "will", "take", "place", "later", "in", "the", "day", "(", "1300", "GMT", ")", ",", "parliamentary", "officials", "said", "." ], "ids": [ 16976, 10734, 10116, 112, 187, 13145, 10134, 10472, 21408, 10142, 10105, 12370, 23794, 10142, 13685, 10111, 169, 12628, 23658, 93339, 11337, 13574, 11192, 10873, 10106, 10105, 11940, 113, 20968, 20362, 114, 117, 50485, 27730, 12415, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "win", "a", "clear", "mandate", "for", "the", "five", "-", "year", "presidential", "term", ",", "a", "candidate", "must", "secure", "68", "votes", "from", "the", "101", "-", "member", "parliament", "." ], "ids": [ 11469, 14125, 169, 24866, 106424, 10142, 10105, 12403, 118, 10924, 36476, 13719, 117, 169, 22102, 14982, 45853, 12370, 24659, 10188, 10105, 14123, 118, 12008, 40519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Enn", "Mark", "##vart", ",", "Chairman", "of", "the", "National", "Election", "Commission", ",", "said", "96", "members", "of", "parliament", "voted", "in", "the", "second", "round", ",", "with", "12", "ab", "##stent", "##ions", "and", "one", "ballot", "paper", "in", "##vali", "##d", "." ], "ids": [ 65047, 11997, 73492, 117, 28635, 10108, 10105, 10655, 36512, 14941, 117, 12415, 12308, 12464, 10108, 40519, 34584, 10106, 10105, 11132, 13569, 117, 10169, 10186, 11357, 104077, 15880, 10111, 10464, 93339, 17895, 10106, 22263, 10162, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Monday", ",", "in", "the", "first", "round", "of", "voting", ",", "Mer", "##i", "secured", "45", "votes", "and", "R", "##uut", "##el", "34", "." ], "ids": [ 10576, 40714, 117, 10106, 10105, 10422, 13569, 10108, 48814, 117, 10734, 10116, 57202, 10827, 24659, 10111, 155, 61645, 10570, 11069, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Mer", "##i", "'", "s", "popularity", "has", "suffered", "in", "recent", "years", ",", "with", "politicians", "critici", "##sing", "him", "for", "taking", "too", "much", "power", "and", "acting", "without", "consul", "##ting", "parliament", "." ], "ids": [ 10734, 10116, 112, 187, 40179, 10393, 26090, 10106, 19037, 10855, 117, 10169, 75284, 87672, 16357, 10957, 10142, 18084, 16683, 13172, 13183, 10111, 25086, 13663, 53704, 12141, 40519, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "a", "third", "round", "of", "voting", "fail", "##s", "to", "give", "either", "candidate", "68", "votes", ",", "the", "parliamentary", "speaker", "has", "to", "con", "##vene", "an", "electoral", "college", "of", "all", "101", "MP", "##s", "and", "273", "local", "government", "representatives", "for", "a", "new", "vote", "that", "could", "take", "up", "to", "a", "month", "." ], "ids": [ 14535, 169, 12628, 13569, 10108, 48814, 84891, 10107, 10114, 18090, 16106, 22102, 12370, 24659, 117, 10105, 50485, 57738, 10393, 10114, 10173, 61190, 10151, 29125, 16083, 10108, 10435, 14123, 27211, 10107, 10111, 28414, 11436, 12047, 49959, 10142, 169, 10751, 18926, 10189, 12174, 13574, 10741, 10114, 169, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Slovak", "women", "visited", "Du", "##tro", "##ux", ",", "police", "say", "." ], "ids": [ 78425, 13190, 30270, 14925, 14239, 11855, 117, 15034, 23763, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Peter", "Lac", "##a" ], "ids": [ 10979, 12602, 10113 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "BR", "##AT", "##IS", "##LA", "##VA", "1996", "-", "08", "-", "27" ], "ids": [ 49351, 32071, 19088, 44376, 47172, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Marc", "Du", "##tro", "##ux", ",", "the", "chief", "accused", "in", "Belgium", "'", "s", "sensa", "##tional", "child", "murder", "and", "sex", "abuse", "case", ",", "visited", "Slovakia", "a", "number", "of", "times", "and", "about", "10", "young", "Slovak", "women", "went", "to", "Belgium", "at", "his", "invitation", ",", "police", "said", "on", "Tuesday", "." ], "ids": [ 15254, 14925, 14239, 11855, 117, 10105, 19421, 37303, 10106, 26519, 112, 187, 63175, 42361, 18048, 29448, 10111, 18549, 51401, 13474, 117, 30270, 43031, 169, 11487, 10108, 13465, 10111, 10978, 10150, 14739, 78425, 13190, 13446, 10114, 26519, 10160, 10226, 77674, 117, 15034, 12415, 10135, 70245, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "they", "have", "difficulty", "remember", "##ing", "what", "happened", "there", ",", "perhaps", "because", "of", "drugs", ",", "and", "are", "unsur", "##e", "whether", "they", "were", "filmed", "for", "por", "##nog", "##raphy", ",", "Rudolf", "Ga", "##jd", "##os", ",", "head", "of", "the", "Slovak", "office", "of", "Inter", "##pol", ",", "told", "Reuters", "." ], "ids": [ 16976, 10689, 10529, 66178, 93161, 10230, 12976, 44936, 11155, 117, 36981, 12373, 10108, 40421, 117, 10111, 10301, 51027, 10112, 21883, 10689, 10309, 43729, 10142, 10183, 14567, 81503, 117, 16204, 69699, 31134, 10310, 117, 13578, 10108, 10105, 78425, 14301, 10108, 24362, 28924, 117, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 2, 9, 9, 3, 7, 9, 9, 3, 9 ] }, { "tokens": [ "Although", "Ga", "##jd", "##os", "spoke", "of", "\"", "girls", "\"", "his", "deputy", ",", "Eva", "Bou", "##dova", ",", "said", "the", "case", "involved", "about", "10", "young", "women", "in", "their", "early", "20", "##s", "." ], "ids": [ 15785, 69699, 31134, 10310, 50005, 10108, 107, 27833, 107, 10226, 45404, 117, 18742, 62583, 64927, 117, 12415, 10105, 13474, 16247, 10978, 10150, 14739, 13190, 10106, 10455, 11732, 10197, 10107, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "police", "inter", "##roga", "##ted", "several", "Slovak", "girls", "who", "said", "that", "they", "had", "been", "invited", "by", "Mark", "Du", "##tro", "##ux", "to", "visit", "Belgium", ",", "\"", "Ga", "##jd", "##os", "said", "." ], "ids": [ 107, 10117, 15034, 22021, 59648, 11912, 11736, 78425, 27833, 10479, 12415, 10189, 10689, 10374, 10590, 33392, 10155, 11997, 14925, 14239, 11855, 10114, 27541, 26519, 117, 107, 69699, 31134, 10310, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "The", "girls", "said", "they", "went", "to", "Belgium", "vol", "##unta", "##rily", "and", "the", "police", "suspect", "that", "they", "were", "used", "to", "act", "in", "por", "##nog", "##raphic", "films", ".", "\"" ], "ids": [ 107, 10117, 27833, 12415, 10689, 13446, 10114, 26519, 12714, 27682, 103866, 10111, 10105, 15034, 97881, 10189, 10689, 10309, 11031, 10114, 19833, 10106, 10183, 14567, 48532, 14280, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "police", "suspect", "(", "the", "girls", ")", "were", "under", "the", "influence", "of", "drugs", "as", "some", "girls", "admitted", "they", "took", "uns", "##pec", "##ified", "pi", "##lls", ".", "\"" ], "ids": [ 107, 10117, 15034, 97881, 113, 10105, 27833, 114, 10309, 10571, 10105, 17306, 10108, 40421, 10146, 11152, 27833, 40345, 10689, 12149, 15826, 53625, 31825, 24109, 22881, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "sus", "##pic", "##ions", "of", "a", "rape", ",", "but", "the", "police", "still", "have", "to", "find", "the", "victim", ",", "\"", "Ga", "##jd", "##os", "added", "." ], "ids": [ 107, 12865, 10529, 10846, 34891, 15880, 10108, 169, 82523, 117, 10473, 10105, 15034, 12647, 10529, 10114, 17860, 10105, 62585, 117, 107, 69699, 31134, 10310, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Du", "##tro", "##ux", "'", "s", "last", "visit", "to", "Slovakia", "was", "reported", "to", "have", "been", "as", "recent", "as", "July", "." ], "ids": [ 14925, 14239, 11855, 112, 187, 12469, 27541, 10114, 43031, 10134, 15943, 10114, 10529, 10590, 10146, 19037, 10146, 11112, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Slovak", "police", "are", "also", "co", "##oper", "##ating", "with", "Belgium", "in", "the", "search", "for", "An", "March", "##al", "and", "E", "##ef", "##je", "Lamb", "##reck", "##s", ",", "who", "went", "missing", "last", "August", "." ], "ids": [ 78425, 15034, 10301, 10379, 11170, 56361, 33121, 10169, 26519, 10106, 10105, 22419, 10142, 10313, 11144, 10415, 10111, 142, 16822, 10381, 60005, 80442, 10107, 117, 10479, 13446, 39542, 12469, 10735, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Du", "##tro", "##ux", ",", "39", ",", "who", "was", "charged", "last", "week", "with", "the", "ab", "##duction", "and", "illegal", "imprisonment", "of", "two", "other", "girls", "aged", "14", "and", "12", ",", "is", "one", "of", "several", "suspect", "##s", "in", "the", "March", "##al", "and", "Lamb", "##reck", "##s", "case", "." ], "ids": [ 14925, 14239, 11855, 117, 11303, 117, 10479, 10134, 38253, 12469, 16118, 10169, 10105, 11357, 54366, 10111, 39806, 91044, 10108, 10551, 10684, 27833, 30262, 10247, 10111, 10186, 117, 10124, 10464, 10108, 11736, 97881, 10107, 10106, 10105, 11144, 10415, 10111, 60005, 80442, 10107, 13474, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Last", "Saturday", "he", "led", "police", "to", "the", "bodies", "of", "two", "other", "girls", ",", "aged", "eight", ",", "who", "died", "of", "star", "##vation", "this", "year", "after", "their", "ab", "##duction", "in", "June", ",", "1995", "." ], "ids": [ 14812, 24848, 10261, 12857, 15034, 10114, 10105, 34106, 10108, 10551, 10684, 27833, 117, 30262, 16222, 117, 10479, 12482, 10108, 16624, 39784, 10531, 10924, 10662, 10455, 11357, 54366, 10106, 11120, 117, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Czech", "office", "of", "Inter", "##pol", "said", "on", "Friday", "it", "would", "neither", "con", "##fir", "##m", "nor", "den", "##y", "that", "Du", "##tro", "##ux", "had", "been", "in", "the", "Czech", "Republic", ",", "Slovakia", "'", "s", "western", "nei", "##gh", "##bour", "and", "former", "fede", "##ration", "partner", "." ], "ids": [ 10117, 22148, 14301, 10108, 24362, 28924, 12415, 10135, 30767, 10271, 10894, 51148, 10173, 61644, 10147, 31515, 10140, 10157, 10189, 14925, 14239, 11855, 10374, 10590, 10106, 10105, 22148, 13681, 117, 43031, 112, 187, 16672, 11888, 15774, 71527, 10111, 11775, 83482, 19466, 22825, 119 ], "entity": [ "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgian", "police", "said", "an", "officer", "had", "visited", "Bratislava", "to", "talk", "with", "Slovak", "detective", "##s", "about", "An", "and", "E", "##ef", "##je", "and", "other", "disa", "##ppe", "##aran", "##ces", ",", "and", "he", "planned", "to", "go", "also", "to", "Prague", "." ], "ids": [ 36652, 15034, 12415, 10151, 19288, 10374, 30270, 27576, 10114, 31311, 10169, 78425, 57127, 10107, 10978, 10313, 10111, 142, 16822, 10381, 10111, 10684, 36474, 21092, 24367, 14585, 117, 10111, 10261, 24292, 10114, 11783, 10379, 10114, 33745, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 9, 9, 9, 4, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "W", "##EA", "##TH", "##ER", "-", "Con", "##ditions", "at", "C", "##IS", "airport", "##s", "-", "August", "27", "." ], "ids": [ 160, 36789, 109166, 24093, 118, 12845, 91936, 10160, 140, 19088, 28460, 10107, 118, 10735, 10365, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "27" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "closure", "##s", "of", "airport", "##s", "due", "to", "bad", "weather", "are", "expected", "in", "the", "Commonwealth", "of", "Independent", "States", "on", "August", "28", "and", "August", "29", ",", "the", "Russian", "Weather", "Service", "said", "on", "Tuesday", "." ], "ids": [ 10657, 69177, 10107, 10108, 28460, 10107, 10850, 10114, 15838, 35660, 10301, 25973, 10106, 10105, 22603, 10108, 20199, 10859, 10135, 10735, 10348, 10111, 10735, 10386, 117, 10105, 13463, 48843, 13489, 12415, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Moscow", "News", "##room", "+", "709", "##5", "941", "852", "##0" ], "ids": [ 118, 118, 18744, 12219, 25525, 116, 67432, 11166, 82944, 70072, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "serial", "killer", "strikes", "again", "." ], "ids": [ 13463, 23900, 61976, 86206, 13123, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "27" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "police", "in", "the", "Ural", "##s", "city", "of", "Perm", "are", "on", "the", "trail", "of", "a", "serial", "killer", "who", "has", "claimed", "his", "seventh", "victim", "in", "just", "a", "few", "months", ",", "It", "##ar", "-", "Tas", "##s", "news", "agency", "said", "on", "Tuesday", "." ], "ids": [ 13463, 15034, 10106, 10105, 89256, 10107, 11584, 10108, 67222, 10301, 10135, 10105, 56559, 10108, 169, 23900, 61976, 10479, 10393, 20737, 10226, 37192, 62585, 10106, 12820, 169, 13824, 15555, 117, 10377, 10354, 118, 57387, 10107, 14424, 34649, 12415, 10135, 70245, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "latest", "attack", ",", "the", "killer", "rape", "##d", "and", "sta", "##bbed", "a", "young", "woman", "in", "a", "lift", ",", "leaving", "her", "body", "on", "a", "landing", "." ], "ids": [ 10167, 10105, 50908, 16342, 117, 10105, 61976, 82523, 10162, 10111, 16527, 98091, 169, 14739, 18299, 10106, 169, 63376, 117, 21005, 10485, 14333, 10135, 169, 37798, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tas", "##s", "did", "not", "say", "exactly", "when", "it", "took", "place", "." ], "ids": [ 57387, 10107, 12172, 10472, 23763, 62136, 10841, 10271, 12149, 11192, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "earlier", "released", "a", "suspect", "after", "women", "who", "had", "survived", "an", "attack", "failed", "to", "identify", "him", "." ], "ids": [ 18051, 18905, 11539, 169, 97881, 10662, 13190, 10479, 10374, 37035, 10151, 16342, 20775, 10114, 51361, 10957, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "army", ",", "Che", "##chen", "##s", "open", "new", "round", "of", "talks", "." ], "ids": [ 13463, 17977, 117, 44131, 11909, 10107, 14087, 10751, 13569, 10108, 56672, 119 ], "entity": [ "B-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "27" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russia", "'", "s", "military", "commander", "in", "Che", "##chny", "##a", "began", "new", "talks", "with", "separat", "##ist", "chief", "-", "of", "-", "staff", "As", "##lan", "Mask", "##hado", "##v", "on", "Tuesday", ",", "It", "##ar", "-", "Tas", "##s", "news", "agency", "said", "." ], "ids": [ 14664, 112, 187, 14041, 27703, 10106, 44131, 95063, 10113, 11941, 10751, 56672, 10169, 81806, 11293, 19421, 118, 10108, 118, 18927, 10882, 12055, 69189, 54719, 10477, 10135, 70245, 117, 10377, 10354, 118, 57387, 10107, 14424, 34649, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Tas", "##s", "said", "the", "talks", "were", "taking", "place", "in", "the", "settlement", "of", "Nov", "##ye", "Ata", "##gi", ",", "some", "20", "km", "(", "12", "miles", ")", "south", "of", "the", "Che", "##chen", "capital", "G", "##ro", "##zny", "." ], "ids": [ 57387, 10107, 12415, 10105, 56672, 10309, 18084, 11192, 10106, 10105, 23931, 10108, 36779, 12871, 68795, 11210, 117, 11152, 10197, 10204, 113, 10186, 14148, 114, 13144, 10108, 10105, 44131, 11909, 12185, 144, 10567, 25424, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "talks", "had", "been", "post", "##pone", "##d", "while", "the", "Russian", "##s", "wait", "##ed", "for", "the", "rebels", "to", "return", "arms", "and", "ammunition", "seized", "from", "Russian", "soldiers", "at", "the", "weekend", "." ], "ids": [ 10117, 56672, 10374, 10590, 11841, 35741, 10162, 11371, 10105, 13463, 10107, 83279, 10336, 10142, 10105, 57545, 10114, 15079, 28150, 10111, 77036, 80176, 10188, 13463, 23324, 10160, 10105, 43440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Che", "##chen", "##s", "said", "on", "Monday", "they", "had", "returned", "all", "the", "weapons", ",", "which", "they", "said", "were", "seized", "by", "a", "ren", "##ega", "##de", "group", "." ], "ids": [ 10117, 44131, 11909, 10107, 12415, 10135, 40714, 10689, 10374, 14030, 10435, 10105, 31881, 117, 10319, 10689, 12415, 10309, 80176, 10155, 169, 63256, 19172, 10253, 11795, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "talks", "between", "Mask", "##hado", "##v", "and", "Russia", "'", "s", "V", "##ya", "##ches", "##lav", "Ti", "##kh", "##omir", "##ov", "are", "aimed", "at", "putting", "the", "finishing", "touch", "##es", "to", "a", "cea", "##sef", "##ire", "seal", "##ed", "last", "week", "in", "talks", "with", "Russian", "security", "chief", "Alexander", "Le", "##bed", "." ], "ids": [ 10117, 56672, 10948, 69189, 54719, 10477, 10111, 14664, 112, 187, 159, 10679, 16272, 25768, 29033, 48502, 77516, 11024, 10301, 53004, 10160, 71028, 10105, 34348, 54981, 10171, 10114, 169, 25578, 107749, 11627, 37985, 10336, 12469, 16118, 10106, 56672, 10169, 13463, 21849, 19421, 12063, 10281, 33627, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Le", "##bed", ",", "who", "met", "Russian", "Prime", "Minister", "Viktor", "Cher", "##nomy", "##rdin", "on", "Monday", "to", "discuss", "the", "progress", "he", "made", "on", "a", "political", "settlement", "for", "the", "break", "##away", "region", ",", "has", "been", "seeking", "a", "meeting", "with", "President", "Boris", "Ye", "##lts", "##in", ",", "who", "started", "a", "holiday", "near", "Moscow", "on", "Monday", "." ], "ids": [ 10281, 33627, 117, 10479, 10428, 13463, 19924, 14355, 24970, 35554, 100395, 86890, 10135, 40714, 10114, 71695, 10105, 40316, 10261, 11019, 10135, 169, 13736, 23931, 10142, 10105, 24194, 38249, 12220, 117, 10393, 10590, 51285, 169, 19822, 10169, 12811, 21463, 20567, 72847, 10245, 117, 10479, 13457, 169, 71806, 12883, 18744, 10135, 40714, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Argentine", "bishop", "re", "##min", "##ds", "cabinet", "of", "Command", "##ments", "." ], "ids": [ 31469, 39868, 11639, 14956, 13268, 33801, 10108, 23945, 14542, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UE", "##NO", "##S", "AI", "##RE", "##S", ",", "Argentina", "1996", "-", "08", "-", "27" ], "ids": [ 139, 62674, 67292, 10731, 62405, 66014, 10731, 117, 12853, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Archbishop", "of", "Buenos", "Aires", "said", "on", "Tuesday", "the", "first", "thing", "he", "would", "do", "if", "elected", "president", "of", "Argentina", "would", "be", "to", "put", "up", "poster", "##s", "of", "the", "Ten", "Command", "##ments", "in", "government", "offices", "." ], "ids": [ 10117, 49823, 10108, 13929, 13960, 12415, 10135, 70245, 10105, 10422, 40414, 10261, 10894, 10149, 12277, 14254, 12931, 10108, 12853, 10894, 10347, 10114, 14499, 10741, 89897, 10107, 10108, 10105, 16411, 23945, 14542, 10106, 12047, 29918, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "asked", "me", "what", "would", "be", "the", "first", "thing", "I", "would", "do", "if", "I", "were", "president", ",", "and", "I", "said", "the", "first", "thing", "I", "would", "do", "would", "be", "to", "res", "##ign", "straight", "away", ",", "\"", "Archbishop", "Antonio", "Qua", "##rra", "##cino", "said", "at", "a", "ser", "##mon", "attended", "by", "several", "cabinet", "ministers", "." ], "ids": [ 107, 11696, 22151, 10911, 12976, 10894, 10347, 10105, 10422, 40414, 146, 10894, 10149, 12277, 146, 10309, 12931, 117, 10111, 146, 12415, 10105, 10422, 40414, 146, 10894, 10149, 10894, 10347, 10114, 39429, 58445, 31214, 14942, 117, 107, 49823, 11873, 56618, 21084, 38333, 12415, 10160, 169, 10493, 16278, 17696, 10155, 11736, 33801, 66281, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "But", "before", "going", ",", "I", "would", "have", "big", "signs", "put", "up", "in", "all", "government", "offices", ",", "those", "to", "do", "with", "justice", ",", "in", "all", "sectors", ",", "with", "the", "Ten", "Command", "##ments", ",", "\"", "he", "added", "." ], "ids": [ 107, 16976, 11360, 19090, 117, 146, 10894, 10529, 22185, 45033, 14499, 10741, 10106, 10435, 12047, 29918, 117, 12676, 10114, 10149, 10169, 25791, 117, 10106, 10435, 69714, 117, 10169, 10105, 16411, 23945, 14542, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Argentina", "'", "s", "top", "Roman", "Catholic", "c", "##leri", "##c", "said", "the", "Biblical", "command", "##ment", "\"", "Th", "##ou", "sh", "##alt", "not", "st", "##eal", "\"", "would", "get", "special", "emphasis", "\"", "because", "it", "has", "to", "be", "about", "the", "most", "common", "thing", "these", "days", ".", "\"" ], "ids": [ 12853, 112, 187, 12364, 12359, 15473, 171, 12538, 10350, 12415, 10105, 89857, 20818, 10426, 107, 51635, 11010, 48201, 22897, 10472, 28780, 30759, 107, 10894, 15329, 14478, 60848, 107, 12373, 10271, 10393, 10114, 10347, 10978, 10105, 10992, 14624, 40414, 11762, 13990, 119, 107 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Qua", "##rra", "##cino", "and", "other", "Church", "leaders", "are", "regular", "critics", "of", "the", "government", "'", "s", "free", "-", "market", "economic", "policy", "." ], "ids": [ 56618, 21084, 38333, 10111, 10684, 12690, 24155, 10301, 15670, 29832, 10108, 10105, 12047, 112, 187, 13961, 118, 17313, 13925, 14368, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazil", "'", "s", "Ele", "##tro", "##pa", "##ulo", "names", "new", "president", "." ], "ids": [ 16765, 112, 187, 16561, 14239, 11359, 22540, 17978, 10751, 12931, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "SAO", "PA", "##UL", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 90616, 32349, 100673, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sao", "Paulo", "state", "power", "firm", "Ele", "##tro", "##pa", "##ulo", "said", "it", "has", "named", "Eduardo", "Bern", "##ini", "as", "new", "president", ",", "replacing", "Emmanuel", "So", "##bral", ",", "who", "will", "head", "a", "secretari", "##at", "at", "the", "Transportation", "Ministry", "." ], "ids": [ 51645, 13360, 11388, 13183, 23410, 16561, 14239, 11359, 22540, 12415, 10271, 10393, 12038, 19131, 25123, 11778, 10146, 10751, 12931, 117, 45857, 21189, 12882, 56716, 117, 10479, 11337, 13578, 169, 109342, 10526, 10160, 10105, 44063, 19170, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Bern", "##ini", "is", "expected", "to", "take", "office", "Thursday", ",", "a", "Ele", "##tro", "##pa", "##ulo", "spoke", "##s", "##woman", "said", "." ], "ids": [ 25123, 11778, 10124, 25973, 10114, 13574, 14301, 67067, 117, 169, 16561, 14239, 11359, 22540, 50005, 10107, 79999, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Rom", "##ina", "Ni", "##caret", "##ta", ",", "Sao", "Paulo", "news", "##room", ",", "551", "##1", "232", "441", "##1", "." ], "ids": [ 118, 118, 21239, 11067, 30409, 98397, 10213, 117, 51645, 13360, 14424, 25525, 117, 46282, 10759, 23944, 41347, 10759, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "government", "wo", "n", "'", "t", "pay", "ran", "##som", "for", "ki", "##dna", "##p", "victims", "." ], "ids": [ 17693, 12047, 12796, 182, 112, 188, 16868, 17044, 32081, 10142, 10879, 35630, 10410, 41205, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "J", "##OS", "##E", ",", "Costa", "Rica", "1996", "-", "08", "-", "27" ], "ids": [ 21318, 11537, 147, 21793, 11259, 117, 13902, 20834, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Netherlands", "government", "has", "ruled", "out", "paying", "ran", "##som", "money", "for", "a", "Dutch", "couple", "ki", "##dna", "##pped", "from", "their", "farm", ",", "while", "Costa", "Rica", "##n", "authorities", "said", "on", "Tuesday", "they", "had", "no", "leads", "in", "the", "case", "." ], "ids": [ 10117, 22043, 12047, 10393, 34920, 10950, 81846, 17044, 32081, 17920, 10142, 169, 17693, 20969, 10879, 35630, 44357, 10188, 10455, 30568, 117, 11371, 13902, 20834, 10115, 28308, 12415, 10135, 70245, 10689, 10374, 10192, 34868, 10106, 10105, 13474, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "not", "had", "contact", "with", "the", "ki", "##dna", "##pper", "##s", "nor", "do", "we", "have", "any", "leads", "to", "take", "us", "to", "where", "they", "might", "be", "held", ",", "\"", "Chief", "of", "Judicial", "Police", "Manuel", "Alvarado", "told", "Reuters", "." ], "ids": [ 107, 12865, 10529, 10472, 10374, 20637, 10169, 10105, 10879, 35630, 26248, 10107, 31515, 10149, 11951, 10529, 11178, 34868, 10114, 13574, 19626, 10114, 10940, 10689, 20970, 10347, 11991, 117, 107, 16730, 10108, 101283, 18051, 13108, 95417, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "B-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 4, 8, 9, 3, 9 ] }, { "tokens": [ "Hurt", "##e", "Sie", "##rd", "Z", "##yl", "##stra", "and", "his", "wife", ",", "Jets", "##i", "Hendrik", "##a", "Co", "##ers", ",", "both", "50", ",", "were", "ab", "##duct", "##ed", "from", "the", "tea", "##k", "plantation", "they", "managed", "late", "Saturday", "or", "early", "Sunday", "by", "at", "least", "two", "men", "demand", "##ing", "$", "1", ".", "5", "million", "ran", "##som", ",", "authorities", "said", "." ], "ids": [ 83912, 10112, 11583, 12023, 163, 27652, 19975, 10111, 10226, 14384, 117, 59891, 10116, 29090, 10113, 13098, 10901, 117, 11408, 10462, 117, 10309, 11357, 54489, 10336, 10188, 10105, 57675, 10174, 103170, 10689, 22391, 13002, 24848, 10345, 11732, 19731, 10155, 10160, 16298, 10551, 10588, 34394, 10230, 109, 122, 119, 126, 12473, 17044, 32081, 117, 28308, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Costa", "Rica", "##n", "officials", "on", "Monday", "had", "given", "different", "names", "for", "the", "couple", "." ], "ids": [ 13902, 20834, 10115, 27730, 10135, 40714, 10374, 13507, 12902, 17978, 10142, 10105, 20969, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anton", "Sc", "##hut", "##te", ",", "an", "official", "with", "the", "em", "##bas", "##sy", "for", "Belgium", ",", "the", "Netherlands", "and", "Luxembourg", ",", "said", "the", "Dutch", "government", "had", "ruled", "out", "paying", "any", "money", "in", "ran", "##som", ".", "\"" ], "ids": [ 16242, 55260, 46296, 10216, 117, 10151, 14731, 10169, 10105, 10266, 21322, 16105, 10142, 26519, 117, 10105, 22043, 10111, 23903, 117, 12415, 10105, 17693, 12047, 10374, 34920, 10950, 81846, 11178, 17920, 10106, 17044, 32081, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "re", "looking", "at", "a", "criminal", "act", "that", "has", "no", "political", "aspect", "as", "far", "as", "what", "we", "can", "tell", ",", "\"", "Sc", "##hut", "##te", "added", "." ], "ids": [ 12865, 112, 11639, 34279, 10160, 169, 30931, 19833, 10189, 10393, 10192, 13736, 33194, 10146, 13301, 10146, 12976, 11951, 10944, 41549, 117, 107, 55260, 46296, 10216, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "A", "note", "with", "the", "ran", "##som", "demand", "was", "left", "in", "the", "couple", "'", "s", "car", ",", "which", "was", "used", "in", "the", "ki", "##dna", "##pping", ",", "Sc", "##hut", "##te", "told", "a", "news", "conference", "on", "Monday", "." ], "ids": [ 138, 19864, 10169, 10105, 17044, 32081, 34394, 10134, 12153, 10106, 10105, 20969, 112, 187, 13000, 117, 10319, 10134, 11031, 10106, 10105, 10879, 35630, 53570, 117, 55260, 46296, 10216, 21937, 169, 14424, 25029, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "note", ",", "believed", "to", "have", "been", "hand", "-", "written", "in", "Spanish", "and", "signed", "by", "the", "victims", ",", "was", "addressed", "to", "E", "##be", "Hui", "##zing", "##a", ",", "another", "Dutch", "citizen", "who", "owns", "the", "tree", "plantation", ".", "\"" ], "ids": [ 10357, 12415, 10105, 19864, 117, 20718, 10114, 10529, 10590, 15230, 118, 13398, 10106, 14661, 10111, 14775, 10155, 10105, 41205, 117, 10134, 71121, 10114, 142, 11044, 77845, 19308, 10113, 117, 12864, 17693, 64735, 10479, 76282, 10105, 23194, 103170, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "De", "##pend", "##ing", "on", "you", ",", "we", "will", "either", "live", "or", "die", ",", "\"", "it", "said", "." ], "ids": [ 10190, 63592, 10230, 10135, 13028, 117, 11951, 11337, 16106, 12962, 10345, 10128, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alvarado", "said", "the", "car", "was", "abandoned", "about", "40", "miles", "(", "60", "km", ")", "north", "of", "the", "couple", "'", "s", "house", "but", "said", "that", "did", "not", "indicate", "the", "ki", "##dna", "##pper", "##s", "intended", "to", "take", "their", "victims", "into", "neighbouring", "Nicaragua", "." ], "ids": [ 95417, 12415, 10105, 13000, 10134, 32296, 10978, 10533, 14148, 113, 10709, 10204, 114, 12756, 10108, 10105, 20969, 112, 187, 13215, 10473, 12415, 10189, 12172, 10472, 35802, 10105, 10879, 35630, 26248, 10107, 24071, 10114, 13574, 10455, 41205, 10708, 79475, 32337, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "farm", "is", "in", "the", "border", "region", "where", "a", "German", "tourist", "and", "a", "Swiss", "tour", "guide", "were", "ki", "##dna", "##pped", "last", "New", "Year", "'", "s", "Eve", "by", "a", "heavily", "armed", "band", "led", "by", "a", "former", "Nicaragua", "##n", "guerrilla", "." ], "ids": [ 10117, 30568, 10124, 10106, 10105, 20949, 12220, 10940, 169, 12026, 61431, 10111, 169, 22984, 12842, 25083, 10309, 10879, 35630, 44357, 12469, 10287, 13567, 112, 187, 33127, 10155, 169, 33556, 34174, 11570, 12857, 10155, 169, 11775, 32337, 10115, 106552, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "The", "two", "were", "held", "for", "71", "days", "until", "relatives", "paid", "a", "ran", "##som", "." ], "ids": [ 10117, 10551, 10309, 11991, 10142, 12513, 13990, 11444, 51893, 25938, 169, 17044, 32081, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "of", "the", "suspected", "ab", "##ductor", "##s", "have", "since", "been", "arrested", "." ], "ids": [ 13214, 10108, 10105, 80337, 11357, 74145, 10107, 10529, 11764, 10590, 29479, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Venezuela", "unions", "hard", "##en", "towards", "CV", "##G", "privat", "##ization", "." ], "ids": [ 15693, 76841, 19118, 10136, 18095, 27642, 11447, 51085, 19980, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "CA", "##RA", "##CA", "##S", "1996", "-", "08", "-", "27" ], "ids": [ 24707, 29990, 46900, 10731, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "s", "##well", "of", "protest", "is", "growing", "within", "Venezuela", "'", "s", "trade", "unions", "at", "the", "proposed", "year", "-", "end", "privat", "##ization", "of", "the", "state", "-", "owned", "holding", "company", "Corpo", "##rac", "##ion", "Vene", "##zo", "##lana", "de", "G", "##ua", "##yana", "(", "CV", "##G", ")", ",", "CV", "##G", "union", "leaders", "said", "Tuesday", "." ], "ids": [ 138, 187, 15862, 10108, 36627, 10124, 25566, 12381, 15693, 112, 187, 18908, 76841, 10160, 10105, 21622, 10924, 118, 11572, 51085, 19980, 10108, 10105, 11388, 118, 17012, 29008, 12100, 58644, 44208, 11046, 72815, 12096, 32787, 10104, 144, 11908, 31523, 113, 27642, 11447, 114, 117, 27642, 11447, 20763, 24155, 12415, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "oppose", "the", "way", "the", "government", "is", "pro", "##ceed", "##ing", "with", "the", "sale", ",", "\"", "Ramon", "Mach", "##uca", ",", "Sid", "##or", "trade", "union", "Secretary", "General", "and", "member", "of", "union", "-", "based", "opposition", "party", "Radical", "Cause", ",", "told", "reporter", "##s", "." ], "ids": [ 107, 12865, 53037, 10105, 13170, 10105, 12047, 10124, 11284, 66390, 10230, 10169, 10105, 15488, 117, 107, 33894, 65654, 26540, 117, 31091, 10667, 18908, 20763, 19382, 11220, 10111, 12008, 10108, 20763, 118, 11610, 21227, 14039, 60062, 109005, 117, 21937, 41408, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "do", "n", "'", "t", "believe", "the", "government", "will", "make", "its", "time", "##table", ",", "\"", "he", "added", "." ], "ids": [ 107, 12865, 10149, 182, 112, 188, 30587, 10105, 12047, 11337, 13086, 10474, 10635, 30434, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sid", "##or", "is", "the", "CV", "##G", "'", "s", "steel", "-", "producing", "arm", ",", "sl", "##ated", "for", "a", "December", "sale", "worth", "an", "estimated", "$", "1", ".", "5", "billion", "." ], "ids": [ 31091, 10667, 10124, 10105, 27642, 11447, 112, 187, 28605, 118, 31958, 31251, 117, 38523, 22525, 10142, 169, 11288, 15488, 43509, 10151, 25267, 109, 122, 119, 126, 25848, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "CV", "##G", "'", "s", "al", "##umi", "##num", "companies", "Ve", "##nal", "##um", "and", "Al", "##uca", "##sa", "are", "also", "scheduled", "to", "be", "sold", "early", "1997", "." ], "ids": [ 10117, 27642, 11447, 112, 187, 10164, 17019, 18991, 18866, 19561, 17661, 10465, 10111, 10883, 26540, 10466, 10301, 10379, 34081, 10114, 10347, 15337, 11732, 10391, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ar", "##guin", "##g", "that", "CV", "##G", "'", "s", "privat", "##ization", "would", "result", "in", "some", "13", ",", "000", "lay", "##off", "##s", ",", "compared", "to", "the", "government", "'", "s", "estimated", "1", ",", "500", ",", "CV", "##G", "'", "s", "union", "leaders", "told", "reporter", "##s", "they", "would", "strike", "and", "stage", "protests", "if", "their", "concerns", "were", "not", "addressed", "." ], "ids": [ 18484, 86041, 10240, 10189, 27642, 11447, 112, 187, 51085, 19980, 10894, 14493, 10106, 11152, 10249, 117, 10259, 47413, 20584, 10107, 117, 25626, 10114, 10105, 12047, 112, 187, 25267, 122, 117, 10757, 117, 27642, 11447, 112, 187, 20763, 24155, 21937, 41408, 10107, 10689, 10894, 37456, 10111, 15365, 60931, 12277, 10455, 42663, 10309, 10472, 71121, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "oppose", "any", "privat", "##ization", "that", "hur", "##ts", "workers", "'", "welfare", "and", "does", "not", "take", "into", "account", "its", "social", "impact", ",", "\"", "they", "said", "." ], "ids": [ 107, 12865, 53037, 11178, 51085, 19980, 10189, 52824, 10806, 23829, 112, 78366, 10111, 15107, 10472, 13574, 10708, 23200, 10474, 12142, 21316, 117, 107, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "opposition", "party", "Radical", "Cause", "controls", "all", "of", "the", "union", "##ized", "workers", "at", "the", "CV", "##G", "heavy", "industry", "complex", "and", "has", "systematic", "##ally", "opposed", "all", "government", "legislation", "in", "con", "##gres", "##s", "." ], "ids": [ 10117, 21227, 14039, 60062, 109005, 59897, 10435, 10108, 10105, 20763, 16589, 23829, 10160, 10105, 27642, 11447, 18296, 17425, 17217, 10111, 10393, 57912, 19777, 30488, 10435, 12047, 40807, 10106, 10173, 68094, 10107, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Omar", "Lugo", ",", "Caracas", "news", "##room", ",", "582", "834", "##40", "##5" ], "ids": [ 118, 118, 27221, 47696, 117, 35958, 14424, 25525, 117, 50254, 84229, 38109, 11166 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nicaragua", "##n", "dr", "##unk", "##s", "fear", "\"", "love", "##bit", "##e", "\"", "band", "##it", "." ], "ids": [ 32337, 10115, 17094, 33551, 10107, 44929, 107, 16138, 20768, 10112, 107, 11570, 10486, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##AG", "##U", "##A", ",", "Nicaragua", "1996", "-", "08", "-", "27" ], "ids": [ 73020, 109865, 12022, 10738, 117, 32337, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Heavy", "drink", "##ers", "in", "a", "Nicaragua", "##n", "city", "were", "search", "##ing", "for", "someone", "who", "has", "covered", "them", "in", "\"", "love", "##bit", "##es", "\"", "while", "they", "were", "passed", "out", "in", "a", "dr", "##unk", "##en", "st", "##up", "##or", ",", "a", "local", "newspaper", "reported", "on", "Tuesday", "." ], "ids": [ 31920, 69423, 10901, 10106, 169, 32337, 10115, 11584, 10309, 22419, 10230, 10142, 30455, 10479, 10393, 21543, 11345, 10106, 107, 16138, 20768, 10171, 107, 11371, 10689, 10309, 20006, 10950, 10106, 169, 17094, 33551, 10136, 28780, 14590, 10667, 117, 169, 11436, 22047, 15943, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "dre", "##ade", "##d", "\"", "chu", "##pa", "##bol", "##os", "\"", "-", "-", "\"", "dr", "##unk", "##su", "##cker", "\"", "-", "-", "prey", "##s", "on", "men", "who", "have", "passed", "out", "in", "the", "streets", "of", "Mata", "##gal", "##pa", ",", "80", "miles", "(", "130", "km", "##s", ")", "north", "of", "Mana", "##gua", ",", "placing", "hi", "##ckey", "-", "like", "\"", "love", "##bit", "##es", "\"", "on", "various", "parts", "of", "their", "bodies", ",", "El", "Nuevo", "Diario", "reported", "." ], "ids": [ 10117, 35028, 12930, 10162, 107, 109628, 11359, 22729, 10310, 107, 118, 118, 107, 17094, 33551, 12892, 19153, 107, 118, 118, 94638, 10107, 10135, 10588, 10479, 10529, 20006, 10950, 10106, 10105, 41969, 10108, 38373, 17026, 11359, 117, 10832, 14148, 113, 13389, 10204, 10107, 114, 12756, 10108, 109645, 20337, 117, 66959, 11520, 92334, 118, 11850, 107, 16138, 20768, 10171, 107, 10135, 13547, 15569, 10108, 10455, 34106, 117, 10224, 26849, 48135, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "En", "##rage", "##d", "dr", "##unk", "##s", "and", "street", "people", "in", "this", "town", "known", "for", "its", "mach", "##ismo", "have", "organised", "a", "so", "-", "far", "unsuccessful", "search", "for", "the", "cu", "##lp", "##rit", "who", "finds", "victims", "in", "the", "dark", "streets", "surrounding", "a", "local", "market", "." ], "ids": [ 10243, 40696, 10162, 17094, 33551, 10107, 10111, 23840, 11426, 10106, 10531, 12221, 11053, 10142, 10474, 109664, 13689, 10529, 54200, 169, 10380, 118, 13301, 57669, 22419, 10142, 10105, 10854, 35451, 16598, 10479, 31478, 41205, 10106, 10105, 25100, 41969, 27027, 169, 11436, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "total", "number", "of", "victims", "was", "still", "unknown", "." ], "ids": [ 10117, 11339, 11487, 10108, 41205, 10134, 12647, 27306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "first", "of", "the", "victims", "were", "two", "va", "##gra", "##nts", "who", "sl", "##ept", "in", "an", "abandoned", "car", "in", "front", "of", "a", "local", "bank", ",", "the", "newspaper", "said", "." ], "ids": [ 10117, 10422, 10108, 10105, 41205, 10309, 10551, 10321, 25635, 14073, 10479, 38523, 54973, 10106, 10151, 32296, 13000, 10106, 14589, 10108, 169, 11436, 19423, 117, 10105, 22047, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "spite", "of", "the", "collective", "fear", "gr", "##ip", "##ping", "Mata", "##gal", "##pa", "'", "s", "drink", "##ers", ",", "local", "women", "expressed", "little", "sy", "##mpa", "##thy", "." ], "ids": [ 10167, 102845, 10108, 10105, 49417, 44929, 30518, 17437, 15398, 38373, 17026, 11359, 112, 187, 69423, 10901, 117, 11436, 13190, 31685, 16745, 12261, 31285, 54047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Its", "just", "desse", "##rts", "for", "all", "the", "'", "bolo", "##s", "'", "(", "dr", "##unk", "##ards", ")", "who", "sleep", "in", "the", "streets", "of", "our", "beautiful", "town", ",", "\"", "said", "a", "woman", "who", "worked", "in", "the", "local", "market", "." ], "ids": [ 107, 14864, 12820, 23633, 26215, 10142, 10435, 10105, 112, 23109, 10107, 112, 113, 17094, 33551, 47133, 114, 10479, 63658, 10106, 10105, 41969, 10108, 17446, 42235, 12221, 117, 107, 12415, 169, 18299, 10479, 13858, 10106, 10105, 11436, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazil", "likely", "to", "turn", "Ban", "##es", "##pa", "federal", "bank", "-", "paper", "." ], "ids": [ 16765, 22497, 10114, 18923, 21631, 10171, 11359, 16293, 19423, 118, 17895, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SAO", "PA", "##UL", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 90616, 32349, 100673, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazil", "is", "likely", "to", "turn", "Sao", "Paulo", "state", "bank", "Ban", "##es", "##pa", "into", "a", "federal", "bank", "in", "a", "prior", "step", "to", "privat", "##ization", ",", "according", "to", "un", "##named", "government", "sources", ",", "O", "Globo", "daily", "said", "." ], "ids": [ 16765, 10124, 22497, 10114, 18923, 51645, 13360, 11388, 19423, 21631, 10171, 11359, 10708, 169, 16293, 19423, 10106, 169, 20972, 31877, 10114, 51085, 19980, 117, 18071, 10114, 10119, 95196, 12047, 19023, 117, 152, 40601, 27636, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 5, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "The", "newspaper", "said", "the", "Central", "Bank", "special", "administration", "of", "Ban", "##es", "##pa", "ends", "in", "December", "30", "and", "after", "that", "the", "bank", "has", "to", "be", "liquid", "##ated", "or", "turned", "into", "a", "federal", "bank", "since", "there", "are", "no", "conditions", "to", "return", "Ban", "##es", "##pa", "to", "Sao", "Paulo", "state", "government", "." ], "ids": [ 10117, 22047, 12415, 10105, 11885, 13533, 14478, 17941, 10108, 21631, 10171, 11359, 29047, 10106, 11288, 10244, 10111, 10662, 10189, 10105, 19423, 10393, 10114, 10347, 58538, 22525, 10345, 21031, 10708, 169, 16293, 19423, 11764, 11155, 10301, 10192, 17315, 10114, 15079, 21631, 10171, 11359, 10114, 51645, 13360, 11388, 12047, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "A", "Central", "Bank", "spoke", "##sman", "said", "he", "could", "not", "con", "##fir", "##m", "or", "den", "##y", "the", "report", "." ], "ids": [ 138, 11885, 13533, 50005, 24305, 12415, 10261, 12174, 10472, 10173, 61644, 10147, 10345, 10140, 10157, 10105, 17553, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ban", "##es", "##pa", "has", "been", "under", "central", "bank", "special", "temporary", "administration", "since", "December", "1994", "." ], "ids": [ 21631, 10171, 11359, 10393, 10590, 10571, 12397, 19423, 14478, 43270, 17941, 11764, 11288, 10444, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "central", "bank", "management", "could", "be", "lift", "##ed", "if", "Sao", "Paulo", "state", "decided", "to", "take", "part", "in", "the", "recent", "federal", "government", "'", "s", "plan", "to", "rest", "##ru", "##cture", "state", "banks", "." ], "ids": [ 10117, 12397, 19423, 17150, 12174, 10347, 63376, 10336, 12277, 51645, 13360, 11388, 17270, 10114, 13574, 10668, 10106, 10105, 19037, 16293, 12047, 112, 187, 13065, 10114, 17333, 11680, 57336, 11388, 41375, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Under", "the", "plan", ",", "the", "federal", "government", "would", "provide", "100", "percent", "of", "the", "fina", "##ncing", "needed", "to", "rest", "##ru", "##cture", "debt", "of", "state", "banks", "being", "privat", "##ized", ",", "liquid", "##ated", "or", "turned", "into", "development", "banks", "." ], "ids": [ 12594, 10105, 13065, 117, 10105, 16293, 12047, 10894, 16871, 10407, 22362, 10108, 10105, 79420, 37730, 23794, 10114, 17333, 11680, 57336, 55869, 10108, 11388, 41375, 11223, 51085, 16589, 117, 58538, 22525, 10345, 21031, 10708, 13405, 41375, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "also", "offers", "to", "ref", "##inan", "##ce", "up", "to", "50", "percent", "of", "the", "debt", "held", "by", "state", "banks", "whose", "governments", "decide", "to", "keep", "control", "of", "their", "banks", "." ], "ids": [ 10377, 10379, 23818, 10114, 48056, 39646, 10419, 10741, 10114, 10462, 22362, 10108, 10105, 55869, 11991, 10155, 11388, 41375, 16879, 52052, 19068, 10114, 23819, 12608, 10108, 10455, 41375, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Although", "the", "plan", "was", "designed", "under", "terms", "proposed", "by", "Sao", "Paulo", "state", "governor", "Mario", "Co", "##vas", ",", "he", "has", "showed", "no", "interest", "in", "taking", "part", "in", "the", "plan", "because", "Sao", "Paulo", "'", "s", "debt", "with", "Ban", "##es", "##pa", "has", "increased", "sharp", "##ly", ",", "O", "Globo", "said", "." ], "ids": [ 15785, 10105, 13065, 10134, 15513, 10571, 18873, 21622, 10155, 51645, 13360, 11388, 28795, 14011, 13098, 14139, 117, 10261, 10393, 27463, 10192, 17644, 10106, 18084, 10668, 10106, 10105, 13065, 12373, 51645, 13360, 112, 187, 55869, 10169, 21631, 10171, 11359, 10393, 19299, 77348, 10454, 117, 152, 40601, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Sao", "Paulo", "state", "'", "s", "debt", "is", "now", "estimated", "at", "19", "billion", "reais", "." ], "ids": [ 51645, 13360, 11388, 112, 187, 55869, 10124, 11858, 25267, 10160, 10270, 25848, 76721, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "Globo", "also", "said", "another", "del", "##icate", "case", "to", "be", "solve", "##d", "involves", "private", "bank", "Ba", "##meri", "##ndus", "." ], "ids": [ 152, 40601, 10379, 12415, 12864, 10127, 58621, 13474, 10114, 10347, 100679, 10162, 53963, 14591, 19423, 21333, 85137, 95709, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "newspaper", "said", "Ba", "##meri", "##ndus", "has", "sent", "to", "the", "Central", "Bank", "a", "proposal", "for", "rest", "##ru", "##ct", "##uring", "combined", "with", "a", "request", "for", "a", "90", "-", "day", "credit", "line", ",", "paying", "four", "percent", "a", "year", "plus", "the", "Basic", "Interest", "Rate", "of", "the", "Central", "Bank", "(", "TB", "##C", ")", "." ], "ids": [ 10117, 22047, 12415, 21333, 85137, 95709, 10393, 14541, 10114, 10105, 11885, 13533, 169, 43542, 10142, 17333, 11680, 14526, 31653, 25302, 10169, 169, 37449, 10142, 169, 10919, 118, 11940, 37021, 12117, 117, 81846, 11598, 22362, 169, 10924, 10563, 10105, 34454, 88492, 105299, 10108, 10105, 11885, 13533, 113, 73562, 10858, 114, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "O", "Globo", "also", "said", "the", "loan", "would", "give", "Ba", "##meri", "##ndus", "time", "to", "sell", "assets", "." ], "ids": [ 152, 40601, 10379, 12415, 10105, 33390, 10894, 18090, 21333, 85137, 95709, 10635, 10114, 36300, 51701, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ba", "##meri", "##ndus", ",", "Brazil", "'", "s", "fourth", "-", "largest", "private", "bank", ",", "has", "been", "facing", "liquid", "##ity", "troubles", "." ], "ids": [ 21333, 85137, 95709, 117, 16765, 112, 187, 16918, 118, 15363, 14591, 19423, 117, 10393, 10590, 48237, 58538, 11949, 72760, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ba", "##meri", "##ndus", "declined", "to", "comment", "on", "negotiations", "being", "held", "with", "the", "Central", "Bank", "." ], "ids": [ 21333, 85137, 95709, 44948, 10114, 49641, 10135, 61946, 11223, 11991, 10169, 10105, 11885, 13533, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "-", "-", "Fat", "##ima", "Cristina", ",", "Sao", "Paulo", "news", "##room", ",", "55", "-", "11", "-", "232", "##44", "##11" ], "ids": [ 118, 118, 48803, 12443, 28286, 117, 51645, 13360, 14424, 25525, 117, 11358, 118, 10193, 118, 23944, 98041, 37115 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Czech", "Republic", "'", "s", "Havel", "to", "tour", "Brazil", "in", "September", "." ], "ids": [ 22148, 13681, 112, 187, 96405, 10114, 12842, 16765, 10106, 10596, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-PER", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 4, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "BR", "##AS", "##IL", "##IA", "1996", "-", "08", "-", "27" ], "ids": [ 49351, 38025, 38850, 35976, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Czech", "Republic", "President", "Va", "##cla", "##v", "Havel", "is", "scheduled", "to", "make", "an", "official", "visit", "to", "Brazil", "Sept", "." ], "ids": [ 22148, 13681, 12811, 14723, 60582, 10477, 96405, 10124, 34081, 10114, 13086, 10151, 14731, 27541, 10114, 16765, 51768, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 1, 5, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "15", "-", "21", ",", "Brazil", "'", "s", "Foreign", "Relations", "Ministry", "said", "on", "Tuesday", "." ], "ids": [ 10208, 118, 10296, 117, 16765, 112, 187, 20277, 36503, 19170, 12415, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Havel", "is", "due", "to", "meet", "with", "his", "Brazilian", "counter", "##part", "Fernando", "Henrique", "Cardoso", "in", "the", "capital", "Brasil", "##ia", "and", "will", "visit", "the", "cities", "of", "Mana", "##us", ",", "Sao", "Paulo", "and", "Rio", "de", "Janeiro", "." ], "ids": [ 96405, 10124, 10850, 10114, 23267, 10169, 10226, 32818, 46298, 48433, 14022, 40804, 89450, 10106, 10105, 12185, 12264, 10280, 10111, 11337, 27541, 10105, 19838, 10108, 109645, 10251, 117, 51645, 13360, 10111, 12109, 10104, 14822, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Also", "due", "to", "visit", "Brazil", "in", "September", "are", "South", "Korean", "President", "Kim", "Young", "Sam", "and", "German", "Chancellor", "Helmut", "Kohl", "." ], "ids": [ 20593, 10850, 10114, 27541, 16765, 10106, 10596, 10301, 11056, 20501, 12811, 13539, 12478, 14268, 10111, 12026, 59109, 25970, 106563, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 2, 6, 9, 4, 8, 8, 9, 2, 9, 4, 8, 9 ] }, { "tokens": [ "Former", "Argentine", "bene", "##vole", "##nt", "di", "##ctat", "##or", "Alejandro", "Lan", "##usse", "dies", "." ], "ids": [ 42355, 31469, 41847, 26741, 10368, 10120, 95400, 10667, 23425, 19670, 33181, 15229, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "B", "##UE", "##NO", "##S", "AI", "##RE", "##S", "1996", "-", "08", "-", "26" ], "ids": [ 139, 62674, 67292, 10731, 62405, 66014, 10731, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alejandro", "Lan", "##usse", ",", "the", "former", "di", "##ctat", "##or", "who", "ruled", "Argentina", "for", "two", "years", ",", "died", "at", "age", "78", "on", "Monday", "." ], "ids": [ 23425, 19670, 33181, 117, 10105, 11775, 10120, 95400, 10667, 10479, 34920, 12853, 10142, 10551, 10855, 117, 12482, 10160, 12089, 12492, 10135, 40714, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lan", "##usse", "died", "after", "being", "brought", "to", "a", "hospital", "a", "week", "ago", "following", "a", "fall", "at", "home", "that", "resulted", "in", "a", "blood", "c", "##lot", "in", "the", "brain", "." ], "ids": [ 19670, 33181, 12482, 10662, 11223, 17327, 10114, 169, 18141, 169, 16118, 36390, 11901, 169, 18042, 10160, 11816, 10189, 26633, 10106, 169, 24911, 171, 20288, 10106, 10105, 34467, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "operated", "on", "earlier", "in", "the", "week", "but", "failed", "to", "recover", "from", "surgery", "." ], "ids": [ 10357, 10134, 19301, 10135, 18905, 10106, 10105, 16118, 10473, 20775, 10114, 94962, 10188, 44811, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "former", "di", "##ctat", "##or", ",", "who", "ruled", "from", "1971", "to", "1973", ",", "was", "best", "known", "for", "allowing", "Juan", "Domingo", "Pero", "##n", ",", "Argentina", "'", "s", "fame", "##d", "pop", "##ulis", "##t", "leader", ",", "to", "return", "to", "Argentina", "after", "17", "years", "of", "forced", "exile", "." ], "ids": [ 10117, 11775, 10120, 95400, 10667, 117, 10479, 34920, 10188, 10732, 10114, 10724, 117, 10134, 12504, 11053, 10142, 28357, 11686, 22173, 21434, 10115, 117, 12853, 112, 187, 51930, 10162, 13717, 52393, 10123, 15014, 117, 10114, 15079, 10114, 12853, 10662, 10273, 10855, 10108, 20054, 67696, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lan", "##usse", "took", "over", "the", "leadership", "of", "the", "country", "after", "five", "years", "of", "di", "##ctat", "##ors", "##hip", "." ], "ids": [ 19670, 33181, 12149, 10491, 10105, 25121, 10108, 10105, 12723, 10662, 12403, 10855, 10108, 10120, 95400, 16379, 17883, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "unlike", "his", "two", "predecessor", "##s", ",", "Juan", "Carlos", "On", "##gani", "##a", "and", "Marcelo", "Levin", "##gst", "##on", ",", "who", "ruled", "Argentina", "with", "an", "iron", "hand", ",", "Lan", "##usse", "st", "##eer", "##ed", "the", "country", "toward", "democracy", "." ], "ids": [ 16976, 59114, 10226, 10551, 58875, 10107, 117, 11686, 12050, 10576, 102405, 10113, 10111, 38165, 62900, 65278, 10263, 117, 10479, 34920, 12853, 10169, 10151, 32374, 15230, 117, 19670, 33181, 28780, 23869, 10336, 10105, 12723, 32216, 67519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "resulted", "in", "general", "elections", "in", "March", "1973", "when", "the", "Pero", "##nist", "##s", "led", "by", "Hector", "Campo", "##ra", "and", "Vicente", "Sol", "##ano", "Lima", "returned", "to", "power", "." ], "ids": [ 13646, 26633, 10106, 11389, 22054, 10106, 11144, 10724, 10841, 10105, 21434, 44902, 10107, 12857, 10155, 43453, 22188, 10288, 10111, 21089, 19655, 12301, 18671, 14030, 10114, 13183, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Lan", "##usse", "was", "a", "candidate", "in", "the", "election", "but", "failed", "to", "defeat", "his", "old", "ad", "##verso", "##ries", "and", "never", "returned", "to", "public", "office", "." ], "ids": [ 19670, 33181, 10134, 169, 22102, 10106, 10105, 13685, 10473, 20775, 10114, 24800, 10226, 12898, 10840, 66005, 15388, 10111, 14794, 14030, 10114, 11683, 14301, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "imprisoned", "for", "four", "years", "in", "1951", "for", "taking", "part", "in", "a", "coup", "attempt", "to", "over", "##th", "##row", "Pero", "##n", "led", "by", "General", "Benjamin", "Men", "##ende", "##z", "." ], "ids": [ 10357, 10134, 73412, 10142, 11598, 10855, 10106, 11200, 10142, 18084, 10668, 10106, 169, 26854, 21395, 10114, 10491, 11143, 21454, 21434, 10115, 12857, 10155, 11220, 16810, 13026, 13201, 10305, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Lan", "##usse", "'", "s", "rule", "saw", "the", "gradual", "rise", "of", "left", "-", "wing", "act", "##ivi", "##sm", "which", "cu", "##lmi", "##nated", "in", "another", "period", "of", "brutal", "Argentine", "di", "##ctat", "##ors", "##hip", "from", "1976", "to", "1983", ",", "during", "which", "the", "military", "launched", "its", "\"", "dir", "##ty", "war", "\"", "that", "resulted", "in", "10", ",", "000", "missing", "people", "." ], "ids": [ 19670, 33181, 112, 187, 21983, 17112, 10105, 102414, 28710, 10108, 12153, 118, 22571, 19833, 22317, 19534, 10319, 10854, 45659, 57566, 10106, 12864, 13127, 10108, 81088, 31469, 10120, 95400, 16379, 17883, 10188, 10705, 10114, 10643, 117, 10939, 10319, 10105, 14041, 18850, 10474, 107, 15895, 11195, 10338, 107, 10189, 26633, 10106, 10150, 117, 10259, 39542, 11426, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "his", "autobiography", "published", "in", "1990", ",", "Lan", "##usse", "described", "himself", "as", "a", "military", "man", "with", "\"", "democratic", "ideas", ".", "\"" ], "ids": [ 10167, 10226, 100710, 12304, 10106, 10420, 117, 19670, 33181, 13010, 14764, 10146, 169, 14041, 10817, 10169, 107, 72209, 23802, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "born", "in", "Buenos", "Aires", "in", "1918", "and", "married", "Ile", "##ana", "Bell", "with", "whom", "he", "had", "nine", "children", "." ], "ids": [ 10357, 10134, 11175, 10106, 13929, 13960, 10106, 11097, 10111, 13524, 87945, 11631, 15521, 10169, 18104, 10261, 10374, 19964, 12694, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "entered", "the", "Military", "College", "in", "1935", "." ], "ids": [ 10357, 19226, 10105, 19425, 11454, 10106, 11271, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Ten", "missing", "in", "north", "China", "ship", "collision", "." ], "ids": [ 16411, 39542, 10106, 12756, 11593, 17309, 94460, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "27" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ten", "people", "were", "missing", "after", "a", "fishing", "boat", "coll", "##ide", "##d", "with", "a", "passenger", "liner", "and", "sank", "off", "China", "'", "s", "northeastern", "province", "of", "Li", "##ao", "##ning", ",", "state", "radio", "said", "on", "Tuesday", "." ], "ids": [ 16411, 11426, 10309, 39542, 10662, 169, 43768, 30418, 28552, 13315, 10162, 10169, 169, 33155, 92558, 10111, 61581, 11898, 11593, 112, 187, 81029, 14342, 10108, 13258, 14875, 11269, 117, 11388, 12429, 12415, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fishing", "boat", "sank", "and", "its", "entire", "crew", "was", "missing", "after", "a", "collision", "with", "the", "\"", "Tian", "##tan", "\"", "liner", "off", "the", "port", "of", "Dal", "##ian", "early", "on", "Monday", ",", "the", "report", "said", "." ], "ids": [ 10117, 43768, 30418, 61581, 10111, 10474, 19192, 24032, 10134, 39542, 10662, 169, 94460, 10169, 10105, 107, 90036, 12059, 107, 92558, 11898, 10105, 16874, 10108, 18205, 11630, 11732, 10135, 40714, 117, 10105, 17553, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "the", "liner", "was", "heading", "to", "Dal", "##ian", "from", "the", "northern", "port", "of", "Tian", "##jin", ",", "it", "said", "." ], "ids": [ 10377, 12415, 10105, 92558, 10134, 82839, 10114, 18205, 11630, 10188, 10105, 17335, 16874, 10108, 90036, 21331, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Dal", "##ian", "port", "officials", ",", "contacte", "##d", "by", "telephone", ",", "confirmed", "the", "collision", "but", "gave", "no", "further", "details", "." ], "ids": [ 18205, 11630, 16874, 27730, 117, 87471, 10162, 10155, 69009, 117, 27347, 10105, 94460, 10473, 15362, 10192, 14586, 29500, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mata", "##hari", "rev", "##ises", "down", "1996", "net", "target", "." ], "ids": [ 38373, 44830, 86095, 30466, 12935, 10389, 11988, 28564, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "JA", "##KA", "##RT", "##A", "1996", "-", "08", "-", "27" ], "ids": [ 53399, 67813, 46935, 10738, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indonesian", "department", "store", "operator", "PT", "Mata", "##hari", "Putra", "Prima", "said", "on", "Tuesday", "that", "it", "had", "revised", "down", "its", "1996", "net", "profit", "target", "." ], "ids": [ 47340, 21079, 13708, 36935, 30350, 38373, 44830, 89164, 20328, 12415, 10135, 70245, 10189, 10271, 10374, 41226, 12935, 10474, 10389, 11988, 25081, 28564, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mata", "##hari", "'", "s", "finance", "director", ",", "Han", "##ifa", "##h", "Kom", "##ala", ",", "said", "they", "revised", "down", "net", "profit", "for", "1996", "to", "46", "billion", "from", "its", "original", "target", "of", "50", "billion", "ru", "##pia", "##h", "." ], "ids": [ 38373, 44830, 112, 187, 48053, 12461, 117, 10818, 44874, 10237, 106306, 13322, 117, 12415, 10689, 41226, 12935, 11988, 25081, 10142, 10389, 10114, 11528, 25848, 10188, 10474, 11364, 28564, 10108, 10462, 25848, 13483, 17837, 10237, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "to", "revised", "down", "our", "target", "due", "to", "weak", "sales", "performance", "in", "the", "third", "quarter", ",", "\"", "said", "Kom", "##ala", "." ], "ids": [ 107, 12865, 10529, 10114, 41226, 12935, 17446, 28564, 10850, 10114, 61285, 23857, 14432, 10106, 10105, 12628, 28330, 117, 107, 12415, 106306, 13322, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "He", "also", "said", "the", "company", "ex", "##pect", "to", "record", "a", "83", "billion", "ru", "##pia", "##h", "of", "net", "profit", "in", "1997", "." ], "ids": [ 10357, 10379, 12415, 10105, 12100, 11419, 51511, 10114, 12410, 169, 12408, 25848, 13483, 17837, 10237, 10108, 11988, 25081, 10106, 10391, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Jakarta", "news", "##room", "+", "622", "##1", "384", "-", "636", "##4" ], "ids": [ 118, 118, 14164, 14424, 25525, 116, 56639, 10759, 32466, 118, 54105, 11011 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", ".", "Korea", "asked", "to", "stop", "China", "-", "bound", "mission", "##aries", "." ], "ids": [ 156, 119, 14096, 22151, 10114, 20517, 11593, 118, 46538, 17032, 26445, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "27" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Beijing", "has", "called", "on", "Seoul", "to", "stop", "South", "Korean", "mission", "##aries", "from", "travelling", "to", "China", ",", "a", "South", "Korean", "em", "##bas", "##sy", "spoke", "##sman", "said", "on", "Tuesday", "." ], "ids": [ 23824, 10393, 11552, 10135, 26335, 10114, 20517, 11056, 20501, 17032, 26445, 10188, 81353, 10114, 11593, 117, 169, 11056, 20501, 10266, 21322, 16105, 50005, 24305, 12415, 10135, 70245, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "appeal", "was", "made", "on", "Sunday", "during", "talks", "between", "South", "Korean", "deputy", "Foreign", "Minister", "Lee", "Ki", "-", "cho", "##o", "and", "his", "Chinese", "counter", "##part", "Tang", "Ji", "##ax", "##uan", ",", "the", "spoke", "##sman", "said", "." ], "ids": [ 10117, 44861, 10134, 11019, 10135, 19731, 10939, 56672, 10948, 11056, 20501, 45404, 20277, 14355, 12006, 28941, 118, 11257, 10133, 10111, 10226, 13299, 46298, 48433, 26603, 30822, 31691, 16093, 117, 10105, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "not", "known", "why", "China", "raised", "the", "issue", "." ], "ids": [ 10377, 10124, 10472, 11053, 31237, 11593, 20526, 10105, 15557, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##hei", "##st", "China", "officially", "ban", "##s", "missionary", "activities", "but", "often", "turns", "a", "blind", "eye", "to", "religious", "activities", "of", "people", "nominal", "##ly", "employed", "as", "foreign", "language", "teachers", ",", "particularly", "in", "remote", "areas", "that", "are", "unable", "to", "attract", "other", "candidates", "." ], "ids": [ 11699, 89508, 10562, 11593, 23296, 11915, 10107, 89063, 19286, 10473, 12899, 37374, 169, 59893, 32684, 10114, 19366, 19286, 10108, 11426, 67255, 10454, 29682, 10146, 20796, 13702, 38160, 117, 19658, 10106, 55808, 14544, 10189, 10301, 30553, 10114, 96721, 10684, 33439, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", "na", "##bs", "blind", "10", "-", "year", "-", "old", "illegal", "immigrant", "." ], "ids": [ 15078, 14577, 10132, 19528, 59893, 10150, 118, 10924, 118, 12898, 39806, 98839, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "27" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "blind", "10", "-", "year", "-", "old", "boy", "from", "China", "s", "##nea", "##ked", "over", "the", "border", "into", "Hong", "Kong", "and", "was", "arrested", "as", "an", "illegal", "immigrant", ",", "Hong", "Kong", "police", "said", "on", "Tuesday", "." ], "ids": [ 138, 59893, 10150, 118, 10924, 118, 12898, 26905, 10188, 11593, 187, 32239, 30511, 10491, 10105, 20949, 10708, 15078, 14577, 10111, 10134, 29479, 10146, 10151, 39806, 98839, 117, 15078, 14577, 15034, 12415, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "caught", "by", "police", "trying", "to", "force", "his", "way", "into", "a", "home", "in", "the", "rural", "New", "Territories", ",", "a", "police", "spoke", "##sman", "said", "." ], "ids": [ 10357, 10134, 39797, 10155, 15034, 32862, 10114, 15031, 10226, 13170, 10708, 169, 11816, 10106, 10105, 18380, 10287, 72615, 117, 169, 15034, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "boy", "came", "from", "China", "'", "s", "eastern", "province", "of", "Jiang", "##su", "." ], "ids": [ 107, 10117, 26905, 13383, 10188, 11593, 112, 187, 18677, 14342, 10108, 68373, 12892, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "He", "was", "spotted", "by", "a", "passer", "##by", "trying", "to", "climb", "into", "an", "apartment", "in", "the", "early", "hours", "of", "Monday", "morning", ",", "\"", "the", "spoke", "##sman", "said", "." ], "ids": [ 10357, 10134, 96924, 10155, 169, 34650, 11530, 32862, 10114, 93274, 10708, 10151, 54617, 10106, 10105, 11732, 19573, 10108, 40714, 28757, 117, 107, 10105, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "decision", "has", "yet", "been", "made", "on", "how", "to", "deal", "with", "the", "boy", "." ], "ids": [ 10657, 19231, 10393, 21833, 10590, 11019, 10135, 14796, 10114, 19918, 10169, 10105, 26905, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", "police", "regularly", "catch", "hundreds", "of", "illegal", "immigrants", "and", "people", "who", "have", "over", "##sta", "##yed", "their", "visas", "from", "mainland", "China", "and", "send", "them", "back", "." ], "ids": [ 15078, 14577, 15034, 36942, 61093, 48329, 10108, 39806, 44736, 10111, 11426, 10479, 10529, 10491, 10972, 68159, 10455, 62665, 10188, 70083, 11593, 10111, 45567, 11345, 12014, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", ",", "a", "British", "colony", ",", "rev", "##erts", "to", "Chinese", "control", "next", "year", "but", "will", "remain", "seal", "##ed", "off", "from", "the", "mainland", "except", "to", "a", "tin", "##y", "trick", "##le", "of", "legal", "immigrants", "and", "people", "with", "special", "visit", "permit", "##s", "." ], "ids": [ 15078, 14577, 117, 169, 11160, 48968, 117, 86095, 64115, 10114, 13299, 12608, 13451, 10924, 10473, 11337, 25430, 37985, 10336, 11898, 10188, 10105, 70083, 23423, 10114, 169, 21629, 10157, 71662, 10284, 10108, 17139, 44736, 10111, 11426, 10169, 14478, 27541, 52345, 10107, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 2, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bosnia", "##n", "premier", "in", "Turkey", "for", "one", "day", "visit", "." ], "ids": [ 29634, 10115, 11913, 10106, 22519, 10142, 10464, 11940, 27541, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##KA", "##RA", "1996", "-", "08", "-", "27" ], "ids": [ 50972, 67813, 29990, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bosnia", "##n", "Prime", "Minister", "Hasan", "Murat", "##ovi", "##c", "arrived", "in", "Ankara", "on", "Tuesday", "for", "an", "official", "visit", "where", "he", "is", "due", "to", "discuss", "Turkey", "'", "s", "aid", "to", "the", "former", "Yugoslav", "republic", "." ], "ids": [ 29634, 10115, 19924, 14355, 36578, 55008, 16653, 10350, 22584, 10106, 23883, 10135, 70245, 10142, 10151, 14731, 27541, 10940, 10261, 10124, 10850, 10114, 71695, 22519, 112, 187, 19778, 10114, 10105, 11775, 93444, 108499, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 4, 8, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "premier", ",", "who", "is", "due", "to", "meet", "his", "Turkish", "counter", "##part", "Ne", "##cm", "##etti", "##n", "Er", "##bakan", "on", "Tuesday", ",", "will", "also", "be", "discuss", "##ing", "the", "post", "##pone", "##d", "Bosnia", "##n", "elections", ",", "a", "foreign", "ministry", "official", "said", "." ], "ids": [ 10117, 11913, 117, 10479, 10124, 10850, 10114, 23267, 10226, 22814, 46298, 48433, 19416, 27528, 21985, 10115, 10915, 91850, 10135, 70245, 117, 11337, 10379, 10347, 71695, 10230, 10105, 11841, 35741, 10162, 29634, 10115, 22054, 117, 169, 20796, 65338, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "small", "number", "of", "Bosnia", "##ns", "had", "also", "begun", "to", "vote", "in", "Turkey", "." ], "ids": [ 138, 12474, 11487, 10108, 29634, 10891, 10374, 10379, 49510, 10114, 18926, 10106, 22519, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Murat", "##ovi", "##c", "is", "also", "due", "to", "meet", "with", "President", "Sul", "##ey", "##man", "Demi", "##rel", ",", "Foreign", "Minister", "Tan", "##su", "Ci", "##ller", "and", "Turkish", "businessman", ",", "the", "ministry", "official", "said", "." ], "ids": [ 55008, 16653, 10350, 10124, 10379, 10850, 10114, 23267, 10169, 12811, 16049, 13005, 10589, 71326, 19362, 117, 20277, 14355, 30594, 12892, 51457, 18289, 10111, 22814, 49910, 117, 10105, 65338, 14731, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "will", "leave", "on", "Thursday", "." ], "ids": [ 10357, 11337, 21964, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "U", ".", "S", ".", "diplomat", "in", "charge", "of", "elections", "in", "Bosnia", "announced", "earlier", "that", "municipal", "poll", "##s", "due", "on", "September", "14", "with", "other", "Bosnia", "##n", "elections", "would", "be", "put", "off", "because", "of", "irregular", "##ities", "by", "the", "Ser", "##bs", "in", "register", "##ing", "voters", "." ], "ids": [ 138, 158, 119, 156, 119, 45652, 10106, 18163, 10108, 22054, 10106, 29634, 13854, 18905, 10189, 14935, 70156, 10107, 10850, 10135, 10596, 10247, 10169, 10684, 29634, 10115, 22054, 10894, 10347, 14499, 11898, 12373, 10108, 55143, 17285, 10155, 10105, 39759, 19528, 10106, 47424, 10230, 55450, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "no", "new", "date", "had", "been", "set", "yet", "." ], "ids": [ 10357, 12415, 10192, 10751, 13664, 10374, 10590, 11847, 21833, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Turkish", "people", "are", "watching", "closely", "the", "developments", "in", "Bosnia", "." ], "ids": [ 107, 22814, 11426, 10301, 84532, 34331, 10105, 74475, 10106, 29634, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "We", "have", "seen", "elections", "as", "a", "step", "in", "the", "normal", "##isation", "process", ",", "\"", "the", "foreign", "ministry", "official", "said", "." ], "ids": [ 12865, 10529, 15652, 22054, 10146, 169, 31877, 10106, 10105, 16626, 20312, 15138, 117, 107, 10105, 20796, 65338, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "U", ".", "N", ".", "relief", "co", "##ordinator", "arrives", "in", "Iraq", "." ], "ids": [ 10287, 158, 119, 151, 119, 31276, 11170, 72397, 69631, 10106, 21455, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Leon", "Bar", "##kh", "##o" ], "ids": [ 19409, 20698, 48502, 10133 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "BA", "##G", "##HD", "##AD", "1996", "-", "08", "-", "27" ], "ids": [ 39999, 11447, 99997, 55538, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "new", "U", ".", "N", ".", "relief", "co", "##ordinator", "has", "arrived", "in", "Baghdad", "to", "take", "up", "the", "task", "of", "organi", "##sing", "human", "##itarian", "goods", "distribution", "and", "to", "face", "Iraq", "'", "s", "continuing", "opposition", "over", "the", "number", "of", "international", "monitor", "##s", "to", "be", "involved", "." ], "ids": [ 138, 10751, 158, 119, 151, 119, 31276, 11170, 72397, 10393, 22584, 10106, 73055, 10114, 13574, 10741, 10105, 37758, 10108, 91969, 16357, 14179, 63378, 36931, 18477, 10111, 10114, 13295, 21455, 112, 187, 47635, 21227, 10491, 10105, 11487, 10108, 12533, 60774, 10107, 10114, 10347, 16247, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "N", ".", "and", "diplomatic", "sources", "said", "on", "Tuesday", "that", "Secretary", "-", "General", "Bou", "##tros", "Bou", "##tros", "-", "G", "##hali", "had", "appointed", "Italian", "G", "##ual", "##tier", "##o", "Fu", "##lch", "##eri", "and", "sent", "him", "to", "Iraq", "last", "week", "to", "replace", "Moro", "##cca", "##n", "Mohamed", "Ze", "##j", "##jar", "##i", "." ], "ids": [ 158, 119, 151, 119, 10111, 64838, 19023, 12415, 10135, 70245, 10189, 19382, 118, 11220, 62583, 34715, 62583, 34715, 118, 144, 63889, 10374, 14896, 11667, 144, 17907, 34146, 10133, 17056, 93049, 13227, 10111, 14541, 10957, 10114, 21455, 12469, 16118, 10114, 37156, 66832, 20057, 10115, 31790, 15536, 10418, 17502, 10116, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 2, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 6, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "One", "diplomat", "said", "Iraq", "and", "U", ".", "N", ".", "were", "still", "in", "disa", "##gree", "##ment", "on", "how", "many", "international", "observer", "##s", "would", "be", "required", "to", "as", "##cer", "##tain", "the", "e", "##quita", "##ble", "distribution", "of", "human", "##itarian", "supplies", "that", "will", "be", "pro", "##cure", "##d", "under", "Baghdad", "'", "s", "oil", "deal", "with", "U", ".", "N", "." ], "ids": [ 11340, 45652, 12415, 21455, 10111, 158, 119, 151, 119, 10309, 12647, 10106, 36474, 91479, 10426, 10135, 14796, 11299, 12533, 79368, 10107, 10894, 10347, 17468, 10114, 10146, 17505, 37879, 10105, 173, 54810, 11203, 18477, 10108, 14179, 63378, 49963, 10189, 11337, 10347, 11284, 55888, 10162, 10571, 73055, 112, 187, 21073, 19918, 10169, 158, 119, 151, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "United", "Nations", "would", "like", "to", "em", "##ploy", "hundreds", "of", "foreign", "monitor", "##s", "." ], "ids": [ 107, 10117, 10609, 15145, 10894, 11850, 10114, 10266, 91823, 48329, 10108, 20796, 60774, 10107, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Baghdad", "says", "it", "can", "only", "accept", "a", "few", "dozen", "##s", ",", "\"", "said", "the", "diplomat", "." ], "ids": [ 73055, 22153, 10271, 10944, 10893, 45218, 169, 13824, 84956, 10107, 117, 107, 12415, 10105, 45652, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Baghdad", "holds", "that", "the", "Iraq", "-", "U", ".", "N", ".", "me", "##mora", "##ndum", "of", "understanding", "on", "partial", "oil", "sales", "signed", "last", "June", "does", "not", "sp", "##eci", "##fy", "how", "many", "foreign", "observer", "##s", "should", "be", "stationed", "in", "Iraq", "." ], "ids": [ 73055, 28278, 10189, 10105, 21455, 118, 158, 119, 151, 119, 10911, 79374, 52831, 10108, 37149, 10135, 39474, 21073, 23857, 14775, 12469, 11120, 15107, 10472, 32650, 95076, 24203, 14796, 11299, 20796, 79368, 10107, 14819, 10347, 77675, 10106, 21455, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "Ob", "##servation", "of", "food", "supplies", "and", "their", "distribution", "are", "still", "a", "major", "issue", "and", "seems", "the", "two", "sides", "have", "not", "yet", "filled", "the", "gap", "separat", "##ing", "them", ",", "\"", "said", "another", "diplomat", "." ], "ids": [ 107, 43019, 62201, 10108, 18301, 49963, 10111, 10455, 18477, 10301, 12647, 169, 11922, 15557, 10111, 34208, 10105, 10551, 27263, 10529, 10472, 21833, 39287, 10105, 55995, 81806, 10230, 11345, 117, 107, 12415, 12864, 45652, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraq", "'", "s", "partial", "oil", "sales", "pa", "##ct", "with", "U", ".", "N", ".", ",", "allowing", "c", "##rude", "export", "##s", "worth", "$", "2", "billion", "every", "six", "months", ",", "gives", "U", ".", "N", ".", "the", "right", "to", "super", "##vise", "the", "purchase", "and", "distribution", "of", "food", "supplies", "in", "the", "country", "." ], "ids": [ 21455, 112, 187, 39474, 21073, 23857, 10931, 14526, 10169, 158, 119, 151, 119, 117, 28357, 171, 97417, 59220, 10107, 43509, 109, 123, 25848, 14234, 12449, 15555, 117, 24952, 158, 119, 151, 119, 10105, 13448, 10114, 25212, 36540, 10105, 37891, 10111, 18477, 10108, 18301, 49963, 10106, 10105, 12723, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "deal", "is", "a", "human", "##itarian", "exception", "to", "the", "U", ".", "N", ".", "san", "##ctions", "imposed", "on", "Iraq", "for", "in", "##vad", "##ing", "Kuwait", "in", "1990", "which", "include", "a", "ban", "on", "its", "oil", "export", "##s", "." ], "ids": [ 10117, 19918, 10124, 169, 14179, 63378, 30646, 10114, 10105, 158, 119, 151, 119, 14608, 42068, 83358, 10135, 21455, 10142, 10106, 16678, 10230, 44892, 10106, 10420, 10319, 12363, 169, 11915, 10135, 10474, 21073, 59220, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fu", "##lch", "##eri", "declined", "comment", "on", "the", "differences", "between", "the", "U", ".", "N", ".", "and", "Iraq", ",", "saying", "only", ":", "\"", "There", "are", "several", "different", "things", "which", "still", "need", "to", "be", "done", ".", "\"" ], "ids": [ 17056, 93049, 13227, 44948, 49641, 10135, 10105, 39336, 10948, 10105, 158, 119, 151, 119, 10111, 21455, 117, 22807, 10893, 131, 107, 11723, 10301, 11736, 12902, 24682, 10319, 12647, 17367, 10114, 10347, 20378, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fu", "##lch", "##eri", "started", "his", "U", ".", "N", ".", "career", "in", "1960", "and", "has", "long", "experience", "in", "U", ".", "N", ".", "emergency", "relief", "in", "Congo", ",", "Angola", ",", "Sudan", "and", "Somalia", "." ], "ids": [ 17056, 93049, 13227, 13457, 10226, 158, 119, 151, 119, 13021, 10106, 10699, 10111, 10393, 11695, 20627, 10106, 158, 119, 151, 119, 44461, 31276, 10106, 20633, 117, 21149, 117, 28407, 10111, 44803, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 1, 9, 1, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Kansas", "feed", "##lot", "cattle", "market", "quiet", ",", "no", "sales", "-", "USD", "##A", "." ], "ids": [ 16735, 44988, 20288, 56980, 17313, 104951, 117, 10192, 23857, 118, 24868, 10738, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "DO", "##D", "##GE", "C", "##IT", "##Y", "1996", "-", "08", "-", "27" ], "ids": [ 99843, 11490, 58719, 140, 37611, 14703, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "was", "quiet", ",", "with", "no", "sales", "sl", "##au", "##ghter", "st", "##eer", "##s", "or", "he", "##ifer", "##s", "confirmed", "." ], "ids": [ 15006, 10134, 104951, 117, 10169, 10192, 23857, 38523, 11705, 45953, 28780, 23869, 10107, 10345, 10261, 50930, 10107, 27347, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##quiry", "and", "demand", "very", "light", "." ], "ids": [ 10167, 56914, 10111, 34394, 12558, 15765, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sales", "confirmed", "week", "to", "date", "on", "4", ",", "200", "head", ",", "mostly", "previously", "contracted", "or", "formula", "##ted", "cattle", "." ], "ids": [ 48514, 27347, 16118, 10114, 13664, 10135, 125, 117, 10777, 13578, 117, 19774, 17477, 107661, 10345, 29659, 11912, 56980, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##fir", "##med", "-", "none", "." ], "ids": [ 12845, 61644, 21986, 118, 46638, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Chicago", "news", "##des", "##k", "312", "408", "872", "##0", "-", "-" ], "ids": [ 118, 118, 12317, 14424, 10920, 10174, 25104, 36899, 77107, 10929, 118, 118 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anti", "-", "ab", "##ortion", "speaker", "praise", "##s", "Democrat", "tol", "##erance", "." ], "ids": [ 26267, 118, 11357, 95171, 57738, 80753, 10107, 45338, 53183, 91710, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Alan", "Els", "##ner" ], "ids": [ 14309, 13075, 11129 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "anti", "-", "ab", "##ortion", "politician", "addressed", "the", "Democratic", "convention", "on", "Tuesday", ",", "but", "praised", "the", "over", "##w", "##hel", "##ming", "##ly", "pro", "-", "ab", "##ortion", "rights", "party", "for", "its", "tol", "##erance", "of", "his", "minority", "views", "." ], "ids": [ 10313, 14249, 118, 11357, 95171, 20354, 71121, 10105, 19281, 37812, 10135, 70245, 117, 10473, 38394, 10105, 10491, 10874, 31572, 16405, 10454, 11284, 118, 11357, 95171, 16691, 14039, 10142, 10474, 53183, 91710, 10108, 10226, 54147, 33396, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rep", "." ], "ids": [ 72337, 119 ], "entity": [ "B-MISC", "O" ], "entity_ids": [ 2, 9 ] }, { "tokens": [ "Tony", "Hall", "of", "Ohio", "said", "he", "and", "other", "Democrats", "who", "opposed", "ab", "##ortion", "had", "always", "felt", "left", "out", "in", "their", "own", "party", "." ], "ids": [ 13749, 11763, 10108, 13608, 12415, 10261, 10111, 10684, 56282, 10479, 30488, 11357, 95171, 10374, 19540, 24666, 12153, 10950, 10106, 10455, 12542, 14039, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "But", "this", "year", "is", "different", "." ], "ids": [ 107, 16976, 10531, 10924, 10124, 12902, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "the", "first", "time", ",", "the", "Democratic", "Party", "has", "included", "in", "our", "platform", "a", "conscience", "clause", ",", "\"", "he", "said", "." ], "ids": [ 11399, 10105, 10422, 10635, 117, 10105, 19281, 12529, 10393, 12742, 10106, 17446, 22753, 169, 63789, 104911, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "clause", "recognize", "##s", "and", "wel", "##come", "##s", "Democrats", "with", "div", "##erg", "##ent", "views", "on", "ab", "##ortion", "and", "states", "they", "have", "a", "full", "part", "to", "play", "at", "all", "levels", "of", "the", "party", "." ], "ids": [ 10117, 104911, 80673, 10107, 10111, 16829, 61643, 10107, 56282, 10169, 76486, 69248, 11405, 33396, 10135, 11357, 95171, 10111, 16316, 10689, 10529, 169, 13375, 10668, 10114, 12253, 10160, 10435, 21559, 10108, 10105, 14039, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Democratic", "Party", "is", "indeed", "the", "party", "of", "true", "inclusive", "##ness", ",", "\"", "Hall", "said", "." ], "ids": [ 107, 10117, 19281, 12529, 10124, 69815, 10105, 14039, 10108, 22024, 34379, 14010, 117, 107, 11763, 12415, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "At", "its", "convention", "four", "years", "ago", ",", "organize", "##rs", "prevented", "then", "Pennsylvania", "Go", "##v", "." ], "ids": [ 11699, 10474, 37812, 11598, 10855, 36390, 117, 83684, 10943, 75660, 11059, 14726, 14439, 10477, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Robert", "Casey", ",", "a", "ve", "##heme", "##nt", "opponent", "of", "ab", "##ortion", ",", "from", "speaking", "." ], "ids": [ 10820, 32759, 117, 169, 10323, 101318, 10368, 53610, 10108, 11357, 95171, 117, 10188, 33740, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Republicans", "have", "used", "their", "decision", "as", "an", "example", "of", "Democrat", "into", "##lera", "##nce", "ever", "since", "." ], "ids": [ 93700, 10529, 11031, 10455, 19231, 10146, 10151, 14351, 10108, 45338, 10708, 37684, 12150, 17038, 11764, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Casey", "told", "a", "news", "conference", "in", "Chicago", "on", "Tuesday", "he", "had", "asked", "to", "speak", "again", "this", "year", "but", "was", "turned", "down", "." ], "ids": [ 32759, 21937, 169, 14424, 25029, 10106, 12317, 10135, 70245, 10261, 10374, 22151, 10114, 41541, 13123, 10531, 10924, 10473, 10134, 21031, 12935, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Democratic", "leaders", "said", "there", "was", "not", "room", "on", "the", "program", "for", "every", "retired", "governor", "to", "speak", "." ], "ids": [ 19281, 24155, 12415, 11155, 10134, 10472, 19555, 10135, 10105, 12483, 10142, 14234, 18675, 28795, 10114, 41541, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "believe", "the", "Democratic", "party", "ou", "##ght", "to", "be", "pro", "-", "woman", ",", "pro", "-", "child", "and", "pro", "-", "life", ",", "\"", "Casey", "said", "." ], "ids": [ 107, 146, 30587, 10105, 19281, 14039, 10431, 20687, 10114, 10347, 11284, 118, 18299, 117, 11284, 118, 18048, 10111, 11284, 118, 12103, 117, 107, 32759, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "\"", "I", "asked", "for", "the", "opportunity", "to", "deliver", "this", "message", "from", "the", "podium", "of", "the", "Democrat", "National", "Convention", "." ], "ids": [ 107, 146, 22151, 10142, 10105, 34468, 10114, 80498, 10531, 30514, 10188, 10105, 39252, 10108, 10105, 45338, 10655, 25318, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "For", "the", "second", "time", "in", "four", "years", ",", "my", "request", "fell", "on", "dea", "##f", "ear", "##s", ",", "\"", "he", "said", "." ], "ids": [ 11399, 10105, 11132, 10635, 10106, 11598, 10855, 117, 15127, 37449, 25194, 10135, 42492, 10575, 104700, 10107, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Republican", "Party", ",", "whose", "platform", "calls", "for", "making", "all", "ab", "##ortion", "##s", "illegal", ",", "faced", "a", "similar", "dil", "##emma", "this", "year", "when", "Massachusetts", "Go", "##v", "." ], "ids": [ 10117, 21776, 12529, 117, 16879, 22753, 31886, 10142, 14293, 10435, 11357, 95171, 10107, 39806, 117, 31952, 169, 13213, 36031, 57717, 10531, 10924, 10841, 15123, 14439, 10477, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "William", "We", "##ld", "asked", "to", "deliver", "a", "speech", "defending", "ab", "##ortion", "rights", "and", "was", "turned", "down", "." ], "ids": [ 10694, 12865, 12620, 22151, 10114, 80498, 169, 29811, 53730, 11357, 95171, 16691, 10111, 10134, 21031, 12935, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bob", "Dol", "##e", ",", "the", "Republican", "presidential", "nominee", ",", "tried", "and", "failed", "to", "ins", "##ert", "a", "tol", "##erance", "clause", "in", "his", "party", "'", "s", "platform", "re", "##co", "##gni", "##zing", "the", "valid", "##ity", "of", "those", "within", "the", "party", "who", "supported", "ab", "##ortion", "rights", "." ], "ids": [ 13583, 100035, 10112, 117, 10105, 21776, 36476, 81878, 117, 27156, 10111, 20775, 10114, 15498, 11605, 169, 53183, 91710, 104911, 10106, 10226, 14039, 112, 187, 22753, 11639, 10812, 27170, 19308, 10105, 64999, 11949, 10108, 12676, 12381, 10105, 14039, 10479, 19992, 11357, 95171, 16691, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Democrats", "also", "heard", "Tuesday", "two", "passion", "##ate", "speech", "##es", "defending", "ab", "##ortion", "rights", "." ], "ids": [ 56282, 10379, 32240, 70245, 10551, 53946, 12436, 29811, 10171, 53730, 11357, 95171, 16691, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kate", "Michel", "##man", ",", "president", "of", "the", "National", "Ab", "##ortion", "Rights", "Action", "League", ",", "described", "how", "she", "had", "an", "ab", "##ortion", "at", "a", "time", "when", "the", "procedure", "was", "illegal", "after", "her", "husband", "abandoned", "her", "with", "three", "young", "children", "." ], "ids": [ 20965, 13273, 10589, 117, 12931, 10108, 10105, 10655, 15595, 95171, 22305, 21208, 11074, 117, 13010, 14796, 10833, 10374, 10151, 11357, 95171, 10160, 169, 10635, 10841, 10105, 48244, 10134, 39806, 10662, 10485, 19634, 32296, 10485, 10169, 11003, 14739, 12694, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "'", "m", "here", "to", "speak", "up", "for", "choice", "and", "to", "speak", "for", "truth", "." ], "ids": [ 107, 146, 112, 181, 19353, 10114, 41541, 10741, 10142, 30865, 10111, 10114, 41541, 10142, 47226, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "message", "from", "the", "Republican", "Party", "is", "one", "of", "dis", "##dai", "##n", "." ], "ids": [ 10117, 30514, 10188, 10105, 21776, 12529, 10124, 10464, 10108, 27920, 33738, 10115, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Their", "answer", "to", "choice", "is", "control", "and", "punishment", "." ], "ids": [ 17551, 57085, 10114, 30865, 10124, 12608, 10111, 80149, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Our", "answer", "is", "trust", ",", "com", "##pass", "##ion", "and", "respect", ",", "\"", "she", "said", "." ], "ids": [ 18465, 57085, 10124, 54399, 117, 10212, 36388, 11046, 10111, 28944, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Georgia", "Rep", "." ], "ids": [ 15234, 72337, 119 ], "entity": [ "B-LOC", "B-MISC", "O" ], "entity_ids": [ 1, 2, 9 ] }, { "tokens": [ "Cynthia", "M", "##c", "##K", "##inne", "##y", "said", ":", "\"", "You", "make", "your", "moral", "decisions", "." ], "ids": [ 60440, 150, 10350, 11733, 42506, 10157, 12415, 131, 107, 11065, 13086, 20442, 23680, 48126, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "'", "ll", "make", "mine", "and", "let", "'", "s", "leave", "(", "Republican", "House", "Speaker", ")", "New", "##t", "G", "##ing", "##rich", "out", "of", "it", ".", "\"" ], "ids": [ 146, 112, 22469, 13086, 27546, 10111, 13595, 112, 187, 21964, 113, 21776, 11545, 64844, 114, 10287, 10123, 144, 10230, 27749, 10950, 10108, 10271, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Spring", "/", "White", "W", "##hea", "##t", "-", "Bi", "##ds", "mostly", "st", "##eady", "." ], "ids": [ 158, 119, 156, 119, 18698, 120, 12136, 160, 45546, 10123, 118, 31156, 13268, 19774, 28780, 61973, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dark", "northern", "spring", "and", "white", "wheat", "bid", "##s", "were", "mostly", "st", "##eady", "on", "Tuesday", "but", "a", "few", "locations", "quoted", "weak", "##er", "values", "as", "newly", "har", "##vested", "spring", "wheat", "flood", "##ed", "the", "market", ",", "several", "cash", "grain", "deal", "##ers", "said", "." ], "ids": [ 16193, 17335, 26053, 10111, 15263, 109653, 50385, 10107, 10309, 19774, 28780, 61973, 10135, 70245, 10473, 169, 13824, 32602, 70676, 61285, 10165, 31313, 10146, 26574, 10453, 83099, 26053, 109653, 71027, 10336, 10105, 17313, 117, 11736, 52828, 69132, 19918, 10901, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "'", "s", "too", "much", "nearby", "wheat", "coming", "into", "the", "market", "so", "we", "'", "re", "backing", "off", "the", "basis", "to", "slow", "it", "down", ",", "\"", "a", "Montana", "deal", "##er", "said", "." ], "ids": [ 107, 11723, 112, 187, 16683, 13172, 22301, 109653, 23959, 10708, 10105, 17313, 10380, 11951, 112, 11639, 31962, 11898, 10105, 17172, 10114, 41573, 10271, 12935, 117, 107, 169, 24408, 19918, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Bi", "##ds", "there", "dropped", "10", "cents", "per", "bus", "##hel", "." ], "ids": [ 31156, 13268, 11155, 30241, 10150, 63487, 10178, 19369, 31572, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Harvest", "was", "also", "progress", "##ing", "well", "in", "parts", "of", "North", "Dakota", ",", "but", "one", "deal", "##er", "there", "said", "new", "crop", "movement", "remained", "limited", "to", "a", "st", "##eady", "trick", "##le", ".", "\"" ], "ids": [ 80291, 10134, 10379, 40316, 10230, 11206, 10106, 15569, 10108, 11225, 21435, 117, 10473, 10464, 19918, 10165, 11155, 12415, 10751, 99402, 17123, 15980, 19264, 10114, 169, 28780, 61973, 71662, 10284, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "re", "seeing", "some", "new", "crop", "coming", "in", "now", "but", "it", "'", "s", "slow", "going", ",", "\"", "the", "deal", "##er", "said", "." ], "ids": [ 12865, 112, 11639, 57039, 11152, 10751, 99402, 23959, 10106, 11858, 10473, 10271, 112, 187, 41573, 19090, 117, 107, 10105, 19918, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Else", "##where", ",", "basis", "values", "were", "mostly", "st", "##eady", "in", "quiet", "conditions", "with", "little", "note", "##wort", "##y", "domestic", "or", "export", "business", ",", "deal", "##ers", "said", "." ], "ids": [ 68006, 30935, 117, 17172, 31313, 10309, 19774, 28780, 61973, 10106, 104951, 17315, 10169, 16745, 19864, 46007, 10157, 31084, 10345, 59220, 14155, 117, 19918, 10901, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dur", "##um", "bid", "##s", "were", "st", "##eady", "after", "jumping", "50", "cents", "per", "bus", "##hel", "in", "some", "areas", "on", "Monday", "." ], "ids": [ 66545, 10465, 50385, 10107, 10309, 28780, 61973, 10662, 99257, 10462, 63487, 10178, 19369, 31572, 10106, 11152, 14544, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Price", "per", "bus", "##hel", "for", "14", "-", "p", "##ct", "protein", "dark", "northern", "spring", ",", "durum", "and", "white", "wheat", "##s", ",", "in", "dollars", "per", "bus", "##hel", ":" ], "ids": [ 23002, 10178, 19369, 31572, 10142, 10247, 118, 184, 14526, 18693, 25100, 17335, 26053, 117, 101699, 10111, 15263, 109653, 10107, 117, 10106, 27953, 10178, 19369, 31572, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spring", "Ch", "##g", "Dur", "##um", "(", "m", ")", "Ch", "##g", "White", "Ch", "##g" ], "ids": [ 18698, 33939, 10240, 66545, 10465, 113, 181, 114, 33939, 10240, 12136, 33939, 10240 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "Minneapolis", "5", ".", "06", "up", ".", "02", "5", ".", "75", "un", "##c", "-", "-", "-", "-" ], "ids": [ 43614, 126, 119, 10719, 10741, 119, 10983, 126, 119, 11417, 10119, 10350, 118, 118, 118, 118 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Du", "##lut", "##h", "5", ".", "06", "up", ".", "02", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 14925, 40846, 10237, 126, 119, 10719, 10741, 119, 10983, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##RT", "##H", "DA", "##KO", "##TA" ], "ids": [ 49307, 46935, 12396, 47855, 57277, 24951 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "Hunter" ], "ids": [ 20043 ], "entity": [ "B-LOC" ], "entity_ids": [ 1 ] }, { "tokens": [ "(", "Red", "River", ")", "4", ".", "46", "d", "##n", ".", "02", "5", ".", "00", "un", "##c", "-", "-", "-", "-" ], "ids": [ 113, 11641, 11575, 114, 125, 119, 11528, 172, 10115, 119, 10983, 126, 119, 11025, 10119, 10350, 118, 118, 118, 118 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spring", "Ch", "##g", "HR", "##W", "12", "##p", "##ct", "Ch", "##g", "White", "Ch", "##g" ], "ids": [ 18698, 33939, 10240, 47114, 13034, 10186, 10410, 14526, 33939, 10240, 12136, 33939, 10240 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bill", "##ings", "MT", "4", ".", "62", "up", ".", "01", "4", ".", "50", "d", "##n", ".", "01", "-", "-", "-", "-", "-", "-" ], "ids": [ 13160, 18800, 74649, 125, 119, 12066, 10741, 119, 10669, 125, 119, 10462, 172, 10115, 119, 10669, 118, 118, 118, 118, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Havre", "MT", "4", ".", "54", "d", "##n", ".", "10", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 59887, 74649, 125, 119, 11653, 172, 10115, 119, 10150, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "B-LOC", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rudy", "##ard", "MT", "4", ".", "54", "d", "##n", ".", "10", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 53868, 13167, 74649, 125, 119, 11653, 172, 10115, 119, 10150, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wolf", "Point", "MT", "4", ".", "41", "d", "##n", ".", "10", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 17970, 14143, 74649, 125, 119, 11349, 172, 10115, 119, 10150, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portland", "OR", "5", ".", "60", "up", ".", "02", "5", ".", "1700", "d", "##n", ".", "01" ], "ids": [ 25381, 69308, 126, 119, 10709, 10741, 119, 10983, 126, 119, 17322, 172, 10115, 119, 10669 ], "entity": [ "B-LOC", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pen", "##dle", "##ton", "OR", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "4", ".", "730", "##0", "up", ".", "01" ], "ids": [ 52559, 27477, 11183, 69308, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 125, 119, 45177, 10929, 10741, 119, 10669 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cool", "##ee", "City", "W", "##A", "5", ".", "13", "up", ".", "02", "-", "-", "-", "-", "-", "-", "4", ".", "7000", "un", "##c" ], "ids": [ 40248, 13321, 10773, 160, 10738, 126, 119, 10249, 10741, 119, 10983, 118, 118, 118, 118, 118, 118, 125, 119, 37671, 10119, 10350 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Water", "##ville", "W", "##A", "5", ".", "05", "up", ".", "02", "-", "-", "-", "-", "-", "-", "4", ".", "620", "##0", "un", "##c" ], "ids": [ 17702, 12043, 160, 10738, 126, 119, 10831, 10741, 119, 10983, 118, 118, 118, 118, 118, 118, 125, 119, 35942, 10929, 10119, 10350 ], "entity": [ "B-LOC", "I-LOC", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wen", "##at", "##che", "##e", "W", "##A", "5", ".", "15", "up", ".", "02", "-", "-", "-", "-", "-", "-", "4", ".", "720", "##0", "un", "##c" ], "ids": [ 64786, 10526, 11119, 10112, 160, 10738, 126, 119, 10208, 10741, 119, 10983, 118, 118, 118, 118, 118, 118, 125, 119, 35809, 10929, 10119, 10350 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "note", ":", "n", "##c", "=", "ac", "##om", "##pari", "##son", ",", "na", "=", "not", "available" ], "ids": [ 19864, 131, 182, 10350, 134, 13621, 10692, 101813, 11599, 117, 10132, 134, 10472, 14579 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Chicago", "bureau", "312", "-", "408", "-", "872", "##0", ")" ], "ids": [ 113, 12317, 32340, 25104, 118, 36899, 118, 77107, 10929, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Birmingham", "Public", "Park", ",", "Ala", "." ], "ids": [ 22712, 14647, 11239, 117, 56500, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9 ] }, { "tokens": [ ",", "Aa", "##3", "/", "VM", "##IG", "-", "1", "-", "Moody", "'", "s", "." ], "ids": [ 117, 80131, 10884, 120, 18618, 89696, 118, 122, 118, 64663, 112, 187, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Moody", "'", "s", "In", "##vestor", "##s", "Service", "-" ], "ids": [ 64663, 112, 187, 10167, 83436, 10107, 13489, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Rat", "##ing", "Anno", "##unce", "##ment", "As", "of", "08", "/", "23", "/", "96", "." ], "ids": [ 29839, 10230, 26473, 93050, 10426, 10882, 10108, 11052, 120, 10328, 120, 12308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Issue", "##r", ":", "Birmingham", "Public", "Park", "&", "Rec", "." ], "ids": [ 39115, 10129, 131, 22712, 14647, 11239, 111, 97200, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 5, 5, 9 ] }, { "tokens": [ "Bd", "." ], "ids": [ 26475, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Revenue" ], "ids": [ 69092 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "ref", "." ], "ids": [ 48056, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "(", "Y", "##MC", "##A", "Pro", "##j", "." ], "ids": [ 113, 162, 99649, 10738, 14021, 10418, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ ")", "ser", ".", "'" ], "ids": [ 114, 10493, 119, 112 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "96" ], "ids": [ 12308 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "State", ":", "AL" ], "ids": [ 11104, 131, 47271 ], "entity": [ "O", "O", "B-LOC" ], "entity_ids": [ 9, 9, 1 ] }, { "tokens": [ "Rat", "##ing", ":", "Aa", "##3", "/", "VM", "##IG", "1" ], "ids": [ 29839, 10230, 131, 80131, 10884, 120, 18618, 89696, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sale", "Am", "##oun", "##t", ":", "3", ",", "390", ",", "000" ], "ids": [ 66272, 11500, 43971, 10123, 131, 124, 117, 28323, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##pect", "##ed", "Sale", "Date", ":", "08", "/", "28", "/", "96" ], "ids": [ 27746, 51511, 10336, 66272, 29897, 131, 11052, 120, 10348, 120, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "U", ".", "S", ".", "Municipal", "Des", "##k", ",", "212", "-", "859", "-", "1650" ], "ids": [ 118, 118, 158, 119, 156, 119, 18069, 13810, 10174, 117, 22023, 118, 80786, 118, 29117 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "lau", "##ds", "Russian", "-", "Che", "##chen", "deal", "." ], "ids": [ 158, 119, 156, 119, 27207, 13268, 13463, 118, 44131, 11909, 19918, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "United", "States", "on", "Tuesday", "wel", "##come", "##d", "a", "deal", "aimed", "at", "res", "##umi", "##ng", "a", "tro", "##op", "withdrawal", "from", "the", "em", "##bat", "##tle", "##d", "Che", "##chen", "capital", ",", "G", "##ro", "##zny", "." ], "ids": [ 10117, 10609, 10859, 10135, 70245, 16829, 61643, 10162, 169, 19918, 53004, 10160, 39429, 17019, 10376, 169, 42169, 13362, 94192, 10188, 10105, 10266, 18234, 16406, 10162, 44131, 11909, 12185, 117, 144, 10567, 25424, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "\"", "That", "is", "a", "wel", "##come", "development", "." ], "ids": [ 107, 13646, 10124, 169, 16829, 61643, 13405, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "ur", "##ge", "both", "sides", "to", "continue", "their", "dialogue", "aimed", "at", "reaching", "a", "political", "settlement", "\"", "of", "the", "20", "-", "month", "conflict", "between", "Russian", "troops", "and", "Che", "##chen", "rebels", ",", "State", "Department", "spoke", "##sman", "G", "##lyn", "Davies", "said", "." ], "ids": [ 12865, 10399, 10525, 11408, 27263, 10114, 17734, 10455, 51077, 53004, 10160, 34186, 169, 13736, 23931, 107, 10108, 10105, 10197, 118, 14064, 24620, 10948, 13463, 20836, 10111, 44131, 11909, 57545, 117, 11104, 12933, 50005, 24305, 144, 34417, 23539, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 6, 9, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "The", "commander", "of", "Russian", "troops", "in", "Che", "##chny", "##a", ",", "V", "##ya", "##ches", "##lav", "Ti", "##kh", "##omir", "##ov", ",", "and", "Che", "##chen", "rebel", "chief", "-", "of", "-", "staff", "As", "##lan", "Mas", "##hado", "##v", "signed", "the", "deal", "under", "which", "the", "tro", "##op", "withdrawal", "is", "to", "res", "##ume", "on", "Wednesday", "." ], "ids": [ 10117, 27703, 10108, 13463, 20836, 10106, 44131, 95063, 10113, 117, 159, 10679, 16272, 25768, 29033, 48502, 77516, 11024, 117, 10111, 44131, 11909, 56696, 19421, 118, 10108, 118, 18927, 10882, 12055, 16423, 54719, 10477, 14775, 10105, 19918, 10571, 10319, 10105, 42169, 13362, 94192, 10124, 10114, 39429, 20467, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 1, 5, 5, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ak", "##ron", ",", "Ohio", ",", "$", "6", "mln", "bonds", "rated", "single", "-", "A", "-", "Moody", "'", "s", "." ], "ids": [ 71275, 11620, 117, 13608, 117, 109, 127, 35198, 93163, 48069, 11376, 118, 138, 118, 64663, 112, 187, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", ",", "Aug", "27", "-", "Moody", "'", "s", "In", "##vestor", "##s", "Service", "-", "Rat", "##ing" ], "ids": [ 86607, 13034, 162, 42622, 11733, 117, 53012, 10365, 118, 64663, 112, 187, 10167, 83436, 10107, 13489, 118, 29839, 10230 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Anno", "##unce", "##ment", "As", "of", "08", "/", "26", "/", "96", "." ], "ids": [ 26473, 93050, 10426, 10882, 10108, 11052, 120, 10314, 120, 12308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Issue", "##r", ":", "Ak", "##ron" ], "ids": [ 39115, 10129, 131, 71275, 11620 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 3, 7 ] }, { "tokens": [ "State", ":", "OH" ], "ids": [ 11104, 131, 29639 ], "entity": [ "O", "O", "B-LOC" ], "entity_ids": [ 9, 9, 1 ] }, { "tokens": [ "Rat", "##ing", ":", "A" ], "ids": [ 29839, 10230, 131, 138 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Sale", "Am", "##oun", "##t", ":", "6", ",", "310", ",", "000" ], "ids": [ 66272, 11500, 43971, 10123, 131, 127, 117, 23993, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##pect", "##ed", "Sale", "Date", ":", "08", "/", "28", "/", "96" ], "ids": [ 27746, 51511, 10336, 66272, 29897, 131, 11052, 120, 10348, 120, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stal", "##lone", ",", "fia", "##nce", "##e", "have", "baby", "girl", "." ], "ids": [ 95166, 32840, 117, 26908, 12150, 10112, 10529, 40138, 24699, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##AM", "##I", "1996", "-", "08", "-", "27" ], "ids": [ 75416, 36535, 11281, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Actor", "Sylvester", "Stal", "##lone", "and", "his", "fia", "##nce", "##e", ",", "model", "Jennifer", "Fl", "##avi", "##n", ",", "had", "a", "baby", "girl", "on", "Tuesday", ",", "Stal", "##lone", "'", "s", "public", "##ist", "said", "." ], "ids": [ 30136, 70491, 95166, 32840, 10111, 10226, 26908, 12150, 10112, 117, 13192, 21362, 29981, 30266, 10115, 117, 10374, 169, 40138, 24699, 10135, 70245, 117, 95166, 32840, 112, 187, 11683, 11293, 12415, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "7", "-", "pound", ",", "4", "-", "ou", "##nce", "(", "3", ".", "3", "kg", ")", "girl", ",", "named", "Sophia", "Rose", ",", "was", "born", "shortly", "after", "mid", "##night", "at", "South", "Miami", "Hospital", ",", "public", "##ist", "Paul", "Bloch", "said", "." ], "ids": [ 10117, 128, 118, 99233, 117, 125, 118, 10431, 12150, 113, 124, 119, 124, 11895, 114, 24699, 117, 12038, 38001, 14873, 117, 10134, 11175, 31555, 10662, 15607, 45217, 10160, 11056, 17626, 16025, 117, 11683, 11293, 10772, 61652, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "Both", "mother", "and", "baby", "are", "doing", "fine", "and", "are", "in", "won", "##der", "##ful", "health", ",", "\"", "he", "said", ",", "adding", "that", "it", "was", "the", "couple", "'", "s", "first", "child", "." ], "ids": [ 107, 20973, 15293, 10111, 40138, 10301, 30918, 13435, 10111, 10301, 10106, 11367, 11304, 14446, 17004, 117, 107, 10261, 12415, 117, 44841, 10189, 10271, 10134, 10105, 20969, 112, 187, 10422, 18048, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "Stal", "##lone", ",", "best", "known", "for", "the", "\"", "Rocky", "\"", "and", "\"", "Ram", "##bo", "\"", "movies", ",", "left", "the", "set", "of", "\"", "Cop", "##land", ",", "\"", "which", "is", "filming", "in", "New", "York", "and", "New", "Jersey", ",", "to", "be", "with", "Fl", "##avi", "##n", "for", "the", "birth", "." ], "ids": [ 10357, 12415, 95166, 32840, 117, 12504, 11053, 10142, 10105, 107, 31015, 107, 10111, 107, 42932, 11790, 107, 39129, 117, 12153, 10105, 11847, 10108, 107, 94160, 11080, 117, 107, 10319, 10124, 62645, 10106, 10287, 10482, 10111, 10287, 14448, 117, 10114, 10347, 10169, 29981, 30266, 10115, 10142, 10105, 24711, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Poll", "shows", "Clinton", "lead", "over", "Dol", "##e", "jump", "##s", "to", "15", "pt", "##s", "." ], "ids": [ 89951, 15573, 24139, 14107, 10491, 100035, 10112, 54941, 10107, 10114, 10208, 28756, 10107, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "ABC", "News", "poll", "released", "on", "Tuesday", "showed", "President", "Bill", "Clinton", "'", "s", "lead", "over", "Republican", "challenge", "##r", "Bob", "Dol", "##e", "stretch", "##ing", "to", "15", "points", "in", "advance", "of", "the", "Nov", ".", "5", "election", "." ], "ids": [ 10313, 16052, 12219, 70156, 11539, 10135, 70245, 27463, 12811, 13160, 24139, 112, 187, 14107, 10491, 21776, 36040, 10129, 13583, 100035, 10112, 85690, 10230, 10114, 10208, 12789, 10106, 34809, 10108, 10105, 36779, 119, 126, 13685, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "poll", ",", "taken", "on", "Sunday", "and", "Monday", "as", "the", "president", "engaged", "in", "a", "w", "##his", "##tle", "-", "stop", "train", "trip", "to", "the", "Democratic", "Convention", "in", "Chicago", ",", "put", "Clinton", "at", "51", "percent", ",", "Dol", "##e", "at", "36", "percent", "and", "Ross", "Pero", "##t", "of", "the", "Reform", "Party", "at", "8", "percent", "." ], "ids": [ 10117, 70156, 117, 15109, 10135, 19731, 10111, 40714, 10146, 10105, 12931, 34377, 10106, 169, 191, 49311, 16406, 118, 20517, 17767, 37307, 10114, 10105, 19281, 25318, 10106, 12317, 117, 14499, 24139, 10160, 11524, 22362, 117, 100035, 10112, 10160, 11055, 22362, 10111, 16690, 21434, 10123, 10108, 10105, 42204, 12529, 10160, 129, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 1, 9, 9, 4, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "A", "similar", "poll", "conducted", "on", "Saturday", "and", "Sunday", "had", "showed", "a", "nine", "point", "lead", "for", "Clinton", ",", "ahead", "by", "47", "-", "38", "percent", "." ], "ids": [ 138, 13213, 70156, 23736, 10135, 24848, 10111, 19731, 10374, 27463, 169, 19964, 12331, 14107, 10142, 24139, 117, 35629, 10155, 11413, 118, 11171, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dol", "##e", ",", "down", "by", "around", "20", "points", "in", "early", "August", "in", "ABC", "poll", "##s", ",", "had", "closed", "to", "within", "four", "percentage", "points", "immediately", "after", "the", "Republican", "convention", "in", "San", "Diego", "earlier", "in", "August", "." ], "ids": [ 100035, 10112, 117, 12935, 10155, 12166, 10197, 12789, 10106, 11732, 10735, 10106, 16052, 70156, 10107, 117, 10374, 18440, 10114, 12381, 11598, 46971, 12789, 24029, 10662, 10105, 21776, 37812, 10106, 10469, 14665, 18905, 10106, 10735, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Other", "poll", "##s", "also", "showed", "a", "strong", "Dol", "##e", "bou", "##nce", "after", "San", "Diego", "but", "Clinton", "then", "re", "##building", "his", "lead", "." ], "ids": [ 14490, 70156, 10107, 10379, 27463, 169, 18093, 100035, 10112, 94335, 12150, 10662, 10469, 14665, 10473, 24139, 11059, 11639, 56923, 10226, 14107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 1, 5, 9, 4, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tuesday", "'", "s", "poll", "involved", "1", ",", "002", "registered", "voters", "and", "had", "a", "margin", "of", "error", "of", "3", ".", "5", "percentage", "points", "." ], "ids": [ 70245, 112, 187, 70156, 16247, 122, 117, 26181, 33712, 55450, 10111, 10374, 169, 53388, 10108, 34046, 10108, 124, 119, 126, 46971, 12789, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ABC", "said", "a", "parallel", "poll", "of", "824", "likely", "voters", "showed", "the", "president", "ahead", "by", "11", "points", ",", "with", "Clinton", "at", "50", "percent", ",", "Dol", "##e", "at", "39", "percent", "and", "Pero", "##t", "at", "6", "percent", "." ], "ids": [ 16052, 12415, 169, 26280, 70156, 10108, 71611, 22497, 55450, 27463, 10105, 12931, 35629, 10155, 10193, 12789, 117, 10169, 24139, 10160, 10462, 22362, 117, 100035, 10112, 10160, 11303, 22362, 10111, 21434, 10123, 10160, 127, 22362, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "The", "poll", "of", "registered", "voters", "showed", "a", "shift", "in", "favor", "of", "the", "Democrats", "in", "the", "elections", "for", "House", "of", "Representatives", ",", "with", "51", "percent", "saying", "that", "if", "the", "vote", "were", "today", "they", "would", "go", "for", "a", "Democrat", "and", "41", "percent", "op", "##ting", "for", "a", "Republican", "." ], "ids": [ 10117, 70156, 10108, 33712, 55450, 27463, 169, 51467, 10106, 19122, 10108, 10105, 56282, 10106, 10105, 22054, 10142, 11545, 10108, 37774, 117, 10169, 11524, 22362, 22807, 10189, 12277, 10105, 18926, 10309, 18745, 10689, 10894, 11783, 10142, 169, 45338, 10111, 11349, 22362, 10303, 12141, 10142, 169, 21776, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "That", "compared", "with", "the", "previous", "poll", "'", "s", "48", "-", "43", "lead", "for", "the", "Democrats", "." ], "ids": [ 13646, 25626, 10169, 10105, 16741, 70156, 112, 187, 11300, 118, 11370, 14107, 10142, 10105, 56282, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "The", "poll", "gave", "Clinton", "a", "53", "percent", "to", "39", "percent", "lead", "over", "Dol", "##e", "if", "Pero", "##t", "were", "not", "in", "the", "race", "." ], "ids": [ 10117, 70156, 15362, 24139, 169, 11756, 22362, 10114, 11303, 22362, 14107, 10491, 100035, 10112, 12277, 21434, 10123, 10309, 10472, 10106, 10105, 14025, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "poll", "indicated", "a", "fall", "in", "the", "number", "of", "people", "who", "believed", "Dol", "##e", "would", "be", "able", "to", "fu", "##lf", "##il", "his", "promise", "to", "cut", "the", "federal", "budget", "deficit", "and", "cut", "income", "taxes", "by", "15", "percent", "at", "the", "same", "time", "." ], "ids": [ 10117, 70156, 37944, 169, 18042, 10106, 10105, 11487, 10108, 11426, 10479, 20718, 100035, 10112, 10894, 10347, 16197, 10114, 11005, 35173, 11030, 10226, 73871, 10114, 21610, 10105, 16293, 25293, 107383, 10111, 21610, 18245, 49870, 10155, 10208, 22362, 10160, 10105, 11561, 10635, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "showed", "23", "percent", "believed", "it", "possible", "compared", "to", "70", "who", "believed", "it", "was", "n", "'", "t", "." ], "ids": [ 10377, 27463, 10328, 22362, 20718, 10271, 14128, 25626, 10114, 10923, 10479, 20718, 10271, 10134, 182, 112, 188, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "compared", "to", "26", "-", "57", "in", "the", "previous", "poll", "." ], "ids": [ 13646, 25626, 10114, 10314, 118, 11817, 10106, 10105, 16741, 70156, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "bulk", "mill", "##fe", "##eds", "-", "Im", "##mediate", "supply", "tight", "." ], "ids": [ 158, 119, 156, 119, 91415, 43980, 14601, 57000, 118, 10796, 91042, 28914, 85202, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mill", "##fe", "##ed", "supplies", "for", "pro", "##mpt", "ship", "##ment", "remained", "tight", "and", "prices", "continued", "to", "move", "higher", ",", "mill", "##fe", "##ed", "deal", "##ers", "said", "." ], "ids": [ 28639, 14601, 10336, 49963, 10142, 11284, 109361, 17309, 10426, 15980, 85202, 10111, 57476, 14278, 10114, 18577, 17981, 117, 43980, 14601, 10336, 19918, 10901, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "High", "-", "price", "##d", "corn", "and", "increased", "demand", "for", "lives", "##tock", "feed", "continued", "to", "support", "mill", "##fe", "##ed", "prices", "in", "nearly", "all", "sectors", "." ], "ids": [ 11956, 118, 30839, 10162, 93599, 10111, 19299, 34394, 10142, 21418, 60458, 44988, 14278, 10114, 13145, 43980, 14601, 10336, 57476, 10106, 21377, 10435, 69714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fl", "##our", "mills", "sold", "much", "of", "their", "production", "through", "September", "leaving", "little", "available", "for", "pro", "##mpt", "ship", "##ment", "." ], "ids": [ 29981, 17964, 102445, 15337, 13172, 10108, 10455, 12116, 11222, 10596, 21005, 16745, 14579, 10142, 11284, 109361, 17309, 10426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portland", "sources", "said", "feed", "mix", "##er", "demand", "was", "keeping", "pace", "with", "mill", "##fe", "##ed", "production", "and", "driving", "prices", "higher", "." ], "ids": [ 25381, 19023, 12415, 44988, 28236, 10165, 34394, 10134, 51318, 32547, 10169, 43980, 14601, 10336, 12116, 10111, 37897, 57476, 17981, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portland", "sources", "said", "with", "corn", "price", "##d", "there", "at", "$", "200", "per", "ton", "and", "bar", "##ley", "at", "$", "140", ",", "the", "mill", "##fe", "##eds", "at", "$", "125", "represent", "a", "good", "value", "." ], "ids": [ 25381, 19023, 12415, 10169, 93599, 30839, 10162, 11155, 10160, 109, 10777, 10178, 22464, 10111, 18121, 12105, 10160, 109, 13958, 117, 10105, 43980, 14601, 57000, 10160, 109, 14048, 30382, 169, 15198, 19211, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "southeast", "U", ".", "S", ".", ",", "deal", "##ers", "said", "feed", "mix", "##ers", "continued", "to", "be", "st", "##eady", "buy", "##ers", "with", "demand", "increasing", "for", "October", "to", "March", "positions", "." ], "ids": [ 10167, 10105, 36798, 158, 119, 156, 119, 117, 19918, 10901, 12415, 44988, 28236, 10901, 14278, 10114, 10347, 28780, 61973, 47715, 10901, 10169, 34394, 30816, 10142, 11212, 10114, 11144, 23188, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "closely", "-", "watched", "Kansas", "City", "rail", "market", "was", "st", "##eady", "at", "$", "115", "per", "ton", "bid", "and", "$", "118", "offered", "." ], "ids": [ 10117, 34331, 118, 92147, 16735, 10773, 29547, 17313, 10134, 28780, 61973, 10160, 109, 15680, 10178, 22464, 50385, 10111, 109, 17515, 20841, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Chicago", "news", "##des", "##k", "312", "-", "408", "-", "872", "##0", "-", "-" ], "ids": [ 118, 118, 12317, 14424, 10920, 10174, 25104, 118, 36899, 118, 77107, 10929, 118, 118 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Puerto", "Rico", "girl", "has", "surgery", "for", "hair", "##y", "face", "." ], "ids": [ 15968, 21012, 24699, 10393, 44811, 10142, 40830, 10157, 13295, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "1996", "-", "08", "-", "27" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "two", "-", "year", "old", "Puerto", "Rica", "##n", "girl", "began", "sur", "##gical", "treatment", "on", "Tuesday", "for", "a", "rare", "condition", "that", "has", "left", "half", "of", "her", "face", "covered", "with", "a", "hair", "##y", ",", "dark", "-", "brown", "patch", "of", "skin", "." ], "ids": [ 138, 10551, 118, 10924, 12898, 15968, 20834, 10115, 24699, 11941, 10326, 60764, 21379, 10135, 70245, 10142, 169, 23902, 24713, 10189, 10393, 12153, 13877, 10108, 10485, 13295, 21543, 10169, 169, 40830, 10157, 117, 25100, 118, 31299, 105741, 10108, 40564, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "girl", ",", "Aby", "##ss", "De", "##J", "##esu", "##s", ",", "su", "##ffers", "from", "a", "\"", "hair", "##y", "ne", "##vus", "\"", "on", "the", "right", "side", "of", "her", "face", ",", "a", "condition", "that", "has", "only", "been", "reported", "a", "few", "times", "in", "medical", "journals", ",", "the", "St", ".", "Christopher", "Children", "'", "s", "Hospital", "said", "." ], "ids": [ 10117, 24699, 117, 79196, 13420, 10190, 15417, 78448, 10107, 117, 10198, 85779, 10188, 169, 107, 40830, 10157, 10554, 31353, 107, 10135, 10105, 13448, 12250, 10108, 10485, 13295, 117, 169, 24713, 10189, 10393, 10893, 10590, 15943, 169, 13824, 13465, 10106, 19436, 78273, 117, 10105, 10838, 119, 15244, 18267, 112, 187, 16025, 12415, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 5, 9, 9 ] }, { "tokens": [ "In", "addition", "to", "social", "os", "##tra", "##cism", ",", "the", "condition", "also", "carries", "a", "high", "risk", "of", "cancer", "." ], "ids": [ 10167, 14763, 10114, 12142, 10427, 13207, 65571, 117, 10105, 24713, 10379, 64216, 169, 11846, 24179, 10108, 22723, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "will", "be", "correct", "##ed", "by", "gradually", "expanding", "healthy", "skin", "with", "a", "sur", "##gical", "ball", "##oon", ",", "then", "trans", "##plant", "##ing", "that", "skin", "to", "the", "af", "##f", "##lic", "##ted", "side", "of", "her", "face", "." ], "ids": [ 10377, 11337, 10347, 49148, 10336, 10155, 50681, 82158, 89601, 40564, 10169, 169, 10326, 60764, 20724, 15938, 117, 11059, 37241, 65921, 10230, 10189, 40564, 10114, 10105, 10452, 10575, 25303, 11912, 12250, 10108, 10485, 13295, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "She", "is", "doing", "well", ",", "\"", "hospital", "spoke", "##s", "##woman", "Carol", "Norris", "said", ".", "\"" ], "ids": [ 107, 11149, 10124, 30918, 11206, 117, 107, 18141, 50005, 10107, 79999, 23059, 53286, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "The", "surgery", "is", "under", "way", ".", "\"" ], "ids": [ 10117, 44811, 10124, 10571, 13170, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Norris", "said", "Tuesday", "'", "s", "surgery", "involved", "placing", "five", "ball", "##oons", "in", "De", "##J", "##esu", "##s", "'", "s", "for", "##eh", "##ead", ",", "shoulder", "##s", "and", "the", "back", "of", "her", "neck", "and", "partially", "fill", "##ing", "them", "with", "a", "sal", "##ine", "solution", "." ], "ids": [ 53286, 12415, 70245, 112, 187, 44811, 16247, 66959, 12403, 20724, 89305, 10106, 10190, 15417, 78448, 10107, 112, 187, 10142, 25723, 30297, 117, 78681, 10107, 10111, 10105, 12014, 10108, 10485, 63938, 10111, 53986, 20241, 10230, 11345, 10169, 169, 31119, 11088, 28502, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "sal", "##ine", "solution", "will", "be", "ins", "##erted", "in", "16", "weekly", "treatment", "##s", "." ], "ids": [ 15946, 31119, 11088, 28502, 11337, 10347, 15498, 46949, 10106, 10250, 33159, 21379, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "girl", ",", "who", "was", "accompanied", "to", "Philadelphia", "by", "her", "parents", ",", "will", "need", "more", "surgery", "later", "to", "correct", "the", "condition", "on", "her", "chest", ",", "back", "and", "legs", ",", "the", "hospital", "said", "." ], "ids": [ 10117, 24699, 117, 10479, 10134, 39951, 10114, 15979, 10155, 10485, 17293, 117, 11337, 17367, 10798, 44811, 10873, 10114, 49148, 10105, 24713, 10135, 10485, 94230, 117, 12014, 10111, 51863, 117, 10105, 18141, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ea", "##u", "Claire", ",", "Wi", "##sc", "." ], "ids": [ 47132, 10138, 24448, 117, 52742, 31505, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 9, 1, 5, 5 ] }, { "tokens": [ "rev", "##s", "won", "by", "Robert", "W", ".", "Baird", "." ], "ids": [ 86095, 10107, 11367, 10155, 10820, 160, 119, 85188, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Robert", "W", ".", "Baird", "&", "Co", "." ], "ids": [ 10820, 160, 119, 85188, 111, 13098, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ ",", "Inc", ".", ",", "said", "it", "won", "$", "1", "million", "of", "Ea", "##u", "Claire", ",", "Wi", "##sc", "." ], "ids": [ 117, 13604, 119, 117, 12415, 10271, 11367, 109, 122, 12473, 10108, 47132, 10138, 24448, 117, 52742, 31505, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 1, 5, 5 ] }, { "tokens": [ ",", "water", "##works", "system", "mort", "##gage", "revenue", "bonds", ",", "Series", "1996", ",", "with", "a", "true", "interest", "cost", "of", "5", ".", "289", "##3", "percent", "." ], "ids": [ 117, 12286, 51778, 11787, 12338, 93794, 51557, 93163, 117, 13239, 10389, 117, 10169, 169, 22024, 17644, 18849, 10108, 126, 119, 31990, 10884, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Massachusetts", "home", "sales", "di", "##p", "in", "July", "-", "report", "." ], "ids": [ 15123, 11816, 23857, 10120, 10410, 10106, 11112, 118, 17553, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 139, 21793, 60493, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Home", "sales", "across", "Massachusetts", "were", "down", "2", ".", "3", "percent", "in", "July", ",", "compared", "to", "a", "month", "earlier", ",", "but", "up", "21", "percent", "for", "the", "year", ",", "according", "to", "the", "Massachusetts", "Association", "of", "Real", "##tors", "." ], "ids": [ 13898, 23857, 15130, 15123, 10309, 12935, 123, 119, 124, 22362, 10106, 11112, 117, 25626, 10114, 169, 14064, 18905, 117, 10473, 10741, 10296, 22362, 10142, 10105, 10924, 117, 18071, 10114, 10105, 15123, 11751, 10108, 12384, 24324, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "The", "association", "said", "a", "total", "of", "4", ",", "464", "single", "-", "family", "homes", "were", "sold", "in", "July", ",", "compared", "to", "4", ",", "570", "in", "June", "." ], "ids": [ 10117, 18061, 12415, 169, 11339, 10108, 125, 117, 40289, 11376, 118, 11365, 14154, 10309, 15337, 10106, 11112, 117, 25626, 10114, 125, 117, 31545, 10106, 11120, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "average", "selling", "price", ",", "$", "206", ",", "464", ",", "was", "up", "10", ".", "6", "percent", "over", "July", "1995", "." ], "ids": [ 10117, 13551, 30870, 30839, 117, 109, 21717, 117, 40289, 117, 10134, 10741, 10150, 119, 127, 22362, 10491, 11112, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##dom", "##iniu", "##m", "sales", "edge", "##d", "up", "6", ".", "0", "percent", "for", "July", "and", "24", ".", "8", "percent", "for", "the", "year", ",", "the", "group", "said", ",", "while", "prices", "for", "con", "##dos", "nu", "##dge", "##d", "up", "less", "than", "1", ".", "0", "percent", "to", "an", "average", "of", "$", "123", ",", "394", "." ], "ids": [ 12845, 15561, 106495, 10147, 23857, 30599, 10162, 10741, 127, 119, 121, 22362, 10142, 11112, 10111, 10233, 119, 129, 22362, 10142, 10105, 10924, 117, 10105, 11795, 12415, 117, 11371, 57476, 10142, 10173, 11181, 11085, 25431, 10162, 10741, 15306, 11084, 122, 119, 121, 22362, 10114, 10151, 13551, 10108, 109, 16968, 117, 37847, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "July", ",", "the", "average", "rate", "on", "a", "30", "-", "year", "fixed", "rate", "mort", "##gage", "was", "8", ".", "25", "percent", ",", "below", "June", "'", "s", "8", ".", "32", "percent", "but", "still", "higher", "than", "February", "'", "s", "7", ".", "03", "percent", ",", "the", "report", "noted", "." ], "ids": [ 10167, 11112, 117, 10105, 13551, 18344, 10135, 169, 10244, 118, 10924, 37770, 18344, 12338, 93794, 10134, 129, 119, 10258, 22362, 117, 17544, 11120, 112, 187, 129, 119, 10842, 22362, 10473, 12647, 17981, 11084, 11508, 112, 187, 128, 119, 10907, 22362, 117, 10105, 17553, 18575, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Boston", "bureau", ",", "617", "-", "367", "-", "410", "##6" ], "ids": [ 118, 118, 13683, 32340, 117, 56159, 118, 33317, 118, 26407, 11211 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Amt", "##rak", "train", "dera", "##ils", ",", "three", "injured", "-", "officials", "." ], "ids": [ 16513, 15793, 17767, 95465, 38308, 117, 11003, 36081, 118, 27730, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##P", "##EL", "##IE", "##R", ",", "V", "##t", "." ], "ids": [ 102059, 77261, 11127, 68999, 71655, 11273, 117, 159, 10123, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "27" ], "ids": [ 10389, 118, 11052, 118, 10365 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "three", "people", "were", "injured", "when", "an", "Amt", "##rak", "passenger", "train", "sl", "##am", "##med", "into", "an", "empty", "log", "##ging", "truck", "and", "dera", "##iled", "Tuesday", ",", "officials", "said", "." ], "ids": [ 11699, 16298, 11003, 11426, 10309, 36081, 10841, 10151, 16513, 15793, 33155, 17767, 38523, 11008, 21986, 10708, 10151, 65042, 49316, 13808, 58907, 10111, 95465, 79257, 70245, 117, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Vermont", "##er", ",", "which", "runs", "between", "St", ".", "Alban", "##s", ",", "Vermont", ",", "near", "the", "Canadian", "border", "and", "Washington", ",", "D", ".", "C", ".", ",", "coll", "##ide", "##d", "with", "the", "truck", "at", "7", ":", "51", "a", ".", "m", ".", "ED", "##T", "near", "the", "rural", "town", "of", "R", "##ox", "##bury", "some", "15", "miles", "southeast", "of", "the", "state", "capital", "Mont", "##peli", "##er", ",", "Amt", "##rak", "spoke", "##s", "##woman", "Maureen", "Ga", "##rri", "##ty", "said", "." ], "ids": [ 10117, 34919, 10165, 117, 10319, 17913, 10948, 10838, 119, 32938, 10107, 117, 34919, 117, 12883, 10105, 14023, 20949, 10111, 11586, 117, 141, 119, 140, 119, 117, 28552, 13315, 10162, 10169, 10105, 58907, 10160, 128, 131, 11524, 169, 119, 181, 119, 74053, 11090, 12883, 10105, 18380, 12221, 10108, 155, 31978, 19218, 11152, 10208, 14148, 36798, 10108, 10105, 11388, 12185, 19472, 77558, 10165, 117, 16513, 15793, 50005, 10107, 79999, 85403, 69699, 24874, 11195, 12415, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 9, 9, 9, 2, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "Vermont", "Central", "Hospital", "spoke", "##sman", "Dan", "P", "##ud", "##vah", "said", "two", "of", "the", "injured", "were", "treated", "there", "-", "-", "the", "truck", "driver", ",", "who", "was", "suffering", "from", "multiple", "trauma", "injuries", ",", "and", "a", "passenger", "." ], "ids": [ 34919, 11885, 16025, 50005, 24305, 14261, 153, 11679, 99508, 12415, 10551, 10108, 10105, 36081, 10309, 45369, 11155, 118, 118, 10105, 58907, 25926, 117, 10479, 10134, 49552, 10188, 19865, 87458, 49718, 117, 10111, 169, 33155, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##ud", "##vah", "said", "he", "understood", "other", "people", "with", "minor", "injuries", "were", "being", "treated", "at", "the", "scene", "." ], "ids": [ 153, 11679, 99508, 12415, 10261, 71183, 10684, 11426, 10169, 17746, 49718, 10309, 11223, 45369, 10160, 10105, 18167, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ga", "##rri", "##ty", "said", "a", "train", "conductor", "was", "also", "injured", "." ], "ids": [ 69699, 24874, 11195, 12415, 169, 17767, 42225, 10134, 10379, 36081, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "train", "'", "s", "engine", "and", "its", "six", "cars", "dera", "##iled", "but", "were", "still", "standing", ",", "state", "police", "said", "." ], "ids": [ 10117, 17767, 112, 187, 18240, 10111, 10474, 12449, 24602, 95465, 79257, 10473, 10309, 12647, 32173, 117, 11388, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "exact", "number", "of", "passa", "##nger", "##s", "on", "the", "train", "was", "not", "known", ".", "\"" ], "ids": [ 10117, 45809, 11487, 10108, 21323, 18904, 10107, 10135, 10105, 17767, 10134, 10472, 11053, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "had", "70", "reserva", "##tions", "for", "the", "train", ",", "but", "that", "does", "n", "'", "t", "mean", "there", "were", "70", "passengers", "aboard", ",", "\"", "Ga", "##rri", "##ty", "said", "." ], "ids": [ 12865, 10374, 10923, 44967, 15024, 10142, 10105, 17767, 117, 10473, 10189, 15107, 182, 112, 188, 36110, 11155, 10309, 10923, 37008, 65331, 117, 107, 69699, 24874, 11195, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Uni", "##nju", "##red", "passengers", "were", "to", "be", "taken", "by", "bus", "to", "Springfield", ",", "Massachusetts", ",", "where", "they", "will", "be", "put", "aboard", "another", "train", "to", "continue", "their", "journey", "to", "New", "York", "City", "and", "Washington", ",", "Ga", "##rri", "##ty", "said", "." ], "ids": [ 22966, 17595, 15711, 37008, 10309, 10114, 10347, 15109, 10155, 19369, 10114, 37692, 117, 15123, 117, 10940, 10689, 11337, 10347, 14499, 65331, 12864, 17767, 10114, 17734, 10455, 43610, 10114, 10287, 10482, 10773, 10111, 11586, 117, 69699, 24874, 11195, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "She", "said", "the", "train", "was", "travelling", "at", "54", "mph", "when", "it", "crashed", "into", "the", "truck", ",", "which", "was", "crossing", "the", "tracks", "onto", "a", "dir", "##t", "road", "in", "the", "rural", "area", "border", "##ing", "the", "North", "##field", "Mountains", "." ], "ids": [ 11149, 12415, 10105, 17767, 10134, 81353, 10160, 11653, 25992, 10841, 10271, 91126, 10708, 10105, 58907, 117, 10319, 10134, 41031, 10105, 17965, 31095, 169, 15895, 10123, 15485, 10106, 10105, 18380, 11168, 20949, 10230, 10105, 11225, 13408, 24107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Para", "##ly", "##mpi", "##cs", "an", "example", "for", "g", "##lo", "##omy", "France", "-", "Ju", "##ppe", "." ], "ids": [ 13497, 10454, 35407, 13331, 10151, 14351, 10142, 175, 10715, 98877, 10688, 118, 45031, 21092, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "27" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Prime", "Minister", "Alain", "Ju", "##ppe", "on", "Tuesday", "hai", "##led", "hand", "##icap", "##ped", "athletes", "who", "took", "part", "in", "Atlanta", "'", "s", "Para", "##ly", "##mpi", "##c", "Games", "as", "an", "example", "for", "g", "##lo", "##om", "-", "str", "##ick", "##en", "France", "." ], "ids": [ 19924, 14355, 20444, 45031, 21092, 10135, 70245, 13080, 16376, 15230, 73130, 16898, 57700, 10479, 12149, 10668, 10106, 19600, 112, 187, 13497, 10454, 35407, 10350, 14501, 10146, 10151, 14351, 10142, 175, 10715, 10692, 118, 17791, 20898, 10136, 10688, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "What", "we", "hear", "every", "morning", "is", "g", "##lo", "##om", ",", "resignation", "and", "s", "##cept", "##icis", "##m", ".", ".", "." ], "ids": [ 107, 12489, 11951, 62064, 14234, 28757, 10124, 175, 10715, 10692, 117, 66129, 10111, 187, 97782, 56766, 10147, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "You", "are", "the", "opposite", ",", "\"", "Ju", "##ppe", "told", "a", "successful", "French", "team", "at", "Paris", "airport", "as", "he", "wel", "##come", "##d", "them", "back", "from", "the", "games", "which", "followed", "the", "July", "-", "August", "Olympics", "." ], "ids": [ 11065, 10301, 10105, 35598, 117, 107, 45031, 21092, 21937, 169, 17330, 11894, 11121, 10160, 10728, 28460, 10146, 10261, 16829, 61643, 10162, 11345, 12014, 10188, 10105, 13332, 10319, 15689, 10105, 11112, 118, 10735, 19185, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "\"", "If", "you", "had", "been", "struck", ".", ".", "." ], "ids": [ 107, 14535, 13028, 10374, 10590, 45622, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "by", "the", "disease", "of", "s", "##cept", "##icis", "##m", ",", "g", "##lo", "##om", "and", "resignation", ",", "you", "would", "not", "be", "here", "." ], "ids": [ 10155, 10105, 21911, 10108, 187, 97782, 56766, 10147, 117, 175, 10715, 10692, 10111, 66129, 117, 13028, 10894, 10472, 10347, 19353, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "You", "are", "a", "true", "example", "for", "the", "nation", ",", "\"", "he", "said", "." ], "ids": [ 11065, 10301, 169, 22024, 14351, 10142, 10105, 22274, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "French", "team", "won", "95", "medals", "in", "Atlanta", ",", "35", "of", "them", "gold", "." ], "ids": [ 10117, 11894, 11121, 11367, 11978, 48512, 10106, 19600, 117, 10803, 10108, 11345, 18128, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Op", "##inio", "##n", "poll", "##s", "consistently", "show", "French", "voters", "pes", "##sim", "##istic", "and", "fed", "up", "as", "the", "economy", "sta", "##gna", "##tes", "and", "une", "##mp", "##lo", "##ye", "##ment", "li", "##nger", "##s", "at", "near", "-", "record", "levels", "." ], "ids": [ 12160, 30412, 10115, 70156, 10107, 97742, 11897, 11894, 55450, 59411, 52977, 29025, 10111, 79782, 10741, 10146, 10105, 27570, 16527, 21153, 11197, 10111, 10231, 18573, 10715, 12871, 10426, 11614, 18904, 10107, 10160, 12883, 118, 12410, 21559, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "shares", "end", "fraction", "##ally", "weak", "##er", "." ], "ids": [ 11894, 45751, 11572, 107433, 19777, 61285, 10165, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "27" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "shares", "ended", "fraction", "##ally", "weak", "##er", "as", "une", "##ase", "about", "union", "un", "##rest", "sl", "##ated", "for", "the", "autumn", "and", "a", "weak", "##er", "franc", "got", "the", "better", "of", "a", "sl", "##ight", "rise", "on", "Wall", "Street", "." ], "ids": [ 11894, 45751, 18428, 107433, 19777, 61285, 10165, 10146, 10231, 16896, 10978, 20763, 10119, 34189, 38523, 22525, 10142, 10105, 82240, 10111, 169, 61285, 10165, 63184, 19556, 10105, 18322, 10108, 169, 38523, 27521, 28710, 10135, 19523, 11962, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "The", "blue", "-", "chip", "CA", "##C", "-", "40", "index", "ended", "2", ".", "43", "points", "or", "0", ".", "12", "percent", "lower", "at", "2", ",", "017", ".", "99", "points", "after", "a", "brief", "fora", "##y", "into", "positive", "territory", "when", "the", "New", "York", "stock", "market", "opened", "higher", "." ], "ids": [ 10117, 23254, 118, 64008, 24707, 10858, 118, 10533, 19776, 18428, 123, 119, 11370, 12789, 10345, 121, 119, 10186, 22362, 18165, 10160, 123, 117, 90071, 119, 12187, 12789, 10662, 169, 29040, 21207, 10157, 10708, 19737, 24399, 10841, 10105, 10287, 10482, 20511, 17313, 14377, 17981, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "broad", "##er", "SB", "##F", "-", "120", "index", "closed", "1", ".", "19", "points", "or", "0", ".", "08", "percent", "lower", "at", "1", ",", "421", ".", "90", "points", "." ], "ids": [ 10117, 41848, 10165, 64669, 11565, 118, 12048, 19776, 18440, 122, 119, 10270, 12789, 10345, 121, 119, 11052, 22362, 18165, 10160, 122, 117, 38648, 119, 10919, 12789, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Market", "turno", "##ver", "was", "3", ".", "8", "billion", "francs", ",", "about", "average", "for", "the", "quiet", "August", "period", ",", "including", "2", ".", "6", "billion", "on", "the", "most", "actively", "traded", "CA", "##C", "-", "40", "shares", "." ], "ids": [ 28409, 17440, 12563, 10134, 124, 119, 129, 25848, 49303, 117, 10978, 13551, 10142, 10105, 104951, 10735, 13127, 117, 11198, 123, 119, 127, 25848, 10135, 10105, 10992, 72597, 52696, 24707, 10858, 118, 10533, 45751, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "The", "Socialist", "CF", "##D", "##T", "union", "war", "##ned", "of", "\"", "tension", "and", "conflict", "\"", "when", "France", "returns", "to", "work", "after", "the", "summer", "break", "and", "called", "for", "a", "drive", "to", "create", "up", "to", "500", ",", "000", "jobs", "in", "nine", "months", "." ], "ids": [ 10117, 42637, 29551, 11490, 11090, 20763, 10338, 17021, 10108, 107, 55027, 10111, 24620, 107, 10841, 10688, 38302, 10114, 11424, 10662, 10105, 17995, 24194, 10111, 11552, 10142, 169, 23806, 10114, 18842, 10741, 10114, 10757, 117, 10259, 45083, 10106, 19964, 15555, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "teachers", "'", "union", ",", "the", "Federation", "Syn", "##dica", "##le", "Unit", "##aire", "(", "FS", "##U", ")", ",", "called", "for", "members", "to", "protest", "against", "job", "cuts", "expected", "in", "the", "government", "'", "s", "aust", "##erit", "##y", "budget", "due", "to", "be", "unveiled", "in", "September", "." ], "ids": [ 138, 38160, 112, 20763, 117, 10105, 18975, 42370, 27096, 10284, 19919, 16556, 113, 83276, 12022, 114, 117, 11552, 10142, 12464, 10114, 36627, 11327, 23627, 73311, 25973, 10106, 10105, 12047, 112, 187, 61728, 101493, 10157, 25293, 10850, 10114, 10347, 98359, 10106, 10596, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "##xie", "##ties", "over", "the", "budget", "ni", "##gg", "##led", "the", "currency", "markets", "where", "the", "franc", "lost", "around", "half", "a", "cent", "##ime", "from", "Monday", "'", "s", "late", "European", "levels", "to", "3", ".", "421", "##1", "per", "mark", "." ], "ids": [ 10313, 50536, 14197, 10491, 10105, 25293, 10414, 21127, 16376, 10105, 83759, 42893, 10940, 10105, 63184, 14172, 12166, 13877, 169, 32882, 19151, 10188, 40714, 112, 187, 13002, 11914, 21559, 10114, 124, 119, 38648, 10759, 10178, 29221, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Index", "heavy", "##weight", "##s", "Elf", "and", "R", "##hone", "Poul", "##en", "##c", "both", "ended", "slightly", "weak", "##er", "while", "active", "Euro", "##tun", "##nel", "was", "un", "##chang", "##ed", "on", "nearly", "a", "million", "shares", "traded", "." ], "ids": [ 12135, 18296, 31869, 10107, 102485, 10111, 155, 50198, 91704, 10136, 10350, 11408, 18428, 31603, 61285, 10165, 11371, 14459, 17526, 35345, 17608, 10134, 10119, 64208, 10336, 10135, 21377, 169, 12473, 45751, 52696, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "People", "are", "mor", "##ose", "and", "it", "'", "s", "not", "the", "post", "-", "holiday", "period", "or", "the", "budget", "or", "company", "results", "that", "are", "going", "to", "lift", "anyone", "'", "s", "spirit", "##s", ",", "\"", "a", "broke", "##r", "said", "." ], "ids": [ 107, 14235, 10301, 24984, 14569, 10111, 10271, 112, 187, 10472, 10105, 11841, 118, 71806, 13127, 10345, 10105, 25293, 10345, 12100, 17466, 10189, 10301, 19090, 10114, 63376, 51747, 112, 187, 41576, 10107, 117, 107, 169, 30500, 10129, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "U", "##IC", ",", "part", "of", "ins", "##urer", "GA", "##N", ",", "sl", "##id", "12", ".", "19", "percent", "to", "55", ".", "1", "francs", "after", "reporting", "a", "net", "att", "##rib", "##uta", "##ble", "first", "-", "half", "loss", "of", "758", "million", "francs", "after", "the", "close", "on", "Monday", "." ], "ids": [ 115, 158, 30889, 117, 10668, 10108, 15498, 100613, 74212, 11537, 117, 38523, 11249, 10186, 119, 10270, 22362, 10114, 11358, 119, 122, 49303, 10662, 60524, 169, 11988, 10788, 47116, 14118, 11203, 10422, 118, 13877, 18576, 10108, 75077, 12473, 49303, 10662, 10105, 16065, 10135, 40714, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Market", "##s", "were", "disa", "##ppo", "##inted", "by", "a", "reca", "##pital", "##isation", "of", "800", "million", "francs", "which", "comment", "##ators", "said", "was", "larger", "than", "expected", "." ], "ids": [ 28409, 10107, 10309, 36474, 45565, 107583, 10155, 169, 103778, 55743, 20312, 10108, 11900, 12473, 49303, 10319, 49641, 56602, 12415, 10134, 20434, 11084, 25973, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Super", "##market", "##s", "group", "Carr", "##ef", "##our", "gained", "2", ".", "19", "percent", "to", "2", ",", "616", "francs", "after", "broke", "##rs", "Che", "##uvre", "##ux", "de", "Vir", "##ieu", "confirmed", "the", "stock", "on", "their", "buy", "list", ",", "a", "fund", "manager", "said", "." ], "ids": [ 115, 12786, 60336, 10107, 11795, 45332, 16822, 17964, 25222, 123, 119, 10270, 22362, 10114, 123, 117, 54060, 49303, 10662, 30500, 10943, 44131, 86442, 11855, 10104, 106433, 50327, 27347, 10105, 20511, 10135, 10455, 47715, 13416, 117, 169, 31771, 16935, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Rein", "##sur", "##ance", "group", "Sc", "##or", "gained", "2", ".", "1", "percent", "to", "202", "francs", "on", "news", "that", "British", "ins", "##urer", "Pr", "##uden", "##tial", "had", "sold", "its", "Mer", "##canti", "##le", "&", "General", "rein", "##sur", "##ance", "business", "to", "Swiss", "Re", "." ], "ids": [ 115, 109150, 66679, 16460, 11795, 55260, 10667, 25222, 123, 119, 122, 22362, 10114, 22171, 49303, 10135, 14424, 10189, 11160, 15498, 100613, 106482, 23280, 72416, 10374, 15337, 10474, 10734, 103441, 10284, 111, 11220, 74720, 66679, 16460, 14155, 10114, 22984, 20304, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 2, 3, 9 ] }, { "tokens": [ "*", "Con", "##glo", "##mera", "##te", "Bol", "##lore", "lost", "2", ".", "4", "percent", "to", "521", "francs", "after", "a", "morning", "trading", "suspension", "during", "which", "it", "said", "it", "had", "approved", "plans", "to", "buy", "out", "its", "73", ".", "83", "percent", "owned", "transport", "unit", "Sc", "##ac", "Del", "##mas", "Vi", "##leu", "##je", "##ux", "(", "SD", "##V", ")", "and", "invited", "share", "##holders", "to", "tender", "their", "shares", "." ], "ids": [ 115, 12845, 77646, 35545, 10216, 45598, 42895, 14172, 123, 119, 125, 22362, 10114, 21022, 49303, 10662, 169, 28757, 46663, 52341, 10939, 10319, 10271, 12415, 10271, 10374, 29855, 18195, 10114, 47715, 10950, 10474, 12545, 119, 12408, 22362, 17012, 16024, 16511, 55260, 18306, 15973, 12922, 31826, 101304, 10381, 11855, 113, 27589, 11779, 114, 10111, 33392, 23867, 75111, 10114, 96486, 10455, 45751, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Al", "##cate", "##l", "Als", "##th", "##om", "fell", "1", ".", "7", "percent", "to", "395", ".", "0", "." ], "ids": [ 115, 10883, 26054, 10161, 11966, 11143, 10692, 25194, 122, 119, 128, 22362, 10114, 30432, 119, 121, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Op", "##thal", "##mic", "products", "manufacturer", "Es", "##sil", "##or", "gained", "2", ".", "6", "percent", "to", "1", ",", "328", "francs", "after", "Oak", "##ley", "Inc", "of", "the", "United", "States", "said", "it", "had", "been", "granted", "an", "option", "to", "buy", "the", "non", "-", "pre", "##scription", "lens", "production", "unit", "of", "Gent", "##ex", "##t", "Op", "##tics", "Inc", ",", "an", "Es", "##sil", "##or", "International", "subsidiary", "." ], "ids": [ 115, 12160, 61972, 27057, 20895, 56961, 10912, 34934, 10667, 25222, 123, 119, 127, 22362, 10114, 122, 117, 31815, 49303, 10662, 36923, 12105, 13604, 10108, 10105, 10609, 10859, 12415, 10271, 10374, 10590, 26964, 10151, 32562, 10114, 47715, 10105, 10446, 118, 12229, 55785, 82295, 12116, 16511, 10108, 39454, 28580, 10123, 12160, 26409, 13604, 117, 10151, 10912, 34934, 10667, 10771, 53898, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "-", "-", "Paris", "news", "##room", "+", "331", "422", "##1", "545", "##2" ], "ids": [ 118, 118, 10728, 14424, 25525, 116, 30690, 38735, 10759, 49589, 10729 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Sri", "Lanka", "##n", "News", "##paper", "##s", "-", "August", "27", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 16098, 20828, 10115, 12219, 95596, 10107, 118, 10735, 10365, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "are", "some", "of", "the", "main", "stories", "in", "Tuesday", "'", "s", "Sri", "Lanka", "##n", "newspapers", ":" ], "ids": [ 18317, 10301, 11152, 10108, 10105, 12126, 21158, 10106, 70245, 112, 187, 16098, 20828, 10115, 48473, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "-", "-", "-" ], "ids": [ 118, 118, 118 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "V", "##EE", "##RA", "##K", "##ES", "##AR", "##I" ], "ids": [ 159, 95825, 29990, 11733, 25054, 52188, 11281 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "Bomb", "bl", "##ast", "in", "T", "##EL", "##O", "office", "in", "Tri", "##nco", "##male", "##e", "kills", "one", ",", "wound", "##s", "six", "." ], "ids": [ 63141, 21484, 15171, 10106, 157, 68999, 11403, 14301, 10106, 36642, 32636, 47144, 10112, 69179, 10464, 117, 109205, 10107, 12449, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "officer", "and", "a", "soldier", "killed", "in", "accident", "##al", "c", "##lash", "between", "two", "groups", "of", "soldiers", "near", "Cha", "##vak", "##ach", "##cher", "##i", "in", "Ja", "##ff", "##na", "." ], "ids": [ 11340, 19288, 10111, 169, 50803, 15875, 10106, 25037, 10415, 171, 25297, 10948, 10551, 15647, 10108, 23324, 12883, 53453, 95982, 11587, 13396, 10116, 10106, 28248, 13820, 10219, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Army", "sent", "##ries", "thought", "a", "group", "of", "soldiers", "approach", "##ing", "them", "were", "Tamil", "rebels", "and", "opened", "fire", "." ], "ids": [ 12762, 14541, 15388, 18957, 169, 11795, 10108, 23324, 23068, 10230, 11345, 10309, 22489, 57545, 10111, 14377, 13559, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-" ], "ids": [ 118, 118, 118 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "T", "##HI", "##NA", "##KA", "##RA", "##N" ], "ids": [ 157, 108880, 36742, 67813, 29990, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7 ] }, { "tokens": [ "TU", "##L", "##F", "leader", "M", ".", "Sivas", "##ith", "##tham", "##para", "##m", "says", "it", "is", "meaning", "##less", "to", "talk", "to", "UN", "##P", "about", "peace", "package", "and", "that", "the", "government", "should", "sub", "##mit", "peace", "plan", "to", "parliament", "very", "soon", "." ], "ids": [ 94747, 11369, 11565, 15014, 150, 119, 104362, 28229, 90389, 30978, 10147, 22153, 10271, 10124, 21157, 14985, 10114, 31311, 10114, 26578, 11127, 10978, 28101, 62432, 10111, 10189, 10105, 12047, 14819, 13987, 15772, 28101, 13065, 10114, 40519, 12558, 17864, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-" ], "ids": [ 118, 118, 118 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "DA", "##IL", "##Y", "NEWS" ], "ids": [ 47855, 38850, 14703, 109023 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "Br", "##ead", "and", "fl", "##our", "prices", "have", "been", "raised", "with", "immediate", "effect", "but", "government", "will", "provide", "relief", "to", "under", "##pri", "##vile", "##dge", "##d", "sections", "of", "society", "." ], "ids": [ 38508, 30297, 10111, 58768, 17964, 57476, 10529, 10590, 20526, 10169, 46938, 18514, 10473, 12047, 11337, 16871, 31276, 10114, 10571, 101319, 82065, 25431, 10162, 30293, 10108, 19912, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-" ], "ids": [ 118, 118, 118 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "THE", "IS", "##LA", "##ND" ], "ids": [ 17443, 40214, 44376, 58521 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "Ex", "##cise", "Commissioner", "W", ".", "N", ".", "F", ".", "Chandra", "##rat", "##ne", "den", "##ies", "allegations", "that", "new", "guide", "##lines", "in", "issue", "of", "li", "##quo", "##r", "licence", "##s", "are", "aimed", "at", "forcing", "large", "number", "of", "li", "##quo", "##r", "licence", "holder", "##s", "out", "of", "business", "for", "political", "reasons", "." ], "ids": [ 27746, 67743, 24366, 160, 119, 151, 119, 143, 119, 67169, 12553, 10238, 10140, 11624, 85190, 10189, 10751, 25083, 31782, 10106, 15557, 10108, 11614, 79423, 10129, 45241, 10107, 10301, 53004, 10160, 75098, 12077, 11487, 10108, 11614, 79423, 10129, 45241, 48938, 10107, 10950, 10108, 14155, 10142, 13736, 31725, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-" ], "ids": [ 118, 118, 118 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "LAN", "##KA", "##DE", "##EP", "##A" ], "ids": [ 94057, 67813, 60675, 59742, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "Tamil", "Tiger", "rebels", "have", "sent", "12", "female", "suicide", "bombers", "to", "stage", "sim", "##ult", "##ane", "##ous", "attacks", "on", "President", "Chan", "##dri", "##ka", "Kumar", "##atu", "##nga", "'", "s", "motor", "##cade", "in", "Colombo", "." ], "ids": [ 22489, 25899, 57545, 10529, 14541, 10186, 16762, 35656, 109594, 10114, 15365, 92304, 16203, 12822, 13499, 26483, 10135, 12811, 27602, 40230, 10371, 38686, 19003, 18161, 112, 187, 15257, 55039, 10106, 40367, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "-", "-", "-" ], "ids": [ 118, 118, 118 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "DI", "##VA", "##IN", "##A" ], "ids": [ 110014, 47172, 27128, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "Cultural", "Ministry", "planning", "to", "spend", "large", "sum", "of", "money", "to", "buy", "silver", "crown", "believed", "to", "have", "been", "worn", "by", "ancient", "king", "and", "now", "in", "Australia", "." ], "ids": [ 17439, 19170, 30240, 10114, 63222, 12077, 28439, 10108, 17920, 10114, 47715, 23394, 52990, 20718, 10114, 10529, 10590, 32091, 10155, 21226, 20636, 10111, 11858, 10106, 11729, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "-", "-", "-" ], "ids": [ 118, 118, 118 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "DIN", "##AM", "##IN", "##A" ], "ids": [ 63617, 36535, 27128, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "Government", "close", "##s", "R", "##uh", "##unu", "University", "inde", "##finite", "##ly", "after", "big", "c", "##lash", "between", "two", "groups", "of", "students", "in", "which", "eight", "were", "wounded", "and", "hospital", "##ised", "." ], "ids": [ 14581, 16065, 10107, 155, 18593, 28041, 10404, 100991, 89618, 10454, 10662, 22185, 171, 25297, 10948, 10551, 15647, 10108, 13501, 10106, 10319, 16222, 10309, 39127, 10111, 18141, 20666, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Colombo", "news", "##room", "tel", "941", "-", "434", "##31", "##9" ], "ids": [ 118, 118, 40367, 14424, 25525, 34603, 82944, 118, 44726, 81456, 11373 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mother", "Teresa", "turns", "86", "but", "still", "in", "danger", "." ], "ids": [ 23625, 21218, 37374, 12224, 10473, 12647, 10106, 45882, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##upa", "##m", "Ban", "##er", "##jee" ], "ids": [ 155, 25009, 10147, 21631, 10165, 76083 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "CA", "##LC", "##UT", "##TA", "1996", "-", "08", "-", "27" ], "ids": [ 24707, 84906, 65729, 24951, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mother", "Teresa", "spent", "her", "86", "##th", "birthday", "in", "a", "Calcutta", "hospital", "bed", "on", "Tuesday", "as", "tribute", "##s", "to", "the", "legendary", "missionary", "pour", "##ed", "in", "from", "around", "the", "world", "." ], "ids": [ 23625, 21218, 18571, 10485, 12224, 11143, 56396, 10106, 169, 54383, 18141, 30113, 10135, 70245, 10146, 51903, 10107, 10114, 10105, 83974, 89063, 10322, 10336, 10106, 10188, 12166, 10105, 11356, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Doctor", "##s", "said", "that", "later", "in", "the", "day", "they", "would", "try", "to", "we", "##an", "the", "Nobel", "Peace", "Prize", "laurea", "##te", "from", "the", "resp", "##irat", "##or", "that", "has", "aide", "##d", "her", "br", "##eath", "##ing", "for", "the", "past", "six", "days", "." ], "ids": [ 17376, 10107, 12415, 10189, 10873, 10106, 10105, 11940, 10689, 10894, 31638, 10114, 11951, 10206, 10105, 16280, 20705, 17017, 85280, 10216, 10188, 10105, 52812, 56610, 10667, 10189, 10393, 23135, 10162, 10485, 33989, 54006, 10230, 10142, 10105, 17781, 12449, 13990, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Her", "condition", "seems", "to", "be", "better", ",", "but", "the", "danger", "remains", "as", "long", "as", "she", "is", "on", "resp", "##irat", "##or", ",", "\"", "an", "official", "at", "Wood", "##lands", "Nursing", "Home", "said", ".", "\"" ], "ids": [ 107, 13229, 24713, 34208, 10114, 10347, 18322, 117, 10473, 10105, 45882, 19602, 10146, 11695, 10146, 10833, 10124, 10135, 52812, 56610, 10667, 117, 107, 10151, 14731, 10160, 18315, 18425, 108326, 13898, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "She", "is", "con", "##sci", "##ous", "but", "her", "br", "##eath", "##ing", "is", "irregular", ".", "\"" ], "ids": [ 11149, 10124, 10173, 89270, 13499, 10473, 10485, 33989, 54006, 10230, 10124, 55143, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rev", "##ered", "Roman", "Catholic", "nun", "was", "admitted", "to", "the", "Calcutta", "hospital", "a", "week", "ago", "with", "high", "fever", "and", "severe", "vom", "##iting", "." ], "ids": [ 10117, 86095, 45452, 12359, 15473, 11715, 10134, 40345, 10114, 10105, 54383, 18141, 169, 16118, 36390, 10169, 11846, 105142, 10111, 34844, 11036, 48802, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "later", "suffered", "heart", "failure", "and", "was", "diagnosed", "with", "malaria", "." ], "ids": [ 11149, 10873, 26090, 21736, 31562, 10111, 10134, 107123, 10169, 88086, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Her", "fever", "has", "since", "abate", "##d", "and", "the", "heart", "failure", "has", "been", "brought", "under", "control", ",", "but", "her", "heart", "continues", "to", "beat", "irregular", "##ly", ",", "doctors", "said", "." ], "ids": [ 13229, 105142, 10393, 11764, 108952, 10162, 10111, 10105, 21736, 31562, 10393, 10590, 17327, 10571, 12608, 117, 10473, 10485, 21736, 25266, 10114, 27868, 55143, 10454, 117, 82782, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Un", "##less", "she", "br", "##eathe", "##s", "on", "her", "own", ",", "I", "would", "ad", "##vise", "you", "to", "keep", "your", "finger", "##s", "crossed", ",", "\"", "said", "a", "doctor", "who", "was", "familiar", "with", "her", "case", "but", "not", "part", "of", "the", "six", "-", "member", "team", "treat", "##ing", "Mother", "Teresa", "." ], "ids": [ 107, 11038, 14985, 10833, 33989, 110532, 10107, 10135, 10485, 12542, 117, 146, 10894, 10840, 36540, 13028, 10114, 23819, 20442, 88519, 10107, 56433, 117, 107, 12415, 169, 26937, 10479, 10134, 29626, 10169, 10485, 13474, 10473, 10472, 10668, 10108, 10105, 12449, 118, 12008, 11121, 81634, 10230, 23625, 21218, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "The", "nun", "'", "s", "birthday", "prompted", "gr", "##eet", "##ings", ",", "bou", "##quet", "##s", "and", "prayer", "##s", "from", "around", "the", "world", "." ], "ids": [ 10117, 11715, 112, 187, 56396, 93003, 30518, 23203, 18800, 117, 94335, 27579, 10107, 10111, 82012, 10107, 10188, 12166, 10105, 11356, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pope", "John", "Paul", "II", "and", "Israeli", "Foreign", "Minister", "David", "Levy", "sent", "her", "get", "-", "well", "messages", ",", "the", "Press", "Trust", "of", "India", "said", "." ], "ids": [ 23874, 10421, 10772, 10335, 10111, 28446, 20277, 14355, 10804, 16608, 14541, 10485, 15329, 118, 11206, 58945, 117, 10105, 10568, 22271, 10108, 11098, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 2, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "\"", "Ask", "for", "a", "mira", "##cle", "." ], "ids": [ 107, 93919, 10142, 169, 51259, 19478, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Happy", "Birthday", "to", "our", "Dear", "##est", "Mother", ",", "\"", "read", "a", "placa", "##rd", "at", "the", "Shi", "##shu", "B", "##hav", "##an", "children", "'", "s", "home", "in", "central", "Calcutta", "run", "by", "Mother", "Teresa", "'", "s", "Mission", "##aries", "of", "Charity", "." ], "ids": [ 22678, 57981, 10114, 17446, 51555, 13051, 23625, 117, 107, 24944, 169, 57474, 12023, 10160, 10105, 44795, 106738, 139, 79313, 10206, 12694, 112, 187, 11816, 10106, 12397, 54383, 14095, 10155, 23625, 21218, 112, 187, 14157, 26445, 10108, 71370, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "On", "Monday", ",", "both", "houses", "of", "India", "'", "s", "parliament", "wish", "##ed", "the", "nation", "'", "s", "adopted", "sister", "a", "happy", "birthday", "and", "speed", "##y", "recovery", "from", "her", "illness", "." ], "ids": [ 10576, 40714, 117, 11408, 21174, 10108, 11098, 112, 187, 40519, 66069, 10336, 10105, 22274, 112, 187, 24726, 19806, 169, 54214, 56396, 10111, 19085, 10157, 61958, 10188, 10485, 56507, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Prayer", "##s", "continued", "in", "Calcutta", ",", "one", "of", "the", "world", "'", "s", "poor", "##est", "cities", ",", "where", "Mother", "Teresa", "'", "s", "Mission", "##aries", "of", "Charity", "runs", "several", "homes", "for", "the", "poor", "and", "des", "##titut", "##e", "." ], "ids": [ 62399, 10107, 14278, 10106, 54383, 117, 10464, 10108, 10105, 11356, 112, 187, 23247, 13051, 19838, 117, 10940, 23625, 21218, 112, 187, 14157, 26445, 10108, 71370, 17913, 11736, 14154, 10142, 10105, 23247, 10111, 10139, 102083, 10112, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Street", "children", ",", "some", "of", "them", "born", "to", "pro", "##stitute", "##s", ",", "held", "prayer", "##s", "on", "the", "street", ".", "\"" ], "ids": [ 11962, 12694, 117, 11152, 10108, 11345, 11175, 10114, 11284, 69442, 10107, 117, 11991, 82012, 10107, 10135, 10105, 23840, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "of", "us", "know", "about", "her", "." ], "ids": [ 11101, 10108, 19626, 21852, 10978, 10485, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "is", "like", "a", "god", "##dess", ",", "\"", "said", "Raj", "##u", ",", "8", ",", "who", "has", "a", "mother", "but", "no", "father", "." ], "ids": [ 11149, 10124, 11850, 169, 22009, 59257, 117, 107, 12415, 56510, 10138, 117, 129, 117, 10479, 10393, 169, 15293, 10473, 10192, 13194, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "States", "##man", "newspaper", "quoted", "40", "-", "year", "-", "old", "Manga", "##la", "Das", ",", "paral", "##yse", "##d", "from", "her", "wa", "##ist", "down", "and", "a", "resident", "of", "the", "Pre", "##m", "Dan", "(", "Gift", "of", "Love", ")", "home", "for", "the", "des", "##titut", "##e", ",", "as", "saying", "she", "and", "her", "friends", "had", "been", "pra", "##ying", "in", "##ces", "##sant", "##ly", "for", "Mother", "Teresa", "'", "s", "recovery", "." ], "ids": [ 10117, 10859, 10589, 22047, 70676, 10533, 118, 10924, 118, 12898, 50432, 10330, 10672, 117, 102568, 45158, 10162, 10188, 10485, 11471, 11293, 12935, 10111, 169, 44192, 10108, 10105, 35248, 10147, 14261, 113, 62074, 10108, 11248, 114, 11816, 10142, 10105, 10139, 102083, 10112, 117, 10146, 22807, 10833, 10111, 10485, 21997, 10374, 10590, 69857, 40018, 10106, 14585, 31271, 10454, 10142, 23625, 21218, 112, 187, 61958, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Tara", "##k", "Das", ",", "70", ",", "was", "picked", "up", "from", "a", "Calcutta", "foot", "##pat", "##h", "a", "week", "ago", "by", "passer", "##s", "-", "by", "who", "took", "pit", "##y", "on", "him", "and", "brought", "him", "to", "Ni", "##rmal", "Hr", "##ida", "##y", "(", "Im", "##ma", "##cula", "##te", "Home", ")", "." ], "ids": [ 51806, 10174, 10672, 117, 10923, 117, 10134, 52289, 10741, 10188, 169, 54383, 24963, 18115, 10237, 169, 16118, 36390, 10155, 34650, 10107, 118, 10155, 10479, 12149, 55277, 10157, 10135, 10957, 10111, 17327, 10957, 10114, 30409, 66619, 74968, 11726, 10157, 113, 10796, 10369, 32107, 10216, 13898, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "not", "know", "who", "she", "is", "." ], "ids": [ 107, 146, 10149, 10472, 21852, 10479, 10833, 10124, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "have", "never", "seen", "her", ",", "but", "I", "can", "only", "ble", "##ss", "her", "for", "what", "she", "has", "done", "for", "people", "like", "me", ",", "\"", "Das", "told", "The", "States", "##man", "." ], "ids": [ 146, 10529, 14794, 15652, 10485, 117, 10473, 146, 10944, 10893, 10718, 13420, 10485, 10142, 12976, 10833, 10393, 20378, 10142, 11426, 11850, 10911, 117, 107, 10672, 21937, 10117, 10859, 10589, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Mother", "Teresa", "'", "s", "condition", "improved", "on", "Sunday", "as", "her", "fever", "abate", "##d", ",", "and", "on", "Monday", "she", "was", "able", "to", "s", "##cri", "##bble", "notes", "to", "doctors", "and", "nun", "##s", "." ], "ids": [ 23625, 21218, 112, 187, 24713, 34605, 10135, 19731, 10146, 10485, 105142, 108952, 10162, 117, 10111, 10135, 40714, 10833, 10134, 16197, 10114, 187, 99590, 55873, 19899, 10114, 82782, 10111, 11715, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thousand", "##s", "in", "Calcutta", ",", "where", "she", "founded", "her", "Mission", "##aries", "of", "Charity", "religious", "order", "in", "1949", ",", "pra", "##yed", "for", "her", "recovery", "." ], "ids": [ 61795, 10107, 10106, 54383, 117, 10940, 10833, 14078, 10485, 14157, 26445, 10108, 71370, 19366, 12990, 10106, 11095, 117, 69857, 68159, 10142, 10485, 61958, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ministers", "of", "the", "communist", "government", "of", "West", "Bengal", "state", "and", "people", "of", "different", "religions", "joined", "Catholics", "to", "pra", "##y", "for", "Mother", "Teresa", "'", "s", "recovery", "at", "Mother", "House", "." ], "ids": [ 95010, 10108, 10105, 64574, 12047, 10108, 11164, 32599, 11388, 10111, 11426, 10108, 12902, 64757, 13914, 89482, 10114, 69857, 10157, 10142, 23625, 21218, 112, 187, 61958, 10160, 23625, 11545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "We", "joined", "the", "prayer", "to", "express", "our", "solid", "##arity", "with", "her", "work", "for", "the", "cause", "of", "the", "poor", "and", "down", "##tro", "##dden", ",", "\"", "said", "Nan", "##da", "Go", "##pal", "B", "##hat", "##tach", "##ary", "##a", ",", "a", "communist", "minister", "in", "West", "Bengal", "." ], "ids": [ 107, 12865, 13914, 10105, 82012, 10114, 47620, 17446, 37751, 91566, 10169, 10485, 11424, 10142, 10105, 15311, 10108, 10105, 23247, 10111, 12935, 14239, 71339, 117, 107, 12415, 44286, 10229, 14439, 34935, 139, 19180, 92799, 14926, 10113, 117, 169, 64574, 16930, 10106, 11164, 32599, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Islam", "##ists", "can", "meet", "in", "London", ",", "minister", "." ], "ids": [ 14727, 18206, 10944, 23267, 10106, 10829, 117, 16930, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "IS", "##LA", "##MA", "##BA", "##D", "1996", "-", "08", "-", "27" ], "ids": [ 40214, 44376, 30696, 35999, 11490, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "British", "Foreign", "Secretary", "Malcolm", "R", "##if", "##kind", "said", "on", "Tuesday", "that", "his", "government", "would", "only", "take", "action", "against", "a", "planned", "conference", "of", "Islam", "##ist", "groups", "in", "London", "if", "British", "law", "was", "broken", "." ], "ids": [ 11160, 20277, 19382, 26572, 155, 13918, 62891, 12415, 10135, 70245, 10189, 10226, 12047, 10894, 10893, 13574, 14204, 11327, 169, 24292, 25029, 10108, 14727, 11293, 15647, 10106, 10829, 12277, 11160, 13255, 10134, 36197, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "People", "who", "wish", "to", "hold", "conferences", "of", "course", "do", "n", "'", "t", "need", "to", "seek", "permission", "from", "the", "government", "in", "Britain", ",", "\"", "R", "##if", "##kind", ",", "in", "Pakistan", "for", "a", "visit", ",", "told", "Reuters", ".", "\"" ], "ids": [ 107, 14235, 10479, 66069, 10114, 18500, 83881, 10108, 15348, 10149, 182, 112, 188, 17367, 10114, 48394, 52389, 10188, 10105, 12047, 10106, 16032, 117, 107, 155, 13918, 62891, 117, 10106, 15437, 10142, 169, 27541, 117, 21937, 46617, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "As", "long", "as", "they", "ob", "##ey", "our", "laws", "then", "that", "is", "not", "something", "the", "government", "would", "normally", "inter", "##fere", "with", ".", "\"" ], "ids": [ 10882, 11695, 10146, 10689, 17339, 13005, 17446, 28160, 11059, 10189, 10124, 10472, 26133, 10105, 12047, 10894, 48252, 22021, 50544, 10169, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Islam", "##ist", "conference", ",", "due", "to", "be", "held", "in", "London", "on", "September", "8", ",", "has", "caused", "concern", "in", "countries", "such", "as", "Algeria", "and", "Egypt", ",", "which", "are", "fighting", "armed", "Islamic", "militants", "." ], "ids": [ 10117, 14727, 11293, 25029, 117, 10850, 10114, 10347, 11991, 10106, 10829, 10135, 10596, 129, 117, 10393, 19513, 43607, 10106, 15911, 11049, 10146, 43776, 10111, 20440, 117, 10319, 10301, 27535, 34174, 22150, 73829, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "British", "Jewish", "groups", "have", "also", "protest", "##ed", "because", "they", "say", "members", "of", "Algeria", "'", "s", "Islamic", "Sal", "##vation", "Front", "(", "FIS", ")", "and", "the", "Palestinian", "Islamic", "group", "Hamas", "are", "on", "the", "guest", "list", "." ], "ids": [ 11160, 17119, 15647, 10529, 10379, 36627, 10336, 12373, 10689, 23763, 12464, 10108, 43776, 112, 187, 22150, 64831, 39784, 19241, 113, 63392, 114, 10111, 10105, 56119, 22150, 11795, 83152, 10301, 10135, 10105, 26959, 13416, 119 ], "entity": [ "B-MISC", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "B-MISC", "B-MISC", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 9, 3, 9, 9, 9, 2, 2, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##if", "##kind", "said", "it", "was", "for", "the", "home", "secretary", "(", "interior", "minister", ")", "to", "act", "by", "den", "##ying", "visas", "to", "participants", "if", "he", "felt", "there", "was", "reason", "to", "believe", "that", "they", "might", "break", "the", "law", "." ], "ids": [ 155, 13918, 62891, 12415, 10271, 10134, 10142, 10105, 11816, 37664, 113, 14806, 16930, 114, 10114, 19833, 10155, 10140, 40018, 62665, 10114, 35675, 12277, 10261, 24666, 11155, 10134, 27949, 10114, 30587, 10189, 10689, 20970, 24194, 10105, 13255, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Our", "policy", "has", "to", "be", "fundamental", "##ly", "based", "on", "respect", "for", "the", "rule", "of", "law", "and", "ins", "##isten", "##ce", "that", "it", "be", "observed", ",", "\"", "he", "said", "." ], "ids": [ 107, 18465, 14368, 10393, 10114, 10347, 27971, 10454, 11610, 10135, 28944, 10142, 10105, 21983, 10108, 13255, 10111, 15498, 17146, 10419, 10189, 10271, 10347, 34148, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##if", "##kind", "was", "in", "Pakistan", "at", "the", "start", "of", "an", "Asian", "tour", "that", "will", "also", "take", "him", "to", "India", ",", "Sri", "Lanka", ",", "Japan", "and", "Mongolia", "." ], "ids": [ 155, 13918, 62891, 10134, 10106, 15437, 10160, 10105, 15148, 10108, 10151, 16900, 12842, 10189, 11337, 10379, 13574, 10957, 10114, 11098, 117, 16098, 20828, 117, 11891, 10111, 41680, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Afghan", "leader", "tells", "U", ".", "S", ".", "Congress", "##man", "of", "peace", "plan", "." ], "ids": [ 82228, 15014, 27024, 158, 119, 156, 119, 15984, 10589, 10108, 28101, 13065, 119 ], "entity": [ "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Say", "##ed", "Salah", "##uddin" ], "ids": [ 24625, 10336, 44581, 76170 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "KA", "##BU", "##L", "1996", "-", "08", "-", "27" ], "ids": [ 85314, 108865, 11369, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Afghan", "government", "military", "chief", "Ahmad", "Shah", "Mas", "##ood", "brief", "##ed", "visiting", "U", ".", "S", ".", "Congress", "##man", "Dana", "R", "##ohr", "##aba", "##cher", "on", "Tuesday", "on", "a", "peace", "plan", "for", "his", "war", "##tor", "##n", "country", "." ], "ids": [ 82228, 12047, 14041, 19421, 24717, 24496, 16423, 39041, 29040, 10336, 48780, 158, 119, 156, 119, 15984, 10589, 27149, 155, 97062, 18696, 13396, 10135, 70245, 10135, 169, 28101, 13065, 10142, 10226, 10338, 11813, 10115, 12723, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "spoke", "##sman", "for", "Mas", "##ood", "said", "he", "had", "told", "the", "California", "Republican", "at", "a", "meeting", "in", "northern", "Kabul", "that", "President", "Bu", "##r", "##han", "##uddin", "Ra", "##bban", "##i", "'", "s", "government", "favour", "##ed", "talks", "with", "all", "Afghan", "faction", "##s", "to", "set", "up", "an", "interim", "government", "." ], "ids": [ 138, 50005, 24305, 10142, 16423, 39041, 12415, 10261, 10374, 21937, 10105, 11621, 21776, 10160, 169, 19822, 10106, 17335, 33716, 10189, 12811, 11916, 10129, 11781, 76170, 38571, 88901, 10116, 112, 187, 12047, 61264, 10336, 56672, 10169, 10435, 82228, 84395, 10107, 10114, 11847, 10741, 10151, 63313, 12047, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 2, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "faction", "##s", "should", "agree", "to", "app", "##oint", "a", "transition", "##al", "leader", ",", "draft", "a", "new", "constitution", ",", "collect", "heavy", "weapons", ",", "create", "a", "national", "army", "and", "hold", "free", "elections", "in", "which", "the", "transition", "##al", "leader", "would", "be", "barre", "##d", "from", "standing", ",", "he", "added", "." ], "ids": [ 10117, 84395, 10107, 14819, 68312, 10114, 72894, 94453, 169, 35959, 10415, 15014, 117, 28447, 169, 10751, 34953, 117, 80739, 18296, 31881, 117, 18842, 169, 11844, 17977, 10111, 18500, 13961, 22054, 10106, 10319, 10105, 35959, 10415, 15014, 10894, 10347, 107553, 10162, 10188, 32173, 117, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##ohr", "##aba", "##cher", "flew", "into", "Ba", "##gram", "military", "air", "##base", "north", "of", "Kabul", "in", "a", "Red", "Cross", "plane", "on", "Tuesday", "after", "meeting", "northern", "opposition", "militia", "leader", "General", "Abdul", "Rashid", "Dos", "##tum", "." ], "ids": [ 155, 97062, 18696, 13396, 64284, 10708, 21333, 31253, 14041, 12566, 31464, 12756, 10108, 33716, 10106, 169, 11641, 15666, 35007, 10135, 70245, 10662, 19822, 17335, 21227, 86957, 15014, 11220, 23642, 93828, 23846, 15673, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Mas", "##ood", "'", "s", "spoke", "##sman", "Am", "##roll", "##ah", "(", "one", "name", ")", "said", "R", "##ohr", "##aba", "##cher", "had", "recently", "visited", "Italy", ",", "Saudi", "Arabia", "and", "Pakistan", "as", "part", "of", "a", "mission", "to", "promote", "peace", "in", "Afghanistan", "." ], "ids": [ 16423, 39041, 112, 187, 50005, 24305, 11500, 51091, 12257, 113, 10464, 11324, 114, 12415, 155, 97062, 18696, 13396, 10374, 23746, 30270, 11619, 117, 26598, 27860, 10111, 15437, 10146, 10668, 10108, 169, 17032, 10114, 32807, 28101, 10106, 18776, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 1, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "We", "are", "certainly", "serious", "more", "than", "before", "to", "find", "a", "solution", "to", "the", "Afghan", "problem", "and", "support", "every", "U", ".", "N", ".", "plan", ",", "\"", "Am", "##roll", "##ah", "quoted", "R", "##ohr", "##aba", "##cher", "as", "saying", "." ], "ids": [ 107, 12865, 10301, 88134, 32342, 10798, 11084, 11360, 10114, 17860, 169, 28502, 10114, 10105, 82228, 18077, 10111, 13145, 14234, 158, 119, 151, 119, 13065, 117, 107, 11500, 51091, 12257, 70676, 155, 97062, 18696, 13396, 10146, 22807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "However", ",", "a", "spoke", "##sman", "for", "Prime", "Minister", "G", "##ul", "##bud", "##din", "He", "##km", "##aty", "##ar", ",", "a", "long", "-", "time", "rival", "of", "Mas", "##ood", ",", "expressed", "concern", "at", "signs", "of", "renewed", "U", ".", "S", ".", "interest", "in", "Afghanistan", "." ], "ids": [ 12209, 117, 169, 50005, 24305, 10142, 19924, 14355, 144, 10604, 41276, 15612, 10357, 23440, 55241, 10354, 117, 169, 11695, 118, 10635, 24792, 10108, 16423, 39041, 117, 31685, 43607, 10160, 45033, 10108, 81783, 158, 119, 156, 119, 17644, 10106, 18776, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "America", "wants", "to", "block", "the", "establishment", "of", "a", "strong", "Islamic", "government", "in", "Afghanistan", "and", "the", "U", ".", "S", ".", "inte", "##nds", "to", "neutral", "##ise", "the", "Afghan", "peace", "process", "initiated", "by", "the", "Afghan", "##s", "themselves", ",", "\"", "said", "the", "spoke", "##sman", ",", "Hamid", "Ibrahim", "##i", "." ], "ids": [ 107, 11440, 45769, 10114, 27242, 10105, 31989, 10108, 169, 18093, 22150, 12047, 10106, 18776, 10111, 10105, 158, 119, 156, 119, 14168, 27090, 10114, 52546, 13041, 10105, 82228, 28101, 15138, 56571, 10155, 10105, 82228, 10107, 20182, 117, 107, 12415, 10105, 50005, 24305, 117, 78406, 30727, 10116, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "\"", "A", "great", "game", "has", "been", "started", "in", "Afghanistan", "as", "America", "feels", "that", "Tehran", "and", "Moscow", "have", "got", "stronger", "in", "the", "Afghan", "picture", "-", "-", "something", "Washington", "wants", "to", "change", ",", "\"", "he", "said", "." ], "ids": [ 107, 138, 14772, 11661, 10393, 10590, 13457, 10106, 18776, 10146, 11440, 84992, 10189, 73520, 10111, 18744, 10529, 19556, 85688, 10106, 10105, 82228, 36761, 118, 118, 26133, 11586, 45769, 10114, 15453, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##ohr", "##aba", "##cher", "was", "expected", "to", "visit", "neutral", "faction", "leaders", "in", "the", "eastern", "city", "of", "Ja", "##lala", "##bad", "and", "meet", "leaders", "of", "the", "rebel", "Islamic", "Tale", "##ban", "militia", "in", "the", "southern", "city", "of", "Kan", "##dah", "##ar", "." ], "ids": [ 155, 97062, 18696, 13396, 10134, 25973, 10114, 27541, 52546, 84395, 24155, 10106, 10105, 18677, 11584, 10108, 28248, 91113, 24623, 10111, 23267, 24155, 10108, 10105, 56696, 22150, 27632, 10927, 86957, 10106, 10105, 17156, 11584, 10108, 57528, 30942, 10354, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Afghan", "guerrilla", "faction", "##s", "have", "been", "lock", "##ed", "in", "a", "blood", "##y", "power", "struggle", "since", "the", "fall", "of", "the", "communist", "government", "in", "April", "1992", "." ], "ids": [ 82228, 106552, 84395, 10107, 10529, 10590, 79601, 10336, 10106, 169, 24911, 10157, 13183, 48919, 11764, 10105, 18042, 10108, 10105, 64574, 12047, 10106, 10780, 10450, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "##km", "##aty", "##ar", ",", "once", "Ra", "##bban", "##i", "'", "s", "main", "rival", ",", "made", "a", "peace", "pa", "##ct", "with", "him", "and", "re", "##jo", "##ined", "the", "government", "as", "prime", "minister", "in", "June", "." ], "ids": [ 10357, 23440, 55241, 10354, 117, 14907, 38571, 88901, 10116, 112, 187, 12126, 24792, 117, 11019, 169, 28101, 10931, 14526, 10169, 10957, 10111, 11639, 11039, 28751, 10105, 12047, 10146, 19287, 16930, 10106, 11120, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "state", "bank", "sell", "##s", "1", ".", "38", "bl", "##n", "ru", "##pe", "##es", "of", "bonds", "." ], "ids": [ 15437, 11388, 19423, 36300, 10107, 122, 119, 11171, 21484, 10115, 13483, 11355, 10171, 10108, 93163, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##RA", "##CH", "##I", ",", "Pakistan", "1996", "-", "08", "-", "27" ], "ids": [ 85314, 29990, 86448, 11281, 117, 15437, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "State", "(", "central", ")", "Bank", "of", "Pakistan", "auction", "##ed", "three", "-", ",", "five", "-", "and", "10", "-", "year", "federal", "investment", "bonds", "worth", "1", ".", "38", "billion", "ru", "##pe", "##es", "on", "Tuesday", "." ], "ids": [ 10117, 11104, 113, 12397, 114, 13533, 10108, 15437, 106733, 10336, 11003, 118, 117, 12403, 118, 10111, 10150, 118, 10924, 16293, 37933, 93163, 43509, 122, 119, 11171, 25848, 13483, 11355, 10171, 10135, 70245, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "bank", "said", "it", "had", "accepted", "bid", "##s", "of", "250", "million", "ru", "##pe", "##es", "at", "par", "for", "three", "-", "year", "bonds", ",", "3", ".", "5", "million", "ru", "##pe", "##es", "at", "par", "for", "five", "-", "year", "bonds", "and", "1", ".", "126", "billion", "at", "par", "for", "10", "-", "year", "bonds", "." ], "ids": [ 10117, 19423, 12415, 10271, 10374, 24926, 50385, 10107, 10108, 12214, 12473, 13483, 11355, 10171, 10160, 10248, 10142, 11003, 118, 10924, 93163, 117, 124, 119, 126, 12473, 13483, 11355, 10171, 10160, 10248, 10142, 12403, 118, 10924, 93163, 10111, 122, 119, 17813, 25848, 10160, 10248, 10142, 10150, 118, 10924, 93163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "auction", "is", "set", "for", "settlement", "on", "Thursday", "." ], "ids": [ 10117, 106733, 10124, 11847, 10142, 23931, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "previous", "auction", "on", "July", "11", ",", "it", "accepted", "bid", "##s", "worth", "300", "million", "ru", "##pe", "##es", "at", "par", "for", "three", "-", "year", "bonds", ",", "44", ".", "5", "million", "ru", "##pe", "##es", "at", "par", "for", "five", "-", "year", "bonds", "and", "782", ".", "6", "million", "ru", "##pe", "##es", "at", "par", "for", "10", "-", "year", "bonds", "." ], "ids": [ 10167, 10105, 16741, 106733, 10135, 11112, 10193, 117, 10271, 24926, 50385, 10107, 43509, 11093, 12473, 13483, 11355, 10171, 10160, 10248, 10142, 11003, 118, 10924, 93163, 117, 11126, 119, 126, 12473, 13483, 11355, 10171, 10160, 10248, 10142, 12403, 118, 10924, 93163, 10111, 77402, 119, 127, 12473, 13483, 11355, 10171, 10160, 10248, 10142, 10150, 118, 10924, 93163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Karachi", "news", "##room", "922", "##1", "-", "568", "##51", "##9", "##2" ], "ids": [ 118, 118, 82344, 14424, 25525, 72446, 10759, 118, 54879, 77581, 11373, 10729 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nepal", "offers", "to", "talk", "to", "Mao", "##ist", "ins", "##urg", "##ents", "." ], "ids": [ 22276, 23818, 10114, 31311, 10114, 32339, 11293, 15498, 51932, 24384, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Go", "##pal", "Sharma" ], "ids": [ 14439, 34935, 66062 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "KA", "##TH", "##MA", "##ND", "##U", "1996", "-", "08", "-", "27" ], "ids": [ 85314, 109166, 30696, 58521, 12022, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nepal", "'", "s", "centre", "-", "right", "coalition", "government", "has", "offered", "to", "meet", "the", "country", "'", "s", "hard", "##line", "Mao", "##ist", "communist", "##s", "for", "talks", "in", "a", "bid", "to", "end", "an", "ins", "##urg", "##ency", "in", "Nepal", "'", "s", "western", "districts", ",", "officials", "said", "on", "Tuesday", "." ], "ids": [ 22276, 112, 187, 12672, 118, 13448, 41028, 12047, 10393, 20841, 10114, 23267, 10105, 12723, 112, 187, 19118, 12953, 32339, 11293, 64574, 10107, 10142, 56672, 10106, 169, 50385, 10114, 11572, 10151, 15498, 51932, 87415, 10106, 22276, 112, 187, 16672, 24412, 117, 27730, 12415, 10135, 70245, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Mao", "##ists", "oppose", "multi", "-", "party", "democracy", "and", "want", "to", "establish", "a", "communist", "state", "." ], "ids": [ 10117, 32339, 18206, 53037, 21247, 118, 14039, 67519, 10111, 21528, 10114, 33623, 169, 64574, 11388, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "Nepal", "##i", "government", "said", "the", "ins", "##urg", "##ents", "must", "give", "up", "violence", "before", "it", "nego", "##tia", "##tes", "with", "them", "." ], "ids": [ 16976, 10105, 22276, 10116, 12047, 12415, 10105, 15498, 51932, 24384, 14982, 18090, 10741, 26342, 11360, 10271, 21134, 16180, 11197, 10169, 11345, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "(", "the", "ins", "##urg", "##ents", ")", "should", "first", "give", "up", "their", "violent", "activities", ",", "\"", "Home", "(", "Interior", ")", "Minister", "Khu", "##m", "Ba", "##had", "##ur", "K", "##had", "##ga", "said", "." ], "ids": [ 107, 11696, 113, 10105, 15498, 51932, 24384, 114, 14819, 10422, 18090, 10741, 10455, 43934, 19286, 117, 107, 13898, 113, 33667, 114, 14355, 58442, 10147, 21333, 33796, 10546, 148, 33796, 10483, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "About", "54", "people", "have", "died", "in", "Mao", "##ist", "ins", "##urg", "##ent", "activity", "and", "in", "police", "action", "against", "them", "since", "February", ",", "officials", "said", "." ], "ids": [ 16260, 11653, 11426, 10529, 12482, 10106, 32339, 11293, 15498, 51932, 11405, 22205, 10111, 10106, 15034, 14204, 11327, 11345, 11764, 11508, 117, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nepal", "##i", "opposition", "parties", "have", "accused", "the", "police", "of", "having", "killed", "more", "people", "than", "the", "ins", "##urg", "##ents", "." ], "ids": [ 22276, 10116, 21227, 18708, 10529, 37303, 10105, 15034, 10108, 13677, 15875, 10798, 11426, 11084, 10105, 15498, 51932, 24384, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "human", "rights", "groups", "have", "criticised", "the", "government", "'", "s", "handling", "of", "the", "situation", "." ], "ids": [ 13885, 14179, 16691, 15647, 10529, 91588, 10105, 12047, 112, 187, 52703, 10108, 10105, 18586, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "speech", "in", "parliament", "on", "Tuesday", ",", "K", "##had", "##ga", "challenged", "the", "Mao", "##ist", "communist", "##s", "to", "\"", "win", "the", "people", "'", "s", "confidence", "\"", "and", "win", "election", "to", "parliament", "." ], "ids": [ 10167, 169, 29811, 10106, 40519, 10135, 70245, 117, 148, 33796, 10483, 72921, 10105, 32339, 11293, 64574, 10107, 10114, 107, 14125, 10105, 11426, 112, 187, 74187, 107, 10111, 14125, 13685, 10114, 40519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Monday", ",", "he", "had", "offered", "to", "talk", "to", "leaders", "of", "the", "United", "People", "'", "s", "Front", "Nepal", "(", "B", "##hat", "##tara", "##i", ")", ",", "the", "Mao", "##ist", "faction", "which", "leads", "the", "ins", "##urg", "##ency", "." ], "ids": [ 10576, 40714, 117, 10261, 10374, 20841, 10114, 31311, 10114, 24155, 10108, 10105, 10609, 14235, 112, 187, 19241, 22276, 113, 139, 19180, 35474, 10116, 114, 117, 10105, 32339, 11293, 84395, 10319, 34868, 10105, 15498, 51932, 87415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "government", "is", "ready", "to", "gu", "##aran", "##tee", "security", "of", "the", "Mao", "##ist", "representatives", "who", "want", "to", "take", "part", "in", "peace", "##ful", "dialogue", ",", "\"", "K", "##had", "##ga", "said", "." ], "ids": [ 107, 10117, 12047, 10124, 42374, 10114, 75980, 24367, 47738, 21849, 10108, 10105, 32339, 11293, 49959, 10479, 21528, 10114, 13574, 10668, 10106, 28101, 14446, 51077, 117, 107, 148, 33796, 10483, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "A", "multi", "-", "party", "democracy", "was", "set", "up", "in", "Nepal", "six", "years", "ago", ",", "after", "a", "popular", "movement", "by", "the", "centri", "##st", "Nepal", "##i", "Congress", "party", "jointly", "with", "the", "Communist", "United", "Marx", "##ist", "-", "Lenin", "##ist", "(", "U", "##ML", ")", "party", "." ], "ids": [ 138, 21247, 118, 14039, 67519, 10134, 11847, 10741, 10106, 22276, 12449, 10855, 36390, 117, 10662, 169, 12600, 17123, 10155, 10105, 64286, 10562, 22276, 10116, 15984, 14039, 94744, 10169, 10105, 33065, 10609, 22919, 11293, 118, 33970, 11293, 113, 158, 77526, 114, 14039, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "The", "Nepal", "##i", "Congress", "leads", "the", "three", "-", "party", "coalition", "government", "while", "the", "U", "##ML", "is", "the", "main", "opposition", "party", "." ], "ids": [ 10117, 22276, 10116, 15984, 34868, 10105, 11003, 118, 14039, 41028, 12047, 11371, 10105, 158, 77526, 10124, 10105, 12126, 21227, 14039, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indian", "soy", "prices", "end", "st", "##eady", "ahead", "of", "holiday", "." ], "ids": [ 12544, 103559, 57476, 11572, 28780, 61973, 35629, 10108, 71806, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##DO", "##RE", ",", "India", "1996", "-", "08", "-", "27" ], "ids": [ 36351, 104847, 66014, 117, 11098, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indian", "soy", "##bea", "##n", "prices", "on", "Tuesday", "remained", "st", "##eady", "at", "12", ",", "900", "-", "13", ",", "100", "ru", "##pe", "##es", "per", "ton", "##ne", "in", "plant", "delivery", "condition", ",", "deal", "##ers", "said" ], "ids": [ 12544, 103559, 92710, 10115, 57476, 10135, 70245, 15980, 28780, 61973, 10160, 10186, 117, 13545, 118, 10249, 117, 10407, 13483, 11355, 10171, 10178, 22464, 10238, 10106, 16430, 55626, 24713, 117, 19918, 10901, 12415 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "arrival", "##s", "were", "poor", "due", "to", "the", "festival", "season", "." ], "ids": [ 11696, 12415, 40285, 10107, 10309, 23247, 10850, 10114, 10105, 15242, 11226, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Market", "##s", "in", "central", "India", "would", "be", "closed", "for", "a", "local", "religious", "holiday", "on", "Wednesday", "." ], "ids": [ 28409, 10107, 10106, 12397, 11098, 10894, 10347, 18440, 10142, 169, 11436, 19366, 71806, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yo", "##il", "prices", "fell", "on", "increased", "selling", "against", "poor", "demand", "." ], "ids": [ 12882, 15594, 11030, 57476, 25194, 10135, 19299, 30870, 11327, 23247, 34394, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yo", "##il", "solve", "##nt", "was", "down", "by", "400", "ru", "##pe", "##es", "per", "ton", "##ne", "and", "soy", "##oi", "##l", "ref", "##ined", "was", "down", "by", "400", "ru", "##pe", "##es", "." ], "ids": [ 12882, 15594, 11030, 100679, 10368, 10134, 12935, 10155, 11176, 13483, 11355, 10171, 10178, 22464, 10238, 10111, 103559, 14638, 10161, 48056, 28751, 10134, 12935, 10155, 11176, 13483, 11355, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yo", "##il", "ref", "##ined", "fell", "by", "200", "ru", "##pe", "##es", "on", "weak", "under", "##tone", "." ], "ids": [ 12882, 15594, 11030, 48056, 28751, 25194, 10155, 10777, 13483, 11355, 10171, 10135, 61285, 10571, 20124, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yme", "##al", "yellow", "was", "$", "276", "-", "277", "and", "soy", "##mea", "##l", "black", "was", "$", "246", "-", "248", "per", "ton", "##ne", "in", "export", "." ], "ids": [ 12882, 55460, 10415, 29815, 10134, 109, 28852, 118, 28884, 10111, 103559, 41947, 10161, 15045, 10134, 109, 26439, 118, 24889, 10178, 22464, 10238, 10106, 59220, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rap", "##ese", "##ed", "extraction", "was", "$", "115", "per", "ton", "##ne", "in", "export", "." ], "ids": [ 47957, 13565, 10336, 81681, 10134, 109, 15680, 10178, 22464, 10238, 10106, 59220, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Export", "demand", "was", "good", "but", "availability", "was", "limited", "." ], "ids": [ 108268, 34394, 10134, 15198, 10473, 106067, 10134, 19264, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rap", "##ese", "##ed", "extraction", "was", "3", ",", "850", "ru", "##pe", "##es", "FOR", "Bed", "##ibu", "##nder", "and", "was", "3", ",", "800", "-", "3", ",", "825", "ru", "##pe", "##es", "FOR", "B", "##havn", "##aga", "##r", "." ], "ids": [ 47957, 13565, 10336, 81681, 10134, 124, 117, 24934, 13483, 11355, 10171, 109544, 76757, 91610, 16497, 10111, 10134, 124, 117, 11900, 118, 124, 117, 62553, 13483, 11355, 10171, 109544, 139, 63740, 19357, 10129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Price", "##s", "in", "ru", "##pe", "##es", "per", "ton", "##ne", ")" ], "ids": [ 113, 23002, 10107, 10106, 13483, 11355, 10171, 10178, 22464, 10238, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Market", "Ar", "##riva", "##ls", "Au", "##ction", "Trade", "##rs", "Plant" ], "ids": [ 28409, 18484, 37838, 11747, 13209, 17530, 15006, 10943, 15112 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "tonnes", ")" ], "ids": [ 113, 10106, 39435, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "De", "##was", "45", "Yellow", "12", ",", "700", "-", "12", ",", "950", "12", ",", "900", "-", "13", ",", "150", "12", ",", "900", "-", "13", ",", "100" ], "ids": [ 10190, 64785, 10827, 30129, 10186, 117, 12367, 118, 10186, 117, 29997, 10186, 117, 13545, 118, 10249, 117, 11766, 10186, 117, 13545, 118, 10249, 117, 10407 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Black", "11", ",", "900", "-", "12", ",", "100" ], "ids": [ 11750, 10193, 117, 13545, 118, 10186, 117, 10407 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Man", "##ds", "##aur", "10", "Yellow", "12", ",", "600", "-", "12", ",", "750", "12", ",", "700", "-", "12", ",", "850" ], "ids": [ 11343, 13268, 103058, 10150, 30129, 10186, 117, 11796, 118, 10186, 117, 17052, 10186, 117, 12367, 118, 10186, 117, 24934 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ne", "##emu", "##ch", "n", ".", "a", "Yellow", "-", "-" ], "ids": [ 19416, 39674, 10269, 182, 119, 169, 30129, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M", "##how", "2", "Yellow", "12", ",", "700", "-", "12", ",", "800", "12", ",", "750", "-", "12", ",", "850" ], "ids": [ 150, 52743, 123, 30129, 10186, 117, 12367, 118, 10186, 117, 11900, 10186, 117, 17052, 118, 10186, 117, 24934 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rat", "##lam", "10", "Yellow", "12", ",", "600", "-", "12", ",", "750", "12", ",", "700", "-", "12", ",", "800" ], "ids": [ 29839, 21114, 10150, 30129, 10186, 117, 11796, 118, 10186, 117, 17052, 10186, 117, 12367, 118, 10186, 117, 11900 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ash", "##ta", "10", "Yellow", "12", ",", "700", "-", "12", ",", "900", "12", ",", "800", "-", "13", ",", "000" ], "ids": [ 45707, 10213, 10150, 30129, 10186, 117, 12367, 118, 10186, 117, 13545, 10186, 117, 11900, 118, 10249, 117, 10259 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indo", "##re", "25", "Yellow", "12", ",", "750", "-", "12", ",", "950", "12", ",", "900", "-", "13", ",", "100" ], "ids": [ 31499, 10246, 10258, 30129, 10186, 117, 17052, 118, 10186, 117, 29997, 10186, 117, 13545, 118, 10249, 117, 10407 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "D", "##har", "5", "Yellow", "12", ",", "700", "-", "12", ",", "800", "12", ",", "750", "-", "12", ",", "900" ], "ids": [ 141, 18387, 126, 30129, 10186, 117, 12367, 118, 10186, 117, 11900, 10186, 117, 17052, 118, 10186, 117, 13545 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", "##j", "##jai", "##n", "8", "Yellow", "12", ",", "750", "-", "12", ",", "900", "12", ",", "850", "-", "13", ",", "050" ], "ids": [ 158, 10418, 26685, 10115, 129, 30129, 10186, 117, 17052, 118, 10186, 117, 13545, 10186, 117, 24934, 118, 10249, 117, 60801 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ja", "##ora", "n", ".", "a", "Yellow", "-", "-" ], "ids": [ 28248, 14945, 182, 119, 169, 30129, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barn", "##aga", "##r", "n", ".", "a", "Yellow", "-", "-" ], "ids": [ 61802, 19357, 10129, 182, 119, 169, 30129, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Khan", "##dw", "##a", "n", ".", "a", "Yellow", "-", "-" ], "ids": [ 16324, 96407, 10113, 182, 119, 169, 30129, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ash", "##ok", "##na", "##gar", "n", ".", "a", "Yellow", "-", "-" ], "ids": [ 45707, 11140, 10219, 14415, 182, 119, 169, 30129, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Na", "##lk", "##hera", "n", ".", "a", "Yellow", "-", "-" ], "ids": [ 10685, 24323, 73995, 182, 119, 169, 30129, 118, 118 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yo", "##il", "(", "in", "ru", "##pe", "##es", "per", "ton", "##ne", ")" ], "ids": [ 12882, 15594, 11030, 113, 10106, 13483, 11355, 10171, 10178, 22464, 10238, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yo", "##il", "solve", "##nt", "plant", "delivery", "30", ",", "300", "-", "30", ",", "400" ], "ids": [ 12882, 15594, 11030, 100679, 10368, 16430, 55626, 10244, 117, 11093, 118, 10244, 117, 11176 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yo", "##il", "solve", "##nt", "market", "delivery", "30", ",", "700", "-", "30", ",", "800" ], "ids": [ 12882, 15594, 11030, 100679, 10368, 17313, 55626, 10244, 117, 12367, 118, 10244, 117, 11900 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yo", "##il", "ref", "##ined", "plant", "delivery", "32", ",", "700", "-", "32", ",", "800" ], "ids": [ 12882, 15594, 11030, 48056, 28751, 16430, 55626, 10842, 117, 12367, 118, 10842, 117, 11900 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yo", "##il", "ref", "##ined", "market", "delivery", "32", ",", "900", "-", "33", ",", "000" ], "ids": [ 12882, 15594, 11030, 48056, 28751, 17313, 55626, 10842, 117, 13545, 118, 11000, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##yme", "##al", "(", "in", "ru", "##pe", "##es", "per", "ton", "##ne", ",", "free", "on", "rail", "-", "FOR", ")" ], "ids": [ 12882, 55460, 10415, 113, 10106, 13483, 11355, 10171, 10178, 22464, 10238, 117, 13961, 10135, 29547, 118, 109544, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yellow", "Black" ], "ids": [ 30129, 11750 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "FOR", "Bombay", "9", ",", "800", "8", ",", "800" ], "ids": [ 109544, 39961, 130, 117, 11900, 129, 117, 11900 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FOR", "Bed", "##i", "Bund", "##er", "9", ",", "800", "8", ",", "800" ], "ids": [ 109544, 76757, 10116, 46752, 10165, 130, 117, 11900, 129, 117, 11900 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "$", "1", "=", "35", ".", "73", "ru", "##pe", "##es", ")" ], "ids": [ 113, 109, 122, 134, 10803, 119, 12545, 13483, 11355, 10171, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bangladesh", "Speaker", "says", "he", "received", "death", "threats", "." ], "ids": [ 24080, 64844, 22153, 10261, 12296, 12557, 85186, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DH", "##A", "##KA", "1996", "-", "08", "-", "27" ], "ids": [ 83164, 10738, 67813, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Speaker", "of", "Bangladesh", "'", "s", "parliament", ",", "Hum", "##ay", "##un", "Ras", "##hee", "##d", "Cho", "##ud", "##hur", "##y", ",", "said", "he", "had", "received", "death", "threats", "from", "ano", "##nymous", "calle", "##rs", "after", "opposition", "parties", "threatened", "to", "boy", "##cott", "proceedings", "chair", "##ed", "by", "him", "." ], "ids": [ 10117, 64844, 10108, 24080, 112, 187, 40519, 117, 91636, 13998, 11107, 57908, 110151, 10162, 50690, 11679, 27077, 10157, 117, 12415, 10261, 10374, 12296, 12557, 85186, 10188, 12797, 66615, 27823, 10943, 10662, 21227, 18708, 44593, 10114, 26905, 48426, 93399, 40006, 10336, 10155, 10957, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "told", "the", "Bengali", "newspaper", "Bang", "##lab", "##aza", "##r", "Pat", "##rika", "on", "Tuesday", "that", "such", "threats", "were", "possibly", "coming", "from", "\"", "those", "who", "want", "to", "push", "the", "country", "into", "chaos", "and", "un", "##rest", ".", "\"" ], "ids": [ 10357, 21937, 10105, 68427, 22047, 24453, 41284, 29797, 10129, 24714, 46123, 10135, 70245, 10189, 11049, 85186, 10309, 33370, 23959, 10188, 107, 12676, 10479, 21528, 10114, 68052, 10105, 12723, 10708, 92108, 10111, 10119, 34189, 119, 107 ], "entity": [ "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "calle", "##rs", "said", "his", "life", "could", "be", "cut", "short", ",", "the", "newspaper", "said", "." ], "ids": [ 10117, 27823, 10943, 12415, 10226, 12103, 12174, 10347, 21610, 13716, 117, 10105, 22047, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "speaker", "was", "not", "immediately", "available", "for", "comment", "." ], "ids": [ 10117, 57738, 10134, 10472, 24029, 14579, 10142, 49641, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##ud", "##hur", "##y", ",", "a", "former", "foreign", "minister", "and", "veteran", "diplomat", ",", "was", "appointed", "speaker", "of", "the", "330", "-", "member", "parliament", "on", "July", "13", ",", "a", "month", "after", "general", "elections", "returned", "the", "A", "##wami", "League", "of", "Prime", "Minister", "Sheikh", "Has", "##ina", "to", "power", "after", "21", "years", "." ], "ids": [ 50690, 11679, 27077, 10157, 117, 169, 11775, 20796, 16930, 10111, 55669, 45652, 117, 10134, 14896, 57738, 10108, 10105, 20564, 118, 12008, 40519, 10135, 11112, 10249, 117, 169, 14064, 10662, 11389, 22054, 14030, 10105, 138, 105097, 11074, 10108, 19924, 14355, 58837, 45896, 11067, 10114, 13183, 10662, 10296, 10855, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##ud", "##hur", "##y", "also", "was", "president", "of", "the", "41", "##st", "session", "of", "the", "U", ".", "N", ".", "General", "Assembly", "in", "1986", "-", "87", "." ], "ids": [ 50690, 11679, 27077, 10157, 10379, 10134, 12931, 10108, 10105, 11349, 10562, 30066, 10108, 10105, 158, 119, 151, 119, 11220, 17918, 10106, 10578, 118, 12581, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "prime", "minister", "Be", "##gum", "K", "##hale", "##da", "Zi", "##a", ",", "now", "the", "opposition", "leader", "in", "parliament", "and", "head", "of", "the", "Bangladesh", "National", "##ist", "Party", "(", "B", "##NP", ")", ",", "said", "her", "followers", "might", "boy", "##cott", "ass", "##em", "##by", "sessions", "chair", "##ed", "by", "the", "\"", "partisan", "\"", "speaker", "." ], "ids": [ 42355, 19287, 16930, 14321, 55792, 148, 39149, 10229, 99890, 10113, 117, 11858, 10105, 21227, 15014, 10106, 40519, 10111, 13578, 10108, 10105, 24080, 10655, 11293, 12529, 113, 139, 59654, 114, 117, 12415, 10485, 76342, 20970, 26905, 48426, 13935, 10451, 11530, 45320, 40006, 10336, 10155, 10105, 107, 105050, 107, 57738, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "ruling", "A", "##wami", "league", "is", "making", "parliament", "in", "##ef", "##fect", "##ive", "and", "the", "speaker", "is", "contributing", "to", "that", "by", "not", "allowing", "the", "opposition", "MP", "##s", "enough", "time", "to", "speak", ",", "\"", "she", "told", "a", "rally", "in", "northern", "district", "of", "Bog", "##ra", "on", "Monday", "." ], "ids": [ 107, 10117, 50788, 138, 105097, 15616, 10124, 14293, 40519, 10106, 16822, 84732, 11942, 10111, 10105, 57738, 10124, 62051, 10114, 10189, 10155, 10472, 28357, 10105, 21227, 27211, 10107, 21408, 10635, 10114, 41541, 117, 107, 10833, 21937, 169, 58575, 10106, 17335, 12107, 10108, 97033, 10288, 10135, 40714, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Has", "##ina", ",", "speaking", "to", "a", "group", "of", "engineers", "in", "Dhaka", "on", "Monday", ",", "accused", "the", "B", "##NP", "of", "resort", "##ing", "to", "\"", "terrorism", "\"", "as", "part", "of", "its", "plan", "to", "create", "ins", "##tab", "##ility", "and", "chaos", "in", "the", "country", "." ], "ids": [ 45896, 11067, 117, 33740, 10114, 169, 11795, 10108, 75222, 10106, 75710, 10135, 40714, 117, 37303, 10105, 139, 59654, 10108, 60637, 10230, 10114, 107, 96969, 107, 10146, 10668, 10108, 10474, 13065, 10114, 18842, 15498, 33051, 44704, 10111, 92108, 10106, 10105, 12723, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "is", "not", "desire", "##able", ".", ".", "." ], "ids": [ 107, 10747, 10124, 10472, 52253, 13096, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "and", "we", "will", "deal", "with", "such", "designs", "ster", "##nl", "##y", ",", "\"", "the", "prime", "minister", "said", "." ], "ids": [ 10111, 11951, 11337, 19918, 10169, 11049, 37032, 78342, 108854, 10157, 117, 107, 10105, 19287, 16930, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bangladesh", "June", "M2", "up", "3", ".", "8", "p", "##ct", "m", "/", "m", ",", "up", "8", ".", "2", "p", "##ct", "y", "/", "y", "." ], "ids": [ 24080, 11120, 68985, 10741, 124, 119, 129, 184, 14526, 181, 120, 181, 117, 10741, 129, 119, 123, 184, 14526, 193, 120, 193, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DH", "##A", "##KA", "1996", "-", "08", "-", "27" ], "ids": [ 83164, 10738, 67813, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bangladesh", "'", "s", "M2", "money", "supply", "rose", "3", ".", "8", "percent", "in", "June", "to", "456", ".", "8", "billion", "taka", "after", "a", "0", ".", "27", "percent", "rise", "to", "439", ".", "9", "billion", "in", "May", ",", "central", "bank", "officials", "said", "." ], "ids": [ 24080, 112, 187, 68985, 17920, 28914, 29467, 124, 119, 129, 22362, 10106, 11120, 10114, 36380, 119, 129, 25848, 81739, 10662, 169, 121, 119, 10365, 22362, 28710, 10114, 43400, 119, 130, 25848, 10106, 10725, 117, 12397, 19423, 27730, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "year", "-", "on", "-", "year", "rise", "was", "8", ".", "2", "percent", "to", "June", ",", "1996", "." ], "ids": [ 10117, 10924, 118, 10135, 118, 10924, 28710, 10134, 129, 119, 123, 22362, 10114, 11120, 117, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##NG", "##LA", "##DE", "##SH", "'", "S", "MO", "##NE", "##Y", "SU", "##P", "##P", "##L", "##Y" ], "ids": [ 39999, 34065, 44376, 60675, 64091, 112, 156, 102059, 93280, 14703, 86643, 11127, 11127, 11369, 14703 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##UN", "##E", "MA", "##Y", "J", "##UN", "##E", "1995" ], "ids": [ 147, 69849, 11259, 27277, 14703, 147, 69849, 11259, 10436 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M2", "money", "supply", "(", "bl", "##n", "taka", ")", "456", ".", "8", "439", ".", "9", "422", ".", "1" ], "ids": [ 68985, 17920, 28914, 113, 21484, 10115, 81739, 114, 36380, 119, 129, 43400, 119, 130, 38735, 119, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M1", "money", "supply", "(", "bl", "##n", "taka", ")", "144", ".", "5", "139", ".", "3", "131", ".", "7" ], "ids": [ 54051, 17920, 28914, 113, 21484, 10115, 81739, 114, 18393, 119, 126, 19615, 119, 124, 18372, 119, 128 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##EL", "##IB", "##OR", "IN", "##TER", "##ES", "##T", "RA", "##TE", "##S", "LA", "##R", "##GE", "##L", "##Y", "UN", "##CH", "##AN", "##GE", "##D", "." ], "ids": [ 145, 68999, 72918, 42622, 36351, 99552, 25054, 11090, 64007, 29833, 10731, 29079, 11273, 58719, 11369, 14703, 26578, 86448, 41275, 58719, 11490, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##EL", "##SI", "##NK", "##I", "1996", "-", "08", "-", "27" ], "ids": [ 145, 68999, 44802, 78043, 11281, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "##lib", "##or", "market", "interest", "rates" ], "ids": [ 10357, 36125, 10667, 17313, 17644, 38200 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "were", "largely", "un", "##chang", "##ed", "at", "the", "Bank", "of", "Finland", "'", "s", "daily", "fi", "##xin", "##g", "on" ], "ids": [ 10309, 25340, 10119, 64208, 10336, 10160, 10105, 13533, 10108, 15497, 112, 187, 27636, 14045, 76750, 10240, 10135 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tuesday", "." ], "ids": [ 70245, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "The", "key", "three", "-", "month", "rate", "was", "st", "##eady", "at", "3", ".", "40", "percent", "." ], "ids": [ 10117, 18444, 11003, 118, 14064, 18344, 10134, 28780, 61973, 10160, 124, 119, 10533, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "August", "27", "fi", "##x", "August", "26", "fi", "##x" ], "ids": [ 10735, 10365, 14045, 10686, 10735, 10314, 14045, 10686 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "m", "##th", "He", "##lib", "##or", "3", ".", "27", "p", "##ct", "3", ".", "29", "p", "##ct" ], "ids": [ 122, 118, 181, 11143, 10357, 36125, 10667, 124, 119, 10365, 184, 14526, 124, 119, 10386, 184, 14526 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "m", "##th", "He", "##lib", "##or", "3", ".", "34", "p", "##ct", "3", ".", "34", "p", "##ct" ], "ids": [ 123, 118, 181, 11143, 10357, 36125, 10667, 124, 119, 11069, 184, 14526, 124, 119, 11069, 184, 14526 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "m", "##th", "He", "##lib", "##or", "3", ".", "40", "p", "##ct", "3", ".", "40", "p", "##ct" ], "ids": [ 124, 118, 181, 11143, 10357, 36125, 10667, 124, 119, 10533, 184, 14526, 124, 119, 10533, 184, 14526 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "m", "##th", "He", "##lib", "##or", "3", ".", "56", "p", "##ct", "3", ".", "55", "p", "##ct" ], "ids": [ 127, 118, 181, 11143, 10357, 36125, 10667, 124, 119, 11628, 184, 14526, 124, 119, 11358, 184, 14526 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", "-", "m", "##th", "He", "##lib", "##or", "3", ".", "73", "p", "##ct", "3", ".", "70", "p", "##ct" ], "ids": [ 130, 118, 181, 11143, 10357, 36125, 10667, 124, 119, 12545, 184, 14526, 124, 119, 10923, 184, 14526 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "12", "-", "m", "##th", "He", "##lib", "##or", "3", ".", "89", "p", "##ct", "3", ".", "87", "p", "##ct" ], "ids": [ 10186, 118, 181, 11143, 10357, 36125, 10667, 124, 119, 12642, 184, 14526, 124, 119, 12581, 184, 14526 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Helsinki", "news", "##room", "+", "358", "-", "0", "-", "680", "50", "248" ], "ids": [ 118, 118, 18179, 14424, 25525, 116, 37702, 118, 121, 118, 35922, 10462, 24889 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barr", "##ick", "gets", "93", "p", "##ct", "of", "Are", "##qui", "##pa", "." ], "ids": [ 79283, 20898, 30811, 12479, 184, 14526, 10108, 13491, 39639, 11359, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barr", "##ick", "Gold", "Corp", "said", "on", "Tuesday", "its", "take", "##over", "offer", "for", "Are", "##qui", "##pa", "Resources", "Ltd", "was", "successful", ",", "with", "93", "percent", "of", "the", "36", ".", "3", "million", "shares", "not", "already", "owned", "tender", "##ed", "under", "the", "bid", ",", "which", "ex", "##pired", "over", "##night", "." ], "ids": [ 79283, 20898, 14363, 44687, 12415, 10135, 70245, 10474, 13574, 16666, 24443, 10142, 13491, 39639, 11359, 33513, 15129, 10134, 17330, 117, 10169, 12479, 22362, 10108, 10105, 11055, 119, 124, 12473, 45751, 10472, 19034, 17012, 96486, 10336, 10571, 10105, 50385, 117, 10319, 11419, 110603, 10491, 45217, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "are", "pl", "##eas", "##ed", "that", "Are", "##qui", "##pa", "share", "##holders", "ah", "##ave", "chosen", "so", "over", "##w", "##hel", "##ming", "##ly", "to", "accept", "this", "offer", "." ], "ids": [ 107, 12865, 10301, 20648, 42658, 10336, 10189, 13491, 39639, 11359, 23867, 75111, 69863, 23641, 27997, 10380, 10491, 10874, 31572, 16405, 10454, 10114, 45218, 10531, 24443, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "now", "have", "the", "opportunity", "to", "real", "##ize", "the", "potential", "of", "Are", "##qui", "##pa", "'", "s", "excellent", "assets", ",", "\"", "Barr", "##ick", "chairman", "and", "chief", "executive", "Peter", "Mu", "##nk", "said", "in", "a", "statement", "." ], "ids": [ 12865, 11858, 10529, 10105, 34468, 10114, 13486, 19181, 10105, 23078, 10108, 13491, 39639, 11359, 112, 187, 50337, 51701, 117, 107, 79283, 20898, 27627, 10111, 19421, 22676, 10979, 49056, 17761, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "C", "$", "30", "-", "a", "-", "share", "deal", "means", "Barr", "##ick", "will", "own", "Are", "##qui", "##pa", "'", "s", "attractive", "Pier", "##ina", "gold", "de", "##posit", "in", "Peru", "." ], "ids": [ 10117, 140, 109, 10244, 118, 169, 118, 23867, 19918, 17574, 79283, 20898, 11337, 12542, 13491, 39639, 11359, 112, 187, 102512, 41941, 11067, 18128, 10104, 106185, 10106, 18158, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 3, 7, 7, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Barr", "##ick", "said", "details", "involving", "the", "allo", "##cation", "between", "Barr", "##ick", "shares", "and", "cash", "will", "be", "available", "shortly", "." ], "ids": [ 79283, 20898, 12415, 29500, 40368, 10105, 20779, 26287, 10948, 79283, 20898, 45751, 10111, 52828, 11337, 10347, 14579, 31555, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barr", "##ick", "'", "s", "offer", "of", "C", "$", "30", "a", "share", "or", "part", "cash", ",", "part", "share", "offer", "was", "Barr", "##ick", "'", "s", "second", "attempt", "to", "s", "##wall", "##ow", "the", "small", "Vancouver", "-", "based", "gold", "pro", "##spect", "##or", "." ], "ids": [ 79283, 20898, 112, 187, 24443, 10108, 140, 109, 10244, 169, 23867, 10345, 10668, 52828, 117, 10668, 23867, 24443, 10134, 79283, 20898, 112, 187, 11132, 21395, 10114, 187, 33743, 16602, 10105, 12474, 21541, 118, 11610, 18128, 11284, 77229, 10667, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Toronto", "-", "based", "Barr", "##ick", ",", "the", "world", "'", "s", "third", "largest", "gold", "producer", ",", "sweet", "##ened", "its", "July", "11", "bid", "to", "C", "$", "30", "a", "share", "from", "C", "$", "27", "on", "August", "16", "after", "a", "fresh", "bat", "##ch", "of", "dr", "##ill", "results", "from", "the", "Pier", "##ina", "de", "##posit", "." ], "ids": [ 15256, 118, 11610, 79283, 20898, 117, 10105, 11356, 112, 187, 12628, 15363, 18128, 16607, 117, 72711, 27867, 10474, 11112, 10193, 50385, 10114, 140, 109, 10244, 169, 23867, 10188, 140, 109, 10365, 10135, 10735, 10250, 10662, 169, 54181, 11519, 10269, 10108, 17094, 19503, 17466, 10188, 10105, 41941, 11067, 10104, 106185, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Ex", "##pert", "##s", "have", "sp", "##ecu", "##lated", "the", "de", "##posit", "has", "potential", "reserves", "of", "up", "to", "12", "million", "ou", "##nces", "." ], "ids": [ 27746, 52368, 10107, 10529, 32650, 97038, 50476, 10105, 10104, 106185, 10393, 23078, 60405, 10108, 10741, 10114, 10186, 12473, 10431, 28524, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "dr", "##illing", "results", "are", "expected", "soon", "." ], "ids": [ 15946, 17094, 75579, 17466, 10301, 25973, 17864, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Barr", "##ick", "bid", "took", "observer", "##s", "by", "surprise", ",", "since", "Are", "##qui", "##pa", "'", "s", "exploration", "was", "still", "in", "its", "early", "stages", "." ], "ids": [ 10117, 79283, 20898, 50385, 12149, 79368, 10107, 10155, 48886, 117, 11764, 13491, 39639, 11359, 112, 187, 61326, 10134, 12647, 10106, 10474, 11732, 35023, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Are", "##qui", "##pa", "share", "##holders", "had", "the", "option", "to", "choose", "C", "$", "30", "cash", "or", "0", ".", "79", "Barr", "##ick", "shares", "plus", "50", "cents", "for", "each", "Are", "##qui", "##pa", "share", "." ], "ids": [ 13491, 39639, 11359, 23867, 75111, 10374, 10105, 32562, 10114, 48089, 140, 109, 10244, 52828, 10345, 121, 119, 12791, 79283, 20898, 45751, 10563, 10462, 63487, 10142, 11948, 13491, 39639, 11359, 23867, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Sha", "##res", "were", "to", "be", "pro", "-", "rated", "if", "more", "than", "14", ".", "4", "million", "were", "requested", "." ], "ids": [ 106583, 11234, 10309, 10114, 10347, 11284, 118, 48069, 12277, 10798, 11084, 10247, 119, 125, 12473, 10309, 59728, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Reuters", "Toronto", "Bureau", "416", "941", "-", "810", "##0" ], "ids": [ 118, 118, 46617, 15256, 12344, 33833, 82944, 118, 49357, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Penn", "Treaty", "termina", "##tes", "acquisition", "pa", "##ct", "." ], "ids": [ 33784, 38031, 34947, 11197, 41714, 10931, 14526, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AL", "##LE", "##NT", "##OW", "##N", ",", "Pa", "." ], "ids": [ 47271, 51036, 77261, 33893, 11537, 117, 26907, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "27" ], "ids": [ 10389, 118, 11052, 118, 10365 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Penn", "Treaty", "American", "Corp", "said", "Tuesday", "it", "termina", "##ted", "a", "previously", "announced", "non", "-", "binding", "letter", "of", "intent", "to", "purchase", "Merr", "##ion", "Insurance", "Company", "Inc", ",", "a", "New", "York", "licensed", "company", "." ], "ids": [ 33784, 38031, 10536, 44687, 12415, 70245, 10271, 34947, 11912, 169, 17477, 13854, 10446, 118, 42249, 19310, 10108, 58692, 10114, 37891, 105713, 11046, 61490, 11739, 13604, 117, 169, 10287, 10482, 54044, 12100, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "In", "anno", "##un", "##cing", "its", "decision", ",", "Penn", "Treaty", "said", "it", "\"", "will", "continue", "to", "actively", "pursue", "entering", "into", "the", "New", "York", "long", "-", "term", "care", "market", "through", "li", "##cens", "##ing", "or", "by", "acquisition", ".", "\"" ], "ids": [ 10167, 11671, 11107, 19113, 10474, 19231, 117, 33784, 38031, 12415, 10271, 107, 11337, 17734, 10114, 72597, 57016, 44824, 10708, 10105, 10287, 10482, 11695, 118, 13719, 11131, 17313, 11222, 11614, 28192, 10230, 10345, 10155, 41714, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "explained", "the", "\"", "addition", "of", "a", "New", "York", "license", "will", "enable", "Penn", "Treaty", "American", "Corp", "to", "conduct", "business", "in", "all", "50", "states", ",", "following", "the", "company", "'", "s", "acquisition", "of", "Health", "Insurance", "of", "Vermont", ",", "a", "Vermont", "domicile", "##d", "ins", "##urer", ",", "scheduled", "to", "close", "on", "August", "30", ",", "1996", ".", "\"" ], "ids": [ 10377, 44191, 10105, 107, 14763, 10108, 169, 10287, 10482, 47679, 11337, 79326, 33784, 38031, 10536, 44687, 10114, 45541, 14155, 10106, 10435, 10462, 16316, 117, 11901, 10105, 12100, 112, 187, 41714, 10108, 15931, 61490, 10108, 34919, 117, 169, 34919, 65439, 10162, 15498, 100613, 117, 34081, 10114, 16065, 10135, 10735, 10244, 117, 10389, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "New", "York", "News", "##des", "##k", "212", "-", "859", "-", "1610", "." ], "ids": [ 118, 118, 10287, 10482, 12219, 10920, 10174, 22023, 118, 80786, 118, 35360, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "V", "##N", "##U", "details", "first", "-", "half", "operating", "profits", "." ], "ids": [ 159, 11537, 12022, 29500, 10422, 118, 13877, 24210, 100106, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##AA", "##R", "##LE", "##M", ",", "Netherlands", "1996", "-", "08", "-", "27" ], "ids": [ 145, 62281, 11273, 51036, 11517, 117, 22043, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Publisher", "V", "##N", "##U", "gave", "the", "following", "break", "##down", "of", "its", "first", "-", "half", "results", ":" ], "ids": [ 101773, 159, 11537, 12022, 15362, 10105, 11901, 24194, 27160, 10108, 10474, 10422, 118, 13877, 17466, 131 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##1", "1996", "H", "##1", "1995" ], "ids": [ 145, 10759, 10389, 145, 10759, 10436 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sales", "Op", "profit", "Sales", "Op", "profit" ], "ids": [ 48514, 12160, 25081, 48514, 12160, 25081 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Consumer", "magazines", "618", "90", "568", "80" ], "ids": [ 82375, 48320, 45806, 10919, 54879, 10832 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "News", "##paper", "##s", "363", "49", "295", "46" ], "ids": [ 12219, 95596, 10107, 35611, 11580, 26089, 11528 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Commercial", "TV", "127", "6", "loss", "174", "33", "profit" ], "ids": [ 51204, 10813, 17592, 127, 18576, 22767, 11000, 25081 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Business", "info", "Europe", "231", "24", "178", "18" ], "ids": [ 15281, 26978, 11767, 25034, 10233, 22475, 10218 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Business", "info", "USA", "382", "61", "362", "41" ], "ids": [ 15281, 26978, 11061, 37309, 12314, 37257, 11349 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Education", "42", "6", "36", "3" ], "ids": [ 15063, 11276, 127, 11055, 124 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Miscellaneous", "charges", "-", "-", "-", "16", "-", "-", "-", "30" ], "ids": [ 63724, 31128, 118, 118, 118, 10250, 118, 118, 118, 10244 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "##S", "-", "Sales", "and", "operating", "profit", "are", "given", "in", "millions", "of", "gu", "##ild", "##ers", "." ], "ids": [ 49307, 29833, 10731, 118, 48514, 10111, 24210, 25081, 10301, 13507, 10106, 18123, 10108, 75980, 65820, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Commercial", "TV", "includes", "pro", "rata", "share", "of", "sales", "and", "operating", "profits", "in", "Dutch", "group", "HM", "##G", "and", "Belgium", "'", "s", "VT", "##M", "." ], "ids": [ 51204, 10813, 15433, 11284, 17672, 23867, 10108, 23857, 10111, 24210, 100106, 10106, 17693, 11795, 109234, 11447, 10111, 26519, 112, 187, 108339, 11517, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 3, 7, 9, 1, 9, 9, 3, 7, 9 ] }, { "tokens": [ "-", "-", "Amsterdam", "news", "##room", "+", "31", "20", "504", "5000", ",", "Fax", "+", "31", "20", "504", "504", "##0" ], "ids": [ 118, 118, 14017, 14424, 25525, 116, 10413, 10197, 43098, 17436, 117, 64530, 116, 10413, 10197, 43098, 43098, 10929 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AOL", "Europe", "forms", "online", "advertising", "agency", "." ], "ids": [ 107746, 11767, 19639, 13893, 49828, 34649, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##AN", "##O", "##VE", "##R", ",", "Germany", "1996", "-", "08", "-", "27" ], "ids": [ 145, 41275, 11403, 68560, 11273, 117, 12775, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "joint", "venture", "between", "America", "Online", "(", "AOL", ")", "and", "Bert", "##els", "##mann", "AG", "has", "formed", "a", "new", "company", "to", "sell", "advertising", "space", "on", "AOL", "in", "Europe", ",", "a", "Bert", "##els", "##mann", "official", "said", "on", "Tuesday", "." ], "ids": [ 10117, 25680, 48709, 10948, 11440, 14056, 113, 107746, 114, 10111, 42478, 18338, 12350, 17935, 10393, 14629, 169, 10751, 12100, 10114, 36300, 49828, 16199, 10135, 107746, 10106, 11767, 117, 169, 42478, 18338, 12350, 14731, 12415, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 3, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 1, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "new", "company", "is", "called", "Ad", "##O", "##n", "GmbH", "and", "is", "located", "in", "Hamburg", ",", "Bernd", "Sc", "##hip", "##horst", ",", "president", "and", "chief", "operating", "officer", "of", "Bert", "##els", "##mann", "'", "s", "New", "Media", "business", "division", "said", "on", "the", "side", "##lines", "of", "an", "AOL", "news", "conference", "at", "the", "Ce", "##B", "##IT", "Home", "consumer", "electronics", "fair", "in", "Hanover", "." ], "ids": [ 10117, 10751, 12100, 10124, 11552, 25474, 11403, 10115, 19596, 10111, 10124, 11954, 10106, 15021, 117, 49554, 55260, 17883, 84549, 117, 12931, 10111, 19421, 24210, 19288, 10108, 42478, 18338, 12350, 112, 187, 10287, 13341, 14155, 13751, 12415, 10135, 10105, 12250, 31782, 10108, 10151, 107746, 14424, 25029, 10160, 10105, 13338, 11274, 37611, 13898, 64580, 97007, 45122, 10106, 78632, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jan", "Bu", "##ett", "##ner", ",", "managing", "director", "of", "AOL", "Germany", ",", "said", "Ad", "##O", "##n", "was", "in", "the", "formation", "phase", "and", "would", "\"", "get", "off", "the", "ground", "next", "year", ",", "bringing", "in", "advertising", "from", "around", "Europe", ".", "\"" ], "ids": [ 11806, 11916, 13985, 11129, 117, 61274, 12461, 10108, 107746, 12775, 117, 12415, 25474, 11403, 10115, 10134, 10106, 10105, 16345, 20394, 10111, 10894, 107, 15329, 11898, 10105, 16912, 13451, 10924, 117, 45749, 10106, 49828, 10188, 12166, 11767, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 3, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "He", "would", "give", "no", "for", "##eca", "##sts", "on", "advertising", "revenue", "." ], "ids": [ 10357, 10894, 18090, 10192, 10142, 33588, 28036, 10135, 49828, 51557, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AOL", "is", "the", "leading", "global", "commercial", "online", "service", "with", "some", "six", "million", "sub", "##sc", "##rib", "##ers", "worldwide", "." ], "ids": [ 107746, 10124, 10105, 16018, 18331, 17331, 13893, 11989, 10169, 11152, 12449, 12473, 13987, 31505, 47116, 10901, 31197, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "has", "around", "200", ",", "000", "sub", "##sc", "##rib", "##ers", "in", "Europe", ",", "with", "two", "third", "##s", "of", "that", "number", "in", "Germany", "alone", "." ], "ids": [ 10377, 10393, 12166, 10777, 117, 10259, 13987, 31505, 47116, 10901, 10106, 11767, 117, 10169, 10551, 12628, 10107, 10108, 10189, 11487, 10106, 12775, 24087, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "In", "Europe", ",", "the", "service", "is", "available", "in", "Germany", ",", "France", "and", "Britain", "." ], "ids": [ 10167, 11767, 117, 10105, 11989, 10124, 14579, 10106, 12775, 117, 10688, 10111, 16032, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 9 ] }, { "tokens": [ "It", "will", "be", "available", "in", "Austria", "and", "Switzerland", "later", "this", "year", "and", "in", "Sc", "##anda", "##na", "##via", "and", "the", "Ben", "##elu", "##x", "countries", "next", "year", "." ], "ids": [ 10377, 11337, 10347, 14579, 10106, 14479, 10111, 26002, 10873, 10531, 10924, 10111, 10106, 55260, 41971, 10219, 13372, 10111, 10105, 13304, 43560, 10686, 15911, 13451, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "William", "Boston", ",", "Ce", "##B", "##IT", "news", "##room", ",", "017", "##2", "673", "##65", "##10" ], "ids": [ 118, 118, 10694, 13683, 117, 13338, 11274, 37611, 14424, 25525, 117, 90071, 10729, 65213, 74327, 20305 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "passengers", "free", "##d", "from", "Sudan", "##ese", "hija", "##ck", "plane", "." ], "ids": [ 11101, 37008, 13961, 10162, 10188, 28407, 13565, 26429, 11263, 35007, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##AN", "##ST", "##ED", ",", "England", "1996", "-", "08", "-", "27" ], "ids": [ 53317, 41275, 32995, 33809, 117, 11701, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "passengers", "held", "host", "##age", "aboard", "a", "hija", "##cked", "Sudan", "##ese", "Airways", "plane", "div", "##erted", "to", "London", "'", "s", "Stan", "##sted", "airport", "carrying", "199", "passengers", "and", "crew", "have", "been", "free", "##d", ",", "an", "airport", "spoke", "##s", "##woman", "said", "on", "Tuesday", "." ], "ids": [ 11101, 37008, 11991, 19317, 12276, 65331, 169, 26429, 72333, 28407, 13565, 29791, 35007, 76486, 46949, 10114, 10829, 112, 187, 26637, 36018, 28460, 39157, 23366, 37008, 10111, 24032, 10529, 10590, 13961, 10162, 117, 10151, 28460, 50005, 10107, 79999, 12415, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eye", "##wit", "##ness", "##es", "said", "six", "crew", "members", "had", "also", "been", "allowed", "to", "leave", "the", "aircraft", "." ], "ids": [ 28577, 56082, 14010, 10171, 12415, 12449, 24032, 12464, 10374, 10379, 10590, 18162, 10114, 21964, 10105, 16167, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Airport", "spoke", "##s", "##woman", "Ron", "##a", "Young", "confirmed", "that", "all", "the", "passengers", "had", "left", "the", "aircraft", "." ], "ids": [ 13962, 50005, 10107, 79999, 20368, 10113, 12478, 27347, 10189, 10435, 10105, 37008, 10374, 12153, 10105, 16167, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "a", "number", "of", "crew", "members", "had", "left", "the", "aircraft", "and", "said", "details", "would", "be", "given", "at", "a", "news", "conference", "expected", "to", "be", "held", "in", "the", "next", "few", "minutes", "by", "the", "local", "police", "chief", "." ], "ids": [ 18051, 12415, 169, 11487, 10108, 24032, 12464, 10374, 12153, 10105, 16167, 10111, 12415, 29500, 10894, 10347, 13507, 10160, 169, 14424, 25029, 25973, 10114, 10347, 11991, 10106, 10105, 13451, 13824, 15304, 10155, 10105, 11436, 15034, 19421, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "passengers", "were", "released", "in", "bat", "##ches", "during", "the", "course", "of", "the", "morning", "after", "the", "Airbus", "A3", "##10", "landed", "at", "Stan", "##sted", ",", "having", "been", "div", "##erted", "from", "Cyprus", "." ], "ids": [ 10117, 37008, 10309, 11539, 10106, 11519, 16272, 10939, 10105, 15348, 10108, 10105, 28757, 10662, 10105, 35540, 67400, 20305, 58961, 10160, 26637, 36018, 117, 13677, 10590, 76486, 46949, 10188, 45639, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "aircraft", "was", "hija", "##cked", "on", "a", "flight", "from", "K", "##hart", "##oum", "to", "Amman", "by", "six", "or", "seven", "men", ",", "who", "police", "say", "may", "be", "Iraqi", "##s", "." ], "ids": [ 10117, 16167, 10134, 26429, 72333, 10135, 169, 23578, 10188, 148, 34567, 88314, 10114, 107098, 10155, 12449, 10345, 15767, 10588, 117, 10479, 15034, 23763, 11387, 10347, 57806, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "-", "-", "London", "News", "##room", "+", "00", "-", "-", "44", "-", "171", "-", "542", "-", "794", "##7" ], "ids": [ 118, 118, 10829, 12219, 25525, 116, 11025, 118, 118, 11126, 118, 22478, 118, 51620, 118, 73970, 11305 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "Bank", "Corp", "sets", "war", "##rants", "on", "D", "##TB", "-", "Bund", "-", "Future", "." ], "ids": [ 22984, 13533, 44687, 23597, 10338, 55208, 10135, 141, 90828, 118, 46752, 118, 21508, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "Bank", "Corp", "says", "it", "has", "issued", "60", "million", "American", "-", "style", "call", "and", "put", "war", "##rants", ",", "in", "six", "equal", "tra", "##nches", ",", "on", "the", "D", "##TB", "-", "Bund", "-", "Future", "March", "1997", "." ], "ids": [ 22984, 13533, 44687, 22153, 10271, 10393, 21694, 10709, 12473, 10536, 118, 13351, 20575, 10111, 14499, 10338, 55208, 117, 10106, 12449, 32943, 11264, 101385, 117, 10135, 10105, 141, 90828, 118, 46752, 118, 21508, 11144, 10391, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "EX", "##ER", "##CI", "##SE", "PE", "##RI", "##OD", "02", ".", "SE", "##P", ".", "96", "-", "06", ".", "MA", "##R", ".", "97", "PA", "##Y", "##DA", "##TE", "30", ".", "AU", "##G", ".", "96" ], "ids": [ 80426, 24093, 89955, 39039, 80468, 46876, 77836, 10983, 119, 23056, 11127, 119, 12308, 118, 10719, 119, 27277, 11273, 119, 12328, 32349, 14703, 36382, 29833, 10244, 119, 29088, 11447, 119, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IS", "##TI", "##NG", "FF", "##T", "DD", "##F", "MI", "##N", "EX", "##ER", "L", "##OT", "100" ], "ids": [ 149, 19088, 72286, 34065, 44297, 11090, 55541, 11565, 75416, 11537, 80426, 24093, 149, 62146, 10407 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SP", "##OT", "RE", "##F", "##ER", "##EN", "##CE", "95", ".", "35", "PC", "##T" ], "ids": [ 22570, 62146, 71033, 11565, 24093, 50655, 43161, 11978, 119, 10803, 16355, 11090 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AR", "##RA", "##NT", "##S", "ST", "##RI", "##K", "##E", "ISS", "PR", "##IC", "##E", "PR", "##EM", "##I", "##UM", "GE", "##AR", "##ING" ], "ids": [ 160, 52188, 29990, 77261, 10731, 53317, 46876, 11733, 11259, 58915, 23837, 30889, 11259, 23837, 67753, 11281, 72679, 62997, 52188, 50183 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##LL", "A", "96", ".", "00", "PC", "##T", "1", ".", "16", "DEM", "1", ".", "90", "PC", "##T", "82", ".", "20", "X" ], "ids": [ 24707, 82834, 138, 12308, 119, 11025, 16355, 11090, 122, 119, 10250, 10660, 122, 119, 10919, 16355, 11090, 12180, 119, 10197, 161 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##LL", "B", "97", ".", "00", "PC", "##T", "0", ".", "75", "DEM", "2", ".", "50", "PC", "##T", "127", ".", "10", "X" ], "ids": [ 24707, 82834, 139, 12328, 119, 11025, 16355, 11090, 121, 119, 11417, 10660, 123, 119, 10462, 16355, 11090, 17592, 119, 10150, 161 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##LL", "C", "98", ".", "00", "PC", "##T", "0", ".", "47", "DEM", "3", ".", "30", "PC", "##T", "202", ".", "90", "X" ], "ids": [ 24707, 82834, 140, 12327, 119, 11025, 16355, 11090, 121, 119, 11413, 10660, 124, 119, 10244, 16355, 11090, 22171, 119, 10919, 161 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##UT", "D", "94", ".", "00", "PC", "##T", "0", ".", "94", "DEM", "2", ".", "40", "PC", "##T", "101", ".", "40", "X" ], "ids": [ 153, 65729, 141, 12749, 119, 11025, 16355, 11090, 121, 119, 12749, 10660, 123, 119, 10533, 16355, 11090, 14123, 119, 10533, 161 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##UT", "E", "95", ".", "0", "PC", "##T", "1", ".", "33", "DEM", "1", ".", "80", "PC", "##T", "71", ".", "70", "X" ], "ids": [ 153, 65729, 142, 11978, 119, 121, 16355, 11090, 122, 119, 11000, 10660, 122, 119, 10832, 16355, 11090, 12513, 119, 10923, 161 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##UT", "F", "96", ".", "0", "PC", "##T", "1", ".", "84", "DEM", "1", ".", "20", "PC", "##T", "51", ".", "80", "X" ], "ids": [ 153, 65729, 143, 12308, 119, 121, 16355, 11090, 122, 119, 11761, 10660, 122, 119, 10197, 16355, 11090, 11524, 119, 10832, 161 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Reuter", "London", "News", "##room", "+", "44", "171", "542", "765", "##8" ], "ids": [ 118, 118, 109223, 10829, 12219, 25525, 116, 11126, 22478, 51620, 65222, 11396 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DB", "##RS", "con", "##fir", "##ms", "Power", "Corp", ",", "Power", "Financial", "ratings", "." ], "ids": [ 37654, 39469, 10173, 61644, 12387, 12952, 44687, 117, 12952, 30738, 55778, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 3, 7, 9, 3, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 58573, 35066, 77261, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dominion", "Bond", "Rat", "##ing", "Service", "said", "on", "Tuesday", "it", "confirmed", "the", "ratings", "on", "Power", "Corp", "of", "Canada", "'", "s", "senior", "debt", "and", "preferred", "shares", "at", "A", "(", "high", ")", "and", "P", "##f", "##d", "-", "2", ",", "respectively", ",", "with", "stable", "trends", "." ], "ids": [ 93469, 22670, 29839, 10230, 13489, 12415, 10135, 70245, 10271, 27347, 10105, 55778, 10135, 12952, 44687, 10108, 11635, 112, 187, 17843, 55869, 10111, 60278, 45751, 10160, 138, 113, 11846, 114, 10111, 153, 10575, 10162, 118, 123, 117, 25179, 117, 10169, 38430, 109086, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DB", "##RS", "said", "it", "also", "confirmed", "Power", "Financial", "Corp", "'", "s", "senior", "deben", "##tures", ",", "cum", "##ulat", "##ive", "preferred", "shares", "and", "non", "-", "cum", "##ulat", "##ive", "first", "preferred", "shares", ",", "series", "B", ",", "at", "AA", "(", "low", ")", ",", "P", "##f", "##d", "-", "1", "and", "P", "##f", "##d", "-", "1", "(", "low", ")", ",", "all", "with", "stable", "trends", "." ], "ids": [ 37654, 39469, 12415, 10271, 10379, 27347, 12952, 30738, 44687, 112, 187, 17843, 42523, 49185, 117, 16008, 46059, 11942, 60278, 45751, 10111, 10446, 118, 16008, 46059, 11942, 10422, 60278, 45751, 117, 11366, 139, 117, 10160, 30369, 113, 15626, 114, 117, 153, 10575, 10162, 118, 122, 10111, 153, 10575, 10162, 118, 122, 113, 15626, 114, 117, 10435, 10169, 38430, 109086, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turkey", "'", "s", "Kur", "##d", "rebels", "kill", "two", ",", "take", "three", "host", "##age", "." ], "ids": [ 22519, 112, 187, 61912, 10162, 57545, 32099, 10551, 117, 13574, 11003, 19317, 12276, 119 ], "entity": [ "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##KA", "##RA", "1996", "-", "08", "-", "27" ], "ids": [ 50972, 67813, 29990, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kur", "##dish", "guerrilla", "##s", "killed", "two", "people", "and", "took", "three", "host", "##age", "after", "stop", "##ping", "two", "inter", "##city", "buses", "at", "a", "road", "##blo", "##ck", "in", "eastern", "Turkey", ",", "security", "officials", "said", "on", "Tuesday", "." ], "ids": [ 61912, 67522, 106552, 10107, 15875, 10551, 11426, 10111, 12149, 11003, 19317, 12276, 10662, 20517, 15398, 10551, 22021, 70999, 59401, 10160, 169, 15485, 71933, 11263, 10106, 18677, 22519, 117, 21849, 27730, 12415, 10135, 70245, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "told", "reporter", "##s", "a", "group", "of", "Kurdistan", "Workers", "Party", "(", "PKK", ")", "guerrilla", "##s", "stopped", "the", "buses", "at", "a", "road", "##blo", "##ck", "on", "the", "road", "linking", "the", "eastern", "provinces", "of", "Er", "##zin", "##can", "and", "Sivas", "on", "Monday", "night", "and", "forced", "the", "passengers", "to", "get", "out", "." ], "ids": [ 11696, 21937, 41408, 10107, 169, 11795, 10108, 86246, 52896, 12529, 113, 105298, 114, 106552, 10107, 40949, 10105, 59401, 10160, 169, 15485, 71933, 11263, 10135, 10105, 15485, 109784, 10105, 18677, 31209, 10108, 10915, 19325, 24154, 10111, 104362, 10135, 40714, 16903, 10111, 20054, 10105, 37008, 10114, 15329, 10950, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rebels", "killed", "one", "of", "the", "drivers", "and", "a", "passenger", "after", "check", "##ing", "the", "ide", "##nti", "##ties", "of", "the", "passengers", ",", "they", "said", "." ], "ids": [ 10117, 57545, 15875, 10464, 10108, 10105, 54598, 10111, 169, 33155, 10662, 43662, 10230, 10105, 38938, 12752, 14197, 10108, 10105, 37008, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "officials", "said", "the", "rebels", "set", "ab", "##laze", "two", "buses", "and", "released", "all", "but", "three", "passengers", "." ], "ids": [ 10117, 27730, 12415, 10105, 57545, 11847, 11357, 39824, 10551, 59401, 10111, 11539, 10435, 10473, 11003, 37008, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "20", ",", "000", "people", "have", "been", "killed", "in", "the", "12", "-", "year", "-", "old", "conflict", "between", "Turkish", "troops", "and", "PKK", "guerrilla", "##s", "fighting", "for", "auto", "##nomy", "or", "independence", "from", "Turkey", "." ], "ids": [ 15946, 11084, 10197, 117, 10259, 11426, 10529, 10590, 15875, 10106, 10105, 10186, 118, 10924, 118, 12898, 24620, 10948, 22814, 20836, 10111, 105298, 106552, 10107, 27535, 10142, 18257, 100395, 10345, 31412, 10188, 22519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Egypt", "con", "##fis", "##cate", "##s", "paper", "for", "\"", "ma", "##d", "rulers", "\"", "article", "." ], "ids": [ 20440, 10173, 65702, 26054, 10107, 17895, 10142, 107, 10824, 10162, 99456, 107, 13262, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##IR", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 24707, 73522, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egypt", "has", "banned", "and", "con", "##fis", "##cated", "10", ",", "000", "copies", "of", "the", "Cyprus", "-", "based", "Arabic", "monthly", "newspaper", "al", "-", "Tada", "##mun", "because", "of", "an", "editorial", "suggesting", "mental", "health", "tests", "for", "Arab", "leaders", ",", "the", "editor", "-", "in", "-", "chief", "said", "on", "Tuesday", "." ], "ids": [ 20440, 10393, 58587, 10111, 10173, 65702, 57736, 10150, 117, 10259, 26102, 10108, 10105, 45639, 118, 11610, 26571, 61673, 22047, 10164, 118, 76284, 34326, 12373, 10108, 10151, 30202, 85404, 27993, 17004, 34926, 10142, 17365, 24155, 117, 10105, 16595, 118, 10106, 118, 19421, 12415, 10135, 70245, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 2, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mohamed", "Abu", "Li", "##way", "##a", ",", "said", "Information", "Ministry", "censo", "##rs", "had", "told", "him", "to", "send", "all", "the", "copies", "of", "the", "August", "edition", "back", "to", "Cyprus", "at", "his", "own", "ex", "##pense", "." ], "ids": [ 31790, 18332, 13258, 14132, 10113, 117, 12415, 12145, 19170, 19326, 10943, 10374, 21937, 10957, 10114, 45567, 10435, 10105, 26102, 10108, 10105, 10735, 14372, 12014, 10114, 45639, 10160, 10226, 12542, 11419, 34711, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "told", "Reuters", "the", "reason", "was", "his", "own", "front", "-", "page", "editorial", ",", "entitled", "\"", "A", "Chr", "##onic", "Mental", "Ill", "##ness", "\"", "in", "which", "he", "attacks", "com", "##pli", "##ant", "Arab", "leaders", "for", "serving", "U", ".", "S", ".", "and", "Israeli", "interests", "." ], "ids": [ 10357, 21937, 46617, 10105, 27949, 10134, 10226, 12542, 14589, 118, 15975, 30202, 117, 28268, 107, 138, 18787, 56177, 69268, 101288, 14010, 107, 10106, 10319, 10261, 26483, 10212, 62932, 11236, 17365, 24155, 10142, 20252, 158, 119, 156, 119, 10111, 28446, 36026, 119 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 5, 5, 5, 9, 2, 9, 9 ] }, { "tokens": [ "\"", "The", "Arab", "##s", "demand", "that", "our", "Arab", "leaders", "under", "##go", "a", "com", "##puls", "##ory", "examination", "by", "a", "team", "of", "ps", "##ych", "##iat", "##rist", "##s", "to", "see", "how", "sound", "their", "mental", "capa", "##citi", "##es", "are", ",", "\"", "the", "editorial", "said", "." ], "ids": [ 107, 10117, 17365, 10107, 34394, 10189, 17446, 17365, 24155, 10571, 10797, 169, 10212, 96898, 21493, 65548, 10155, 169, 11121, 10108, 97764, 14950, 27825, 24953, 10107, 10114, 12888, 14796, 19302, 10455, 27993, 40306, 87843, 10171, 10301, 117, 107, 10105, 30202, 12415, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Because", "our", "leaders", "have", "started", "to", "be", "##hav", "##e", "with", "extreme", "host", "##ility", "towards", "the", "interests", "of", "their", "peoples", "to", "court", "the", "good", "##wil", "##l", "of", "the", "Americans", "and", "the", "Zion", "##ists", ",", "\"", "he", "added", "." ], "ids": [ 107, 24153, 17446, 24155, 10529, 13457, 10114, 10347, 79313, 10112, 10169, 42331, 19317, 44704, 18095, 10105, 36026, 10108, 10455, 55332, 10114, 14866, 10105, 15198, 70185, 10161, 10108, 10105, 25069, 10111, 10105, 98270, 18206, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "censo", "##rship", "office", "denied", "they", "had", "con", "##fis", "##cated", "the", "newspapers", "but", "declined", "to", "say", "when", "they", "could", "go", "on", "sale", "." ], "ids": [ 10117, 19326, 78692, 14301, 47467, 10689, 10374, 10173, 65702, 57736, 10105, 48473, 10473, 44948, 10114, 23763, 10841, 10689, 12174, 11783, 10135, 15488, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IP", "##O", "F", "##IL", "##ING", "-", "Trans", "##kar", "##yot", "##ic", "The", "##rapie", "##s", "Inc", "." ], "ids": [ 24124, 11403, 143, 38850, 50183, 118, 29608, 15190, 103036, 11130, 10117, 96636, 10107, 13604, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Company", "Name", "Trans", "##kar", "##yot", "##ic", "The", "##rapie", "##s", "Inc" ], "ids": [ 11739, 15729, 29608, 15190, 103036, 11130, 10117, 96636, 10107, 13604 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "Nas", "##da", "##q", "Stock", "symbol", "TK", "##T", "##X" ], "ids": [ 40751, 10229, 11703, 31916, 29725, 77055, 11090, 12674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Esti", "##mated", "price", "range", "$", "13", "-", "$", "15", "/", "sh", "##r" ], "ids": [ 42272, 59746, 30839, 15601, 109, 10249, 118, 109, 10208, 120, 48201, 10129 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "shares", "to", "be", "offered", "2", ".", "5", "million" ], "ids": [ 25220, 45751, 10114, 10347, 20841, 123, 119, 126, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##hr", "##s", "offered", "by", "company", "2", ".", "5", "million" ], "ids": [ 156, 16757, 10107, 20841, 10155, 12100, 123, 119, 126, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##hr", "##s", "outstanding", "after", "i", "##po", "16", ",", "668", ",", "560" ], "ids": [ 156, 16757, 10107, 53933, 10662, 177, 13520, 10250, 117, 44832, 117, 29524 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lead", "Under", "##writer", "Morgan", "Stanley", "and", "Co", "Inc" ], "ids": [ 48860, 12594, 77799, 17133, 15400, 10111, 13098, 13604 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7 ] }, { "tokens": [ "Under", "##writer", "##s", "over", "-", "allo", "##t", "##ment", "375", ",", "000", "sh", "##rs", "Sha", "##res", "to", "be", "purchased", "by", "Ho", "##ech", "##st", "Marion", "R", "##ousse", "##l", "Inc", "357", ",", "143", "Business", ":", "developed", "two", "proprie", "##tary", "technology", "platforms", ",", "gene", "activation", "and", "gene", "therapy", "." ], "ids": [ 12594, 77799, 10107, 10491, 118, 20779, 10123, 10426, 25403, 117, 10259, 48201, 10943, 106583, 11234, 10114, 10347, 24463, 10155, 20220, 16200, 10562, 27276, 155, 102467, 10161, 13604, 33590, 117, 19510, 15281, 131, 14628, 10551, 47212, 65597, 19765, 51325, 117, 24910, 91554, 10111, 24910, 49619, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Use", "of", "Proc", "##eed", "##s", ":", "Research", ",", "pre", "##clin", "##ical", "and", "clinical", "product", "development", ",", "and", "general", "corporate", "purposes", "." ], "ids": [ 45414, 10108, 38050, 40154, 10107, 131, 12959, 117, 12229, 86257, 17616, 10111, 43463, 21535, 13405, 117, 10111, 11389, 46666, 36740, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Financial", "Data", "in", "000", "##s", ":", "1995", "1994" ], "ids": [ 30738, 12159, 10106, 10259, 10107, 131, 10436, 10444 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Revenue", "$", "15", ",", "400", "$", "10", ",", "000" ], "ids": [ 118, 69092, 109, 10208, 117, 11176, 109, 10150, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Net", "Inc", "##ome", "(", "loss", ")", "$", "2", ",", "074", "(", "$", "3", ",", "422", ")" ], "ids": [ 118, 32577, 13604, 22451, 113, 18576, 114, 109, 123, 117, 101649, 113, 109, 124, 117, 38735, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##T", "##RA", "##K", "train", "hits", "truck", ",", "dera", "##ils", "in", "Vermont", "." ], "ids": [ 24339, 11090, 29990, 11733, 17767, 27922, 58907, 117, 95465, 38308, 10106, 34919, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "MO", "##NT", "##P", "##EL", "##IE", "##R", ",", "V", "##t", "." ], "ids": [ 102059, 77261, 11127, 68999, 71655, 11273, 117, 159, 10123, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "27" ], "ids": [ 10389, 118, 11052, 118, 10365 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Amt", "##rak", "train", "struck", "a", "log", "##ging", "truck", "early", "on", "Tuesday", "and", "dera", "##iled", ",", "Vermont", "state", "police", "said", "." ], "ids": [ 10313, 16513, 15793, 17767, 45622, 169, 49316, 13808, 58907, 11732, 10135, 70245, 10111, 95465, 79257, 117, 34919, 11388, 15034, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "A", "state", "police", "spoke", "##s", "##woman", "said", "there", "were", "reports", "of", "minor", "injuries", "as", "a", "result", "of", "the", "dera", "##ilm", "##ent", "near", "R", "##ox", "##bury", ",", "a", "small", "town", "on", "the", "edge", "of", "the", "North", "##field", "Mountains", "some", "15", "miles", "southwest", "of", "Mont", "##peli", "##er", ",", "the", "state", "capital", "." ], "ids": [ 138, 11388, 15034, 50005, 10107, 79999, 12415, 11155, 10309, 26610, 10108, 17746, 49718, 10146, 169, 14493, 10108, 10105, 95465, 51782, 11405, 12883, 155, 31978, 19218, 117, 169, 12474, 12221, 10135, 10105, 30599, 10108, 10105, 11225, 13408, 24107, 11152, 10208, 14148, 37297, 10108, 19472, 77558, 10165, 117, 10105, 11388, 12185, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Further", "details", "were", "not", "immediately", "available", "." ], "ids": [ 43248, 29500, 10309, 10472, 24029, 14579, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wife", "of", "gun", "victim", "Brady", "praise", "##s", "Clinton", "." ], "ids": [ 47434, 10108, 23103, 62585, 45982, 80753, 10107, 24139, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 4, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "26" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10314 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sarah", "Brady", ",", "whose", "Republican", "husband", "was", "severely", "disabled", "in", "an", "assassination", "attempt", "on", "President", "Ronald", "Reagan", ",", "took", "centre", "stage", "at", "the", "Democratic", "National", "convention", "on", "Monday", "night", "to", "praise", "President", "Bill", "Clinton", "'", "s", "gun", "control", "efforts", "." ], "ids": [ 16548, 45982, 117, 16879, 21776, 19634, 10134, 77464, 94447, 10106, 10151, 94509, 21395, 10135, 12811, 21474, 41984, 117, 12149, 12672, 15365, 10160, 10105, 19281, 10655, 37812, 10135, 40714, 16903, 10114, 80753, 12811, 13160, 24139, 112, 187, 23103, 12608, 22116, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "her", "husband", "James", "sitting", "in", "a", "wheel", "##cha", "##ir", "to", "the", "side", "of", "the", "podium", ",", "Mrs", ".", "Brady", "called", "the", "hand", "##gun", "control", "bill", "that", "a", "Democratic", "Congress", "passed", "and", "Clinton", "signed", "in", "1994", "a", "major", "step", "in", "controlling", "fire", "##arm", "violence", "in", "the", "United", "States", "." ], "ids": [ 12613, 10485, 19634, 10900, 62151, 10106, 169, 46812, 12964, 10835, 10114, 10105, 12250, 10108, 10105, 39252, 117, 18830, 119, 45982, 11552, 10105, 15230, 32657, 12608, 34497, 10189, 169, 19281, 15984, 20006, 10111, 24139, 14775, 10106, 10444, 169, 11922, 31877, 10106, 101268, 13559, 76171, 26342, 10106, 10105, 10609, 10859, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 2, 3, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "But", "she", "said", "more", "had", "to", "be", "done", "." ], "ids": [ 16976, 10833, 12415, 10798, 10374, 10114, 10347, 20378, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Brady", "##s", "walk", "##ed", "on", "to", "the", "stage", ",", "he", "on", "her", "arm", "and", "with", "the", "aid", "of", "a", "cane", ",", "to", "a", "ro", "##using", "reception", "from", "the", "convention", "." ], "ids": [ 10117, 45982, 10107, 33734, 10336, 10135, 10114, 10105, 15365, 117, 10261, 10135, 10485, 31251, 10111, 10169, 10105, 19778, 10108, 169, 79325, 117, 10114, 169, 25470, 95179, 74018, 10188, 10105, 37812, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Their", "teen", "##age", "##d", "son", "sat", "in", "a", "VIP", "box", "with", "first", "lady", "Hillary", "Rod", "##ham", "Clinton", "and", "watched", "as", "his", "father", "returned", "to", "his", "wheel", "##cha", "##ir", "." ], "ids": [ 17551, 33003, 12276, 10162, 10312, 20694, 10106, 169, 67902, 21509, 10169, 10422, 61082, 72734, 30602, 13196, 24139, 10111, 92147, 10146, 10226, 13194, 14030, 10114, 10226, 46812, 12964, 10835, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Jim", ",", "we", "must", "have", "made", "a", "wrong", "turn", "." ], "ids": [ 107, 14178, 117, 11951, 14982, 10529, 11019, 169, 56126, 18923, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "is", "n", "'", "t", "San", "Diego", "(", "site", "of", "the", "Republican", "convention", ")", ",", "\"", "Mrs", ".", "Brady", "jo", "##ked", "to", "her", "husband", ",", "who", "was", "serving", "as", "Reagan", "'", "s", "press", "secretary", "when", "he", "was", "shot", "." ], "ids": [ 10747, 10124, 182, 112, 188, 10469, 14665, 113, 11920, 10108, 10105, 21776, 37812, 114, 117, 107, 18830, 119, 45982, 12541, 30511, 10114, 10485, 19634, 117, 10479, 10134, 20252, 10146, 41984, 112, 187, 21040, 37664, 10841, 10261, 10134, 19508, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Sarah", ",", "I", "told", "you", "this", "is", "the", "Democratic", "convention", ",", "\"", "he", "responded", "to", "his", "wife", ",", "who", "before", "the", "shooting", "had", "worked", "for", "two", "Republican", "con", "##gres", "##smen", "and", "the", "Republican", "national", "party", "." ], "ids": [ 107, 16548, 117, 146, 21937, 13028, 10531, 10124, 10105, 19281, 37812, 117, 107, 10261, 58040, 10114, 10226, 14384, 117, 10479, 11360, 10105, 38969, 10374, 13858, 10142, 10551, 21776, 10173, 68094, 60785, 10111, 10105, 21776, 11844, 14039, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "\"", "Since", "the", "Brady", "Law", "went", "into", "effect", "on", "February", "28", ",", "1994", "(", "it", ")", "has", "stopped", "more", "than", "100", ",", "000", "convicted", "fel", "##ons", "and", "other", "prohibited", "purchase", "##rs", "from", "buy", "##ing", "a", "hand", "##gun", "." ], "ids": [ 107, 15591, 10105, 45982, 13216, 13446, 10708, 18514, 10135, 11508, 10348, 117, 10444, 113, 10271, 114, 10393, 40949, 10798, 11084, 10407, 117, 10259, 61487, 13077, 13326, 10111, 10684, 99210, 37891, 10943, 10188, 47715, 10230, 169, 15230, 32657, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Today", ",", "and", "every", "day", ",", "the", "Brady", "Law", "is", "stop", "##ping", "an", "estimated", "85", "fel", "##ons", "from", "buy", "##ing", "a", "hand", "##gun", ",", "\"", "Mrs", ".", "Brady", "said", "." ], "ids": [ 17160, 117, 10111, 14234, 11940, 117, 10105, 45982, 13216, 10124, 20517, 15398, 10151, 25267, 12017, 13077, 13326, 10188, 47715, 10230, 169, 15230, 32657, 117, 107, 18830, 119, 45982, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "She", "added", ",", "\"", "But", "we", "need", "to", "do", "more", "." ], "ids": [ 11149, 16288, 117, 107, 16976, 11951, 17367, 10114, 10149, 10798, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "should", ",", "as", "President", "Clinton", "proposed", "today", ",", "stop", "people", "convicted", "of", "domestic", "violence", "from", "buy", "##ing", "a", "hand", "##gun", "." ], "ids": [ 12865, 14819, 117, 10146, 12811, 24139, 21622, 18745, 117, 20517, 11426, 61487, 10108, 31084, 26342, 10188, 47715, 10230, 169, 15230, 32657, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jim", "and", "I", "join", "with", "you", "ton", "##ight", "in", "salut", "##ing", "the", "great", "job", "that", "President", "Clinton", "has", "done", "in", "fighting", "crime", "and", "gun", "violence", ".", "\"" ], "ids": [ 14178, 10111, 146, 23707, 10169, 13028, 22464, 27521, 10106, 80674, 10230, 10105, 14772, 23627, 10189, 12811, 24139, 10393, 20378, 10106, 27535, 22564, 10111, 23103, 26342, 119, 107 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "'", "s", "a", "hun", "##ter", "and", "a", "sports", "##man", ",", "but", "he", "understand", "##s", "the", "difference", "between", "a", "Re", "##mington", "rifle", "and", "an", "AK", "##47", "." ], "ids": [ 107, 10357, 112, 187, 169, 12041, 10877, 10111, 169, 18204, 10589, 117, 10473, 10261, 49151, 10107, 10105, 30856, 10948, 169, 20304, 95486, 59116, 10111, 10151, 36723, 110715, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "And", "he", "knows", "that", "you", "do", "n", "'", "t", "go", "hunting", "with", "an", "Uz", "##i", "." ], "ids": [ 12689, 10261, 75354, 10189, 13028, 10149, 182, 112, 188, 11783, 57232, 10169, 10151, 50128, 10116, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Mr", ".", "President", "you", "des", "##er", "##ve", "our", "thanks", ".", "\"" ], "ids": [ 12916, 119, 12811, 13028, 10139, 10165, 10612, 17446, 69892, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jim", "Brady", "then", "gave", "a", "big", "thu", "##mb", "##s", "to", "the", "audience", "." ], "ids": [ 14178, 45982, 11059, 15362, 169, 22185, 23886, 27012, 10107, 10114, 10105, 26070, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brady" ], "ids": [ 45982 ], "entity": [ "B-PER" ], "entity_ids": [ 4 ] }, { "tokens": [ "was", "shot", "in", "the", "head", "in", "1981", "by", "gun", "##man", "John", "Hi", "##nc", "##kley", ",", "who", "tried", "to", "kill", "Reagan", "in", "a", "dera", "##nge", "##d", "bid", "to", "im", "##press", "Jo", "##die", "Foster", ",", "an", "actress", "he", "never", "met", "but", "with", "whom", "he", "was", "ob", "##ses", "##sed", "." ], "ids": [ 10134, 19508, 10106, 10105, 13578, 10106, 10654, 10155, 23103, 10589, 10421, 20065, 29420, 103538, 117, 10479, 27156, 10114, 32099, 41984, 10106, 169, 95465, 18180, 10162, 50385, 10114, 10211, 43379, 20977, 19995, 25348, 117, 10151, 24268, 10261, 14794, 10428, 10473, 10169, 18104, 10261, 10134, 17339, 13149, 16219, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Brady", "bill", ",", "calling", "for", "a", "waiting", "period", "before", "someone", "could", "buy", "a", "gun", "so", "a", "background", "check", "could", "be", "made", ",", "was", "first", "introduced", "in", "Congress", "in", "1987", "but", "it", "took", "seven", "years", "to", "pass", "because", "of", "opposition", "from", "the", "National", "Rifle", "Association", "gun", "lo", "##bby", "." ], "ids": [ 10117, 45982, 34497, 117, 37023, 10142, 169, 62052, 13127, 11360, 30455, 12174, 47715, 169, 23103, 10380, 169, 25903, 43662, 12174, 10347, 11019, 117, 10134, 10422, 17037, 10106, 15984, 10106, 10581, 10473, 10271, 12149, 15767, 10855, 10114, 23392, 12373, 10108, 21227, 10188, 10105, 10655, 71775, 11751, 23103, 10406, 31444, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Late", "##st", "opinion", "poll", "##s", "on", "German", "political", "parties", "." ], "ids": [ 25139, 10562, 32282, 70156, 10107, 10135, 12026, 13736, 18708, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Here", "are", "the", "latest", "opinion", "poll", "##s", "tracking", "national", "support", "for", "Germany", "'", "s", "main", "political", "parties", ":" ], "ids": [ 18249, 10301, 10105, 50908, 32282, 70156, 10107, 108307, 11844, 13145, 10142, 12775, 112, 187, 12126, 13736, 18708, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AU", "##G", "##US", "##T", "1996", "CDU", "/", "CSU", "SPD", "FDP", "Green", "##s", "PD", "##S" ], "ids": [ 29088, 11447, 32612, 11090, 10389, 27529, 120, 64921, 23327, 56378, 13068, 10107, 65535, 10731 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "B-ORG", "B-ORG", "B-ORG", "I-ORG", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 3, 3, 3, 7, 3, 7 ] }, { "tokens": [ "Em", "##ni", "##d", "Aug", "25", "41", ".", "0", "34", ".", "0", "7", ".", "0", "10", ".", "0", "6", ".", "0" ], "ids": [ 11289, 10342, 10162, 53012, 10258, 11349, 119, 121, 11069, 119, 121, 128, 119, 121, 10150, 119, 121, 127, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ele", "##ct", "Res", "Aug", "23", "41", ".", "0", "35", ".", "0", "5", ".", "0", "11", ".", "0", "4", ".", "0" ], "ids": [ 16561, 14526, 32070, 53012, 10328, 11349, 119, 121, 10803, 119, 121, 126, 119, 121, 10193, 119, 121, 125, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Allen", "##s", "##bach", "Aug", "21", "37", ".", "2", "32", ".", "8", "8", ".", "0", "13", ".", "0", "5", ".", "6" ], "ids": [ 15101, 10107, 14135, 53012, 10296, 11204, 119, 123, 10842, 119, 129, 129, 119, 121, 10249, 119, 121, 126, 119, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Em", "##ni", "##d", "Aug", "18", "41", ".", "0", "34", ".", "0", "6", ".", "0", "10", ".", "0", "5", ".", "0" ], "ids": [ 11289, 10342, 10162, 53012, 10218, 11349, 119, 121, 11069, 119, 121, 127, 119, 121, 10150, 119, 121, 126, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##UL", "##Y", "1996", "CDU", "/", "CSU", "SPD", "FDP", "Green", "##s", "PD", "##S" ], "ids": [ 147, 100673, 14703, 10389, 27529, 120, 64921, 23327, 56378, 13068, 10107, 65535, 10731 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "B-ORG", "B-ORG", "B-ORG", "I-ORG", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 3, 3, 3, 7, 3, 7 ] }, { "tokens": [ "Em", "##ni", "##d", "July", "7", "39", ".", "0", "32", ".", "0", "7", ".", "0", "11", ".", "0", "5", ".", "0" ], "ids": [ 11289, 10342, 10162, 11112, 128, 11303, 119, 121, 10842, 119, 121, 128, 119, 121, 10193, 119, 121, 126, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ele", "##ct", "Res", "July", "40", ".", "0", "33", ".", "0", "6", ".", "0", "12", ".", "0", "4", ".", "0" ], "ids": [ 16561, 14526, 32070, 11112, 10533, 119, 121, 11000, 119, 121, 127, 119, 121, 10186, 119, 121, 125, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##UN", "##E", "1996", "CDU", "/", "CSU", "SPD", "FDP", "Green", "##s", "PD", "##S" ], "ids": [ 147, 69849, 11259, 10389, 27529, 120, 64921, 23327, 56378, 13068, 10107, 65535, 10731 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "B-ORG", "B-ORG", "B-ORG", "I-ORG", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 3, 3, 3, 7, 3, 7 ] }, { "tokens": [ "Em", "##ni", "##d", "June", "30", "39", ".", "0", "33", ".", "0", "6", ".", "0", "12", ".", "0", "5", ".", "0" ], "ids": [ 11289, 10342, 10162, 11120, 10244, 11303, 119, 121, 11000, 119, 121, 127, 119, 121, 10186, 119, 121, 126, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ele", "##ct", "Res", "June", "21", "42", ".", "0", "33", ".", "0", "6", ".", "0", "12", ".", "0", "4", ".", "0" ], "ids": [ 16561, 14526, 32070, 11120, 10296, 11276, 119, 121, 11000, 119, 121, 127, 119, 121, 10186, 119, 121, 125, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Allen", "##s", "##bach", "June", "12", "37", ".", "4", "32", ".", "8", "7", ".", "3", "12", ".", "3", "5", ".", "4" ], "ids": [ 15101, 10107, 14135, 11120, 10186, 11204, 119, 125, 10842, 119, 129, 128, 119, 124, 10186, 119, 124, 126, 119, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "##sa", "June", "6", "39", ".", "0", "36", ".", "0", "6", ".", "0", "12", ".", "0", "5", ".", "0" ], "ids": [ 11399, 10466, 11120, 127, 11303, 119, 121, 11055, 119, 121, 127, 119, 121, 10186, 119, 121, 126, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MA", "##Y", "1996", "CDU", "/", "CSU", "SPD", "FDP", "Green", "##s", "PD", "##S" ], "ids": [ 27277, 14703, 10389, 27529, 120, 64921, 23327, 56378, 13068, 10107, 65535, 10731 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "B-ORG", "B-ORG", "B-ORG", "I-ORG", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 3, 3, 3, 7, 3, 7 ] }, { "tokens": [ "Em", "##ni", "##d", "May", "26", "40", ".", "0", "31", ".", "0", "6", ".", "0", "13", ".", "0", "6", ".", "0" ], "ids": [ 11289, 10342, 10162, 10725, 10314, 10533, 119, 121, 10413, 119, 121, 127, 119, 121, 10249, 119, 121, 127, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ele", "##ct", "Res", "May", "25", "43", ".", "0", "32", ".", "0", "6", ".", "0", "12", ".", "0", "4", ".", "0" ], "ids": [ 16561, 14526, 32070, 10725, 10258, 11370, 119, 121, 10842, 119, 121, 127, 119, 121, 10186, 119, 121, 125, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "##sa", "May", "23", "38", ".", "0", "37", ".", "0", "7", ".", "0", "11", ".", "0", "5", ".", "0" ], "ids": [ 11399, 10466, 10725, 10328, 11171, 119, 121, 11204, 119, 121, 128, 119, 121, 10193, 119, 121, 126, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Allen", "##s", "##bach", "May", "15", "38", ".", "5", "32", ".", "5", "8", ".", "1", "12", ".", "0", "4", ".", "4" ], "ids": [ 15101, 10107, 14135, 10725, 10208, 11171, 119, 126, 10842, 119, 126, 129, 119, 122, 10186, 119, 121, 125, 119, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AP", "##RI", "##L", "1996", "CDU", "/", "CSU", "SPD", "FDP", "Green", "##s", "PD", "##S" ], "ids": [ 30909, 46876, 11369, 10389, 27529, 120, 64921, 23327, 56378, 13068, 10107, 65535, 10731 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "B-ORG", "B-ORG", "B-ORG", "I-ORG", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 3, 3, 3, 7, 3, 7 ] }, { "tokens": [ "Em", "##ni", "##d", "April", "28", "40", ".", "0", "32", ".", "0", "5", ".", "0", "11", ".", "0", "5", ".", "0" ], "ids": [ 11289, 10342, 10162, 10780, 10348, 10533, 119, 121, 10842, 119, 121, 126, 119, 121, 10193, 119, 121, 126, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ele", "##ct", "Res", "April", "20", "43", ".", "0", "32", ".", "0", "6", ".", "0", "12", ".", "0", "4", ".", "0" ], "ids": [ 16561, 14526, 32070, 10780, 10197, 11370, 119, 121, 10842, 119, 121, 127, 119, 121, 10186, 119, 121, 125, 119, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Allen", "##s", "##bach", "April", "17", "38", ".", "1", "32", ".", "3", "6", ".", "5", "12", ".", "9", "6", ".", "3" ], "ids": [ 15101, 10107, 14135, 10780, 10273, 11171, 119, 122, 10842, 119, 124, 127, 119, 126, 10186, 119, 130, 127, 119, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OF", "##F", "##IC", "##IA", "##L", "RE", "##SU", "##L", "##TS", "OF", "THE", "O", "##CT", "##O", "##B", "##ER", "16", ",", "1994", "GE", "##NE", "##RA", "##L", "EL", "##EC", "##TION", ":" ], "ids": [ 23240, 11565, 30889, 35976, 11369, 71033, 88592, 11369, 36545, 23240, 17443, 152, 91995, 11403, 11274, 24093, 10250, 117, 10444, 62997, 93280, 29990, 11369, 69765, 35826, 98207, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CDU", "/", "CSU", "SPD", "FDP", "Green", "##s", "PD", "##S" ], "ids": [ 27529, 120, 64921, 23327, 56378, 13068, 10107, 65535, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "B-ORG", "B-ORG", "B-ORG", "I-ORG", "B-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 3, 3, 3, 7, 3, 7 ] }, { "tokens": [ "41", ".", "5", "36", ".", "4", "6", ".", "9", "7", ".", "3", "4", ".", "4" ], "ids": [ 11349, 119, 126, 11055, 119, 125, 127, 119, 130, 128, 119, 124, 125, 119, 125 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", ":", "Ele", "##ct", "Res", "=", "Electoral", "Research", "Group", "(", "Forschung", "##sgruppe", "Wahlen", ")" ], "ids": [ 49307, 29833, 131, 16561, 14526, 32070, 134, 58242, 12959, 12054, 113, 39442, 58283, 63363, 114 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "-", "-", "Bonn", "news", "##room", ",", "+", "49", "228", "260", "##97", "##60" ], "ids": [ 118, 118, 21982, 14424, 25525, 117, 116, 11580, 25646, 17948, 100595, 50924 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Most", "host", "##ages", "free", "##d", "from", "hija", "##cked", "Sudan", "##ese", "plane", "." ], "ids": [ 14361, 19317, 24115, 13961, 10162, 10188, 26429, 72333, 28407, 13565, 35007, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "ST", "##AN", "##ST", "##ED", ",", "England", "1996", "-", "08", "-", "27" ], "ids": [ 53317, 41275, 32995, 33809, 117, 11701, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Armed", "hija", "##cker", "##s", "believed", "to", "be", "Iraqi", "##s", "released", "140", "people", "on", "Tuesday", "from", "a", "Sudan", "Airways", "plane", "carrying", "199", "passengers", "and", "crew", "that", "landed", "in", "London", "after", "being", "div", "##erted", "on", "a", "flight", "from", "K", "##hart", "##oum", "to", "Amman", ",", "police", "said", "." ], "ids": [ 51383, 26429, 19153, 10107, 20718, 10114, 10347, 57806, 10107, 11539, 13958, 11426, 10135, 70245, 10188, 169, 28407, 29791, 35007, 39157, 23366, 37008, 10111, 24032, 10189, 58961, 10106, 10829, 10662, 11223, 76486, 46949, 10135, 169, 23578, 10188, 148, 34567, 88314, 10114, 107098, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "spoke", "##sman", "Roger", "G", "##rim", "##wad", "##e", "said", "the", "six", "or", "seven", "hija", "##cker", "##s", "remained", "on", "board", "the", "aircraft", ",", "which", "arrived", "from", "Cyprus", "at", "4", ".", "30", "a", ".", "m", ".", "(", "033", "##0", "GMT", ")", "." ], "ids": [ 18051, 50005, 24305, 13513, 144, 23760, 87051, 10112, 12415, 10105, 12449, 10345, 15767, 26429, 19153, 10107, 15980, 10135, 17936, 10105, 16167, 117, 10319, 22584, 10188, 45639, 10160, 125, 119, 10244, 169, 119, 181, 119, 113, 100402, 10929, 20362, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "He", "said", "they", "had", "made", "various", "request", "##s", "to", "police", "nego", "##tia", "##tors", "but", "stepped", "back", "from", "earlier", "suggest", "##ions", "that", "the", "hija", "##cker", "##s", "had", "asked", "to", "speak", "to", "a", "British", "-", "based", "Iraqi", "police", "named", "as", "Mr", "Sad", "##iki", "." ], "ids": [ 10357, 12415, 10689, 10374, 11019, 13547, 37449, 10107, 10114, 15034, 21134, 16180, 24324, 10473, 99116, 12014, 10188, 18905, 56874, 15880, 10189, 10105, 26429, 19153, 10107, 10374, 22151, 10114, 41541, 10114, 169, 11160, 118, 11610, 57806, 15034, 12038, 10146, 12916, 48691, 20897, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 2, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "The", "hija", "##cker", "##s", ",", "who", "have", "said", "they", "want", "to", "seek", "as", "##ylum", "in", "Britain", ",", "are", "believed", "to", "be", "armed", "with", "gr", "##ena", "##des", "and", "possibly", "other", "ex", "##plosive", "##s", ",", "according", "to", "police", "." ], "ids": [ 10117, 26429, 19153, 10107, 117, 10479, 10529, 12415, 10689, 21528, 10114, 48394, 10146, 54716, 10106, 16032, 117, 10301, 20718, 10114, 10347, 34174, 10169, 30518, 13032, 10920, 10111, 33370, 10684, 11419, 83655, 10107, 117, 18071, 10114, 15034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "earlier", "threatened", "to", "blow", "up", "the", "aircraft", "." ], "ids": [ 11696, 18905, 44593, 10114, 106194, 10741, 10105, 16167, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Airbus", "A3", "##10", "was", "div", "##erted", "first", "to", "Cyprus", ",", "then", "to", "Britain", "." ], "ids": [ 10117, 35540, 67400, 20305, 10134, 76486, 46949, 10422, 10114, 45639, 117, 11059, 10114, 16032, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9 ] }, { "tokens": [ "British", "Data", "in", "merger", "talks", "with", "Men", "##t", "##more", "." ], "ids": [ 11160, 12159, 10106, 53860, 56672, 10169, 13026, 10123, 19594, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "##t", "##more", "Abbey", "said", "on", "Tuesday", "that", "merger", "discussions", "were", "taking", "place", "with", "the", "board", "of", "British", "Data", "Management", ",", "an", "information", "resource", "management", "and", "archive", "storage", "company", "." ], "ids": [ 13026, 10123, 19594, 30339, 12415, 10135, 70245, 10189, 53860, 66608, 10309, 18084, 11192, 10169, 10105, 17936, 10108, 11160, 12159, 16485, 117, 10151, 12929, 40970, 17150, 10111, 25041, 38112, 12100, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "it", "noted", "in", "a", "brief", "statement", ":", "\"", "However", ",", "it", "is", "too", "early", "to", "say", "at", "this", "stage", "whether", "or", "not", "terms", "can", "be", "agreed", ".", "\"" ], "ids": [ 16976, 10271, 18575, 10106, 169, 29040, 33311, 131, 107, 12209, 117, 10271, 10124, 16683, 11732, 10114, 23763, 10160, 10531, 15365, 21883, 10345, 10472, 18873, 10944, 10347, 25577, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "##t", "##more", "Abbey", ",", "the", "UK", "station", "##ery", "and", "house", "##ware", "##s", "business", "formerly", "known", "as", "Pla", "##tig", "##num", ",", "said", "it", "was", "making", "the", "statement", "in", "response", "to", "recent", "newspaper", "articles", "linking", "the", "two", "groups", "." ], "ids": [ 13026, 10123, 19594, 30339, 117, 10105, 10523, 11825, 23131, 10111, 13215, 27444, 10107, 14155, 22239, 11053, 10146, 83292, 18735, 18991, 117, 12415, 10271, 10134, 14293, 10105, 33311, 10106, 21001, 10114, 19037, 22047, 18416, 109784, 10105, 10551, 15647, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "in", "Men", "##t", "##more", "Abbey", "edge", "##d", "two", "pen", "##ce", "higher", "to", "81", ".", "5", "pen", "##ce", ",", "val", "##uing", "the", "group", "at", "just", "under", "30", "million", "st", "##g", "." ], "ids": [ 106583, 11234, 10106, 13026, 10123, 19594, 30339, 30599, 10162, 10551, 66558, 10419, 17981, 10114, 12324, 119, 126, 66558, 10419, 117, 25460, 94213, 10105, 11795, 10160, 12820, 10571, 10244, 12473, 28780, 10240, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "British", "Data", "Management", "'", "s", "shares", "sl", "##ip", "##ped", "0", ".", "5", "pen", "##ce", "to", "179", ".", "5", "##p", ",", "val", "##uing", "that", "company", "at", "around", "45", "million", "st", "##g", "." ], "ids": [ 11160, 12159, 16485, 112, 187, 45751, 38523, 17437, 16898, 121, 119, 126, 66558, 10419, 10114, 22399, 119, 126, 10410, 117, 25460, 94213, 10189, 12100, 10160, 12166, 10827, 12473, 28780, 10240, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "London", "News", "##room", "+", "44", "171", "542", "401", "##7" ], "ids": [ 118, 118, 10829, 12219, 25525, 116, 11126, 22478, 51620, 32584, 11305 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hij", "##ack", "##ed", "Sudan", "plane", "lands", "at", "a", "London", "airport", "." ], "ids": [ 12076, 33145, 10336, 28407, 35007, 31361, 10160, 169, 10829, 28460, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "ST", "##AN", "##ST", "##ED", ",", "England", "1996", "-", "08", "-", "27" ], "ids": [ 53317, 41275, 32995, 33809, 117, 11701, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "hija", "##cked", "Sudan", "Airways", "plane", "carrying", "199", "passengers", "and", "crew", "landed", "at", "Stan", "##sted", "airport", "just", "outside", "London", "early", "on", "Tuesday", "morning", "after", "flying", "from", "Cyprus", ",", "eye", "##wit", "##ness", "##es", "said", "." ], "ids": [ 138, 26429, 72333, 28407, 29791, 35007, 39157, 23366, 37008, 10111, 24032, 58961, 10160, 26637, 36018, 28460, 12820, 17555, 10829, 11732, 10135, 70245, 28757, 10662, 34676, 10188, 45639, 117, 32684, 56082, 14010, 10171, 12415, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Airbus", "310", "Flight", "150", ",", "which", "was", "hija", "##cked", "on", "Monday", "evening", "on", "its", "way", "from", "K", "##hart", "##oum", "to", "the", "Jordan", "##ian", "capital", "Amman", ",", "landed", "at", "4", ".", "30", "a", ".", "m", ".", "(", "033", "##0", "GMT", ")", "after", "a", "flight", "of", "more", "than", "four", "hours", "." ], "ids": [ 10117, 35540, 23993, 25554, 11766, 117, 10319, 10134, 26429, 72333, 10135, 40714, 42135, 10135, 10474, 13170, 10188, 148, 34567, 88314, 10114, 10105, 16366, 11630, 12185, 107098, 117, 58961, 10160, 125, 119, 10244, 169, 119, 181, 119, 113, 100402, 10929, 20362, 114, 10662, 169, 23578, 10108, 10798, 11084, 11598, 19573, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 2, 6, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "one", "of", "the", "uni", "##dent", "##ified", "hija", "##cker", "##s", "was", "apparently", "armed", "with", "gr", "##ena", "##des", "and", "TNT", "and", "threatened", "to", "blow", "the", "plane", "up", "in", "Cyprus", "unless", "it", "was", "ref", "##uelle", "##d", "so", "they", "could", "fly", "to", "Britain", "to", "claim", "political", "as", "##ylum", "." ], "ids": [ 11699, 16298, 10464, 10108, 10105, 69191, 21029, 31825, 26429, 19153, 10107, 10134, 47731, 34174, 10169, 30518, 13032, 10920, 10111, 65655, 10111, 44593, 10114, 106194, 10105, 35007, 10741, 10106, 45639, 60015, 10271, 10134, 48056, 36252, 10162, 10380, 10689, 12174, 26155, 10114, 16032, 10114, 27445, 13736, 10146, 54716, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "will", "surrender", "the", "passengers", "there", "and", "surrender", "themselves", ",", "\"", "police", "spoke", "##sman", "G", "##la", "##f", "##cos", "X", "##enos", "told", "reporter", "##s", "at", "Cyprus", "'", "s", "La", "##rna", "##ca", "airport", "." ], "ids": [ 107, 11696, 11337, 75614, 10105, 37008, 11155, 10111, 75614, 20182, 117, 107, 15034, 50005, 24305, 144, 10330, 10575, 15023, 161, 58286, 21937, 41408, 10107, 10160, 45639, 112, 187, 10159, 13471, 10425, 28460, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "Security", "was", "tight", "at", "Stan", "##sted", "airport", ",", "which", "is", "about", "30", "miles", "(", "50", "km", ")", "northeast", "of", "the", "capital", "." ], "ids": [ 20924, 10134, 85202, 10160, 26637, 36018, 28460, 117, 10319, 10124, 10978, 10244, 14148, 113, 10462, 10204, 114, 33002, 10108, 10105, 12185, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stan", "##sted", "has", "been", "designated", "as", "the", "preferred", "option", "for", "handling", "hija", "##cking", "##s", "in", "southern", "England", "because", "it", "is", "more", "remote", "than", "Heath", "##row", "and", "Ga", "##tw", "##ick", ",", "London", "'", "s", "two", "major", "airport", "##s", ",", "and", "handle", "##s", "less", "air", "traffic", "." ], "ids": [ 26637, 36018, 10393, 10590, 23386, 10146, 10105, 60278, 32562, 10142, 52703, 26429, 72453, 10107, 10106, 17156, 11701, 12373, 10271, 10124, 10798, 55808, 11084, 42676, 21454, 10111, 69699, 76797, 20898, 117, 10829, 112, 187, 10551, 11922, 28460, 10107, 117, 10111, 58208, 10107, 15306, 12566, 26482, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hij", "##ack", "##ed", "Sudan", "plane", "expected", "at", "London", "'", "s", "Stan", "##sted", "." ], "ids": [ 12076, 33145, 10336, 28407, 35007, 25973, 10160, 10829, 112, 187, 26637, 36018, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 1, 9, 9, 1, 5, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "hija", "##cked", "Sudan", "Airways", "plane", "with", "199", "passengers", "and", "crew", "on", "board", "was", "expected", "to", "land", "at", "London", "'", "s", "Stan", "##sted", "airport", "later", "on", "Tuesday", "morning", ",", "a", "police", "spoke", "##s", "##woman", "said", "." ], "ids": [ 138, 26429, 72333, 28407, 29791, 35007, 10169, 23366, 37008, 10111, 24032, 10135, 17936, 10134, 25973, 10114, 11773, 10160, 10829, 112, 187, 26637, 36018, 28460, 10873, 10135, 70245, 28757, 117, 169, 15034, 50005, 10107, 79999, 12415, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "That", "is", "the", "plan", "at", "the", "moment", "." ], "ids": [ 107, 13646, 10124, 10105, 13065, 10160, 10105, 14316, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "is", "where", "the", "plane", "is", "being", "directed", "to", ",", "\"", "Ruth", "Coll", "##in", "of", "Essex", "police", ",", "the", "force", "responsible", "for", "Stan", "##sted", ",", "said", "." ], "ids": [ 13646, 10124, 10940, 10105, 35007, 10124, 11223, 15446, 10114, 117, 107, 23979, 65689, 10245, 10108, 33634, 15034, 117, 10105, 15031, 21586, 10142, 26637, 36018, 117, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Stan", "##sted", ",", "London", "'", "s", "third", "-", "bus", "##iest", "airport", "after", "Heath", "##row", "and", "Ga", "##tw", "##ick", ",", "is", "located", "about", "30", "miles", "(", "48", "km", ")", "northeast", "of", "the", "capital", "." ], "ids": [ 26637, 36018, 117, 10829, 112, 187, 12628, 118, 19369, 66820, 28460, 10662, 42676, 21454, 10111, 69699, 76797, 20898, 117, 10124, 11954, 10978, 10244, 14148, 113, 11300, 10204, 114, 33002, 10108, 10105, 12185, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "British", "officials", "said", "they", "would", "much", "pre", "##fer", "to", "deal", "with", "a", "hija", "##cking", "at", "Stan", "##sted", "because", "of", "its", "relatively", "remote", "location", "and", "because", "air", "traffic", "would", "be", "less", "badly", "dis", "##rupted", "there", "than", "at", "Heath", "##row", "or", "Ga", "##tw", "##ick", "." ], "ids": [ 11160, 27730, 12415, 10689, 10894, 13172, 12229, 14854, 10114, 19918, 10169, 169, 26429, 72453, 10160, 26637, 36018, 12373, 10108, 10474, 28436, 55808, 18214, 10111, 12373, 12566, 26482, 10894, 10347, 15306, 91810, 27920, 63133, 11155, 11084, 10160, 42676, 21454, 10345, 69699, 76797, 20898, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 5, 9 ] }, { "tokens": [ "They", "said", "police", "and", "the", "emergency", "services", "were", "implement", "##ing", "a", "well", "-", "re", "##hea", "##rse", "##d", "cont", "##ingen", "##cy", "plan", "to", "handle", "the", "hija", "##cking", "." ], "ids": [ 11696, 12415, 15034, 10111, 10105, 44461, 12639, 10309, 92292, 10230, 169, 11206, 118, 11639, 45546, 16239, 10162, 60146, 13563, 11710, 13065, 10114, 58208, 10105, 26429, 72453, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "armed", "hija", "##cker", "##s", "of", "the", "Airbus", "310", "Flight", "150", ",", "which", "is", "expected", "to", "arrive", "about", "4", "a", ".", "m", ".", "(", "030", "##0", "GMT", ")", ",", "have", "said", "they", "inte", "##nd", "to", "surrender", "and", "seek", "political", "as", "##ylum", "in", "Britain", "." ], "ids": [ 10117, 34174, 26429, 19153, 10107, 10108, 10105, 35540, 23993, 25554, 11766, 117, 10319, 10124, 25973, 10114, 27814, 10978, 125, 169, 119, 181, 119, 113, 78336, 10929, 20362, 114, 117, 10529, 12415, 10689, 14168, 11534, 10114, 75614, 10111, 48394, 13736, 10146, 54716, 10106, 16032, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "plane", "was", "hija", "##cked", "on", "its", "way", "from", "K", "##hart", "##oum", "to", "the", "Jordan", "##ian", "capital", "Amman", "on", "Monday", "evening", "and", "landed", "at", "La", "##rna", "##ca", "airport", "in", "Cyprus", "to", "ref", "##uel", "." ], "ids": [ 10117, 35007, 10134, 26429, 72333, 10135, 10474, 13170, 10188, 148, 34567, 88314, 10114, 10105, 16366, 11630, 12185, 107098, 10135, 40714, 42135, 10111, 58961, 10160, 10159, 13471, 10425, 28460, 10106, 45639, 10114, 48056, 27043, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 2, 6, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "identity", "and", "number", "of", "the", "hija", "##cker", "##s", "was", "not", "known", "." ], "ids": [ 10117, 28553, 10111, 11487, 10108, 10105, 26429, 19153, 10107, 10134, 10472, 11053, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "of", "them", "nego", "##tia", "##ted", "through", "the", "pilot", "in", "English", "." ], "ids": [ 11340, 10108, 11345, 21134, 16180, 11912, 11222, 10105, 20618, 10106, 11616, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "The", "pilot", "said", "several", "hija", "##cker", "##s", "appeared", "to", "be", "placed", "around", "the", "plane", "." ], "ids": [ 10117, 20618, 12415, 11736, 26429, 19153, 10107, 14565, 10114, 10347, 16906, 12166, 10105, 35007, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pain", "##ted", "par", "##rot", "s", "##cam", "lands", "Australian", "in", "jail", "." ], "ids": [ 44170, 11912, 10248, 28636, 187, 67354, 31361, 12829, 10106, 75934, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "PE", "##RT", "##H", ",", "Australia", "1996", "-", "08", "-", "27" ], "ids": [ 80468, 46935, 12396, 117, 11729, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "con", "##man", "who", "painted", "common", "Australian", "par", "##rots", "with", "dy", "##e", "to", "make", "them", "look", "like", "rare", "birds", "worth", "thousands", "of", "dollars", "was", "jail", "##ed", "for", "fraud", "on", "Tuesday", "." ], "ids": [ 138, 10173, 10589, 10479, 37992, 14624, 12829, 10248, 94373, 10169, 13906, 10112, 10114, 13086, 11345, 25157, 11850, 23902, 29431, 43509, 39966, 10108, 27953, 10134, 75934, 10336, 10142, 93070, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Den", "##ham", "Pe", "##iri", "##s", "painted", "six", "green", "par", "##rots", ",", "worth", "about", "A", "$", "100", "(", "US", "$", "79", ")", "a", "pair", ",", "with", "a", "ci", "##nna", "##mon", "hair", "dy", "##e", "and", "traded", "them", "as", "Indian", "Ring", "##nec", "##k", "Par", "##rots", ",", "valued", "at", "A", "$", "14", ",", "000", "a", "pair", "." ], "ids": [ 10235, 13196, 29005, 19334, 10107, 37992, 12449, 23320, 10248, 94373, 117, 43509, 10978, 138, 109, 10407, 113, 10808, 109, 12791, 114, 169, 27643, 117, 10169, 169, 11322, 16441, 16278, 40830, 13906, 10112, 10111, 52696, 11345, 10146, 12544, 21557, 54881, 10174, 17434, 94373, 117, 106867, 10160, 138, 109, 10247, 117, 10259, 169, 27643, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pe", "##iri", "##s", ",", "32", ",", "of", "Perth", ",", "was", "sentenced", "in", "the", "Western", "Australian", "District", "Court", "to", "two", "years", "in", "jail", "for", "fraud", "after", "trading", "three", "pairs", "of", "im", "##posto", "##r", "birds", "for", "21", "par", "##rots", "worth", "a", "total", "of", "A", "$", "28", ",", "000", "." ], "ids": [ 29005, 19334, 10107, 117, 10842, 117, 10108, 31754, 117, 10134, 53365, 10106, 10105, 13163, 12829, 11958, 14100, 10114, 10551, 10855, 10106, 75934, 10142, 93070, 10662, 46663, 11003, 55736, 10108, 10211, 29727, 10129, 29431, 10142, 10296, 10248, 94373, 43509, 169, 11339, 10108, 138, 109, 10348, 117, 10259, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Every", "##one", "was", "f", "##ool", "##ed", ",", "\"", "said", "pet", "shop", "owner", "Shane", "Drew", ",", "who", "un", "##k", "##now", "##ingly", "traded", "the", "dis", "##gui", "##sed", "birds", "." ], "ids": [ 107, 30929, 12926, 10134, 174, 47195, 10336, 117, 107, 12415, 32784, 39090, 24414, 40429, 34608, 117, 10479, 10119, 10174, 69346, 56299, 52696, 10105, 27920, 55818, 16219, 29431, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "'", "d", "already", "had", "three", "local", "breed", "##ers", "have", "a", "look", "at", "them", "and", "sent", "photos", "and", "videos", "of", "the", "birds", "to", "the", "eastern", "states", "for", "aut", "##hen", "##tica", "##tion", "-", "-", "they", "said", "they", "'", "re", "nic", "##e", "birds", ",", "\"", "Drew", "told", "reporter", "##s", "outside", "court", "." ], "ids": [ 107, 146, 112, 172, 19034, 10374, 11003, 11436, 50246, 10901, 10529, 169, 25157, 10160, 11345, 10111, 14541, 41833, 10111, 37655, 10108, 10105, 29431, 10114, 10105, 18677, 16316, 10142, 49523, 14786, 13640, 10822, 118, 118, 10689, 12415, 10689, 112, 11639, 46267, 10112, 29431, 117, 107, 34608, 21937, 41408, 10107, 17555, 14866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "After", "I", "was", "told", "they", "were", "dy", "##ed", ",", "I", "check", "##ed", "them", "over", "again", "." ], "ids": [ 107, 11301, 146, 10134, 21937, 10689, 10309, 13906, 10336, 117, 146, 43662, 10336, 11345, 10491, 13123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "a", "perfect", "paint", "job", "except", "for", "one", "feat", "##her", "under", "a", "wing", "of", "one", "bird", "that", "was", "only", "half", "dy", "##ed", ",", "\"", "Drew", "said", "." ], "ids": [ 10377, 10134, 169, 43477, 72700, 23627, 23423, 10142, 10464, 17537, 14206, 10571, 169, 22571, 10108, 10464, 44519, 10189, 10134, 10893, 13877, 13906, 10336, 117, 107, 34608, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "Drew", "said", "Pe", "##iri", "##s", ",", "a", "bird", "ent", "##hus", "##ias", "##t", ",", "would", "have", "succeeded", "with", "the", "fraud", "if", "he", "had", "not", "tried", "to", "trade", "a", "fourth", "pair", "of", "bog", "##us", "birds", "after", "an", "associate", "had", "told", "police", "of", "the", "s", "##cam", "." ], "ids": [ 34608, 12415, 29005, 19334, 10107, 117, 169, 44519, 61047, 15471, 15465, 10123, 117, 10894, 10529, 28126, 10169, 10105, 93070, 12277, 10261, 10374, 10472, 27156, 10114, 18908, 169, 16918, 27643, 10108, 66298, 10251, 29431, 10662, 10151, 46175, 10374, 21937, 15034, 10108, 10105, 187, 67354, 119 ], "entity": [ "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "not", "for", "the", "informa", "##nt", ",", "the", "painted", "par", "##rots", "'", "true", "colours", "would", "not", "have", "been", "known", "for", "six", "months", ",", "he", "said", "." ], "ids": [ 14535, 10472, 10142, 10105, 93039, 10368, 117, 10105, 37992, 10248, 94373, 112, 22024, 83829, 10894, 10472, 10529, 10590, 11053, 10142, 12449, 15555, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "mo", "##ult", "in", "the", "summer", ",", "so", "five", "or", "six", "months", "down", "the", "track", ",", "I", "would", "have", "looked", "like", "the", "guilty", "party", ",", "\"", "Drew", "said", "." ], "ids": [ 107, 11696, 46912, 16203, 10106, 10105, 17995, 117, 10380, 12403, 10345, 12449, 15555, 12935, 10105, 14310, 117, 146, 10894, 10529, 59822, 11850, 10105, 56044, 14039, 117, 107, 34608, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "NZ", "motori", "##st", "'", "s", "arrest", "brings", "free", "flight", "to", "Tonga", "." ], "ids": [ 105920, 62424, 10562, 112, 187, 45165, 69315, 13961, 23578, 10114, 61600, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "New", "Zealand", "motori", "##st", "got", "an", "une", "##xpected", "free", "flight", "to", "Tonga", "on", "Tuesday", "after", "being", "caught", "drinking", "and", "driving", "." ], "ids": [ 138, 10287, 14451, 62424, 10562, 19556, 10151, 10231, 101239, 13961, 23578, 10114, 61600, 10135, 70245, 10662, 11223, 39797, 68351, 10111, 37897, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "man", "drew", "attention", "to", "himself", "in", "the", "North", "Island", "town", "of", "Tau", "##rang", "##a", "while", "trying", "to", "reverse", "his", "car", "out", "of", "a", "pot", "##hole", "on", "Saturday", "night", "." ], "ids": [ 10117, 10817, 49098, 21341, 10114, 14764, 10106, 10105, 11225, 11848, 12221, 10108, 88233, 24141, 10113, 11371, 32862, 10114, 60971, 10226, 13000, 10950, 10108, 169, 15050, 84569, 10135, 24848, 16903, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "sp", "##un", "the", "wheels", "so", "much", "that", "the", "tyre", "##s", "caught", "ali", "##ght", "and", "smoke", "began", "pour", "##ing", "from", "under", "the", "bonne", "##t", ",", "the", "New", "Zealand", "Press", "Association", "reported", "." ], "ids": [ 10357, 32650, 11107, 10105, 81561, 10380, 13172, 10189, 10105, 29475, 10107, 39797, 12134, 20687, 10111, 100332, 11941, 10322, 10230, 10188, 10571, 10105, 38809, 10123, 117, 10105, 10287, 14451, 10568, 11751, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Police", "arrested", "the", "man", "and", "charged", "him", "with", "drink", "-", "driving", ",", "but", "then", "is", "##cover", "##ed", "he", "was", "wanted", "by", "the", "Immigration", "Service", "as", "an", "over", "##sta", "##yer", "." ], "ids": [ 18051, 29479, 10105, 10817, 10111, 38253, 10957, 10169, 69423, 118, 37897, 117, 10473, 11059, 10124, 51652, 10336, 10261, 10134, 22591, 10155, 10105, 107898, 13489, 10146, 10151, 10491, 10972, 17750, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "man", "was", "due", "to", "catch", "a", "flight", "to", "Nu", "##ku", "'", "al", "##ofa", "in", "Tonga", "later", "on", "Tuesday", "." ], "ids": [ 10117, 10817, 10134, 10850, 10114, 61093, 169, 23578, 10114, 28336, 10853, 112, 10164, 89549, 10106, 61600, 10873, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Indonesia", "'", "s", "SB", "##P", "##U", "##s", "auction", "results", "." ], "ids": [ 11658, 112, 187, 64669, 11127, 12022, 10107, 106733, 17466, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "JA", "##KA", "##RT", "##A", "1996", "-", "08", "-", "27" ], "ids": [ 53399, 67813, 46935, 10738, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "following", "is", "the", "result", "of", "central", "bank", "sec", "##urities", "(", "SB", "##P", "##U", "##s", ")", "auction", "on", "Tuesday", "at", "080", "##0", "GMT", ":" ], "ids": [ 10117, 11901, 10124, 10105, 14493, 10108, 12397, 19423, 37913, 82073, 113, 64669, 11127, 12022, 10107, 114, 106733, 10135, 70245, 10160, 81051, 10929, 20362, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "SB", "##P", "##U", "##s", "seven", "-", "day", "14", "-", "day" ], "ids": [ 64669, 11127, 12022, 10107, 15767, 118, 11940, 10247, 118, 11940 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cut", "-", "off", "-", "rate", "(", "percent", ")", "15", ".", "75", "16", ".", "00" ], "ids": [ 51275, 118, 11898, 118, 18344, 113, 22362, 114, 10208, 119, 11417, 10250, 119, 11025 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "in", "billion", "ru", "##pia", "##h", ")", "38", ".", "43", "218", ".", "50" ], "ids": [ 25220, 113, 10106, 25848, 13483, 17837, 10237, 114, 11171, 119, 11370, 24599, 119, 10462 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Jakarta", "news", "##room", "+", "622", "##1", "384", "-", "636", "##4" ], "ids": [ 118, 118, 14164, 14424, 25525, 116, 56639, 10759, 32466, 118, 54105, 11011 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Seoul", "em", "##bas", "##sies", "war", "##ned", "of", "terrorist", "attacks", "." ], "ids": [ 26335, 10266, 21322, 42632, 10338, 17021, 10108, 76482, 26483, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "27" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Korea", "has", "told", "its", "overseas", "missions", "to", "step", "up", "security", "since", "its", "em", "##bas", "##sy", "in", "the", "former", "Yugoslavia", "received", "a", "threat", "over", "Seoul", "'", "s", "c", "##rack", "##down", "on", "radical", "students", ",", "the", "foreign", "ministry", "said", "on", "Tuesday", "." ], "ids": [ 11056, 14096, 10393, 21937, 10474, 59391, 28836, 10114, 31877, 10741, 21849, 11764, 10474, 10266, 21322, 16105, 10106, 10105, 11775, 38168, 12296, 169, 41256, 10491, 26335, 112, 187, 171, 71189, 27160, 10135, 31991, 13501, 117, 10105, 20796, 65338, 12415, 10135, 70245, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "letter", "to", "the", "Belgrade", "em", "##bas", "##sy", "on", "Monday", "under", "the", "name", "of", "the", "Macedonian", "Communist", "Party", "demanded", "South", "Korea", "release", "det", "##ained", "student", "leaders", ",", "a", "ministry", "spoke", "##sman", "said", "." ], "ids": [ 138, 19310, 10114, 10105, 48084, 10266, 21322, 16105, 10135, 40714, 10571, 10105, 11324, 10108, 10105, 92341, 33065, 12529, 78164, 11056, 14096, 14072, 10349, 65804, 16470, 24155, 117, 169, 65338, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "letter", "said", "the", "party", "would", "assault", "the", "em", "##bas", "##sy", ",", "other", "South", "Korean", "-", "related", "facilities", "and", "Korean", "national", "##s", "unless", "our", "authorities", "released", "arrested", "students", ",", "\"", "he", "said", "." ], "ids": [ 107, 10117, 19310, 12415, 10105, 14039, 10894, 50150, 10105, 10266, 21322, 16105, 117, 10684, 11056, 20501, 118, 16382, 24302, 10111, 20501, 11844, 10107, 60015, 17446, 28308, 11539, 29479, 13501, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Near", "##ly", "400", "members", "of", "an", "out", "##law", "##ed", "student", "group", "were", "arrested", "after", "violent", "protests", "demand", "##ing", "re", "##uni", "##fication", "with", "communist", "North", "Korea", "were", "c", "##rush", "##ed", "by", "rio", "##t", "police", "at", "a", "Seoul", "university", "this", "month", "." ], "ids": [ 16140, 10454, 11176, 12464, 10108, 10151, 10950, 37811, 10336, 16470, 11795, 10309, 29479, 10662, 43934, 60931, 34394, 10230, 11639, 23124, 22060, 10169, 64574, 11225, 14096, 10309, 171, 60796, 10336, 10155, 27244, 10123, 15034, 10160, 169, 26335, 19756, 10531, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Author", "##ities", "brand", "##ed", "the", "violence", ",", "in", "which", "a", "police", "officer", "was", "killed", ",", "as", "an", "act", "of", "terror", "." ], "ids": [ 57043, 17285, 23467, 10336, 10105, 26342, 117, 10106, 10319, 169, 15034, 19288, 10134, 15875, 117, 10146, 10151, 19833, 10108, 43143, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "ministry", "has", "ordered", "the", "em", "##bas", "##sy", "to", "take", "ur", "##gent", "security", "measures", "against", "possible", "terrorist", "attacks", ",", "\"", "the", "official", "said", ",", "asking", "not", "to", "be", "named", "." ], "ids": [ 107, 10117, 65338, 10393, 23782, 10105, 10266, 21322, 16105, 10114, 13574, 10399, 22500, 21849, 38606, 11327, 14128, 76482, 26483, 117, 107, 10105, 14731, 12415, 117, 72082, 10472, 10114, 10347, 12038, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "had", "called", "for", "similar", "pre", "##ca", "##ution", "##s", "at", "other", "overseas", "missions", ",", "including", "those", "in", "Canada", "and", "Bangladesh", "where", "left", "##ist", "groups", "have", "staged", "protests", "over", "the", "c", "##rack", "##down", "." ], "ids": [ 10377, 10374, 11552, 10142, 13213, 12229, 10425, 30861, 10107, 10160, 10684, 59391, 28836, 117, 11198, 12676, 10106, 11635, 10111, 24080, 10940, 12153, 11293, 15647, 10529, 84310, 60931, 10491, 10105, 171, 71189, 27160, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nuclear", "pa", "##ct", "will", "be", "a", "step", "to", "disa", "##rma", "##ment", "-", "China", "." ], "ids": [ 32176, 10931, 14526, 11337, 10347, 169, 31877, 10114, 36474, 25248, 10426, 118, 11593, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "27" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "on", "Tuesday", "re", "##aff", "##ir", "##med", "its", "support", "for", "a", "global", "nuclear", "test", "ban", "treaty", "blocked", "by", "India", "last", "week", ",", "saying", "the", "pa", "##ct", "would", "be", "an", "important", "step", "in", "achieving", "total", "nuclear", "disa", "##rma", "##ment", "." ], "ids": [ 11593, 10135, 70245, 11639, 100399, 10835, 21986, 10474, 13145, 10142, 169, 18331, 20761, 15839, 11915, 56353, 98935, 10155, 11098, 12469, 16118, 117, 22807, 10105, 10931, 14526, 10894, 10347, 10151, 12452, 31877, 10106, 102863, 11339, 20761, 36474, 25248, 10426, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Although", "the", "final", "draft", "of", "the", "treaty", "probably", "did", "n", "'", "t", "totally", "sat", "##is", "##fy", "any", "country", ",", "it", "was", "in", "general", "balance", "##d", ",", "\"", "the", "official", "People", "'", "s", "Daily", "newspaper", "said", "in", "a", "commentary", "." ], "ids": [ 107, 15785, 10105, 11070, 28447, 10108, 10105, 56353, 23282, 12172, 182, 112, 188, 110240, 20694, 10291, 24203, 11178, 12723, 117, 10271, 10134, 10106, 11389, 40162, 10162, 117, 107, 10105, 14731, 14235, 112, 187, 17252, 22047, 12415, 10106, 169, 62438, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "blocked", "the", "Comprehensive", "Test", "Ban", "Treaty", "(", "CT", "##B", "##T", ")", "at", "the", "Conference", "on", "Dis", "##arma", "##ment", "in", "Geneva", ",", "saying", "the", "pa", "##ct", "did", "not", "contain", "a", "clause", "com", "##mitting", "the", "five", "declared", "nuclear", "powers", "to", "a", "time", "##table", "for", "nuclear", "disa", "##rma", "##ment", "." ], "ids": [ 11098, 98935, 10105, 102301, 22495, 21631, 38031, 113, 45513, 11274, 11090, 114, 10160, 10105, 16424, 10135, 101270, 81008, 10426, 10106, 47244, 117, 22807, 10105, 10931, 14526, 12172, 10472, 36003, 169, 104911, 10212, 86074, 10105, 12403, 25019, 20761, 32043, 10114, 169, 10635, 30434, 10142, 20761, 36474, 25248, 10426, 119 ], "entity": [ "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 2, 6, 6, 6, 9, 2, 6, 6, 9, 9, 9, 2, 6, 6, 6, 6, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "Delhi", "'", "s", "stan", "##ce", ",", "which", "was", "seen", "as", "effectively", "th", "##wart", "##ing", "2", "-", "1", "/", "2", "years", "of", "negotiations", "at", "the", "Conference", "on", "Dis", "##arma", "##ment", ",", "drew", "widespread", "but", "generally", "mu", "##ted", "foreign", "criticism", "." ], "ids": [ 10287, 18720, 112, 187, 45244, 10419, 117, 10319, 10134, 15652, 10146, 46767, 77586, 44677, 10230, 123, 118, 122, 120, 123, 10855, 10108, 61946, 10160, 10105, 16424, 10135, 101270, 81008, 10426, 117, 49098, 48675, 10473, 18081, 12361, 11912, 20796, 43291, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "has", "also", "pl", "##ed", "##ged", "to", "oppose", "any", "forward", "##ing", "of", "the", "draft", "treaty", "to", "the", "United", "Nations", "General", "Assembly", "." ], "ids": [ 11098, 10393, 10379, 20648, 10336, 18832, 10114, 53037, 11178, 23307, 10230, 10108, 10105, 28447, 56353, 10114, 10105, 10609, 15145, 11220, 17918, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "China", "said", "many", "countries", "had", "com", "##pro", "##mised", "to", "complete", "the", "treaty", "and", "that", "the", "issue", "of", "a", "disa", "##rma", "##ment", "schedule", "could", "be", "discussed", "in", "future", "negotiations", "." ], "ids": [ 11593, 12415, 11299, 15911, 10374, 10212, 73099, 89301, 10114, 17876, 10105, 56353, 10111, 10189, 10105, 15557, 10108, 169, 36474, 25248, 10426, 52561, 12174, 10347, 55424, 10106, 16711, 61946, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "completion", "of", "the", "test", "ban", "treaty", "would", "be", "an", "important", "and", "practical", "step", "in", "the", "gradual", "process", "of", "achieving", "total", "nuclear", "disa", "##rma", "##ment", ",", "\"", "it", "said", "." ], "ids": [ 107, 10117, 45734, 10108, 10105, 15839, 11915, 56353, 10894, 10347, 10151, 12452, 10111, 52940, 31877, 10106, 10105, 102414, 15138, 10108, 102863, 11339, 20761, 36474, 25248, 10426, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "has", "pl", "##ed", "##ged", "support", "for", "the", "pa", "##ct", "since", "reaching", "a", "deal", "with", "the", "United", "States", "that", "made", "international", "inspection", "##s", "of", "nuclear", "sites", "more", "difficult", "than", "in", "earlier", "draft", "##s", "of", "the", "accord", "." ], "ids": [ 11593, 10393, 20648, 10336, 18832, 13145, 10142, 10105, 10931, 14526, 11764, 34186, 169, 19918, 10169, 10105, 10609, 10859, 10189, 11019, 12533, 99455, 10107, 10108, 20761, 16055, 10798, 25232, 11084, 10106, 18905, 28447, 10107, 10108, 10105, 35233, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "newspaper", "said", "China", "advocated", "the", "complete", "ban", "and", "destruction", "of", "nuclear", "weapons", "but", "that", "there", "was", "little", "hope", "other", "nuclear", "powers", "would", "soon", "adopt", "the", "same", "stan", "##ce", "." ], "ids": [ 10117, 22047, 12415, 11593, 109182, 10105, 17876, 11915, 10111, 33733, 10108, 20761, 31881, 10473, 10189, 11155, 10134, 16745, 50725, 10684, 20761, 32043, 10894, 17864, 106916, 10105, 11561, 45244, 10419, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Some", "nuclear", "powers", "stub", "##born", "##ly", "up", "##hold", "policies", "of", "nuclear", "det", "##erre", "##nce", "based", "on", "first", "use", "of", "nuclear", "weapons", ",", "\"", "it", "said", "." ], "ids": [ 107, 13885, 20761, 32043, 66337, 32315, 10454, 10741, 21671, 38572, 10108, 20761, 10349, 45084, 12150, 11610, 10135, 10422, 11760, 10108, 20761, 31881, 117, 107, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "held", "on", "July", "29", "what", "it", "said", "would", "be", "its", "last", "nuclear", "test", "before", "a", "self", "-", "imposed", "mora", "##torium", "that", "took", "effect", "the", "following", "day", "." ], "ids": [ 11593, 11991, 10135, 11112, 10386, 12976, 10271, 12415, 10894, 10347, 10474, 12469, 20761, 15839, 11360, 169, 16567, 118, 83358, 25528, 66978, 10189, 12149, 18514, 10105, 11901, 11940, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "was", "the", "last", "declared", "nuclear", "power", "to", "anno", "##unce", "a", "halt", "to", "testing", "." ], "ids": [ 11593, 10134, 10105, 12469, 25019, 20761, 13183, 10114, 11671, 93050, 169, 59334, 10114, 38306, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "de", "##cla", "##res", "food", "pois", "##oning", "threat", "re", "##ced", "##ing", "." ], "ids": [ 11891, 10104, 60582, 11234, 18301, 20487, 61499, 41256, 11639, 38039, 10230, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "27" ], "ids": [ 76531, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "said", "on", "Tuesday", "that", "the", "threat", "from", "a", "mysterious", "killer", "ger", "##m", ",", "while", "still", "requiring", "vi", "##gil", "##ance", ",", "appears", "to", "be", "re", "##ced", "##ing", "in", "the", "western", "Japan", "city", "of", "Sa", "##kai", ",", "where", "the", "epi", "##demi", "##c", "hit", "the", "hard", "##est", "." ], "ids": [ 10117, 12047, 12415, 10135, 70245, 10189, 10105, 41256, 10188, 169, 94982, 61976, 15554, 10147, 117, 11371, 12647, 74063, 13956, 32837, 16460, 117, 20296, 10114, 10347, 11639, 38039, 10230, 10106, 10105, 16672, 11891, 11584, 10108, 12404, 18511, 117, 10940, 10105, 17247, 108986, 10350, 14946, 10105, 19118, 13051, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "food", "pois", "##oning", "epi", "##demi", "##c", "caused", "by", "the", "O", "-", "157", "col", "##on", "ba", "##cil", "##lus", "in", "Sa", "##kai", "appears", "to", "be", "\"", "sett", "##ling", "down", "\"", ",", "Health", "Minister", "Na", "##oto", "Kan", "was", "quoted", "by", "a", "government", "spoke", "##sman", "as", "telling", "the", "cabinet", "." ], "ids": [ 10117, 18301, 20487, 61499, 17247, 108986, 10350, 19513, 10155, 10105, 152, 118, 21026, 12678, 10263, 15688, 34128, 14075, 10106, 12404, 18511, 20296, 10114, 10347, 107, 25115, 11945, 12935, 107, 117, 15931, 14355, 10685, 19235, 57528, 10134, 70676, 10155, 169, 12047, 50005, 24305, 10146, 61758, 10105, 33801, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "O", "-", "157", "col", "##on", "ba", "##cil", "##lus", "has", "been", "found", "responsible", "for", "a", "widespread", "food", "pois", "##oning", "epi", "##demi", "##c", "that", "has", "killed", "11", "people", "and", "made", "over", "9", ",", "500", "ill", "this", "year", "." ], "ids": [ 10117, 152, 118, 21026, 12678, 10263, 15688, 34128, 14075, 10393, 10590, 11823, 21586, 10142, 169, 48675, 18301, 20487, 61499, 17247, 108986, 10350, 10189, 10393, 15875, 10193, 11426, 10111, 11019, 10491, 130, 117, 10757, 32941, 10531, 10924, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sa", "##kai", ",", "near", "the", "regional", "commercial", "centre", "of", "Osaka", ",", "has", "been", "hit", "hard", "##est", "by", "the", "dead", "##ly", "bacteria", ",", "with", "nearly", "6", ",", "500", ",", "mostly", "school", "##child", "##ren", ",", "affected", "by", "the", "disease", "." ], "ids": [ 12404, 18511, 117, 12883, 10105, 16454, 17331, 12672, 10108, 30703, 117, 10393, 10590, 14946, 19118, 13051, 10155, 10105, 23457, 10454, 63318, 117, 10169, 21377, 127, 117, 10757, 117, 19774, 11393, 85123, 10969, 117, 36276, 10155, 10105, 21911, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "children", "in", "Sa", "##kai", "have", "died", "from", "com", "##plications", "associated", "with", "the", "bacteria", "." ], "ids": [ 13214, 12694, 10106, 12404, 18511, 10529, 12482, 10188, 10212, 71712, 18107, 10169, 10105, 63318, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kan", "told", "a", "cabinet", "meeting", "on", "Tuesday", "that", "no", "new", "victims", "have", "been", "reported", "since", "August", "8", ",", "indicating", "that", "the", "peak", "has", "passed", ",", "at", "least", "for", "Sa", "##kai", "." ], "ids": [ 57528, 21937, 169, 33801, 19822, 10135, 70245, 10189, 10192, 10751, 41205, 10529, 10590, 15943, 11764, 10735, 129, 117, 71346, 10189, 10105, 34200, 10393, 20006, 117, 10160, 16298, 10142, 12404, 18511, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Sa", "##kai", "officials", "agreed", "with", "the", "assessment", ",", "but", "said", "it", "was", "too", "early", "to", "feel", "relieve", "##d", "." ], "ids": [ 12404, 18511, 27730, 25577, 10169, 10105, 62492, 117, 10473, 12415, 10271, 10134, 16683, 11732, 10114, 38008, 85440, 10162, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "are", "still", "patients", "hospital", "##ised", "and", "problems", "which", "must", "be", "dealt", "with", ",", "\"", "a", "city", "spoke", "##sman", "said", ",", "citing", "the", "issue", "of", "whether", "to", "allow", "children", "in", "##fected", "with", "the", "bacteria", "but", "not", "showing", "symptoms", "to", "attend", "school", "from", "September", "." ], "ids": [ 107, 11723, 10301, 12647, 25965, 18141, 20666, 10111, 20390, 10319, 14982, 10347, 102810, 10169, 117, 107, 169, 11584, 50005, 24305, 12415, 117, 71306, 10105, 15557, 10108, 21883, 10114, 21992, 12694, 10106, 108881, 10169, 10105, 63318, 10473, 10472, 37501, 62319, 10114, 34465, 11393, 10188, 10596, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Health", "authorities", "believe", "school", "lu", "##nches", "were", "the", "source", "of", "the", "food", "pois", "##oning", "in", "Sa", "##kai", ",", "but", "researchers", "have", "been", "unable", "to", "pin", "##point", "the", "exact", "source", "of", "the", "infection", "." ], "ids": [ 15931, 28308, 30587, 11393, 14657, 101385, 10309, 10105, 15247, 10108, 10105, 18301, 20487, 61499, 10106, 12404, 18511, 117, 10473, 53719, 10529, 10590, 30553, 10114, 59227, 45676, 10105, 45809, 15247, 10108, 10105, 55223, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "outbreak", "has", "prompted", "authorities", "to", "tight", "##en", "san", "##itar", "##y", "standards", "at", "sl", "##au", "##ghter", "##houses", "and", "meat", "##pac", "##king", "plants", "and", "sp", "##ark", "##ed", "calls", "for", "an", "over", "##hau", "##l", "of", "the", "nation", "'", "s", "school", "lu", "##nch", "programme", "." ], "ids": [ 10117, 63831, 10393, 93003, 28308, 10114, 85202, 10136, 14608, 36111, 10157, 30381, 10160, 38523, 11705, 45953, 92520, 10111, 64080, 78560, 15629, 21422, 10111, 32650, 36269, 10336, 31886, 10142, 10151, 10491, 52332, 10161, 10108, 10105, 22274, 112, 187, 11393, 14657, 31215, 19611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ministers", "agreed", "at", "Tuesday", "'", "s", "cabinet", "meeting", "to", "step", "up", "inspection", "measures", "for", "school", "lu", "##nches", "in", "September", "and", "October", ",", "when", "schools", "around", "the", "country", "res", "##ume", "." ], "ids": [ 10117, 66281, 25577, 10160, 70245, 112, 187, 33801, 19822, 10114, 31877, 10741, 99455, 38606, 10142, 11393, 14657, 101385, 10106, 10596, 10111, 11212, 117, 10841, 16009, 12166, 10105, 12723, 39429, 20467, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "'", "s", "Agriculture", "Ministry", "also", "announced", "that", "it", "will", "com", "##pil", "##e", "hy", "##giene", "guide", "##lines", "based", "on", "U", ".", "S", ".", "government", "methods", "of", "check", "##ing", "the", "safety", "of", "farm", "produce", "to", "prevent", "another", "outbreak", "of", "the", "epi", "##demi", "##c", "." ], "ids": [ 11891, 112, 187, 30954, 19170, 10379, 13854, 10189, 10271, 11337, 10212, 30678, 10112, 15165, 79019, 25083, 31782, 11610, 10135, 158, 119, 156, 119, 12047, 27413, 10108, 43662, 10230, 10105, 27116, 10108, 30568, 17368, 10114, 29320, 12864, 63831, 10108, 10105, 17247, 108986, 10350, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "of", "Monday", ",", "31", "children", "were", "still", "hospital", "##ised", "in", "Sa", "##kai", "city", ",", "of", "whom", "six", "were", "in", "serious", "condition", "." ], "ids": [ 10882, 10108, 40714, 117, 10413, 12694, 10309, 12647, 18141, 20666, 10106, 12404, 18511, 11584, 117, 10108, 18104, 12449, 10309, 10106, 32342, 24713, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "aluminium", "ship", "##ments", "surge", "8", ".", "9", "p", "##ct", "in", "July", "." ], "ids": [ 11891, 58258, 17309, 14542, 69824, 129, 119, 130, 184, 14526, 10106, 11112, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "27" ], "ids": [ 76531, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japanese", "ship", "##ments", "of", "aluminium", "mill", "products", "in", "July", "surge", "##d", "8", ".", "9", "percent", "over", "the", "same", "month", "last", "year", "to", "224", ",", "609", "tonnes", ",", "while", "production", "rose", "6", ".", "4", "percent", "to", "222", ",", "457", "tonnes", ",", "according", "to", "preliminary", "data", "released", "on", "Tuesday", "by", "the", "Japan", "Al", "##umi", "##nium", "Federation", "." ], "ids": [ 13847, 17309, 14542, 10108, 58258, 43980, 20895, 10106, 11112, 69824, 10162, 129, 119, 130, 22362, 10491, 10105, 11561, 14064, 12469, 10924, 10114, 21652, 117, 52630, 39435, 117, 11371, 12116, 29467, 127, 119, 125, 22362, 10114, 22717, 117, 42950, 39435, 117, 18071, 10114, 68097, 11165, 11539, 10135, 70245, 10155, 10105, 11891, 10883, 17019, 23310, 18975, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "The", "surge", "reflected", "strong", "demand", "from", "the", "be", "##vera", "##ge", "can", "and", "housing", "construction", "sectors", ",", "fede", "##ration", "officials", "said", "." ], "ids": [ 10117, 69824, 74152, 18093, 34394, 10188, 10105, 10347, 45918, 10525, 10944, 10111, 24116, 13407, 69714, 117, 83482, 19466, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Figures", "released", "two", "weeks", "ago", "from", "Japan", "'", "s", "seven", "largest", "mills", "already", "showed", "that", "Japan", "'", "s", "can", "sheet", "output", "reached", "its", "highest", "monthly", "level", "ever", "in", "July", ",", "reflect", "##ing", "above", "-", "average", "temperatures", "that", "sp", "##ark", "##ed", "a", "jump", "in", "beer", "consumption", "." ], "ids": [ 105894, 11539, 10551, 20750, 36390, 10188, 11891, 112, 187, 15767, 15363, 102445, 19034, 27463, 10189, 11891, 112, 187, 10944, 55030, 37131, 17087, 10474, 18134, 61673, 13277, 17038, 10106, 11112, 117, 67569, 10230, 16038, 118, 13551, 45091, 10189, 32650, 36269, 10336, 169, 54941, 10106, 73768, 62556, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "fede", "##ration", "official", "added", "that", "the", "half", "-", "year", "through", "September", "1996", "also", "appeared", "likely", "to", "set", "a", "new", "record", "for", "can", "production", ",", "despite", "cool", "##er", "temperatures", "in", "August", "." ], "ids": [ 138, 83482, 19466, 14731, 16288, 10189, 10105, 13877, 118, 10924, 11222, 10596, 10389, 10379, 14565, 22497, 10114, 11847, 169, 10751, 12410, 10142, 10944, 12116, 117, 22087, 67420, 10165, 45091, 10106, 10735, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "July", "inventor", "##ies", "stood", "at", "75", ",", "632", "tonnes", ",", "down", "2", ".", "6", "percent", "from", "the", "prior", "month", "." ], "ids": [ 11112, 63204, 11624, 39320, 10160, 11417, 117, 47946, 39435, 117, 12935, 123, 119, 127, 22362, 10188, 10105, 20972, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "July", "foi", "##l", "output", "was", "off", "0", ".", "2", "percent", "year", "-", "on", "-", "year", "at", "11", ",", "525", "tonnes", ",", "while", "foi", "##l", "ship", "##ments", "fell", "0", ".", "8", "percent", "to", "11", ",", "244", "tonnes", "." ], "ids": [ 11112, 10448, 10161, 37131, 10134, 11898, 121, 119, 123, 22362, 10924, 118, 10135, 118, 10924, 10160, 10193, 117, 35316, 39435, 117, 11371, 10448, 10161, 17309, 14542, 25194, 121, 119, 129, 22362, 10114, 10193, 117, 27590, 39435, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "June", "mill", "output", "data", "were", "revised", "slightly", "down", "##ward", "to", "210", ",", "622", "tonnes", "from", "the", "preliminary", "210", ",", "683", ",", "while", "ship", "##ments", "were", "revised", "marginal", "##ly", "up", "##ward", "to", "213", ",", "989", "tonnes", "from", "213", ",", "845", "." ], "ids": [ 11120, 43980, 37131, 11165, 10309, 41226, 31603, 12935, 16988, 10114, 17131, 117, 56639, 39435, 10188, 10105, 68097, 17131, 117, 64070, 117, 11371, 17309, 14542, 10309, 41226, 92379, 10454, 10741, 16988, 10114, 22066, 117, 84019, 39435, 10188, 22066, 117, 60558, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Final", "figures", "for", "June", "pe", "##gged", "can", "stock", "ship", "##ments", "at", "40", ",", "144", "tonnes", ",", "up", "2", ".", "4", "percent", "year", "-", "on", "-", "year", "." ], "ids": [ 14924, 21068, 10142, 11120, 11161, 91518, 10944, 20511, 17309, 14542, 10160, 10533, 117, 18393, 39435, 117, 10741, 123, 119, 125, 22362, 10924, 118, 10135, 118, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ship", "##ments", "to", "the", "auto", "sector", "fell", "5", ".", "5", "percent", "to", "15", ",", "286", "tonnes", ",", "while", "the", "construction", "sector", "rose", "2", ".", "4", "percent", "to", "79", ",", "390", "tonnes", "." ], "ids": [ 51776, 14542, 10114, 10105, 18257, 17417, 25194, 126, 119, 126, 22362, 10114, 10208, 117, 28747, 39435, 117, 11371, 10105, 13407, 17417, 29467, 123, 119, 125, 22362, 10114, 12791, 117, 28323, 39435, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Export", "##s", "di", "##pped", "3", ".", "7", "percent", "to", "18", ",", "867", "tonnes", "." ], "ids": [ 108268, 10107, 10120, 44357, 124, 119, 128, 22362, 10114, 10218, 117, 68389, 39435, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Tokyo", "Com", "##mo", "##diti", "##es", "Des", "##k", "(", "81", "-", "3", "343", "##2", "617", "##9", ")" ], "ids": [ 118, 118, 15308, 16680, 11033, 63203, 10171, 13810, 10174, 113, 12324, 118, 124, 32007, 10729, 56159, 11373, 114 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "thanks", "Gabon", "for", "support", "on", "human", "rights", "." ], "ids": [ 11593, 69892, 54573, 10142, 13145, 10135, 14179, 16691, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "27" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "has", "publicly", "than", "##ked", "Gabon", "for", "its", "strong", "support", "at", "the", "United", "Nations", "Human", "Rights", "Commission", ",", "where", "Beijing", "has", "come", "under", "attack", "from", "Western", "nations", "for", "its", "human", "rights", "record", "." ], "ids": [ 11593, 10393, 53577, 11084, 30511, 54573, 10142, 10474, 18093, 13145, 10160, 10105, 10609, 15145, 15426, 22305, 14941, 117, 10940, 23824, 10393, 10678, 10571, 16342, 10188, 13163, 30683, 10142, 10474, 14179, 16691, 12410, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "'", "s", "President", "Jiang", "Ze", "##min", "offered", "his", "gra", "##titude", "in", "a", "meeting", "on", "Monday", "with", "visiting", "Gabon", "President", "Omar", "Bon", "##go", ",", "the", "official", "Xi", "##nh", "##ua", "news", "agency", "said", "." ], "ids": [ 11593, 112, 187, 12811, 68373, 15536, 14956, 20841, 10226, 63706, 51938, 10106, 169, 19822, 10135, 40714, 10169, 48780, 54573, 12811, 27221, 30120, 10797, 117, 10105, 14731, 59876, 16317, 11908, 14424, 34649, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 8, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Jiang", "also", "acknowledged", "the", "Central", "African", "nation", "'", "s", "support", "for", "China", "'", "s", "stan", "##ce", "on", "Taiwan", ",", "which", "Beijing", "views", "as", "a", "ren", "##ega", "##de", "province", ",", "while", "Bon", "##go", "was", "quoted", "as", "than", "##king", "China", "for", "economic", "and", "tech", "##nological", "aid", ",", "the", "agency", "said", "late", "on", "Monday", "." ], "ids": [ 68373, 10379, 87215, 10105, 11885, 13839, 22274, 112, 187, 13145, 10142, 11593, 112, 187, 45244, 10419, 10135, 19449, 117, 10319, 23824, 33396, 10146, 169, 63256, 19172, 10253, 14342, 117, 11371, 30120, 10797, 10134, 70676, 10146, 11084, 15629, 11593, 10142, 13925, 10111, 100986, 78226, 19778, 117, 10105, 34649, 12415, 13002, 10135, 40714, 119 ], "entity": [ "B-PER", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "April", ",", "China", "qua", "##shed", "a", "draft", "resolution", "by", "the", "U", ".", "N", ".", "Human", "Rights", "Commission", "express", "##ing", "concern", "over", "continuing", "reports", "of", "Beijing", "'", "s", "violation", "##s", "of", "fundamental", "freedom", "##s", "." ], "ids": [ 10167, 10780, 117, 11593, 14517, 42253, 169, 28447, 40017, 10155, 10105, 158, 119, 151, 119, 15426, 22305, 14941, 47620, 10230, 43607, 10491, 47635, 26610, 10108, 23824, 112, 187, 88993, 10107, 10108, 27971, 33700, 10107, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "the", "defeat", "of", "the", "resolution", ",", "drafted", "by", "the", "European", "Union", "and", "the", "United", "States", ",", "China", "'", "s", "Foreign", "Ministry", "than", "##ked", "26", "countries", "for", "backing", "its", "motion", "for", "\"", "no", "action", "\"", "on", "the", "document", "." ], "ids": [ 11301, 10105, 24800, 10108, 10105, 40017, 117, 55746, 10155, 10105, 11914, 11457, 10111, 10105, 10609, 10859, 117, 11593, 112, 187, 20277, 19170, 11084, 30511, 10314, 15911, 10142, 31962, 10474, 30107, 10142, 107, 10192, 14204, 107, 10135, 10105, 25166, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 5, 9, 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "the", "sixth", "year", "in", "a", "row", "that", "China", "avoid", "##ed", "cens", "##ure", "at", "the", "U", ".", "N", ".", "'", "s", "main", "human", "rights", "forum", "." ], "ids": [ 10377, 10134, 10105, 28913, 10924, 10106, 169, 45006, 10189, 11593, 33253, 10336, 29929, 12101, 10160, 10105, 158, 119, 151, 119, 112, 187, 12126, 14179, 16691, 47509, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "has", "been", "accused", "of", "a", "wide", "range", "of", "human", "rights", "abuse", "##s", ",", "often", "in", "violation", "of", "its", "own", "legal", "code", ",", "in", "an", "effort", "to", "silence", "disse", "##nt", "." ], "ids": [ 11593, 10393, 10590, 37303, 10108, 169, 18064, 15601, 10108, 14179, 16691, 51401, 10107, 117, 12899, 10106, 88993, 10108, 10474, 12542, 17139, 16964, 117, 10106, 10151, 24912, 10114, 72445, 15718, 10368, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Xi", "##nh", "##ua", "commentary", "earlier", "this", "year", "said", "a", "plot", "by", "the", "West", "to", "force", "its", "human", "rights", "standards", "and", "values", "on", "other", "countries", "was", "do", "##ome", "##d", "to", "failure", "." ], "ids": [ 138, 59876, 16317, 11908, 62438, 18905, 10531, 10924, 12415, 169, 32473, 10155, 10105, 11164, 10114, 15031, 10474, 14179, 16691, 30381, 10111, 31313, 10135, 10684, 15911, 10134, 10149, 22451, 10162, 10114, 31562, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Taiwan", "'", "s", "Cooper", "##ative", "Bank", "cuts", "prime", "len", "##ding", "rate", "." ], "ids": [ 19449, 112, 187, 18889, 44695, 13533, 73311, 19287, 28859, 13971, 18344, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TA", "##IP", "##E", "##I", "1996", "-", "08", "-", "27" ], "ids": [ 91075, 30331, 11259, 11281, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cooper", "##ative", "Bank", "of", "Taiwan", ",", "one", "of", "the", "island", "'", "s", "leading", "state", "-", "run", "banks", ",", "said", "it", "was", "cutting", "its", "prime", "len", "##ding", "rate", "by", "0", ".", "05", "percentage", "point", ",", "effective", "on", "Tuesday", "." ], "ids": [ 18889, 44695, 13533, 10108, 19449, 117, 10464, 10108, 10105, 17354, 112, 187, 16018, 11388, 118, 14095, 41375, 117, 12415, 10271, 10134, 63039, 10474, 19287, 28859, 13971, 18344, 10155, 121, 119, 10831, 46971, 12331, 117, 26874, 10135, 70245, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "bank", "said", "in", "a", "statement", "it", "was", "cutting", "its", "prime", "len", "##ding", "rate", "to", "7", ".", "35", "percent", "from", "7", ".", "40", "percent", "." ], "ids": [ 10117, 19423, 12415, 10106, 169, 33311, 10271, 10134, 63039, 10474, 19287, 28859, 13971, 18344, 10114, 128, 119, 10803, 22362, 10188, 128, 119, 10533, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "also", "would", "cut", "its", "three", "-", "month", "-", "to", "-", "three", "-", "year", "time", "de", "##posit", "rates", "by", "between", "0", ".", "05", "and", "0", ".", "10", "percentage", "points", "." ], "ids": [ 10377, 10379, 10894, 21610, 10474, 11003, 118, 14064, 118, 10114, 118, 11003, 118, 10924, 10635, 10104, 106185, 38200, 10155, 10948, 121, 119, 10831, 10111, 121, 119, 10150, 46971, 12789, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "moves", "made", "Cooper", "##ative", "the", "first", "major", "bank", "to", "cut", "rates", "in", "response", "to", "a", "call", "on", "Friday", "from", "central", "bank", "governor", "She", "##u", "Yuan", "-", "dong", "." ], "ids": [ 10117, 49157, 11019, 18889, 44695, 10105, 10422, 11922, 19423, 10114, 21610, 38200, 10106, 21001, 10114, 169, 20575, 10135, 30767, 10188, 12397, 19423, 28795, 11149, 10138, 40197, 118, 52200, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "In", "the", "central", "bank", "'", "s", "latest", "bid", "to", "jump", "##start", "Taiwan", "'", "s", "sl", "##ug", "##gis", "##h", "economy", ",", "She", "##u", "ordered", "a", "reduction", "of", "up", "to", "a", "half", "-", "percentage", "point", "in", "banks", "'", "reserve", "requirements", "and", "called", "on", "commercial", "banks", "to", "pass", "on", "the", "saving", "##s", "in", "the", "form", "of", "interest", "rate", "reduction", "##s", "." ], "ids": [ 10167, 10105, 12397, 19423, 112, 187, 50908, 50385, 10114, 54941, 78022, 19449, 112, 187, 38523, 19951, 22725, 10237, 27570, 117, 11149, 10138, 23782, 169, 51608, 10108, 10741, 10114, 169, 13877, 118, 46971, 12331, 10106, 41375, 112, 32608, 39282, 10111, 11552, 10135, 17331, 41375, 10114, 23392, 10135, 10105, 90682, 10107, 10106, 10105, 12188, 10108, 17644, 18344, 51608, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Taipei", "News", "##room", "(", "508", "##0", "##8", "##15", ")" ], "ids": [ 118, 118, 50291, 12219, 25525, 113, 40003, 10929, 11396, 37462, 114 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "##s", "to", "strike", "over", "Jerusalem", "demo", "##lition", "." ], "ids": [ 56119, 10107, 10114, 37456, 10491, 20599, 30776, 91177, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "27" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "leaders", "in", "Jerusalem", "called", "on", "Tuesday", "for", "a", "two", "-", "hour", "strike", "to", "protest", "what", "they", "called", "Israel", "'", "s", "war", "on", "Arab", "East", "Jerusalem", "after", "police", "demolished", "a", "building", "there", "." ], "ids": [ 56119, 24155, 10106, 20599, 11552, 10135, 70245, 10142, 169, 10551, 118, 24730, 37456, 10114, 36627, 12976, 10689, 11552, 12991, 112, 187, 10338, 10135, 17365, 11830, 20599, 10662, 15034, 49692, 169, 12585, 11155, 119 ], "entity": [ "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israeli", "police", "demolished", "a", "10", "metre", "(", "yard", ")", "by", "20", "metre", "structure", "in", "Jerusalem", "'", "s", "Old", "City", "they", "said", "had", "been", "built", "with", "funding", "from", "the", "Palestinian", "self", "-", "rule", "Authority", "for", "use", "as", "a", "social", "club", "." ], "ids": [ 28446, 15034, 49692, 169, 10150, 35843, 113, 27238, 114, 10155, 10197, 35843, 13926, 10106, 20599, 112, 187, 13773, 10773, 10689, 12415, 10374, 10590, 12183, 10169, 30446, 10188, 10105, 56119, 16567, 118, 21983, 26553, 10142, 11760, 10146, 169, 12142, 11111, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "used", "a", "huge", "c", "##rane", "to", "lift", "a", "bu", "##ll", "##do", "##zer", "over", "the", "Old", "City", "'", "s", "walls", "to", "reach", "the", "building", "ami", "##ds", "##t", "narrow", "alle", "##ys", ",", "witnesses", "said", "." ], "ids": [ 18051, 11031, 169, 42126, 171, 27275, 10114, 63376, 169, 11499, 11231, 10317, 14210, 10491, 10105, 13773, 10773, 112, 187, 32343, 10114, 24278, 10105, 12585, 16992, 13268, 10123, 41444, 10968, 12682, 117, 109898, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "By", "##stander", "##s", "at", "the", "scene", "said", "work", "had", "begun", "on", "the", "building", "in", "1991", "and", "it", "had", "yet", "to", "be", "completed", "when", "the", "Israeli", "police", "bu", "##ll", "##do", "##zed", "it", "." ], "ids": [ 12716, 64054, 10107, 10160, 10105, 18167, 12415, 11424, 10374, 49510, 10135, 10105, 12585, 10106, 10442, 10111, 10271, 10374, 21833, 10114, 10347, 15782, 10841, 10105, 28446, 15034, 11499, 11231, 10317, 18309, 10271, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Palestinian", "Authority", "was", "set", "up", "under", "the", "1993", "PL", "##O", "-", "Israel", "interim", "peace", "deal", "." ], "ids": [ 10117, 56119, 26553, 10134, 11847, 10741, 10571, 10105, 10463, 71341, 11403, 118, 12991, 63313, 28101, 19918, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "has", "been", "a", "call", "for", "a", "general", "strike", "between", "one", "(", "1000", "GMT", ")", "and", "three", "o", "'", "clock", ",", "\"", "Palestinian", "law", "##maker", "Ahmed", "Has", "##hem", "Zi", "##gha", "##yer", "told", "Reuters", "." ], "ids": [ 107, 11723, 10393, 10590, 169, 20575, 10142, 169, 11389, 37456, 10948, 10464, 113, 12186, 20362, 114, 10111, 11003, 183, 112, 52843, 117, 107, 56119, 13255, 32295, 25530, 45896, 25947, 99890, 102121, 17750, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 9 ] }, { "tokens": [ "\"", "This", "is", "a", "war", "that", "has", "been", "declared", "on", "us", "and", "we", "want", "our", "people", "to", "come", "and", "see", "the", "site", "where", "they", "declared", "the", "war", ".", "\"" ], "ids": [ 107, 10747, 10124, 169, 10338, 10189, 10393, 10590, 25019, 10135, 19626, 10111, 11951, 21528, 17446, 11426, 10114, 10678, 10111, 12888, 10105, 11920, 10940, 10689, 25019, 10105, 10338, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", "'", "s", "government", ",", "which", "took", "office", "in", "June", ",", "has", "said", "it", "will", "not", "allow", "the", "Authority", ",", "set", "up", "under", "a", "1993", "interim", "peace", "deal", "to", "control", "parts", "of", "the", "Gaza", "Strip", "and", "West", "Bank", ",", "to", "operate", "in", "Jerusalem", "." ], "ids": [ 19924, 14355, 16810, 32577, 36027, 13723, 112, 187, 12047, 117, 10319, 12149, 14301, 10106, 11120, 117, 10393, 12415, 10271, 11337, 10472, 21992, 10105, 26553, 117, 11847, 10741, 10571, 169, 10463, 63313, 28101, 19918, 10114, 12608, 15569, 10108, 10105, 42434, 79527, 10111, 11164, 13533, 117, 10114, 34307, 10106, 20599, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Israel", "'", "s", "previous", "government", "held", "the", "same", "position", "but", "in", "general", "turned", "a", "blind", "eye", "to", "Palestinian", "Authority", "activity", "in", "the", "city", "." ], "ids": [ 12991, 112, 187, 16741, 12047, 11991, 10105, 11561, 12956, 10473, 10106, 11389, 21031, 169, 59893, 32684, 10114, 56119, 26553, 22205, 10106, 10105, 11584, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tuesday", "'", "s", "demo", "##lition", "came", "a", "day", "after", "PL", "##O", "officials", "said", "they", "had", "bow", "##ed", "to", "Net", "##anya", "##hu", "'", "s", "demand", "they", "close", "offices", "in", "Jerusalem", "." ], "ids": [ 70245, 112, 187, 30776, 91177, 13383, 169, 11940, 10662, 71341, 11403, 27730, 12415, 10689, 10374, 98073, 10336, 10114, 32577, 36027, 13723, 112, 187, 34394, 10689, 16065, 29918, 10106, 20599, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "They", "said", "two", "of", "the", "three", "offices", "Israel", "wanted", "closed", "had", "been", "shut", "." ], "ids": [ 11696, 12415, 10551, 10108, 10105, 11003, 29918, 12991, 22591, 18440, 10374, 10590, 70323, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "##anya", "##hu", "has", "made", "closure", "of", "the", "three", "offices", "a", "condition", "for", "res", "##umi", "##ng", "peace", "negotiations", "with", "the", "Palestine", "Liberation", "Organisation", "(", "PL", "##O", ")", "." ], "ids": [ 32577, 36027, 13723, 10393, 11019, 69177, 10108, 10105, 11003, 29918, 169, 24713, 10142, 39429, 17019, 10376, 28101, 61946, 10169, 10105, 31566, 54766, 22223, 113, 71341, 11403, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Israel", "captured", "Arab", "East", "Jerusalem", "in", "the", "1967", "Middle", "East", "war", "and", "ann", "##ex", "##ed", "it", "." ], "ids": [ 12991, 25030, 17365, 11830, 20599, 10106, 10105, 10800, 15441, 11830, 10338, 10111, 28481, 28580, 10336, 10271, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 5, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "says", "it", "will", "never", "ce", "##de", "any", "part", "of", "the", "city", "." ], "ids": [ 10377, 22153, 10271, 11337, 14794, 10794, 10253, 11178, 10668, 10108, 10105, 11584, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "##s", "want", "East", "Jerusalem", "as", "capital", "of", "a", "future", "state", "." ], "ids": [ 56119, 10107, 21528, 11830, 20599, 10146, 12185, 10108, 169, 16711, 11388, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "city", "is", "up", "for", "nego", "##tia", "##tion", "at", "final", "peace", "talks", "which", "have", "yet", "to", "res", "##ume", "under", "Net", "##anya", "##hu", "." ], "ids": [ 10117, 11584, 10124, 10741, 10142, 21134, 16180, 10822, 10160, 11070, 28101, 56672, 10319, 10529, 21833, 10114, 39429, 20467, 10571, 32577, 36027, 13723, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "SEC", "adopt", "##s", "rules", "to", "improve", "in", "##vestor", "access", "to", "best", "stock", "prices", "." ], "ids": [ 92031, 106916, 10107, 23123, 10114, 33992, 10106, 83436, 18314, 10114, 12504, 20511, 57476, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Sec", "##urities", "and", "Exchange", "Commission", "Wednesday", "approved", "rules", "designed", "to", "give", "stock", "market", "investors", "a", "better", "chance", "at", "getting", "the", "best", "price", "available", "for", "their", "orders", "." ], "ids": [ 10117, 109754, 82073, 10111, 32424, 14941, 57611, 29855, 23123, 15513, 10114, 18090, 20511, 17313, 83795, 169, 18322, 27893, 10160, 34875, 10105, 12504, 30839, 14579, 10142, 10455, 31303, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "so", "-", "called", "order", "handling", "rules", ",", "which", "were", "proposed", "last", "September", ",", "were", "approved", "in", "a", "4", "-", "0", "vote", "." ], "ids": [ 10117, 10380, 118, 11552, 12990, 52703, 23123, 117, 10319, 10309, 21622, 12469, 10596, 117, 10309, 29855, 10106, 169, 125, 118, 121, 18926, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "new", "rules", "will", "require", "specialist", "##s", "at", "stock", "exchange", "##s", "and", "market", "makers", "on", "Nas", "##da", "##q", "to", "allow", "customers", "to", "view", "price", "quo", "##tes", "from", "other", "electronic", "trading", "systems", "that", "may", "not", "be", "read", "##ily", "available", "to", "them", "." ], "ids": [ 10117, 10751, 23123, 11337, 35742, 64956, 10107, 10160, 20511, 27714, 10107, 10111, 17313, 104213, 10135, 40751, 10229, 11703, 10114, 21992, 49260, 10114, 17904, 30839, 48718, 11197, 10188, 10684, 20837, 46663, 16768, 10189, 11387, 10472, 10347, 24944, 32464, 14579, 10114, 11345, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rules", "will", "also", "require", "that", "customer", "limit", "orders", "be", "displayed", "with", "prices", "better", "than", "those", "available", "in", "quo", "##tes", "publicly", "available", "at", "the", "time", "." ], "ids": [ 10117, 23123, 11337, 10379, 35742, 10189, 72378, 34316, 31303, 10347, 52991, 10169, 57476, 18322, 11084, 12676, 14579, 10106, 48718, 11197, 53577, 14579, 10160, 10105, 10635, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Special", "##ists", "and", "market", "makers", "are", "companies", "or", "individuals", "recognised", "as", "qualified", "to", "maintain", "an", "order", "##ly", "market", "in", "a", "stock", "." ], "ids": [ 13690, 18206, 10111, 17313, 104213, 10301, 18866, 10345, 20143, 59344, 10146, 32244, 10114, 37215, 10151, 12990, 10454, 17313, 10106, 169, 20511, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "limit", "order", ",", "investors", "sp", "##eci", "##fy", "the", "price", "at", "which", "they", "are", "willing", "to", "buy", "or", "sell", ",", "as", "opposed", "to", "a", "market", "order", "executed", "at", "pre", "##vai", "##ling", "prices", "." ], "ids": [ 10167, 169, 34316, 12990, 117, 83795, 32650, 95076, 24203, 10105, 30839, 10160, 10319, 10689, 10301, 87615, 10114, 47715, 10345, 36300, 117, 10146, 30488, 10114, 169, 17313, 12990, 45955, 10160, 12229, 37557, 11945, 57476, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "These", "rules", "are", "intended", "to", "em", "##power", "all", "investors", ",", "by", "allowing", "their", "orders", "to", "compete", "on", "a", "level", "playing", "field", ",", "and", "by", "providing", "the", "disc", "##los", "##ure", "they", "need", "to", "make", "informed", "decisions", ",", "\"", "said", "SEC", "Chairman", "Arthur", "Levi", "##tt", "." ], "ids": [ 107, 13252, 23123, 10301, 24071, 10114, 10266, 65211, 10435, 83795, 117, 10155, 28357, 10455, 31303, 10114, 33400, 10135, 169, 13277, 14879, 13939, 117, 10111, 10155, 26099, 10105, 27224, 13788, 12101, 10689, 17367, 10114, 13086, 64330, 48126, 117, 107, 12415, 92031, 28635, 13134, 33875, 11527, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9 ] }, { "tokens": [ "The", "SEC", "'", "s", "goal", ",", "he", "added", ",", "was", "to", "create", "\"", "one", "system", "where", "one", "price", "could", "be", "available", "to", "every", "##body", ".", "\"" ], "ids": [ 10117, 92031, 112, 187, 16586, 117, 10261, 16288, 117, 10134, 10114, 18842, 107, 10464, 11787, 10940, 10464, 30839, 12174, 10347, 14579, 10114, 14234, 38078, 119, 107 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "director", "of", "the", "SEC", "'", "s", "division", "of", "market", "regulation", ",", "Richard", "Lindsey", ",", "said", "Wall", "Street", "firms", "will", "probably", "need", "to", "spend", "about", "$", "7", "million", "to", "carry", "out", "the", "improvements", "called", "for", "by", "the", "new", "rules", "." ], "ids": [ 10117, 12461, 10108, 10105, 92031, 112, 187, 13751, 10108, 17313, 57939, 117, 11118, 89132, 117, 12415, 19523, 11962, 84459, 11337, 23282, 17367, 10114, 63222, 10978, 109, 128, 12473, 10114, 31626, 10950, 10105, 67907, 11552, 10142, 10155, 10105, 10751, 23123, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "propos", "##ing", "the", "rules", "last", "year", ",", "the", "SEC", "noted", "that", "while", "technology", "has", "improved", ",", "common", "##place", "practices", "still", "existed", "that", "worked", "against", "investors", "'", "best", "interests", "." ], "ids": [ 10167, 50096, 10230, 10105, 23123, 12469, 10924, 117, 10105, 92031, 18575, 10189, 11371, 19765, 10393, 34605, 117, 14624, 30236, 41011, 12647, 45548, 10189, 13858, 11327, 83795, 112, 12504, 36026, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "noted", "that", "customers", "whose", "orders", "were", "not", "displayed", "lost", "the", "chance", "of", "getting", "the", "best", "possible", "price", "available", "in", "the", "market", "." ], "ids": [ 10377, 18575, 10189, 49260, 16879, 31303, 10309, 10472, 52991, 14172, 10105, 27893, 10108, 34875, 10105, 12504, 14128, 30839, 14579, 10106, 10105, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "also", "cited", "the", "potential", "problem", "of", "a", "two", "-", "tier", "##ed", "market", "in", "which", "market", "makers", "quo", "##te", "one", "price", "to", "public", "investors", "while", "quo", "##ting", "better", "prices", "in", "private", "systems", ",", "thus", "ro", "##bbi", "##ng", "investors", "without", "access", "to", "\"", "hidden", "\"", "quo", "##tes", "the", "benefit", "of", "the", "best", "available", "prices", "." ], "ids": [ 10377, 10379, 41164, 10105, 23078, 18077, 10108, 169, 10551, 118, 60704, 10336, 17313, 10106, 10319, 17313, 104213, 48718, 10216, 10464, 30839, 10114, 11683, 83795, 11371, 48718, 12141, 18322, 57476, 10106, 14591, 16768, 117, 18450, 25470, 37801, 10376, 83795, 13663, 18314, 10114, 107, 57786, 107, 48718, 11197, 10105, 43074, 10108, 10105, 12504, 14579, 57476, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Earl", "##ier", "this", "month", ",", "the", "SEC", "settled", "charges", "of", "alleged", "mal", "##pra", "##ctic", "##es", "on", "Nas", "##da", "##q", "when", "the", "parent", "of", "the", "Nas", "##da", "##q", "market", ",", "the", "National", "Association", "of", "Sec", "##urities", "Deal", "##ers", ",", "agreed", "to", "spend", "$", "100", "million", "over", "five", "years", "to", "upgrade", "its", "over", "##sig", "##ht", "of", "broke", "##rs", "'", "trading", "practices", "." ], "ids": [ 18877, 11709, 10531, 14064, 117, 10105, 92031, 29014, 31128, 10108, 48164, 15189, 30631, 35672, 10171, 10135, 40751, 10229, 11703, 10841, 10105, 43045, 10108, 10105, 40751, 10229, 11703, 17313, 117, 10105, 10655, 11751, 10108, 109754, 82073, 54521, 10901, 117, 25577, 10114, 63222, 109, 10407, 12473, 10491, 12403, 10855, 10114, 107003, 10474, 10491, 45283, 13599, 10108, 30500, 10943, 112, 46663, 41011, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "SEC", "dropped", "a", "third", "proposal", "that", "would", "have", "allowed", "investors", "with", "market", "orders", "to", "trade", "at", "a", "better", "price", "if", "there", "were", "shift", "##s", "in", "prices", "before", "their", "orders", "were", "executed", "." ], "ids": [ 10117, 92031, 30241, 169, 12628, 43542, 10189, 10894, 10529, 18162, 83795, 10169, 17313, 31303, 10114, 18908, 10160, 169, 18322, 30839, 12277, 11155, 10309, 51467, 10107, 10106, 57476, 11360, 10455, 31303, 10309, 45955, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "agency", "said", "it", "would", "monitor", "effects", "of", "the", "two", "new", "rules", "before", "considering", "the", "\"", "price", "improvement", "\"", "proposal", "again", "." ], "ids": [ 10117, 34649, 12415, 10271, 10894, 60774, 21274, 10108, 10105, 10551, 10751, 23123, 11360, 81243, 10105, 107, 30839, 70010, 107, 43542, 13123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "agency", "also", "proposed", "rule", "changes", "that", "would", "require", "continuous", "\"", "bid", "\"", "and", "\"", "ask", "\"", "quota", "##tions", "from", "exchange", "specialist", "##s", "and", "market", "makers", "who", "trade", "more", "than", "1", "percent", "of", "a", "stock", "during", "any", "quarter", "on", "Nas", "##da", "##q", "." ], "ids": [ 10117, 34649, 10379, 21622, 21983, 19010, 10189, 10894, 35742, 51035, 107, 50385, 107, 10111, 107, 63001, 107, 59027, 15024, 10188, 27714, 64956, 10107, 10111, 17313, 104213, 10479, 18908, 10798, 11084, 122, 22362, 10108, 169, 20511, 10939, 11178, 28330, 10135, 40751, 10229, 11703, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "The", "SEC", "'", "s", "limit", "order", "display", "rule", "will", "mean", "a", "major", "change", "for", "Nas", "##da", "##q", ",", "where", "such", "orders", "have", "never", "been", "displayed", "." ], "ids": [ 10117, 92031, 112, 187, 34316, 12990, 28179, 21983, 11337, 36110, 169, 11922, 15453, 10142, 40751, 10229, 11703, 117, 10940, 11049, 31303, 10529, 14794, 10590, 52991, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "president", "of", "the", "Nas", "##da", "##q", ",", "Alfred", "Berkeley", ",", "was", "to", "hold", "a", "news", "conference", "Wednesday", "afternoon", "to", "elaborate", "on", "the", "new", "rules", "'", "effects", "on", "the", "market", ",", "the", "second", "largest", "in", "the", "world", "." ], "ids": [ 10117, 12931, 10108, 10105, 40751, 10229, 11703, 117, 13730, 22218, 117, 10134, 10114, 18500, 169, 14424, 25029, 57611, 73213, 10114, 90052, 10135, 10105, 10751, 23123, 112, 21274, 10135, 10105, 17313, 117, 10105, 11132, 15363, 10106, 10105, 11356, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IT", "##AL", "##IA", "##N", "CA", "##B", "##INE", "##T", "AP", "##PR", "##O", "##VE", "##S", "T", "##EL", "##E", "##VI", "##SI", "##ON", "DE", "##C", "##RE", "##E", "." ], "ids": [ 26956, 32002, 35976, 11537, 24707, 11274, 83198, 11090, 30909, 73386, 11403, 68560, 10731, 157, 68999, 11259, 90939, 44802, 30118, 25067, 10858, 66014, 11259, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ROM", "##E", "1996", "-", "08", "-", "28" ], "ids": [ 41068, 11259, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Italian", "cabinet", "on", "Wednesday", "granted", "a", "rep", "##rie", "##ve", "for", "media", "mogu", "##l", "Silvio", "Berlusconi", "'", "s", "Media", "##set", "television", "empire", "with", "a", "decree", "extending", "the", "current", "legal", "framework", "for", "television", "stations", "until", "January", "31", ",", "1997", "." ], "ids": [ 10117, 11667, 33801, 10135, 57611, 26964, 169, 76456, 12904, 10612, 10142, 12518, 22347, 10161, 49840, 99654, 112, 187, 13341, 14488, 14162, 34873, 10169, 169, 109157, 73240, 10105, 14978, 17139, 54387, 10142, 14162, 18592, 11444, 11238, 10413, 117, 10391, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "decree", "plu", "##gs", "a", "legal", "void", "in", "which", "mag", "##istrat", "##es", "could", "have", "forced", "the", "former", "prime", "minister", "to", "take", "one", "of", "the", "three", "stations", "he", "controls", "off", "the", "air", "because", "of", "a", "court", "ruling", "that", "no", "single", "proprie", "##tor", "should", "be", "allowed", "to", "keep", "three", "channels", "." ], "ids": [ 10117, 109157, 13651, 15703, 169, 17139, 65099, 10106, 10319, 20722, 65293, 10171, 12174, 10529, 20054, 10105, 11775, 19287, 16930, 10114, 13574, 10464, 10108, 10105, 11003, 18592, 10261, 59897, 11898, 10105, 12566, 12373, 10108, 169, 14866, 50788, 10189, 10192, 11376, 47212, 11813, 14819, 10347, 18162, 10114, 23819, 11003, 48101, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pass", "##enger", "##s", "injured", "in", "train", "collision", "in", "Linz", "." ], "ids": [ 30598, 102591, 10107, 36081, 10106, 17767, 94460, 10106, 45064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "L", "##IN", "##Z", ",", "Austria", "1996", "-", "08", "-", "28" ], "ids": [ 149, 27128, 13966, 117, 14479, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "passenger", "train", "coll", "##ide", "##d", "with", "a", "locomotive", "at", "a", "main", "railway", "station", "in", "Linz", "on", "Wednesday", "and", "police", "said", "around", "10", "people", "were", "injured", "." ], "ids": [ 138, 33155, 17767, 28552, 13315, 10162, 10169, 169, 48912, 10160, 169, 12126, 18271, 11825, 10106, 45064, 10135, 57611, 10111, 15034, 12415, 12166, 10150, 11426, 10309, 36081, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Austrian", "television", "reported", "earlier", "that", "more", "than", "20", "had", "been", "hur", "##t", "in", "the", "accident", "at", "the", "station", "in", "Linz", ",", "300", "km", "(", "180", "miles", ")", "west", "of", "Vienna", "." ], "ids": [ 32201, 14162, 15943, 18905, 10189, 10798, 11084, 10197, 10374, 10590, 52824, 10123, 10106, 10105, 25037, 10160, 10105, 11825, 10106, 45064, 117, 11093, 10204, 113, 13912, 14148, 114, 13735, 10108, 20590, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "One", "locomotive", "was", "station", "##ary", "and", "the", "passenger", "train", "coll", "##ide", "##d", "into", "the", "back", "of", "it", ",", "\"", "a", "police", "spoke", "##sman", "in", "Linz", "told", "Reuters", "by", "telephone", "." ], "ids": [ 107, 11340, 48912, 10134, 11825, 14926, 10111, 10105, 33155, 17767, 28552, 13315, 10162, 10708, 10105, 12014, 10108, 10271, 117, 107, 169, 15034, 50005, 24305, 10106, 45064, 21937, 46617, 10155, 69009, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 3, 9, 9, 9 ] }, { "tokens": [ "The", "express", "passenger", "train", "travelling", "from", "St", "##ey", "##r", ",", "southeast", "of", "Linz", ",", "with", "around", "80", "people", "on", "board", ",", "hit", "the", "back", "of", "a", "service", "locomotive", "used", "to", "shu", "##nt", "wagon", "##s", "into", "sid", "##ings", "." ], "ids": [ 10117, 47620, 33155, 17767, 81353, 10188, 10838, 13005, 10129, 117, 36798, 10108, 45064, 117, 10169, 12166, 10832, 11426, 10135, 17936, 117, 14946, 10105, 12014, 10108, 169, 11989, 48912, 11031, 10114, 73495, 10368, 98252, 10107, 10708, 71927, 18800, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "police", "spoke", "##sman", "said", "he", "was", "not", "sure", "whether", "any", "more", "passengers", "were", "still", "trap", "##ped", "in", "the", "w", "##reck", "##age", "." ], "ids": [ 10117, 15034, 50005, 24305, 12415, 10261, 10134, 10472, 62452, 21883, 11178, 10798, 37008, 10309, 12647, 72398, 16898, 10106, 10105, 191, 80442, 12276, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Doctor", "##s", "and", "medical", "staff", "from", "a", "hospital", "across", "the", "road", "from", "the", "station", "were", "at", "the", "scene", "of", "the", "accident", "within", "minutes", "and", "were", "able", "to", "treat", "the", "injured", "quickly", ",", "he", "added", "." ], "ids": [ 17376, 10107, 10111, 19436, 18927, 10188, 169, 18141, 15130, 10105, 15485, 10188, 10105, 11825, 10309, 10160, 10105, 18167, 10108, 10105, 25037, 12381, 15304, 10111, 10309, 16197, 10114, 81634, 10105, 36081, 23590, 117, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Greater", "damage", "was", "aver", "##ted", "as", "the", "driver", "of", "the", "passenger", "train", "had", "time", "to", "apply", "his", "emergency", "brak", "##es", "before", "the", "collision", "occurred", ",", "a", "state", "railway", "##s", "spoke", "##sman", "told", "Austrian", "news", "agency", "AP", "##A", "." ], "ids": [ 32543, 26115, 10134, 15122, 11912, 10146, 10105, 25926, 10108, 10105, 33155, 17767, 10374, 10635, 10114, 48515, 10226, 44461, 40225, 10171, 11360, 10105, 94460, 25738, 117, 169, 11388, 18271, 10107, 50005, 24305, 21937, 32201, 14424, 34649, 30909, 10738, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Saskatchewan", "W", "##hea", "##t", "Pool", "eyes", "ho", "##g", "market", "." ], "ids": [ 39587, 160, 45546, 10123, 49579, 38144, 13173, 10240, 17313, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##IN", "##NI", "##P", "##EG", "1996", "-", "08", "-", "28" ], "ids": [ 160, 27128, 52898, 11127, 104036, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Canada", "'", "s", "largest", "grain", "handling", "firm", "said", "Wednesday", "it", "ex", "##pects", "to", "for", "##ge", "a", "partnership", "with", "ho", "##g", "farmers", "by", "1997", "with", "a", "view", "to", "expanding", "the", "company", "'", "s", "scope", "into", "por", "##k", "production", "." ], "ids": [ 11635, 112, 187, 15363, 69132, 52703, 23410, 12415, 57611, 10271, 11419, 92385, 10114, 10142, 10525, 169, 36944, 10169, 13173, 10240, 55543, 10155, 10391, 10169, 169, 17904, 10114, 82158, 10105, 12100, 112, 187, 85037, 10708, 10183, 10174, 12116, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Saskatchewan", "is", "well", "position", "##ed", "to", "take", "advantage", "of", "growing", "world", "markets", "for", "por", "##k", ",", "\"", "Saskatchewan", "W", "##hea", "##t", "Pool", "chief", "executive", "Don", "Loew", "##en", "said", "in", "a", "company", "statement", "." ], "ids": [ 107, 39587, 10124, 11206, 12956, 10336, 10114, 13574, 38119, 10108, 25566, 11356, 42893, 10142, 10183, 10174, 117, 107, 39587, 160, 45546, 10123, 49579, 19421, 22676, 11740, 109904, 10136, 12415, 10106, 169, 12100, 33311, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SW", "##P", "said", "it", "was", "anal", "##y", "##zing", "potential", "partnership", "##s", "with", "ho", "##g", "farmers", "and", "expected", "the", "first", "deal", "to", "be", "in", "place", "in", "1997", "." ], "ids": [ 92438, 11127, 12415, 10271, 10134, 106615, 10157, 19308, 23078, 36944, 10107, 10169, 13173, 10240, 55543, 10111, 25973, 10105, 10422, 19918, 10114, 10347, 10106, 11192, 10106, 10391, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "end", "of", "Canada", "'", "s", "rail", "freight", "sub", "##sid", "##y", "last", "year", "caused", "a", "shift", "in", "feed", "grain", "production", "to", "the", "eastern", "Prairie", "." ], "ids": [ 10117, 11572, 10108, 11635, 112, 187, 29547, 75843, 13987, 34396, 10157, 12469, 10924, 19513, 169, 51467, 10106, 44988, 69132, 12116, 10114, 10105, 18677, 57105, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ana", "##lys", "##ts", "said", "lives", "##tock", "production", "would", "likely", "shift", "to", "the", "eastern", "Prairie", "rather", "than", "feed", "grain", "##s", "being", "ship", "##ped", "to", "the", "western", "Prairie", "." ], "ids": [ 16377, 52176, 10806, 12415, 21418, 60458, 12116, 10894, 22497, 51467, 10114, 10105, 18677, 57105, 16863, 11084, 44988, 69132, 10107, 11223, 17309, 16898, 10114, 10105, 16672, 57105, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SW", "##P", "said", "it", "may", "develop", "por", "##k", "production", "systems", "that", "provide", "farmers", "with", "large", "integrated", "units", ",", "and", "it", "may", "consider", "contract", "##ing", "programs", "between", "producers", "and", "pack", "##ers", "which", "would", "operate", "within", "the", "existing", "ho", "##g", "market", "framework", "." ], "ids": [ 92438, 11127, 12415, 10271, 11387, 26800, 10183, 10174, 12116, 16768, 10189, 16871, 55543, 10169, 12077, 47833, 17163, 117, 10111, 10271, 11387, 44856, 16108, 10230, 19316, 10948, 46511, 10111, 78978, 10901, 10319, 10894, 34307, 12381, 10105, 26636, 13173, 10240, 17313, 54387, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Saskatchewan", "Por", "##k", "International", "Marketing", "Group", "has", "an", "export", "mono", "##poly", "but", "some", "Saskatchewan", "farmers", "earlier", "this", "month", "called", "for", "an", "open", "market", "in", "ho", "##gs", "." ], "ids": [ 39587, 12399, 10174, 10771, 46842, 12054, 10393, 10151, 59220, 70997, 91733, 10473, 11152, 39587, 55543, 18905, 10531, 14064, 11552, 10142, 10151, 14087, 17313, 10106, 13173, 15703, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Gilbert", "Le", "G", "##ras", "204", "947", "354", "##8" ], "ids": [ 118, 118, 18608, 10281, 144, 12783, 22253, 81188, 33540, 11396 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "R", "##O", "##VE", "##RE", "##TO", "IN", "##TER", "##NA", "##TION", "##AL", "ME", "##ET", "##ING", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 155, 11403, 68560, 66014, 60493, 36351, 99552, 36742, 98207, 32002, 47430, 52338, 50183, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##O", "##VE", "##RE", "##TO", ",", "Italy", "1996", "-", "08", "-", "28" ], "ids": [ 155, 11403, 68560, 66014, 60493, 117, 11619, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "from", "an" ], "ids": [ 100085, 17466, 10188, 10151 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "international", "athletics", "meeting", "on", "Wednesday", ":" ], "ids": [ 12533, 98600, 19822, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "long", "jump", ":" ], "ids": [ 13536, 112, 187, 11695, 54941, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Lu", "##d", "##mila", "Nino", "##va", "(", "Austria", ")", "6", ".", "72", "metres" ], "ids": [ 122, 119, 23859, 10162, 35634, 57086, 10362, 113, 14479, 114, 127, 119, 12120, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "He", "##ike", "Dre", "##chs", "##ler", "(", "Germany", ")", "6", ".", "65" ], "ids": [ 123, 119, 10357, 21353, 72531, 42008, 10815, 113, 12775, 114, 127, 119, 10843 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Fiona", "May", "(", "Italy", ")", "6", ".", "64" ], "ids": [ 124, 119, 82503, 10725, 113, 11619, 114, 127, 119, 11295 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "110", "metres", "hur", "##dles", ":" ], "ids": [ 13026, 112, 187, 13057, 16393, 52824, 92503, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Emilio", "Valle", "(", "Cuba", ")", "13", ".", "42", "seconds" ], "ids": [ 122, 119, 27341, 19159, 113, 17226, 114, 10249, 119, 11276, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Steve", "Brown", "(", "U", ".", "S", ".", ")", "13", ".", "45" ], "ids": [ 123, 119, 13308, 12623, 113, 158, 119, 156, 119, 114, 10249, 119, 10827 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Andrea", "Gia", "##con", "##i", "(", "Italy", ")", "13", ".", "80" ], "ids": [ 124, 119, 16101, 42106, 23486, 10116, 113, 11619, 114, 10249, 119, 10832 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "100", "metres", ":" ], "ids": [ 13536, 112, 187, 10407, 16393, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Chandra", "St", "##ur", "##rup", "(", "Bahamas", ")", "11", ".", "34", "seconds" ], "ids": [ 122, 119, 67169, 10838, 10546, 36660, 113, 64534, 114, 10193, 119, 11069, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Natal", "##ya", "Vor", "##ono", "##va", "(", "Russia", ")", "11", ".", "53" ], "ids": [ 123, 119, 36024, 10679, 28099, 12507, 10362, 113, 14664, 114, 10193, 119, 11756 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Ga", "##bi", "Rok", "##mei", "##er", "(", "Germany", ")", "11", ".", "61" ], "ids": [ 124, 119, 69699, 11645, 51588, 54534, 10165, 113, 12775, 114, 10193, 119, 12314 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "ja", "##veli", "##n", ":" ], "ids": [ 13026, 112, 187, 10201, 57318, 10115, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Sergey", "Maka", "##rov", "(", "Russia", ")", "85", ".", "26", "metres" ], "ids": [ 122, 119, 86453, 103960, 23229, 113, 14664, 114, 12017, 119, 10314, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Tom", "P", "##uks", "##tys", "(", "U", ".", "S", ".", ")", "84", ".", "20" ], "ids": [ 123, 119, 12275, 153, 75706, 47917, 113, 158, 119, 156, 119, 114, 11761, 119, 10197 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Peter", "B", "##lank", "(", "Germany", ")", "81", ".", "64" ], "ids": [ 124, 119, 10979, 139, 83963, 113, 12775, 114, 12324, 119, 11295 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "100", "metres", ":" ], "ids": [ 13026, 112, 187, 10407, 16393, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Os", "##mond", "Ez", "##in", "##wa", "(", "Nigeria", ")", "10", ".", "13", "seconds" ], "ids": [ 122, 119, 12087, 25677, 17599, 10245, 11037, 113, 22045, 114, 10150, 119, 10249, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Davidson", "Ez", "##in", "##wa", "(", "Nigeria", ")", "10", ".", "18" ], "ids": [ 123, 119, 41130, 17599, 10245, 11037, 113, 22045, 114, 10150, 119, 10218 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Stefano", "Till", "##i", "(", "Italy", ")", "10", ".", "43" ], "ids": [ 124, 119, 26381, 32259, 10116, 113, 11619, 114, 10150, 119, 11370 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "400", "metres", ":" ], "ids": [ 13026, 112, 187, 11176, 16393, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Davis", "Ka", "##mo", "##ga", "(", "Uganda", ")", "45", ".", "15", "seconds" ], "ids": [ 122, 119, 14281, 25444, 11033, 10483, 113, 29675, 114, 10827, 119, 10208, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Marco", "Va", "##cca", "##ri", "(", "Italy", ")", "46", ".", "16" ], "ids": [ 123, 119, 14160, 14723, 20057, 10401, 113, 11619, 114, 11528, 119, 10250 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Kennedy", "O", "##chien", "##g", "(", "Kenya", ")", "46", ".", "21" ], "ids": [ 124, 119, 17817, 152, 95584, 10240, 113, 19686, 114, 11528, 119, 10296 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "pole", "va", "##ult", ":" ], "ids": [ 13536, 112, 187, 21326, 10321, 16203, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Maria", "##car", "##la", "Brescia", "##ni", "(", "Italy", ")", "3", ".", "85", "metres" ], "ids": [ 122, 119, 11066, 15983, 10330, 39277, 10342, 113, 11619, 114, 124, 119, 12017, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Andrea", "Muller", "(", "Germany", ")", "3", ".", "75" ], "ids": [ 123, 119, 16101, 54854, 113, 12775, 114, 124, 119, 11417 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Nas", "##tja", "R", "##ys", "##ich", "(", "german", "##y", ")", "3", ".", "75" ], "ids": [ 124, 119, 40751, 23696, 155, 12682, 14401, 113, 88227, 10157, 114, 124, 119, 11417 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "800", "metres", ":" ], "ids": [ 13536, 112, 187, 11900, 16393, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Ana", "Fidel", "##ia", "Qui", "##rot", "(", "Cuba", ")", "1", "minute", "58", ".", "98", "seconds" ], "ids": [ 122, 119, 16377, 66299, 10280, 35921, 28636, 113, 17226, 114, 122, 21760, 11824, 119, 12327, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Let", "##itia", "Vries", "##de", "(", "Sur", "##inam", ")", "2", ":", "00", ".", "39" ], "ids": [ 123, 119, 17144, 46087, 84668, 10253, 113, 14453, 98988, 114, 123, 131, 11025, 119, 11303 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "In", "##ez", "Turner", "(", "Jamaica", ")", "2", ":", "00", ".", "91" ], "ids": [ 124, 119, 10167, 12715, 18339, 113, 32699, 114, 123, 131, 11025, 119, 12519 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "high", "jump", ":" ], "ids": [ 13026, 112, 187, 11846, 54941, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Wolfgang", "Kreis", "##sig", "(", "Germany", ")", "2", ".", "20", "metres" ], "ids": [ 122, 119, 14290, 16937, 45283, 113, 12775, 114, 123, 119, 10197, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Ko", "##stant", "##in", "Mat", "##use", "##vitch", "(", "Israel", ")", "2", ".", "20" ], "ids": [ 123, 119, 30186, 88472, 10245, 57471, 12730, 95437, 113, 12991, 114, 123, 119, 10197 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Michele", "Bu", "##iatt", "##i", "(", "Italy", ")", "2", ".", "15" ], "ids": [ 124, 119, 26654, 11916, 103181, 10116, 113, 11619, 114, 123, 119, 10208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "800", "metres", ":" ], "ids": [ 13026, 112, 187, 11900, 16393, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Robert", "Ki", "##bet", "(", "Kenya", ")", "1", ":", "45", ".", "24" ], "ids": [ 122, 119, 10820, 28941, 20125, 113, 19686, 114, 122, 131, 10827, 119, 10233 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Vincent", "Mala", "##k", "##wen", "(", "Kenya", ")", "1", ":", "45", ".", "62" ], "ids": [ 123, 119, 16179, 58335, 10174, 19584, 113, 19686, 114, 122, 131, 10827, 119, 12066 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Philip", "Ki", "##bito", "##k", "(", "Kenya", ")", "1", ":", "46", ".", "09" ], "ids": [ 124, 119, 13324, 28941, 48000, 10174, 113, 19686, 114, 122, 131, 11528, 119, 11035 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "ja", "##veli", "##n", ":" ], "ids": [ 13536, 112, 187, 10201, 57318, 10115, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Ok", "##sana", "O", "##vchi", "##nni", "##kova", "(", "Russia", ")", "58", ".", "94", "metres" ], "ids": [ 122, 119, 84591, 51308, 152, 61332, 37158, 61653, 113, 14664, 114, 11824, 119, 12749, 16393 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Natal", "##ya", "Shi", "##kolen", "##ko", "(", "Belarus", ")", "57", ".", "44" ], "ids": [ 123, 119, 36024, 10679, 44795, 66187, 10440, 113, 55131, 114, 11817, 119, 11126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Silk", "##e", "Ren", "##k", "(", "Germany", ")", "56", ".", "70" ], "ids": [ 124, 119, 93401, 10112, 52712, 10174, 113, 12775, 114, 11628, 119, 10923 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "400", "metres", "hur", "##dles", ":" ], "ids": [ 13536, 112, 187, 11176, 16393, 52824, 92503, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Vir", "##na", "De", "Angel", "##i", "(", "Italy", ")", "55", ".", "66" ], "ids": [ 122, 119, 106433, 10219, 10190, 17567, 10116, 113, 11619, 114, 11358, 119, 12215 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Natal", "##ya", "Tor", "##shin", "##a", "(", "Kazakhstan", ")", "55", ".", "99" ], "ids": [ 123, 119, 36024, 10679, 24446, 63840, 10113, 113, 43593, 114, 11358, 119, 12187 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Anna", "K", "##nor", "##oz", "(", "Russia", ")", "57", ".", "02" ], "ids": [ 124, 119, 12300, 148, 36064, 20129, 113, 14664, 114, 11817, 119, 10983 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "400", "metres", "hur", "##dles", ":" ], "ids": [ 13026, 112, 187, 11176, 16393, 52824, 92503, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Lauren", "Otto", "##z", "(", "Italy", ")", "49", ".", "16" ], "ids": [ 122, 119, 41712, 13573, 10305, 113, 11619, 114, 11580, 119, 10250 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Brian", "Bron", "##son", "(", "U", ".", "S", ".", ")", "49", ".", "67" ], "ids": [ 123, 119, 13977, 78745, 11599, 113, 158, 119, 156, 119, 114, 11580, 119, 12316 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "John", "Ridge", "##on", "(", "Britain", ")", "49", ".", "83" ], "ids": [ 124, 119, 10421, 25904, 10263, 113, 16032, 114, 11580, 119, 12408 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "3", ",", "000", "metres", ":" ], "ids": [ 13026, 112, 187, 124, 117, 10259, 16393, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Luke", "Ki", "##p", "##kos", "##ge", "##i", "(", "Kenya", ")", "7", ":", "46", ".", "91" ], "ids": [ 122, 119, 21489, 28941, 10410, 18845, 10525, 10116, 113, 19686, 114, 128, 131, 11528, 119, 12519 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Alessandro", "Lamb", "##rus", "##chin", "##i", "(", "Italy", ")", "7", ":", "47", ".", "78" ], "ids": [ 123, 119, 21771, 60005, 13923, 43849, 10116, 113, 11619, 114, 128, 131, 11413, 119, 12492 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Richard", "Ko", "##sg", "##ei", "(", "Kenya", ")", "7", ":", "48", ".", "38" ], "ids": [ 124, 119, 11118, 30186, 84105, 11998, 113, 19686, 114, 128, 131, 11300, 119, 11171 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "BR", "##IT", "##IS", "##H", "MA", "##ST", "##ER", "##S", "F", "##IR", "##ST", "R", "##O", "##UN", "##D", "SC", "##OR", "##ES", "." ], "ids": [ 41525, 11369, 11565, 118, 49351, 37611, 19088, 12396, 27277, 32995, 24093, 10731, 143, 73522, 32995, 155, 11403, 69849, 11490, 18137, 42622, 25054, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##RT", "##HA", "##MP", "##TO", "##N", ",", "England", "1996", "-", "08", "-", "28" ], "ids": [ 49307, 46935, 58132, 79936, 60493, 11537, 117, 11701, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "completed" ], "ids": [ 100085, 15782 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "first", "-", "round", "scores", "in", "the", "rain", "-", "affected", "British", "Masters", "golf" ], "ids": [ 10422, 118, 13569, 49931, 10106, 10105, 50939, 118, 36276, 11160, 20622, 32288 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "championship", "at", "Coll", "##ingt", "##ree", "Park", "on", "Wednesday", "(", "Britain", "unless" ], "ids": [ 20755, 10160, 65689, 47527, 29711, 11239, 10135, 57611, 113, 16032, 60015 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 9, 9, 9, 1, 9 ] }, { "tokens": [ "stated", ")", ":" ], "ids": [ 17067, 114, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "66", "Gavin", "Lev", "##ens", "##on", "(", "South", "Africa", ")" ], "ids": [ 12215, 57112, 51644, 12457, 10263, 113, 11056, 12880, 114 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 5, 9 ] }, { "tokens": [ "68", "Colin", "Mont", "##gom", "##erie" ], "ids": [ 12370, 20766, 19472, 72757, 25433 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 8 ] }, { "tokens": [ "69", "Jose", "Co", "##cere", "##s", "(", "Argentina", ")", ",", "Raymond", "Russell", ",", "Robert", "Allen", "##by" ], "ids": [ 12573, 23029, 13098, 51159, 10107, 113, 12853, 114, 117, 17326, 13481, 117, 10820, 15101, 11530 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Australia", ")", ",", "David", "Gil", "##ford", ",", "Stuart", "Cage", ",", "Mike", "Clayton" ], "ids": [ 113, 11729, 114, 117, 10804, 26463, 13387, 117, 18712, 47683, 117, 13270, 43687 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8 ] }, { "tokens": [ "(", "Australia", ")", ",", "Mark", "R", "##oe", ",", "Emanuele", "Canon", "##ica", "(", "Italy", ")" ], "ids": [ 113, 11729, 114, 117, 11997, 155, 20085, 117, 64492, 44998, 11043, 113, 11619, 114 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "70", "Francisco", "Cea", "(", "Spain", ")", ",", "David", "Howell", ",", "Peter", "He", "##d", "##blo", "##m" ], "ids": [ 10923, 11798, 109435, 113, 16149, 114, 117, 10804, 83382, 117, 10979, 10357, 10162, 71933, 10147 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 4, 8, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Sweden", ")" ], "ids": [ 113, 20937, 114 ], "entity": [ "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9 ] }, { "tokens": [ "71", "Steven", "Bottom", "##ley", ",", "Ove", "Se", "##ll", "##berg", "(", "Sweden", ")", ",", "Jo", "##aki", "##m", "Ha", "##egg", "##man" ], "ids": [ 12513, 17569, 84358, 12105, 117, 68710, 11045, 11231, 11348, 113, 20937, 114, 117, 20977, 22471, 10147, 13740, 91600, 10589 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Sweden", ")", ",", "Stephen", "Ames", "(", "Trinidad", "and", "Tobago", ")", ",", "K", "##las", "Eriksson" ], "ids": [ 113, 20937, 114, 117, 13866, 69604, 113, 31327, 10111, 50946, 114, 117, 148, 13983, 70145 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Sweden", ")", ",", "Roger", "Chapman", ",", "Mark", "Davis", ",", "Pierre", "Fu", "##lke", "(", "Sweden", ")", "," ], "ids": [ 113, 20937, 114, 117, 13513, 33069, 117, 11997, 14281, 117, 11609, 17056, 56400, 113, 20937, 114, 117 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 9, 4, 8, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "Martin", "Gates", ",", "Anders", "Ha", "##gl", "##und", "(", "Sweden", ")" ], "ids": [ 11235, 39000, 117, 20751, 13740, 46066, 17242, 113, 20937, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "72", "Ni", "##cla", "##s", "Fast", "##h", "(", "Sweden", ")", ",", "Michael", "Jon", "##zon", "(", "Sweden", ")", ",", "Chi", "##stia", "##n" ], "ids": [ 12120, 30409, 60582, 10107, 28191, 10237, 113, 20937, 114, 117, 10631, 17749, 22742, 113, 20937, 114, 117, 21946, 88617, 10115 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8 ] }, { "tokens": [ "Ce", "##va", "##er", "(", "France", ")", ",", "Thomas", "B", "##jorn", "(", "Denmark", ")", ",", "Tony", "Johnston", "##e" ], "ids": [ 13338, 10362, 10165, 113, 10688, 114, 117, 11096, 139, 72603, 113, 25854, 114, 117, 13749, 31844, 10112 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Zimbabwe", ")", ",", "Pa", "##dra", "##ig", "Harrington", "(", "Ireland", ")", ",", "Pedro", "Linha", "##rt" ], "ids": [ 113, 34577, 114, 117, 26907, 14951, 11142, 93157, 113, 14637, 114, 117, 12849, 85861, 10976 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Spain", ")", ",", "David", "Carter" ], "ids": [ 113, 16149, 114, 117, 10804, 18047 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8 ] }, { "tokens": [ "73", "Ross", "M", "##c", "##F", "##ar", "##lane", ",", "Domingo", "Hospital", "(", "Spain", ")", ",", "Se", "##ve", "Ball", "##ester", "##os" ], "ids": [ 12545, 16690, 150, 10350, 11565, 10354, 25920, 117, 22173, 16025, 113, 16149, 114, 117, 11045, 10612, 19479, 39807, 10310 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "(", "Spain", ")", ",", "Paul", "Broad", "##hurst", ",", "Greg", "Turner", "(", "New", "Zealand", ")", ",", "Mike" ], "ids": [ 113, 16149, 114, 117, 10772, 86606, 68091, 117, 22438, 18339, 113, 10287, 14451, 114, 117, 13270 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 9, 4, 8, 9, 1, 5, 9, 9, 4 ] }, { "tokens": [ "Har", "##wood", "(", "Australia", ")", ",", "Br", "##enden", "Papp", "##as", "(", "South", "Africa", ")", ",", "Peter" ], "ids": [ 55737, 14759, 113, 11729, 114, 117, 38508, 22316, 94669, 10403, 113, 11056, 12880, 114, 117, 10979 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 4 ] }, { "tokens": [ "Ter", "##ava", "##inen", "(", "U", ".", "S", ".", ")", ",", "Jean", "Van", "de", "Ve", "##lde", "(", "France", ")", ",", "Oy", "##vind", "Roja", "##hn" ], "ids": [ 65272, 15181, 12398, 113, 158, 119, 156, 119, 114, 117, 10766, 11474, 10104, 19561, 15932, 113, 10688, 114, 117, 35978, 48153, 84069, 15797 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "Norway", ")", ",", "Stephen", "M", "##c", "##A", "##llis", "##ter", ",", "Neal", "Briggs" ], "ids": [ 113, 22582, 114, 117, 13866, 150, 10350, 10738, 44417, 10877, 117, 29147, 73268 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8 ] }, { "tokens": [ "Note", ":", "77", "players", "to", "complete", "their", "first", "rounds", "on", "Thursday" ], "ids": [ 20231, 131, 12527, 16021, 10114, 17876, 10455, 10422, 44759, 10135, 67067 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "K", "##EL", "##L", "##Y", "W", "##IN", "##S", "WORLD", "TIME", "TR", "##IA", "##L", "T", "##IT", "##LE", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 148, 68999, 11369, 14703, 160, 27128, 10731, 67376, 89275, 80047, 35976, 11369, 157, 37611, 51036, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "28" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shane", "Kelly", "of", "Australia", "retained", "the", "world", "one", "-", "kilometre", "time", "trial", "title", "at", "the", "world", "track", "championships", "on", "Wednesday", ",", "with", "a", "track", "record", "time", "of", "one", "minute", "2", ".", "777", "seconds", "." ], "ids": [ 40429, 15787, 10108, 11729, 39886, 10105, 11356, 10464, 118, 84485, 10635, 23626, 12887, 10160, 10105, 11356, 14310, 47211, 10135, 57611, 117, 10169, 169, 14310, 12410, 10635, 10108, 10464, 21760, 123, 119, 45773, 34290, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kelly", "averaged", "57", ".", "345", "k", "##ph", "to", "beat", "So", "##ren", "Lau", "##sg", "##berg", "of", "Germany", "by", "eighteen", "hundred", "##ths", "of", "a", "second", "." ], "ids": [ 15787, 101932, 11817, 119, 30287, 179, 28088, 10114, 27868, 12882, 10969, 73185, 84105, 11348, 10108, 12775, 10155, 94964, 34242, 91893, 10108, 169, 11132, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "bronze", "medal", "went", "to", "another", "German", ",", "Jan", "Van", "Ei", "##jden", ",", "in", "1", ":", "04", ".", "541", "." ], "ids": [ 10117, 17930, 16531, 13446, 10114, 12864, 12026, 117, 11806, 11474, 35278, 67041, 117, 10106, 122, 131, 10814, 119, 49172, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "VA", "##N", "H", "##EE", "##S", "##W", "##I", "##J", "##K", "W", "##IN", "##S", "SEC", "##ON", "##D", "ST", "##AG", "##E", "OF", "TOUR", "OF", "NET", "##H", "##ER", "##LA", "##ND", "##S", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 69342, 11537, 145, 95825, 10731, 13034, 11281, 15417, 11733, 160, 27128, 10731, 92031, 30118, 11490, 53317, 109865, 11259, 23240, 86526, 23240, 41645, 12396, 24093, 44376, 58521, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "AL", "##ME", "##RE", ",", "Netherlands", "1996", "-", "08", "-", "28" ], "ids": [ 47271, 42424, 66014, 117, 22043, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "placing", "##s", "in" ], "ids": [ 100085, 66959, 10107, 10106 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "the", "195", "-", "km", "second", "stage", "of", "the", "Tour", "of", "the", "Netherlands", "between" ], "ids": [ 10105, 21825, 118, 10204, 11132, 15365, 10108, 10105, 11595, 10108, 10105, 22043, 10948 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "Haarlem", "and", "Al", "##mere", "on", "Wednesday", ":" ], "ids": [ 62467, 10111, 10883, 32732, 10135, 57611, 131 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Max", "van", "Hee", "##s", "##wijk", "(", "Netherlands", ")", "Motorola", "4", "hours", "39", "minutes" ], "ids": [ 122, 119, 12854, 10145, 107443, 10107, 42727, 113, 22043, 114, 67289, 125, 19573, 11303, 15304 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "six", "seconds", "." ], "ids": [ 12449, 34290, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "2", ".", "Johan", "Cap", "##iot", "(", "Belgium", ")", "Coll", "##stro", "##p" ], "ids": [ 123, 119, 15706, 24069, 69325, 113, 26519, 114, 65689, 34582, 10410 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "3", ".", "Sven", "Te", "##uten", "##berg", "(", "Germany", ")", "U", ".", "S", ".", "Postal" ], "ids": [ 124, 119, 33559, 21452, 30315, 11348, 113, 12775, 114, 158, 119, 156, 119, 89208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 7, 7, 7 ] }, { "tokens": [ "4", ".", "Erik", "Za", "##bel", "(", "Germany", ")", "Tel", "##ekom" ], "ids": [ 125, 119, 16925, 14074, 13770, 113, 12775, 114, 25369, 84782 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "5", ".", "Federico", "Colonna", "(", "Italy", ")", "Map", "##ei" ], "ids": [ 126, 119, 20809, 78709, 113, 11619, 114, 24847, 11998 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "6", ".", "Jan", "##s", "Ko", "##erts", "(", "Netherlands", ")", "Palma", "##ns" ], "ids": [ 127, 119, 11806, 10107, 30186, 64115, 113, 22043, 114, 28138, 10891 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "7", ".", "Michel", "Za", "##noli", "(", "Netherlands", ")", "MX", "On", "##da" ], "ids": [ 128, 119, 13273, 14074, 97775, 113, 22043, 114, 68646, 10576, 10229 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "8", ".", "Giuseppe", "Ci", "##tteri", "##o", "(", "Italy", ")", "Aki" ], "ids": [ 129, 119, 15679, 51457, 51730, 10133, 113, 11619, 114, 93026 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 1, 9, 4 ] }, { "tokens": [ "9", ".", "Robbie", "M", "##c", "##E", "##wen", "(", "Australia", ")", "Ra", "##bo", "##bank" ], "ids": [ 130, 119, 43355, 150, 10350, 11259, 19584, 113, 11729, 114, 38571, 11790, 20583 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "10", ".", "Kaspar", "##s", "Oz", "##ers", "(", "Latvia", ")", "Motorola", "all", "same", "time" ], "ids": [ 10150, 119, 105813, 10107, 51358, 10901, 113, 55926, 114, 67289, 10435, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9 ] }, { "tokens": [ "Leading", "overall", "placing", "##s", "after", "two", "stages", ":" ], "ids": [ 100085, 20947, 66959, 10107, 10662, 10551, 35023, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Colonna", "8", ":", "22", ":", "00" ], "ids": [ 122, 119, 78709, 129, 131, 10306, 131, 11025 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Van", "Hee", "##s", "##wijk", "1", "second", "behind" ], "ids": [ 123, 119, 11474, 107443, 10107, 42727, 122, 11132, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "3", ".", "M", "##c", "##E", "##wen", "same", "time" ], "ids": [ 124, 119, 150, 10350, 11259, 19584, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "4", ".", "Te", "##uten", "##berg", "4", "seconds" ], "ids": [ 125, 119, 21452, 30315, 11348, 125, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "5", ".", "Cap", "##iot", "5" ], "ids": [ 126, 119, 24069, 69325, 126 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "6", ".", "Ko", "##erts", "7" ], "ids": [ 127, 119, 30186, 64115, 128 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "7", ".", "Oz", "##ers", "8" ], "ids": [ 128, 119, 51358, 10901, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "8", ".", "Gian", "##luca", "Cor", "##ini", "(", "Italy", ")", "Aki", "same", "time" ], "ids": [ 129, 119, 57243, 99839, 93495, 11778, 113, 11619, 114, 93026, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 4, 9, 9 ] }, { "tokens": [ "9", ".", "Lance", "Armstrong", "(", "U", ".", "S", ".", ")", "Motorola", "9" ], "ids": [ 130, 119, 45013, 24472, 113, 158, 119, 156, 119, 114, 67289, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 3, 9 ] }, { "tokens": [ "10", ".", "George", "Hi", "##nca", "##pie", "(", "U", ".", "S", ".", ")", "Motorola", "same", "time" ], "ids": [ 10150, 119, 10955, 20065, 27480, 19237, 113, 158, 119, 156, 119, 114, 67289, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 3, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "VA", "##N", "H", "##EE", "##S", "##W", "##I", "##J", "##K", "W", "##IN", "##S", "TOUR", "OF", "NET", "##H", "##ER", "##LA", "##ND", "##S", "SEC", "##ON", "##D", "ST", "##AG", "##E", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 69342, 11537, 145, 95825, 10731, 13034, 11281, 15417, 11733, 160, 27128, 10731, 86526, 23240, 41645, 12396, 24093, 44376, 58521, 10731, 92031, 30118, 11490, 53317, 109865, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AL", "##ME", "##RE", ",", "Netherlands", "1996", "-", "08", "-", "28" ], "ids": [ 47271, 42424, 66014, 117, 22043, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "and", "overall", "standing", "##s", "after", "the", "195", "kilometre", "second", "stage", "of", "the", "Tour", "of", "the", "Netherlands", "between", "Haarlem", "and", "Al", "##mere", "on", "Wednesday", "." ], "ids": [ 100085, 17466, 10111, 20947, 32173, 10107, 10662, 10105, 21825, 84485, 11132, 15365, 10108, 10105, 11595, 10108, 10105, 22043, 10948, 62467, 10111, 10883, 32732, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 1, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Max", "van", "Hee", "##s", "##wijk", "(", "Netherlands", ")", "Motorola", "4", "hours", "39", "minutes", "six", "seconds", "." ], "ids": [ 122, 119, 12854, 10145, 107443, 10107, 42727, 113, 22043, 114, 67289, 125, 19573, 11303, 15304, 12449, 34290, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Johan", "Cap", "##iot", "(", "Belgium", ")", "Coll", "##stro", "##p" ], "ids": [ 123, 119, 15706, 24069, 69325, 113, 26519, 114, 65689, 34582, 10410 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "3", ".", "Sven", "Te", "##uten", "##berg", "(", "Germany", ")", "U", ".", "S", ".", "Postal" ], "ids": [ 124, 119, 33559, 21452, 30315, 11348, 113, 12775, 114, 158, 119, 156, 119, 89208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 7, 7, 7 ] }, { "tokens": [ "4", ".", "Erik", "Za", "##bel", "(", "Germany", ")", "Tel", "##ekom" ], "ids": [ 125, 119, 16925, 14074, 13770, 113, 12775, 114, 25369, 84782 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "5", ".", "Federico", "Colonna", "(", "Italy", ")", "Map", "##ei" ], "ids": [ 126, 119, 20809, 78709, 113, 11619, 114, 24847, 11998 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "6", ".", "Jan", "##s", "Ko", "##erts", "(", "Netherlands", ")", "Palma", "##ns" ], "ids": [ 127, 119, 11806, 10107, 30186, 64115, 113, 22043, 114, 28138, 10891 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "7", ".", "Michel", "Za", "##noli", "(", "Netherlands", ")", "MX", "On", "##da" ], "ids": [ 128, 119, 13273, 14074, 97775, 113, 22043, 114, 68646, 10576, 10229 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "8", ".", "Giuseppe", "Ci", "##tteri", "##o", "(", "Italy", ")", "Aki" ], "ids": [ 129, 119, 15679, 51457, 51730, 10133, 113, 11619, 114, 93026 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 4 ] }, { "tokens": [ "9", ".", "Robbie", "M", "##c", "##E", "##wen", "(", "Australia", ")", "Ra", "##bo", "##bank" ], "ids": [ 130, 119, 43355, 150, 10350, 11259, 19584, 113, 11729, 114, 38571, 11790, 20583 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "10", ".", "Kaspar", "##s", "Oz", "##ers", "(", "Latvia", ")", "Motorola", "all", "same", "time", "." ], "ids": [ 10150, 119, 105813, 10107, 51358, 10901, 113, 55926, 114, 67289, 10435, 11561, 10635, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "overall", "standing", "##s", "after", "second", "stage", "." ], "ids": [ 100085, 20947, 32173, 10107, 10662, 11132, 15365, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Colonna", "8", ":", "22", ":", "00" ], "ids": [ 122, 119, 78709, 129, 131, 10306, 131, 11025 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Van", "Hee", "##s", "##wijk", "1", "second", "behind" ], "ids": [ 123, 119, 11474, 107443, 10107, 42727, 122, 11132, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "3", ".", "M", "##c", "##E", "##wen", "same", "time" ], "ids": [ 124, 119, 150, 10350, 11259, 19584, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "4", ".", "Te", "##uten", "##berg", "4", "seconds" ], "ids": [ 125, 119, 21452, 30315, 11348, 125, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "5", ".", "Cap", "##iot", "5" ], "ids": [ 126, 119, 24069, 69325, 126 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "6", ".", "Ko", "##erts", "7" ], "ids": [ 127, 119, 30186, 64115, 128 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "7", ".", "Oz", "##ers", "8" ], "ids": [ 128, 119, 51358, 10901, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "8", ".", "Gian", "##luca", "Cor", "##ini", "(", "Italy", ")", "Aki", "same", "time" ], "ids": [ 129, 119, 57243, 99839, 93495, 11778, 113, 11619, 114, 93026, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 4, 9, 9 ] }, { "tokens": [ "9", ".", "Lance", "Armstrong", "(", "U", ".", "S", ".", ")", "Motorola", "9" ], "ids": [ 130, 119, 45013, 24472, 113, 158, 119, 156, 119, 114, 67289, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 3, 9 ] }, { "tokens": [ "10", ".", "George", "Hi", "##nca", "##pie", "(", "U", ".", "S", ".", ")", "Motorola", "same", "time", "." ], "ids": [ 10150, 119, 10955, 20065, 27480, 19237, 113, 158, 119, 156, 119, 114, 67289, 11561, 10635, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 3, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "WORLD", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "##S", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 67376, 39774, 36535, 11127, 52980, 64091, 30331, 10731, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "28" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "from", "the" ], "ids": [ 33036, 10188, 10105 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "world", "track", "c", "##ycling", "championships", "on", "Wednesday", ":" ], "ids": [ 11356, 14310, 171, 87497, 47211, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "individual", "pursuit", ":" ], "ids": [ 13026, 112, 187, 16080, 93910, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Selected", "result", "from", "first", "round" ], "ids": [ 17193, 14493, 10188, 10422, 13569 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chris", "Board", "##man", "(", "Britain", ")", "4", ":", "13", ".", "353", "seconds", "(", "world", "record", ")", "caught" ], "ids": [ 13151, 14743, 10589, 113, 16032, 114, 125, 131, 10249, 119, 35373, 34290, 113, 11356, 12410, 114, 39797 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jens", "Le", "##hman", "(", "Germany", ")" ], "ids": [ 30780, 10281, 49811, 113, 12775, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Quarter", "-", "finals" ], "ids": [ 75820, 118, 21758 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Board", "##man", "4", ":", "14", ".", "784", "caught", "Edouard", "G", "##rits", "##on", "(", "Russia", ")" ], "ids": [ 14743, 10589, 125, 131, 10247, 119, 68658, 39797, 74362, 144, 81875, 10263, 113, 14664, 114 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Francis", "Moreau", "(", "France", ")", "4", ":", "16", ".", "274", "beat", "He", "##iko", "S", "##zon", "##n", "(", "Germany", ")" ], "ids": [ 13738, 68232, 113, 10688, 114, 125, 131, 10250, 119, 28925, 27868, 10357, 18924, 156, 22742, 10115, 113, 12775, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "4", ":", "21", ".", "715" ], "ids": [ 125, 131, 10296, 119, 56036 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Andrea", "Coll", "##ine", "##lli", "(", "Italy", ")", "4", ":", "17", ".", "551", "beat", "Michael", "Sands", "##to", "##d" ], "ids": [ 16101, 65689, 11088, 14088, 113, 11619, 114, 125, 131, 10273, 119, 46282, 27868, 10631, 67584, 10340, 10162 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "Denmark", ")", "4", ":", "24", ".", "660" ], "ids": [ 113, 25854, 114, 125, 131, 10233, 119, 37424 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alexei", "Marko", "##v", "(", "Russia", ")", "4", ":", "19", ".", "762", "beat", "Mariano", "Fr", "##ied", "##ick", "(", "U", ".", "S", ".", ")" ], "ids": [ 108548, 41337, 10477, 113, 14664, 114, 125, 131, 10270, 119, 65225, 27868, 32494, 33884, 24140, 20898, 113, 158, 119, 156, 119, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "4", ":", "20", ".", "241" ], "ids": [ 125, 131, 10197, 119, 23536 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "one", "kilometre", "time", "-", "trial", "final" ], "ids": [ 10464, 84485, 10635, 118, 23626, 11070 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Shane", "Kelly", "(", "Australia", ")", "1", "minute", "02", ".", "777", "seconds" ], "ids": [ 122, 119, 40429, 15787, 113, 11729, 114, 122, 21760, 10983, 119, 45773, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "So", "##ren", "Lau", "##sberg", "(", "Germany", ")", "1", ":", "02", ".", "795" ], "ids": [ 123, 119, 12882, 10969, 73185, 23815, 113, 12775, 114, 122, 131, 10983, 119, 71882 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Jan", "Van", "Ei", "##den", "(", "Germany", ")", "1", ":", "04", ".", "541" ], "ids": [ 124, 119, 11806, 11474, 35278, 10633, 113, 12775, 114, 122, 131, 10814, 119, 49172 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Her", "##ve", "Thu", "##et", "(", "France", ")", "1", ":", "04", ".", "732" ], "ids": [ 125, 119, 13229, 10612, 93332, 10308, 113, 10688, 114, 122, 131, 10814, 119, 62267 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Grzegorz", "Kr", "##ej", "##ner", "(", "Poland", ")", "1", ":", "04", ".", "834" ], "ids": [ 126, 119, 77075, 17640, 11950, 11129, 113, 17879, 114, 122, 131, 10814, 119, 84229 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Ain", "##ars", "Ki", "##ksi", "##s", "(", "Latvia", ")", "1", ":", "04", ".", "896" ], "ids": [ 127, 119, 22823, 21087, 28941, 12287, 10107, 113, 55926, 114, 122, 131, 10814, 119, 68802 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Dimitri", "##os", "Georg", "##alis", "(", "Greece", ")", "1", ":", "05", ".", "022" ], "ids": [ 128, 119, 73589, 10310, 13994, 33269, 113, 25154, 114, 122, 131, 10831, 119, 83983 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Jose", "Moreno", "(", "Spain", ")", "1", ":", "05", ".", "219" ], "ids": [ 129, 119, 23029, 29614, 113, 16149, 114, 122, 131, 10831, 119, 25874 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Kei", "##ji", "Ko", "##jima", "(", "Japan", ")", "1", ":", "05", ".", "300" ], "ids": [ 130, 119, 103883, 10775, 30186, 24168, 113, 11891, 114, 122, 131, 10831, 119, 11093 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Graham", "Sharma", "##n", "(", "Australia", ")", "1", ":", "05", ".", "406" ], "ids": [ 10150, 119, 16928, 66062, 10115, 113, 11729, 114, 122, 131, 10831, 119, 28081 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "11", ".", "Jose", "Es", "##cure", "##do", "(", "Spain", ")", "1", ":", "05", ".", "731" ], "ids": [ 10193, 119, 23029, 10912, 55888, 10317, 113, 16149, 114, 122, 131, 10831, 119, 62353 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "12", ".", "Craig", "Mac", "##L", "##ean", "(", "Britain", ")", "1", ":", "05", ".", "735" ], "ids": [ 10186, 119, 21703, 16917, 11369, 14654, 113, 16032, 114, 122, 131, 10831, 119, 63852 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "13", ".", "Christian", "Mei", "##dling", "##er", "(", "Austria", ")", "1", ":", "05", ".", "850" ], "ids": [ 10249, 119, 11757, 18087, 102576, 10165, 113, 14479, 114, 122, 131, 10831, 119, 24934 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "14", ".", "Darren", "McKenzie", "-", "Potter", "(", "New", "Zealand", ")", "1", ":", "06", ".", "289" ], "ids": [ 10247, 119, 53337, 88803, 118, 21465, 113, 10287, 14451, 114, 122, 131, 10719, 119, 31990 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", ".", "Masa", "##na", "##ga", "Shi", "##oha", "##ra", "(", "Japan", ")", "1", ":", "06", ".", "615" ], "ids": [ 10208, 119, 64807, 10219, 10483, 44795, 98253, 10288, 113, 11891, 114, 122, 131, 10719, 119, 50036 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "16", ".", "Jean", "-", "Pierre", "Van", "Z", "##yl", "(", "South", "Africa", ")", "1", ":", "07", ".", "258" ], "ids": [ 10250, 119, 10766, 118, 11609, 11474, 163, 27652, 113, 11056, 12880, 114, 122, 131, 10878, 119, 29226 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kei", "##rin", "final" ], "ids": [ 103883, 13778, 11070 ], "entity": [ "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 9 ] }, { "tokens": [ "1", ".", "Marty", "Not", "##hs", "##tein", "(", "U", ".", "S", ".", ")", ",", "last", "200", "metres", "in", "10", ".", "982", "seconds", "." ], "ids": [ 122, 119, 47730, 16040, 22394, 20248, 113, 158, 119, 156, 119, 114, 117, 12469, 10777, 16393, 10106, 10150, 119, 77779, 34290, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Gary", "Nei", "##wand", "(", "Australia", ")" ], "ids": [ 123, 119, 15516, 25822, 31389, 113, 11729, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "3", ".", "Frederic", "Mag", "##ne", "(", "France", ")" ], "ids": [ 124, 119, 43120, 63672, 10238, 113, 10688, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "4", ".", "Pavel", "Bu", "##ran", "(", "Czech", "Republic", ")" ], "ids": [ 125, 119, 28628, 11916, 12111, 113, 22148, 13681, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9 ] }, { "tokens": [ "5", ".", "Michael", "Hub", "##ner", "(", "Germany", ")" ], "ids": [ 126, 119, 10631, 104451, 11129, 113, 12775, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "6", ".", "Laurent", "Gan", "##e", "(", "France", ")" ], "ids": [ 127, 119, 19982, 90792, 10112, 113, 10688, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "Madison", "final", "(", "50", "km", "##s", ")" ], "ids": [ 23398, 11070, 113, 10462, 10204, 10107, 114 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Silvio", "Martine", "##lli", "-", "Marco", "Villa", "(", "Italy", ")", "34", "points", ",", "in", "a" ], "ids": [ 122, 119, 49840, 82418, 14088, 118, 14160, 13875, 113, 11619, 114, 11069, 12789, 117, 10106, 169 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "time", "of", "55", "minutes", "47", ".", "4", "seconds" ], "ids": [ 10635, 10108, 11358, 15304, 11413, 119, 125, 34290 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Scott", "M", "##c", "##G", "##ror", "##y", "-", "Stephen", "Pat", "##e", "(", "Australia", ")", "25" ], "ids": [ 123, 119, 12812, 150, 10350, 11447, 30101, 10157, 118, 13866, 24714, 10112, 113, 11729, 114, 10258 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "3", ".", "Andreas", "Kap", "##pes", "-", "Carsten", "Wolf", "(", "Germany", ")", "23" ], "ids": [ 124, 119, 17336, 68634, 16354, 118, 109175, 17970, 113, 12775, 114, 10328 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "4", ".", "Kurt", "Bet", "##sch", "##art", "-", "Bruno", "R", "##isi", "(", "Switzerland", ")", "22" ], "ids": [ 125, 119, 18190, 61828, 12044, 15391, 118, 16663, 155, 14553, 113, 26002, 114, 10306 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "5", ".", "Gabriel", "Cu", "##ruch", "##et", "-", "Juan", "Cu", "##ruch", "##et", "(", "Argentine", ")", "15" ], "ids": [ 126, 119, 15447, 34387, 90367, 10308, 118, 11686, 34387, 90367, 10308, 113, 31469, 114, 10208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 2, 9, 9 ] }, { "tokens": [ "6", ".", "Peter", "Pieter", "##s", "-", "Tomas", "Post", "(", "Netherlands", ")", "14" ], "ids": [ 127, 119, 10979, 32905, 10107, 118, 41889, 14539, 113, 22043, 114, 10247 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 9, 1, 9, 9 ] }, { "tokens": [ "7", ".", "J", "im", "##mi", "Madsen", "-", "Jens", "Ve", "##gger", "##by", "(", "Denmark", ")", "14" ], "ids": [ 128, 119, 147, 10211, 10500, 88759, 118, 30780, 19561, 25749, 11530, 113, 25854, 114, 10247 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "8", ".", "Isaac", "Gal", "##vez", "-", "Lopez", "-", "Juan", "L", "##lane", "##ras", "(", "Spain", ")", "11" ], "ids": [ 129, 119, 21639, 66676, 27468, 118, 34054, 118, 11686, 149, 25920, 12783, 113, 16149, 114, 10193 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "9", ".", "Wolfgang", "Kot", "##zmann", "-", "Franz", "St", "##oche", "##r", "(", "Austria", ")", "5" ], "ids": [ 130, 119, 14290, 59214, 84587, 118, 13752, 10838, 65627, 10129, 113, 14479, 114, 126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "10", ".", "Christophe", "Cape", "##lle", "-", "Jean", "-", "Michel", "Mon", "##in", "(", "France", ")", "2" ], "ids": [ 10150, 119, 31051, 18642, 11270, 118, 10766, 118, 13273, 39473, 10245, 113, 10688, 114, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "B", "##O", "##AR", "##DM", "##AN", "F", "##UL", "##F", "##IL", "##S", "WORLD", "RE", "##CO", "##RD", "PR", "##ED", "##IC", "##TION", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 139, 11403, 52188, 94138, 41275, 143, 100673, 11565, 38850, 10731, 67376, 71033, 82272, 84444, 23837, 33809, 30889, 98207, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "Ay", "##res" ], "ids": [ 11235, 77603, 11234 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "28" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "'", "s", "Chris", "Board", "##man", "fu", "##lf", "##ille", "##d", "his", "prediction", "that", "he", "would", "break", "the", "world", "4", ",", "000", "metres", "world", "record", "in", "the", "world", "track", "c", "##ycling", "championships", "on", "Wednesday", "." ], "ids": [ 16032, 112, 187, 13151, 14743, 10589, 11005, 35173, 14420, 10162, 10226, 78089, 10189, 10261, 10894, 24194, 10105, 11356, 125, 117, 10259, 16393, 11356, 12410, 10106, 10105, 11356, 14310, 171, 87497, 47211, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Board", "##man", "clock", "##ed", "four", "minutes", "13", ".", "353", "seconds", "to", "sl", "##ice", "more", "than", "six", "seconds", "from", "the", "previous", "world", "mark", "of", "4", ":", "19", ".", "699", "set", "by", "Olympic", "champion", "Andrea", "Coll", "##ine", "##lli", "of", "Italy", "in", "Atlanta", "in", "July", "." ], "ids": [ 14743, 10589, 52843, 10336, 11598, 15304, 10249, 119, 35373, 34290, 10114, 38523, 11918, 10798, 11084, 12449, 34290, 10188, 10105, 16741, 11356, 29221, 10108, 125, 131, 10270, 119, 55596, 11847, 10155, 17952, 17689, 16101, 65689, 11088, 14088, 10108, 11619, 10106, 19600, 10106, 11112, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 1, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Coll", "##ine", "##lli", "qualified", "in", "second", "place", ",", "also", "beating", "his", "old", "record", "in", "4", ":", "17", ".", "696", "." ], "ids": [ 65689, 11088, 14088, 32244, 10106, 11132, 11192, 117, 10379, 58081, 10226, 12898, 12410, 10106, 125, 131, 10273, 119, 68865, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "was", "very", "ner", "##vous", "before", "the", "start", "but", "then", "I", "was", "ama", "##zed", "by", "the", "speed", "of", "my", "ride", ",", "\"", "Board", "##man", "said", ".", "\"" ], "ids": [ 107, 146, 10134, 12558, 59097, 61211, 11360, 10105, 15148, 10473, 11059, 146, 10134, 28149, 18309, 10155, 10105, 19085, 10108, 15127, 48543, 117, 107, 14743, 10589, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "I", "do", "n", "'", "t", "know", "if", "I", "can", "go", "any", "faster", "." ], "ids": [ 146, 10149, 182, 112, 188, 21852, 12277, 146, 10944, 11783, 11178, 66109, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Who", "knows", "what", "will", "happen", "in", "the", "later", "stages", "?", "\"" ], "ids": [ 14516, 75354, 12976, 11337, 84630, 10106, 10105, 10873, 35023, 136, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Board", "##man", ",", "28", ",", "did", "not", "contest", "the", "Olympic", "pursuit", "because", "of", "its", "proximity", "to", "the", "Tour", "de", "France", "in", "which", "he", "led", "the", "French", "GA", "##N", "team", "." ], "ids": [ 14743, 10589, 117, 10348, 117, 12172, 10472, 37596, 10105, 17952, 93910, 12373, 10108, 10474, 96993, 10114, 10105, 11595, 10104, 10688, 10106, 10319, 10261, 12857, 10105, 11894, 74212, 11537, 11121, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 2, 3, 7, 9, 9 ] }, { "tokens": [ "However", ",", "he", "took", "a", "bronze", "medal", "in", "the", "Olympic", "road", "time", "-", "trial", "and", "then", "returned", "home", "to", "prepare", "for", "the", "world", "track", "series", "in", "the", "Manchester", "indoor", "vel", "##od", "##rome", "." ], "ids": [ 12209, 117, 10261, 12149, 169, 17930, 16531, 10106, 10105, 17952, 15485, 10635, 118, 23626, 10111, 11059, 14030, 11816, 10114, 69977, 10142, 10105, 11356, 14310, 11366, 10106, 10105, 15349, 44091, 21861, 12680, 43110, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "adopted", "the", "\"", "super", "##man", "\"", "riding", "position", "with", "arms", "at", "full", "stretch", "perfect", "##ed", "by", "fellow", "Brit", "##on", "G", "##rae", "##me", "Ob", "##ree", ",", "the", "1995", "world", "champion", ",", "and", "taken", "up", "in", "Atlanta", "by", "Coll", "##ine", "##lli", "." ], "ids": [ 10357, 24726, 10105, 107, 25212, 10589, 107, 56629, 12956, 10169, 28150, 10160, 13375, 85690, 43477, 10336, 10155, 24619, 68447, 10263, 144, 73803, 10627, 43019, 29711, 117, 10105, 10436, 11356, 17689, 117, 10111, 15109, 10741, 10106, 19600, 10155, 65689, 11088, 14088, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Ob", "##ree", "was", "forced", "to", "pull", "out", "of", "his", "title", "defence", "because", "of", "a", "viral", "infection", "." ], "ids": [ 43019, 29711, 10134, 20054, 10114, 80870, 10950, 10108, 10226, 12887, 47245, 12373, 10108, 169, 82356, 55223, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Qualifier", "##s", "for", "Wednesday", "evening", "'", "s", "quarter", "-", "finals", ":" ], "ids": [ 109291, 10107, 10142, 57611, 42135, 112, 187, 28330, 118, 21758, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Chris", "Board", "##man", "(", "Britain", ")", "4", ":", "13", ".", "353" ], "ids": [ 122, 119, 13151, 14743, 10589, 113, 16032, 114, 125, 131, 10249, 119, 35373 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Andrea", "Coll", "##ine", "##lli", "(", "Italy", ")", "4", ":", "17", ".", "696" ], "ids": [ 123, 119, 16101, 65689, 11088, 14088, 113, 11619, 114, 125, 131, 10273, 119, 68865 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Mariano", "Fr", "##ied", "##ick", "(", "U", ".", "S", ".", ")", "4", ":", "19", ".", "808" ], "ids": [ 124, 119, 32494, 33884, 24140, 20898, 113, 158, 119, 156, 119, 114, 125, 131, 10270, 119, 46058 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "He", "##iko", "S", "##zon", "##n", "(", "Germany", ")", "4", ":", "21", ".", "009" ], "ids": [ 125, 119, 10357, 18924, 156, 22742, 10115, 113, 12775, 114, 125, 131, 10296, 119, 58526 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Francis", "Moreau", "(", "France", ")", "4", ":", "21", ".", "454" ], "ids": [ 126, 119, 13738, 68232, 113, 10688, 114, 125, 131, 10296, 119, 44233 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Alexei", "Marko", "##v", "(", "Russia", ")", "4", ":", "22", ".", "738" ], "ids": [ 127, 119, 108548, 41337, 10477, 113, 14664, 114, 125, 131, 10306, 119, 75664 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Michael", "Sands", "##to", "##d", "(", "Denmark", ")", "4", ":", "24", ".", "427" ], "ids": [ 128, 119, 10631, 67584, 10340, 10162, 113, 25854, 114, 125, 131, 10233, 119, 37848 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Edouard", "G", "##rits", "##oun", "(", "Russia", ")", "4", ":", "26", ".", "467" ], "ids": [ 129, 119, 74362, 144, 81875, 43971, 113, 14664, 114, 125, 131, 10314, 119, 47763 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "B", "##O", "##AR", "##DM", "##AN", "BR", "##EA", "##KS", "WORLD", "4", ",", "000", "ME", "##T", "##RE", "##S", "RE", "##CO", "##RD", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 139, 11403, 52188, 94138, 41275, 49351, 36789, 62828, 67376, 125, 117, 10259, 47430, 11090, 66014, 10731, 71033, 82272, 84444, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "28" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "'", "s", "Chris", "Board", "##man", "broke", "the", "world", "4", ",", "000", "metres", "c", "##ycling", "record", "by", "more", "than", "six", "seconds", "at", "the", "world", "championships", "on", "Wednesday", "." ], "ids": [ 16032, 112, 187, 13151, 14743, 10589, 30500, 10105, 11356, 125, 117, 10259, 16393, 171, 87497, 12410, 10155, 10798, 11084, 12449, 34290, 10160, 10105, 11356, 47211, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Board", "##man", "clock", "##ed", "four", "minutes", "13", ".", "353", "seconds", "in", "the", "qualifying", "round", "of", "the", "individual", "pursuit", "event", "to", "beat", "the", "previous", "mark", "of", "4", ":", "19", ".", "699", "set", "by", "Andrea", "Coll", "##ine", "##lli", "of", "Italy", "at", "the", "Atlanta", "Olympics", "on", "July", "24", "." ], "ids": [ 14743, 10589, 52843, 10336, 11598, 15304, 10249, 119, 35373, 34290, 10106, 10105, 43631, 13569, 10108, 10105, 16080, 93910, 14416, 10114, 27868, 10105, 16741, 29221, 10108, 125, 131, 10270, 119, 55596, 11847, 10155, 16101, 65689, 11088, 14088, 10108, 11619, 10160, 10105, 19600, 19185, 10135, 11112, 10233, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-LOC", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 1, 2, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "English", "first", "division" ], "ids": [ 33036, 10108, 11616, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "matches", "on", "Wednesday", ":" ], "ids": [ 41356, 18258, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barn", "##sley", "3", "Reading", "0" ], "ids": [ 61802, 28428, 124, 10629, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Stoke", "1", "Bradford", "0" ], "ids": [ 60824, 122, 40141, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "S", "##wind", "##on", "1", "Oldham", "0" ], "ids": [ 156, 47673, 10263, 122, 109860, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Wolverhampton", "1", "Queens", "Park", "Rangers", "1" ], "ids": [ 98739, 122, 34140, 11239, 23042, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barn", "##sley", "3", "3", "0", "0", "8", "2", "9" ], "ids": [ 61802, 28428, 124, 124, 121, 121, 129, 123, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stoke", "3", "3", "0", "0", "5", "2", "9" ], "ids": [ 60824, 124, 124, 121, 121, 126, 123, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tra", "##n", "##mere", "3", "2", "1", "0", "6", "3", "7" ], "ids": [ 21469, 10115, 32732, 124, 123, 122, 121, 127, 124, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bolton", "3", "2", "1", "0", "5", "2", "7" ], "ids": [ 34462, 124, 123, 122, 121, 126, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wolverhampton", "3", "2", "1", "0", "5", "2", "7" ], "ids": [ 98739, 124, 123, 122, 121, 126, 123, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Queens", "Park", "Rangers", "3", "2", "1", "0", "5", "3", "7" ], "ids": [ 34140, 11239, 23042, 124, 123, 122, 121, 126, 124, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Norwich", "3", "2", "0", "1", "4", "3", "6" ], "ids": [ 51816, 124, 123, 121, 122, 125, 124, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ipswich", "3", "1", "1", "1", "6", "4", "4" ], "ids": [ 86146, 124, 122, 122, 122, 127, 125, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Birmingham", "2", "1", "1", "0", "5", "4", "4" ], "ids": [ 22712, 123, 122, 122, 121, 126, 125, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Crystal", "Palace", "3", "1", "1", "1", "3", "2", "4" ], "ids": [ 28459, 22015, 124, 122, 122, 122, 124, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##wind", "##on", "3", "1", "1", "1", "2", "3", "4" ], "ids": [ 156, 47673, 10263, 124, 122, 122, 122, 123, 124, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oxford", "3", "1", "0", "2", "6", "3", "3" ], "ids": [ 11109, 124, 122, 121, 123, 127, 124, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bradford", "3", "1", "0", "2", "3", "3", "3" ], "ids": [ 40141, 124, 122, 121, 123, 124, 124, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hu", "##dder", "##sfield", "2", "1", "0", "1", "3", "3", "3" ], "ids": [ 43707, 42113, 53495, 123, 122, 121, 122, 124, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Portsmouth", "3", "1", "0", "2", "3", "5", "3" ], "ids": [ 46933, 124, 122, 121, 123, 124, 126, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reading", "3", "1", "0", "2", "3", "8", "3" ], "ids": [ 10629, 124, 122, 121, 123, 124, 129, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Man", "City", "3", "1", "0", "2", "2", "3", "3" ], "ids": [ 11343, 10773, 124, 122, 121, 123, 123, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "West", "Bro", "##m", "##wich", "3", "0", "2", "1", "2", "3", "2" ], "ids": [ 11164, 32470, 10147, 33544, 124, 121, 123, 122, 123, 124, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Port", "Vale", "3", "0", "2", "1", "2", "4", "2" ], "ids": [ 14734, 32286, 124, 121, 123, 122, 123, 125, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", "United", "2", "0", "1", "1", "4", "5", "1" ], "ids": [ 31695, 10609, 123, 121, 122, 122, 125, 126, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##rim", "##sby", "3", "0", "1", "2", "4", "7", "1" ], "ids": [ 144, 23760, 38243, 124, 121, 122, 123, 125, 128, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Charlton", "2", "0", "1", "1", "1", "3", "1" ], "ids": [ 68730, 123, 121, 122, 122, 122, 124, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "##end", "3", "0", "1", "2", "1", "7", "1" ], "ids": [ 11056, 19342, 124, 121, 122, 123, 122, 128, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oldham", "3", "0", "0", "3", "2", "6", "0" ], "ids": [ 109860, 124, 121, 121, 124, 123, 127, 121 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##IS", "##H", "CO", "##UN", "##T", "##Y", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "SC", "##OR", "##ES", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 19088, 12396, 32992, 69849, 11090, 14703, 39774, 36535, 11127, 52980, 64091, 30331, 18137, 42622, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Close", "of", "play", "scores", "on", "the", "first" ], "ids": [ 39981, 10108, 12253, 49931, 10135, 10105, 10422 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "day", "of", "four", "-", "day", "English", "County", "Championship", "cricket", "matches", "on" ], "ids": [ 11940, 10108, 11598, 118, 11940, 11616, 10886, 12341, 32289, 18258, 10135 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Wednesday", ":" ], "ids": [ 57611, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "At", "Portsmouth", ":", "Middlesex", "199", "in", "60", "over", "##s", "(", "K", ".", "Brown", "57", ";" ], "ids": [ 11699, 46933, 131, 74972, 23366, 10106, 10709, 10491, 10107, 113, 148, 119, 12623, 11817, 132 ], "entity": [ "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 9, 3, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "L", ".", "Both", "##am", "5", "-", "67", ")", "." ], "ids": [ 149, 119, 20973, 11008, 126, 118, 12316, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hampshire", "105", "-", "4", "." ], "ids": [ 26036, 14519, 118, 125, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Chester", "-", "le", "-", "Street", ":", "G", "##lam", "##organ", "73", "-", "3", "v", "Durham", "." ], "ids": [ 11699, 32729, 118, 10141, 118, 11962, 131, 144, 21114, 100807, 12545, 118, 124, 190, 37499, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 5, 9, 3, 7, 7, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "F", "##OW", "##LE", "##R", "AND", "MC", "##MA", "##NA", "##MA", "##N", "O", "##UT", "OF", "EN", "##GL", "##AN", "##D", "S", "##Q", "##U", "##AD", "." ], "ids": [ 71020, 65622, 24093, 118, 143, 33893, 51036, 11273, 52428, 24650, 30696, 36742, 30696, 11537, 152, 65729, 23240, 31278, 104780, 41275, 11490, 156, 19282, 12022, 55538, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "soccer", "manager", "Glen", "Ho", "##ddle", "confirmed", "on", "Wednesday", "that", "the", "Liverpool", "pair", "of", "Steve", "M", "##c", "##M", "##ana", "##man", "and", "Robbie", "Fowler", "would", "miss", "England", "'", "s", "World", "Cup", "qualifying", "match", "against", "Moldova", "on", "Sunday", "." ], "ids": [ 11701, 41356, 16935, 30729, 20220, 73182, 27347, 10135, 57611, 10189, 10105, 18376, 27643, 10108, 13308, 150, 10350, 11517, 11631, 10589, 10111, 43355, 49890, 10894, 88237, 11701, 112, 187, 10315, 11544, 43631, 12356, 11327, 29733, 10135, 19731, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "The", "two", "men", ",", "both", "suffering", "from", "back", "injuries", ",", "joined", "the", "England", "squad", "at", "training", "but", "it", "was", "soon", "clear", "they", "had", "no", "chance", "of", "making", "the", "flight", "to", "Kis", "##hine", "##v", "on", "Friday", "." ], "ids": [ 10117, 10551, 10588, 117, 11408, 49552, 10188, 12014, 49718, 117, 13914, 10105, 11701, 30580, 10160, 15722, 10473, 10271, 10134, 17864, 24866, 10689, 10374, 10192, 27893, 10108, 14293, 10105, 23578, 10114, 82441, 76648, 10477, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "had", "some", "s", "##cans", "and", "X", "-", "ray", "##s", "ye", "##ster", "##day", "and", "they", "'", "re", "out", ",", "\"", "said", "Ho", "##ddle", "." ], "ids": [ 107, 11696, 10374, 11152, 187, 59212, 10111, 161, 118, 27212, 10107, 11023, 12765, 24558, 10111, 10689, 112, 11639, 10950, 117, 107, 12415, 20220, 73182, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "\"", "The", "more", "important", "thing", "for", "me", "was", "to", "get", "them", "down", "here", "and", "have", "a", "chat", "." ], "ids": [ 107, 10117, 10798, 12452, 40414, 10142, 10911, 10134, 10114, 15329, 11345, 12935, 19353, 10111, 10529, 169, 69338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "To", "go", "another", "five", "weeks", "without", "that", "chance", "would", "have", "been", "f", "##ool", "##ish", ",", "\"", "he", "added", "." ], "ids": [ 11469, 11783, 12864, 12403, 20750, 13663, 10189, 27893, 10894, 10529, 10590, 174, 47195, 15529, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ho", "##ddle", ",", "who", "has", "already", "lost", "the", "services", "of", "midfielder", "Darren", "And", "##erto", "##n", "and", "defender", "Steve", "Howe", "##y", ",", "delayed", "naming", "any", "replacement", "##s", "." ], "ids": [ 20220, 73182, 117, 10479, 10393, 19034, 14172, 10105, 12639, 10108, 68049, 53337, 12689, 52012, 10115, 10111, 36426, 13308, 46739, 10157, 117, 67058, 90742, 11178, 41636, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "also", "concern", "over", "injuries", "to", "Paul", "Gas", "##co", "##igne", ",", "Les", "Ferdinand", "and", "David", "Bat", "##ty", "." ], "ids": [ 11723, 10134, 10379, 43607, 10491, 49718, 10114, 10772, 34874, 10812, 44304, 117, 10468, 15927, 10111, 10804, 62949, 11195, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "H", "##OR", "##SE", "RA", "##CI", "##NG", "-", "J", "##OCK", "##E", "##Y", "W", "##EA", "##VE", "##R", "RE", "##CE", "##IV", "##ES", "21", "-", "DA", "##Y", "BA", "##N", "." ], "ids": [ 145, 42622, 39039, 64007, 89955, 34065, 118, 147, 96608, 11259, 14703, 160, 36789, 68560, 11273, 71033, 43161, 91238, 25054, 10296, 118, 47855, 14703, 39999, 11537, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "rider", "Jason", "Weaver", "received", "a", "21", "-", "day", "ban", "from", "the", "disciplina", "##ry", "committee", "of", "the", "Jo", "##ckey", "Club", "on", "Wednesday", "." ], "ids": [ 100085, 95232, 16796, 63417, 12296, 169, 10296, 118, 11940, 11915, 10188, 10105, 40104, 10908, 27634, 10108, 10105, 20977, 92334, 11316, 10135, 57611, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Weaver", "had", "been", "reported", "after", "being", "found", "guilty", "of", "ir", "##res", "##pon", "##sible", "riding", "at", "the", "provincial", "track", "of", "Ponte", "##fra", "##ct", "10", "days", "ago", "." ], "ids": [ 63417, 10374, 10590, 15943, 10662, 11223, 11823, 56044, 10108, 10478, 11234, 27119, 55864, 56629, 10160, 10105, 24900, 14310, 10108, 32192, 31162, 14526, 10150, 13990, 36390, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "his", "fourth", "riding", "offen", "##ce", "this", "season", "." ], "ids": [ 10377, 10134, 10226, 16918, 56629, 84646, 10419, 10531, 11226, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Although", "five", "days", "of", "the", "ban", "were", "suspended", "until", "January", "1", ",", "Weaver", "will", "miss", "next", "month", "'", "s", "big", "St", "Le", "##ger", "meeting", ",", "including", "the", "ride", "on", "top", "stay", "##er", "Double", "Tri", "##gger", "in", "the", "Don", "##caster", "Cup", "." ], "ids": [ 15785, 12403, 13990, 10108, 10105, 11915, 10309, 49799, 11444, 11238, 122, 117, 63417, 11337, 88237, 13451, 14064, 112, 187, 22185, 10838, 10281, 11446, 19822, 117, 11198, 10105, 48543, 10135, 12364, 29597, 10165, 23655, 36642, 25749, 10106, 10105, 11740, 74934, 11544, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "Weaver", "shot", "to", "pro", "##minence", "in", "1994", "when", "he", "won", "the", "English", "2", ",", "000", "Guinea", "##s", "on", "Mister", "Bailey", "##s", "in", "his", "first", "ride", "in", "a", "classic", "." ], "ids": [ 63417, 19508, 10114, 11284, 99194, 10106, 10444, 10841, 10261, 11367, 10105, 11616, 123, 117, 10259, 17209, 10107, 10135, 60997, 29761, 10107, 10106, 10226, 10422, 48543, 10106, 169, 36592, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 2, 6, 6, 6, 6, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##OW", "##ING", "-", "RE", "##D", "##G", "##RA", "##VE", "MA", "##Y", "SE", "##E", "##K", "F", "##IF", "##TH", "OL", "##Y", "##MP", "##IC", "GO", "##LD", "." ], "ids": [ 155, 33893, 50183, 118, 71033, 11490, 11447, 29990, 68560, 27277, 14703, 23056, 11259, 11733, 143, 53668, 109166, 19768, 14703, 79936, 30889, 41525, 62943, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "'", "s", "Steven", "Red", "##grave", "said", "on", "Wednesday", "he", "might", "change", "his", "mind", "and", "go", "for", "a", "fifth", "consecutive", "Olympic", "gold", "medal", "at", "the", "2000", "Games", "in", "Sydney", "." ], "ids": [ 16032, 112, 187, 17569, 11641, 54349, 12415, 10135, 57611, 10261, 20970, 15453, 10226, 21133, 10111, 11783, 10142, 169, 22237, 29864, 17952, 18128, 16531, 10160, 10105, 10180, 14501, 10106, 14470, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 9, 1, 9 ] }, { "tokens": [ "Red", "##grave", "is", "one", "of", "only", "five", "athletes", "who", "have", "won", "gold", "medals", "at", "four", "successive", "Olympics", "." ], "ids": [ 11641, 54349, 10124, 10464, 10108, 10893, 12403, 57700, 10479, 10529, 11367, 18128, 48512, 10160, 11598, 47525, 19185, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "He", "shared", "victory", "with", "Matthew", "Pin", "##sent", "in", "the", "co", "##x", "##less", "pairs", "at", "the", "Atlanta", "Games", "and", "said", "at", "the", "time", "that", "would", "be", "his", "last", "shot", "." ], "ids": [ 10357, 29054, 19735, 10169, 18168, 74325, 30832, 10106, 10105, 11170, 10686, 14985, 55736, 10160, 10105, 19600, 14501, 10111, 12415, 10160, 10105, 10635, 10189, 10894, 10347, 10226, 12469, 19508, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "he", "has", "had", "second", "thought", "##s", "since", "then", ".", "\"" ], "ids": [ 16976, 10261, 10393, 10374, 11132, 18957, 10107, 11764, 11059, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "'", "m", "only", "34", "." ], "ids": [ 146, 112, 181, 10893, 11069, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "say", "that", "'", "s", "too", "old", "for", "an", "athlete", ",", "\"", "he", "said", "." ], "ids": [ 13885, 23763, 10189, 112, 187, 16683, 12898, 10142, 10151, 73113, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "But", "I", "'", "ll", "be", "38", "by", "Sydney", "and", "that", "'", "s", "not", "too", "old", "." ], "ids": [ 107, 16976, 146, 112, 22469, 10347, 11171, 10155, 14470, 10111, 10189, 112, 187, 10472, 16683, 12898, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "whether", "I", "have", "got", "the", "ent", "##hus", "##ias", "##m", "for", "the", "training", "over", "the", "next", "four", "years", "." ], "ids": [ 10377, 112, 187, 21883, 146, 10529, 19556, 10105, 61047, 15471, 15465, 10147, 10142, 10105, 15722, 10491, 10105, 13451, 11598, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Row", "##ing", "is", "an", "end", "##urance", "sport", ".", "\"" ], "ids": [ 49912, 10230, 10124, 10151, 11572, 41078, 17925, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "B", "##OT", "##HA", "##M", "DI", "##SM", "##IS", "##SE", "##S", "GA", "##T", "##TI", "##NG", "IN", "F", "##IR", "##ST", "CL", "##AS", "##S", "DE", "##BU", "##T", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 139, 62146, 58132, 11517, 110014, 75282, 19088, 39039, 10731, 74212, 11090, 72286, 34065, 36351, 143, 73522, 32995, 75151, 38025, 10731, 25067, 108865, 11090, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Liam", "Both", "##am", "demonstrated", "his", "father", "Ian", "'", "s", "golden", "touch", "on", "Wednesday", "shortly", "after", "making", "his", "county", "debut", "for", "Hampshire", "." ], "ids": [ 48437, 20973, 11008, 57627, 10226, 13194, 16582, 112, 187, 52477, 54981, 10135, 57611, 31555, 10662, 14293, 10226, 17382, 13424, 10142, 26036, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Both", "##am", "dismissed", "Mike", "Ga", "##tting", "with", "his", "seventh", "ball", "when", "the", "former", "England", "captain", "pushed", "a", "half", "-", "volley", "to", "square", "-", "leg", "on", "the", "first", "day", "of", "the", "four", "-", "day", "match", "against", "Middlesex", "at", "Portsmouth", "." ], "ids": [ 20973, 11008, 59379, 13270, 69699, 64516, 10169, 10226, 37192, 20724, 10841, 10105, 11775, 11701, 28157, 70157, 169, 13877, 118, 104717, 10114, 15163, 118, 33810, 10135, 10105, 10422, 11940, 10108, 10105, 11598, 118, 11940, 12356, 11327, 74972, 10160, 46933, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 1, 9 ] }, { "tokens": [ "Earl", "##ier", "Both", "##am", "arrived", "in", "Portsmouth", "from", "Southampton", "only", "to", "be", "told", "his", "services", "would", "not", "be", "required", "." ], "ids": [ 18877, 11709, 20973, 11008, 22584, 10106, 46933, 10188, 45113, 10893, 10114, 10347, 21937, 10226, 12639, 10894, 10472, 10347, 17468, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "then", "drove", "40", "km", "##s", "back", "to", "play", "for", "the", "second", "XI", "to", "learn", "that", "John", "Stephenson", "had", "dropped", "out", "of", "the", "Middlesex", "match", "in", "the", "meant", "##ime", "with", "a", "shoulder", "injury", "." ], "ids": [ 10357, 11059, 72256, 10533, 10204, 10107, 12014, 10114, 12253, 10142, 10105, 11132, 14627, 10114, 42671, 10189, 10421, 89613, 10374, 30241, 10950, 10108, 10105, 74972, 12356, 10106, 10105, 31580, 19151, 10169, 169, 78681, 27443, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "##am", "das", "##hed", "back", "to", "Portsmouth", "and", "took", "the", "field", "as", "the", "th", "##rid", "over", "began", "." ], "ids": [ 20973, 11008, 10242, 16081, 12014, 10114, 46933, 10111, 12149, 10105, 13939, 10146, 10105, 77586, 33597, 10491, 11941, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ian", "Both", "##am", "began", "his", "test", "career", "in", "1977", "by", "dis", "##mis", "##sing", "Australian", "captain", "Greg", "Cha", "##ppel", "##l", "with", "a", "long", "hop", "and", "went", "on", "to", "become", "his", "country", "'", "s", "most", "successful", "all", "-", "round", "##er", "ever", "with", "5", ",", "200", "runs", ",", "383", "wickets", "plus", "120", "catch", "##es", "in", "102", "tests", "." ], "ids": [ 16582, 20973, 11008, 11941, 10226, 15839, 13021, 10106, 10722, 10155, 27920, 15240, 16357, 12829, 28157, 22438, 53453, 61799, 10161, 10169, 169, 11695, 26369, 10111, 13446, 10135, 10114, 13461, 10226, 12723, 112, 187, 10992, 17330, 10435, 118, 13569, 10165, 17038, 10169, 126, 117, 10777, 17913, 117, 35663, 83839, 10563, 12048, 61093, 10171, 10106, 14818, 34926, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "UN", "##ION", "-", "CA", "##R", "##L", "##ING", "LE", "##F", "##T", "O", "##UT", "OF", "EN", "##GL", "##AN", "##D", "TR", "##A", "##IN", "##ING", "S", "##Q", "##U", "##AD", "." ], "ids": [ 155, 12022, 32469, 14703, 26578, 52980, 118, 24707, 11273, 11369, 50183, 84977, 11565, 11090, 152, 65729, 23240, 31278, 104780, 41275, 11490, 80047, 10738, 27128, 50183, 156, 19282, 12022, 55538, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "England", "captain", "Will", "Carl", "##ing", "along", "with", "Jeremy", "Gus", "##cott", ",", "Rory", "Underwood", "and", "Dean", "Richards", "have", "been", "left", "out", "of", "England", "'", "s", "first", "training", "squad", "of", "the", "season", "." ], "ids": [ 42355, 11701, 28157, 15380, 12225, 10230, 12400, 10169, 27087, 61067, 48426, 117, 78216, 103056, 10111, 18657, 29110, 10529, 10590, 12153, 10950, 10108, 11701, 112, 187, 10422, 15722, 30580, 10108, 10105, 11226, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "quart", "##et", ",", "who", "posse", "##ss", "244", "international", "caps", "between", "them", ",", "were", "also", "om", "##itted", "from", "a", "summer", "training", "camp", "but", "will", "still", "be", "in", "content", "##ion", "when", "the", "northern", "international", "season", "starts", "later", "this", "year", "." ], "ids": [ 10117, 49461, 10308, 117, 10479, 83509, 13420, 27590, 12533, 52036, 10948, 11345, 117, 10309, 10379, 10209, 107456, 10188, 169, 17995, 15722, 16700, 10473, 11337, 12647, 10347, 10106, 19509, 11046, 10841, 10105, 17335, 12533, 11226, 33039, 10873, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Their", "quali", "##ties", "are", "well", "known", "to", "the", "select", "##ors", "and", "they", "will", ",", "of", "course", ",", "be", "considered", "when", "the", "season", "gets", "under", "##way", ",", "\"", "the", "Rugby", "Football", "Union", "said", "in", "a", "statement", "on", "Wednesday", "." ], "ids": [ 107, 17551, 15510, 14197, 10301, 11206, 11053, 10114, 10105, 47054, 16379, 10111, 10689, 11337, 117, 10108, 15348, 117, 10347, 14289, 10841, 10105, 11226, 30811, 10571, 14132, 117, 107, 10105, 21803, 12499, 11457, 12415, 10106, 169, 33311, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "DO", "##D", "##GE", "##RS", "W", "##IN", "F", "##IF", "##TH", "ST", "##RA", "##IG", "##HT", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 99843, 11490, 58719, 39469, 160, 27128, 143, 53668, 109166, 53317, 29990, 89696, 81012, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "1996", "-", "08", "-", "28" ], "ids": [ 102059, 77261, 66014, 32002, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hi", "##deo", "Nom", "##o", "allowed", "a", "run", "in", "seven", "innings", "for", "his", "fifth", "win", "in", "seven", "road", "starts", "and", "Greg", "Ga", "##gne", "cap", "##ped", "a", "three", "-", "run", "fourth", "with", "a", "two", "-", "run", "home", "##r", "as", "the", "Los", "Angeles", "Dodgers", "claimed", "a", "5", "-", "1", "victory", "the", "Montreal", "Expo", "##s", "on", "Tuesday", "." ], "ids": [ 20065, 47303, 107732, 10133, 18162, 169, 14095, 10106, 15767, 48974, 10142, 10226, 22237, 14125, 10106, 15767, 15485, 33039, 10111, 22438, 69699, 17428, 13337, 16898, 169, 11003, 118, 14095, 16918, 10169, 169, 10551, 118, 14095, 11816, 10129, 10146, 10105, 10630, 12233, 82958, 20737, 169, 126, 118, 122, 19735, 10105, 20990, 52947, 10107, 10135, 70245, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "With", "their", "fifth", "straight", "win", ",", "the", "Dodgers", "moved", "a", "half", "-", "game", "ahead", "of", "the", "Expo", "##s", "at", "the", "top", "of", "the", "wild", "card", "hun", "##t", "behind", "Nom", "##o", "(", "13", "-", "10", ")", ",", "who", "allowed", "six", "hits", "and", "walk", "##ed", "four", "with", "six", "strike", "##outs", "." ], "ids": [ 12613, 10455, 22237, 31214, 14125, 117, 10105, 82958, 13059, 169, 13877, 118, 11661, 35629, 10108, 10105, 52947, 10107, 10160, 10105, 12364, 10108, 10105, 32290, 23050, 12041, 10123, 17155, 107732, 10133, 113, 10249, 118, 10150, 114, 117, 10479, 18162, 12449, 27922, 10111, 33734, 10336, 11598, 10169, 12449, 37456, 72199, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "San", "Francisco", ",", "Mike", "Williams", "allowed", "two", "runs", "in", "7", "-", "1", "/", "3", "innings", "and", "Benito", "Santiago", "and", "Ruben", "Amar", "##o", "had", "RB", "##I", "hits", "in", "the", "first", "inning", "as", "the", "Philadelphia", "Phil", "##lies", "edge", "##d", "the", "San", "Francisco", "Giants", "3", "-", "2", "." ], "ids": [ 10167, 10469, 11798, 117, 13270, 12494, 18162, 10551, 17913, 10106, 128, 118, 122, 120, 124, 48974, 10111, 36538, 12336, 10111, 79665, 79324, 10133, 10374, 71201, 11281, 27922, 10106, 10105, 10422, 110505, 10146, 10105, 15979, 18144, 22201, 30599, 10162, 10105, 10469, 11798, 36658, 124, 118, 123, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Williams", "(", "5", "-", "12", ")", ",", "who", "sna", "##pped", "a", "personal", "three", "-", "game", "losing", "streak", ",", "allowed", "five", "hits", ",", "walk", "##ed", "two", "and", "struck", "out", "five", "." ], "ids": [ 12494, 113, 126, 118, 10186, 114, 117, 10479, 62541, 44357, 169, 14927, 11003, 118, 11661, 27817, 88302, 117, 18162, 12403, 27922, 117, 33734, 10336, 10551, 10111, 45622, 10950, 12403, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "also", "Williams", "'", "first", "win", "in", "three", "career", "decisions", "against", "San", "Francisco", "." ], "ids": [ 10377, 10134, 10379, 12494, 112, 10422, 14125, 10106, 11003, 13021, 48126, 11327, 10469, 11798, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "In", "Pittsburgh", ",", "Al", "Martin", "'", "s", "run", "-", "scoring", "single", "sna", "##pped", "a", "fifth", "-", "inning", "tie", "and", "Denny", "Ne", "##agle", "out", "##due", "##led", "John", "Sm", "##olt", "##z", "as", "the", "Pittsburgh", "Pirates", "edge", "##d", "the", "Atlanta", "Braves", "3", "-", "2", "." ], "ids": [ 10167, 23812, 117, 10883, 11235, 112, 187, 14095, 118, 27346, 11376, 62541, 44357, 169, 22237, 118, 110505, 27916, 10111, 83903, 19416, 103392, 10950, 93955, 16376, 10421, 41922, 27667, 10305, 10146, 10105, 23812, 41839, 30599, 10162, 10105, 19600, 97242, 124, 118, 123, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 9, 3, 7, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Braves", "led", "2", "-", "1", "entering", "the", "fifth", ",", "but", "the", "Pirates", "pushed", "across", "two", "runs", "against", "Sm", "##olt", "##z", "(", "20", "-", "7", ")", "." ], "ids": [ 10117, 97242, 12857, 123, 118, 122, 44824, 10105, 22237, 117, 10473, 10105, 41839, 70157, 15130, 10551, 17913, 11327, 41922, 27667, 10305, 113, 10197, 118, 128, 114, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ne", "##agle", "(", "14", "-", "6", ")", "beat", "the", "Braves", "for", "the", "third", "time", "this", "season", ",", "allowing", "two", "runs", "and", "six", "hits", "in", "eight", "innings", "." ], "ids": [ 19416, 103392, 113, 10247, 118, 127, 114, 27868, 10105, 97242, 10142, 10105, 12628, 10635, 10531, 11226, 117, 28357, 10551, 17913, 10111, 12449, 27922, 10106, 16222, 48974, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "St", "Louis", ",", "Gary", "Sheffield", "and", "Devon", "White", "each", "drove", "in", "two", "runs", "and", "Mark", "Hutton", "scattered", "four", "hits", "over", "six", "innings", "to", "lead", "the", "Florida", "Mar", "##lins", "past", "the", "St", ".", "Louis", "Cardinals", "6", "-", "3", "." ], "ids": [ 10167, 10838, 11334, 117, 15516, 31695, 10111, 40165, 12136, 11948, 72256, 10106, 10551, 17913, 10111, 11997, 84219, 95335, 11598, 27922, 10491, 12449, 48974, 10114, 14107, 10105, 13668, 15734, 68541, 17781, 10105, 10838, 119, 11334, 57877, 127, 118, 124, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "White", "added", "a", "solo", "home", "##r", ",", "his", "11th", ",", "off", "relieve", "##r", "Mark", "Pet", "##kov", "##sek", "with", "one", "out", "in", "the", "fifth", ",", "giving", "the", "Mar", "##lins", "a", "6", "-", "0", "lead", "." ], "ids": [ 12136, 16288, 169, 11395, 11816, 10129, 117, 10226, 34062, 117, 11898, 85440, 10129, 11997, 60556, 16433, 57070, 10169, 10464, 10950, 10106, 10105, 22237, 117, 24426, 10105, 15734, 68541, 169, 127, 118, 121, 14107, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "New", "York", ",", "Steve", "Fin", "##ley", "'", "s", "three", "-", "run", "home", "##r", "cap", "##ped", "a", "four", "-", "run", "eighth", "inning", "and", "gave", "the", "San", "Diego", "Padre", "##s", "a", "4", "-", "3", "victory", "over", "New", "York", ",", "sp", "##oi", "##ling", "Bobby", "Valentine", "'", "s", "debut", "as", "Mets", "'", "manager", "." ], "ids": [ 10167, 10287, 10482, 117, 13308, 39982, 12105, 112, 187, 11003, 118, 14095, 11816, 10129, 13337, 16898, 169, 11598, 118, 14095, 46758, 110505, 10111, 15362, 10105, 10469, 14665, 34958, 10107, 169, 125, 118, 124, 19735, 10491, 10287, 10482, 117, 32650, 14638, 11945, 19371, 38456, 112, 187, 13424, 10146, 90707, 112, 16935, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "The", "rally", "made", "a", "winner", "out", "of", "relieve", "##r", "Willie", "Blair" ], "ids": [ 10117, 58575, 11019, 169, 20826, 10950, 10108, 85440, 10129, 34085, 34931 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "Tony", "G", "##wyn", "##n", "and", "Wally", "Joy", "##ner", "had", "two", "hits", "apie", "##ce", ",", "helping", "the", "Padre", "##s", "to", "their", "third", "straight", "win", "." ], "ids": [ 13749, 144, 34690, 10115, 10111, 76701, 32718, 11129, 10374, 10551, 27922, 20456, 10419, 117, 45752, 10105, 34958, 10107, 10114, 10455, 12628, 31214, 14125, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "-", "place", "San", "Diego", "has", "won", "seven", "of", "its", "last", "eight", "games", "and", "improved", "to", "34", "-", "20", "against", "NL", "East", "opponents", "." ], "ids": [ 12128, 118, 11192, 10469, 14665, 10393, 11367, 15767, 10108, 10474, 12469, 16222, 13332, 10111, 34605, 10114, 11069, 118, 10197, 11327, 81130, 11830, 63568, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "In", "Houston", ",", "Tony", "Eu", "##se", "##bio", "'", "s", "eighth", "-", "inning", "sacrifice", "fly", "cap", "##ped", "a", "comeback", "from", "a", "five", "-", "run", "deficit", "that", "gave", "the", "Houston", "Astro", "##s", "a", "6", "-", "5", "victory", "over", "the", "Chicago", "Cubs", "." ], "ids": [ 10167, 18551, 117, 13749, 41859, 10341, 16813, 112, 187, 46758, 118, 110505, 81063, 26155, 13337, 16898, 169, 80800, 10188, 169, 12403, 118, 14095, 107383, 10189, 15362, 10105, 18551, 87075, 10107, 169, 127, 118, 126, 19735, 10491, 10105, 12317, 97605, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "The", "Astro", "##s", "trail", "##ed", "5", "-", "0", "after", "three", "innings", ",", "but", "scored", "three", "runs", "in", "the", "fourth", "and", "one", "in", "the", "sixth", "before", "taking", "the", "lead", "in", "the", "eighth", "." ], "ids": [ 10117, 87075, 10107, 56559, 10336, 126, 118, 121, 10662, 11003, 48974, 117, 10473, 17233, 11003, 17913, 10106, 10105, 16918, 10111, 10464, 10106, 10105, 28913, 11360, 18084, 10105, 14107, 10106, 10105, 46758, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "St", "Louis", ",", "Gary", "Sheffield", "and", "Devon", "White", "each", "drove", "in", "two", "runs", "and", "Mark", "Hutton", "scattered", "four", "hits", "over", "six", "innings", "to", "lead", "the", "Florida", "Mar", "##lins", "past", "the", "St", ".", "Louis", "Cardinals", ",", "6", "-", "3", "," ], "ids": [ 10167, 10838, 11334, 117, 15516, 31695, 10111, 40165, 12136, 11948, 72256, 10106, 10551, 17913, 10111, 11997, 84219, 95335, 11598, 27922, 10491, 12449, 48974, 10114, 14107, 10105, 13668, 15734, 68541, 17781, 10105, 10838, 119, 11334, 57877, 117, 127, 118, 124, 117 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sheffield", ",", "who", "was", "bench", "##ed", "Monday", ",", "delivered", "a", "double", "down", "the", "left", "-", "field", "line", "in", "the", "first", ",", "scoring", "Luis", "Castilla", "and", "Alex", "Arias", "to", "put", "the", "Mar", "##lins", "ahead", "to", "stay", "." ], "ids": [ 31695, 117, 10479, 10134, 86696, 10336, 40714, 117, 37577, 169, 15790, 12935, 10105, 12153, 118, 13939, 12117, 10106, 10105, 10422, 117, 27346, 12816, 25570, 10111, 14728, 62790, 10114, 14499, 10105, 15734, 68541, 35629, 10114, 29597, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "At", "Colorado", ",", "Hal", "Morris", "and", "Eric", "Davis", "each", "home", "##red", "and", "John", "Smile", "##y", "scattered", "six", "hits", "over", "6", "2", "/", "3", "innings", "as", "the", "Cincinnati", "Reds", "defeated", "the", "Colorado", "Rock", "##ies", "4", "-", "3", ",", "sna", "##pping", "a", "four", "-", "game", "losing", "streak", "." ], "ids": [ 11699, 17111, 117, 21699, 17161, 10111, 14057, 14281, 11948, 11816, 15711, 10111, 10421, 56928, 10157, 95335, 12449, 27922, 10491, 127, 123, 120, 124, 48974, 10146, 10105, 31257, 74652, 18058, 10105, 17111, 12158, 11624, 125, 118, 124, 117, 62541, 53570, 169, 11598, 118, 11661, 27817, 88302, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Reds", "took", "a", "one", "-", "run", "lead", "in", "the", "second", "inning", "when", "Morris", "led", "off", "with", "his", "10th", "home", "##r", "off", "starter", "Armando", "Rey", "##nos", "##o", "(", "8", "-", "9", ")", "." ], "ids": [ 10117, 74652, 12149, 169, 10464, 118, 14095, 14107, 10106, 10105, 11132, 110505, 10841, 17161, 12857, 11898, 10169, 10226, 31004, 11816, 10129, 11898, 59099, 44031, 20352, 14386, 10133, 113, 129, 118, 130, 114, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "increased", "their", "bu", "##lge", "to", "4", "-", "0", "in", "the", "third", "when", "Barry", "La", "##rkin", "drew", "a", "one", "-", "out", "walk", ",", "Kevin", "Mitchell", "single", "##d", "and", "Davis", "launched", "his", "22", "##nd", "home", "##r", "over", "the", "right", "-", "field", "wall", "." ], "ids": [ 11696, 19299, 10455, 11499, 35659, 10114, 125, 118, 121, 10106, 10105, 12628, 10841, 18120, 10159, 93068, 49098, 169, 10464, 118, 10950, 33734, 117, 15377, 19906, 11376, 10162, 10111, 14281, 18850, 10226, 10306, 11534, 11816, 10129, 10491, 10105, 13448, 118, 13939, 26699, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "UN", "##ION", "-", "NE", "##W", "Z", "##EA", "##LA", "##ND", "RE", "##CA", "##LL", "ME", "##H", "##RT", "##EN", "##S", "FOR", "F", "##IN", "##AL", "T", "##ES", "##T", "." ], "ids": [ 155, 12022, 32469, 14703, 26578, 52980, 118, 86607, 13034, 163, 36789, 44376, 58521, 71033, 46900, 82834, 47430, 12396, 46935, 50655, 10731, 109544, 143, 27128, 32002, 157, 25054, 11090, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "28" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "New", "Zealand", "rugby", "select", "##ors", "recalled", "fly", "-", "half", "Andrew", "Mehr", "##tens", "on", "Wednesday", "when", "they", "announced", "their", "team", "for", "the", "third", "and", "final", "test", "in", "Johannesburg", "on", "Saturday", "." ], "ids": [ 10117, 10287, 14451, 19812, 47054, 16379, 68117, 26155, 118, 13877, 13999, 74658, 58513, 10135, 57611, 10841, 10689, 13854, 10455, 11121, 10142, 10105, 12628, 10111, 11070, 15839, 10106, 42392, 10135, 24848, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "He", "returns", "in", "place", "of", "Simon", "Cu", "##lha", "##ne", "who", "broke", "a", "w", "##rist", "in", "the", "All", "Blacks", "'", "series", "-", "c", "##lin", "##ching", "victory", "in", "Pretoria", "on", "Saturday", "." ], "ids": [ 10357, 38302, 10106, 11192, 10108, 12237, 34387, 42182, 10238, 10479, 30500, 169, 191, 24953, 10106, 10105, 11101, 107375, 112, 11366, 118, 171, 13020, 41247, 19735, 10106, 45089, 10135, 24848, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Mehr", "##tens", "played", "in", "the", "last", "Tri", "##N", "##ations", "test", "in", "Cape", "Town", "but", "missed", "the", "first", "two", "tests", "in", "the", "current", "series", "after", "tea", "##ring", "a", "car", "##tila", "##ge", "in", "his", "knee", "while", "training", ",", "an", "injury", "which", "needed", "a", "small", "operation", "." ], "ids": [ 74658, 58513, 11553, 10106, 10105, 12469, 36642, 11537, 24965, 15839, 10106, 18642, 14380, 10473, 55233, 10105, 10422, 10551, 34926, 10106, 10105, 14978, 11366, 10662, 57675, 13135, 169, 13000, 49999, 10525, 10106, 10226, 75217, 11371, 15722, 117, 10151, 27443, 10319, 23794, 169, 12474, 20080, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 2, 6, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lock", "Ian", "Jones", "and", "wing", "Jeff", "Wilson", "have", "also", "been", "named", "in", "the", "team", "despite", "doubt", "##s", "over", "their", "fitness", "." ], "ids": [ 76133, 16582, 12298, 10111, 22571, 17218, 13083, 10529, 10379, 10590, 12038, 10106, 10105, 11121, 22087, 86697, 10107, 10491, 10455, 83875, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jones", "has", "a", "knee", "injury", "while", "Wilson", "is", "suffering", "from", "a", "viral", "infection", "." ], "ids": [ 12298, 10393, 169, 75217, 27443, 11371, 13083, 10124, 49552, 10188, 169, 82356, 55223, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Blair", "Larsen", "or", "the", "un", "##cap", "##ped", "Glenn", "Taylor", "are", "on", "stand", "##by", "to", "replace", "Jones", "and", ",", "with", "Jon", "##ah", "Lo", "##mu", "out", "of", "action", "with", "a", "shoulder", "injury", "picked", "up", "in", "Tuesday", "'", "s", "drawn", "match", "against", "G", "##ri", "##qual", "##and", "West", ",", "Eric", "Rush", "is", "favourite", "to", "play", "should", "Wilson", "fail", "to", "recover", "." ], "ids": [ 34931, 37342, 10345, 10105, 10119, 93103, 16898, 26202, 13399, 10301, 10135, 14603, 11530, 10114, 37156, 12298, 10111, 117, 10169, 17749, 12257, 13069, 11717, 10950, 10108, 14204, 10169, 169, 78681, 27443, 52289, 10741, 10106, 70245, 112, 187, 34788, 12356, 11327, 144, 10401, 102260, 14752, 11164, 117, 14057, 33436, 10124, 80494, 10114, 12253, 14819, 13083, 84891, 10114, 94962, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 4, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "Team", ":" ], "ids": [ 12140, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "15", "-", "Christian", "Cullen", ",", "14", "-", "Jeff", "Wilson", ",", "13", "-", "Walter", "Little", ",", "12", "-", "Frank", "Bu", "##nce", ",", "11", "-", "Glen", "Osborne", ";", "10", "-", "Andrew", "Mehr", "##tens", ",", "9", "-", "Justin", "Marshall", ";", "8", "-", "Zi", "##nza", "##n", "Brooke", ",", "7", "-", "Josh", "Kr", "##on", "##feld", ",", "6", "-", "Michael", "Jones", ",", "5", "-", "Ian", "Jones", ",", "4", "-", "Robin", "Brooke", ",", "3", "-", "Ol", "##o", "Brown", ",", "2", "-", "Sean", "Fi", "##tz", "##patrick", "(", "captain", ")", ",", "1", "-", "Craig", "Dow", "##d", "." ], "ids": [ 10208, 118, 11757, 90547, 117, 10247, 118, 17218, 13083, 117, 10249, 118, 12506, 12936, 117, 10186, 118, 11872, 11916, 12150, 117, 10193, 118, 30729, 65888, 132, 10150, 118, 13999, 74658, 58513, 117, 130, 118, 21823, 17705, 132, 129, 118, 99890, 13371, 10115, 46456, 117, 128, 118, 26085, 17640, 10263, 14457, 117, 127, 118, 10631, 12298, 117, 126, 118, 16582, 12298, 117, 125, 118, 17180, 46456, 117, 124, 118, 60160, 10133, 12623, 117, 123, 118, 21286, 36448, 13695, 81573, 113, 28157, 114, 117, 122, 118, 21703, 106035, 10162, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "H", "##OCK", "##E", "##Y", "-", "B", "##ON", "##NE", "##T", "TA", "##K", "##ES", "O", "##VE", "##R", "AS", "SO", "##UT", "##H", "AF", "##RI", "##CA", "##N", "CO", "##AC", "##H", "." ], "ids": [ 145, 96608, 11259, 14703, 118, 139, 30118, 93280, 11090, 91075, 11733, 25054, 152, 68560, 11273, 17421, 71020, 65729, 12396, 55640, 46876, 46900, 11537, 32992, 30340, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "28" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "South", "African", "captain", "Giles", "Bonnet", "was", "named", "by", "the", "South", "African", "Hockey", "Association", "on", "Wednesday", "as", "the", "new", "coach", "of", "the", "men", "'", "s", "national", "side", "." ], "ids": [ 42355, 11056, 13839, 28157, 49355, 94466, 10134, 12038, 10155, 10105, 11056, 13839, 18733, 11751, 10135, 57611, 10146, 10105, 10751, 15701, 10108, 10105, 10588, 112, 187, 11844, 12250, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 4, 8, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bonnet", ",", "who", "has", "been", "coaching", "the", "Kwa", "##zul", "##u", "-", "Natal", "provincial", "team", ",", "takes", "over", "from", "English", "##man", "Gavin", "Feat", "##hers", "##tone", "who", "took", "South", "Africa", "to", "10th", "place", "in", "the", "Olympic", "Games", "in", "Atlanta", "." ], "ids": [ 94466, 117, 10479, 10393, 10590, 57714, 10105, 48511, 67081, 10138, 118, 36024, 24900, 11121, 117, 19135, 10491, 10188, 11616, 10589, 57112, 98112, 65604, 20124, 10479, 12149, 11056, 12880, 10114, 31004, 11192, 10106, 10105, 17952, 14501, 10106, 19600, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 2, 6, 9, 1, 9 ] }, { "tokens": [ "Feat", "##hers", "##tone", ",", "a", "former", "Britain", "captain", ",", "has", "accepted", "a", "coaching", "position", "with", "a", "women", "'", "s", "team", "in", "Ireland", "." ], "ids": [ 98112, 65604, 20124, 117, 169, 11775, 16032, 28157, 117, 10393, 24926, 169, 57714, 12956, 10169, 169, 13190, 112, 187, 11121, 10106, 14637, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "G", "##IB", "##BS", "GE", "##TS", "IN", "##TER", "##NA", "##TION", "##AL", "CA", "##LL", "UP", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 144, 72918, 51535, 62997, 36545, 36351, 99552, 36742, 98207, 32002, 24707, 82834, 53197, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "28" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Western", "Province", "bat", "##sman", "Herschel", "##le", "Gibbs", "was", "the", "only", "un", "##cap", "##ped", "player", "in", "South", "Africa", "'", "s", "14", "-", "man", "squad", "named", "on", "Wednesday", "for", "a", "qua", "##dran", "##gula", "##r", "one", "-", "day", "series", "in", "Kenya", "next", "month", "." ], "ids": [ 13163, 15664, 11519, 24305, 29051, 10284, 57119, 10134, 10105, 10893, 10119, 93103, 16898, 12928, 10106, 11056, 12880, 112, 187, 10247, 118, 10817, 30580, 12038, 10135, 57611, 10142, 169, 14517, 100534, 56901, 10129, 10464, 118, 11940, 11366, 10106, 19686, 13451, 14064, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Kenya", ",", "South", "Africa", ",", "Pakistan", "and", "Sri", "Lanka", "will", "take", "part", "in", "the", "series", "." ], "ids": [ 19686, 117, 11056, 12880, 117, 15437, 10111, 16098, 20828, 11337, 13574, 10668, 10106, 10105, 11366, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "National", "coach", "Bob", "Woo", "##lmer", "said", "Gibbs", ",", "22", ",", "had", "been", "re", "##ward", "##ed", "for", "a", "tre", "##mend", "##ous", "tour", "of", "England", "with", "the", "South", "African", "A", "team", "earlier", "this", "year", "." ], "ids": [ 10655, 15701, 13583, 84270, 78075, 12415, 57119, 117, 10306, 117, 10374, 10590, 11639, 16988, 10336, 10142, 169, 11617, 101480, 13499, 12842, 10108, 11701, 10169, 10105, 11056, 13839, 138, 11121, 18905, 10531, 10924, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "'", "ve", "known", "Herschel", "##le", "since", "he", "was", "11", "years", "old", "and", "he", "showed", "in", "England", "how", "he", "has", "mature", "##d", "." ], "ids": [ 107, 146, 112, 10323, 11053, 29051, 10284, 11764, 10261, 10134, 10193, 10855, 12898, 10111, 10261, 27463, 10106, 11701, 14796, 10261, 10393, 82951, 10162, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "170", "against", "the", "MC", "##C", "was", "an", "innings", "of", "su", "##preme", "class", "against", "the", "best", "bowling", "attack", "we", "faced", "all", "tour", ",", "\"", "Woo", "##lmer", "told", "a", "news", "conference", "." ], "ids": [ 11597, 15410, 11327, 10105, 24650, 10858, 10134, 10151, 48974, 10108, 10198, 107264, 13596, 11327, 10105, 12504, 97228, 16342, 11951, 31952, 10435, 12842, 117, 107, 84270, 78075, 21937, 169, 14424, 25029, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "." ], "ids": [ 119 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "\"", "We", "were", "not", "able", "to", "consider", "Jacques", "Ka", "##llis", ",", "Paul", "Adams", "and", "Shaun", "Poll", "##ock", "due", "to", "injury", "and", "the", "replacement", "##s", "have", "all", "come", "from", "the", "A", "tour", "and", "it", "'", "s", "great", "that", "they", "are", "all", "in", "form", ".", "\"" ], "ids": [ 107, 12865, 10309, 10472, 16197, 10114, 44856, 12745, 25444, 44417, 117, 10772, 16955, 10111, 82113, 89951, 21863, 10850, 10114, 27443, 10111, 10105, 41636, 10107, 10529, 10435, 10678, 10188, 10105, 138, 12842, 10111, 10271, 112, 187, 14772, 10189, 10689, 10301, 10435, 10106, 12188, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spin", "-", "bowling", "all", "-", "round", "##ers", "Nicky", "Bo", "##je", "and", "Derek", "C", "##rook", "##es", "replace", "Poll", "##ock", "and", "Adams", ",", "while", "Gibbs", "comes", "in", "for", "his", "Western", "Province", "coll", "##eague", "Ka", "##llis", "." ], "ids": [ 62393, 118, 97228, 10435, 118, 13569, 10901, 76019, 27622, 10381, 10111, 30815, 140, 95898, 10171, 37156, 89951, 21863, 10111, 16955, 117, 11371, 57119, 21405, 10106, 10142, 10226, 13163, 15664, 28552, 85352, 25444, 44417, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "O", "O", "B-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 9, 4, 9, 9, 4, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Squad", ":", "Hans", "##ie", "C", "##ron", "##je", "(", "captain", ")", ",", "Craig", "Matthews", "(", "vice", "-", "captain", ")", ",", "Dave", "Richardson", ",", "Brian", "M", "##c", "##Millan", ",", "Gary", "Kirsten", ",", "Andrew", "Hudson", ",", "Pat", "Sy", "##m", "##co", "##x", ",", "Jon", "##ty", "Rhodes", ",", "Allan", "Donald", ",", "Fan", "##ie", "de", "Villiers", ",", "Daryl", "##l", "Cu", "##llin", "##an", ",", "Derek", "C", "##rook", "##es", ",", "Herschel", "##le", "G", "##ib", "##s", ",", "Nicky", "Bo", "##je", "." ], "ids": [ 53150, 131, 11768, 10400, 140, 11620, 10381, 113, 28157, 114, 117, 21703, 47100, 113, 16543, 118, 28157, 114, 117, 16073, 29188, 117, 13977, 150, 10350, 78249, 117, 15516, 77584, 117, 13999, 20946, 117, 24714, 32879, 10147, 10812, 10686, 117, 17749, 11195, 35118, 117, 18750, 16437, 117, 30126, 10400, 10104, 56139, 117, 103200, 10161, 34387, 85129, 10206, 117, 30815, 140, 95898, 10171, 117, 29051, 10284, 144, 17609, 10107, 117, 76019, 27622, 10381, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "BA", "##S", "##K", "##ET", "##BA", "##LL", "-", "OL", "##Y", "##MP", "##IA", "##KO", "##S", "BE", "##AT", "RE", "##D", "STAR", "71", "-", "57", "." ], "ids": [ 39999, 10731, 11733, 52338, 35999, 82834, 118, 19768, 14703, 79936, 35976, 57277, 10731, 46291, 32071, 71033, 11490, 103737, 12513, 118, 11817, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "28" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Olympia", "##kos", "of", "Greece", "beat", "Yugoslavia", "'", "s", "Red", "Star", "71", "-", "57", "(", "half", "##time", "40", "-", "34", ")", "in", "the", "first", "match", "of", "an", "international", "club", "basketball", "tournament", "on", "Wednesday", "." ], "ids": [ 39624, 18845, 10108, 25154, 27868, 38168, 112, 187, 11641, 11836, 12513, 118, 11817, 113, 13877, 18086, 10533, 118, 11069, 114, 10106, 10105, 10422, 12356, 10108, 10151, 12533, 11111, 22111, 17390, 10135, 57611, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 1, 9, 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Partizan", "(", "Yugoslavia", ")", ",", "Alba", "(", "Germany", ")", ",", "Dinamo", "(", "Russia", ")", "and", "Ben", "##etto", "##n", "(", "Italy", ")", "are", "also", "taking", "part", "in", "the", "event", "which", "continues", "until", "Saturday", "." ], "ids": [ 93130, 113, 38168, 114, 117, 26613, 113, 12775, 114, 117, 35011, 113, 14664, 114, 10111, 13304, 24327, 10115, 113, 11619, 114, 10301, 10379, 18084, 10668, 10106, 10105, 14416, 10319, 25266, 11444, 24848, 119 ], "entity": [ "B-ORG", "O", "B-LOC", "O", "O", "B-ORG", "O", "B-LOC", "O", "O", "B-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 1, 9, 9, 3, 9, 1, 9, 9, 3, 9, 1, 9, 9, 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "R", "##US", "##SI", "##A", "AND", "BR", "##A", "##Z", "##IL", "DR", "##A", "##W", "2", "-", "2", "IN", "FR", "##IE", "##ND", "##L", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 155, 32612, 44802, 10738, 52428, 49351, 10738, 13966, 38850, 45457, 10738, 13034, 123, 118, 123, 36351, 64655, 71655, 58521, 11369, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "28" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russia", "and", "Brazil", "drew", "2", "-", "2" ], "ids": [ 14664, 10111, 16765, 49098, 123, 118, 123 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "(", "half", "##time", "1", "-", "0", ")", "in", "a", "friendly", "soccer", "international", "on", "Wednesday", "." ], "ids": [ 113, 13877, 18086, 122, 118, 121, 114, 10106, 169, 43941, 41356, 12533, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Russia", "-", "Yuri", "Niki", "##foro", "##v", "(", "18th", "minute", ")", ",", "Vladislav", "Rod", "##imo", "##v" ], "ids": [ 14664, 118, 48614, 105247, 64511, 10477, 113, 27669, 21760, 114, 117, 96738, 30602, 15487, 10477 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "(", "80", "##th", ")" ], "ids": [ 113, 10832, 11143, 114 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Brazil", "-", "Don", "##ize", "##tti", "(", "47", "##th", ")", ",", "Ronaldo", "(", "85", "##th", ")" ], "ids": [ 16765, 118, 11740, 19181, 12683, 113, 11413, 11143, 114, 117, 56937, 113, 12017, 11143, 114 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##tende", "##nce", ":", "20", ",", "000" ], "ids": [ 11699, 58503, 12150, 131, 10197, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Q", "##U", "##AS", "##H", "-", "H", "##ON", "##G", "OP", "##EN", "F", "##IR", "##ST", "R", "##O", "##UN", "##D", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 156, 19282, 12022, 38025, 12396, 118, 145, 30118, 11447, 55355, 50655, 143, 73522, 32995, 155, 11403, 69849, 11490, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "28" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "round", "results", "in", "the", "Hong" ], "ids": [ 12128, 13569, 17466, 10106, 10105, 15078 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "Kong", "Open", "on", "Wednesday", "(", "pre", "##fix", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 14577, 11919, 10135, 57611, 113, 12229, 57014, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "Rodney", "E", "##yle", "##s", "(", "Australia", ")", "beat", "Zara", "##k", "Ja", "##han", "Khan", "(", "Pakistan", ")" ], "ids": [ 123, 118, 53784, 142, 18369, 10107, 113, 11729, 114, 27868, 104766, 10174, 28248, 11781, 16324, 113, 15437, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "15", "-", "6", "8", "-", "15", "15", "-", "10", "7", "-", "15", "15", "-", "12" ], "ids": [ 10208, 118, 127, 129, 118, 10208, 10208, 118, 10150, 128, 118, 10208, 10208, 118, 10186 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Peter", "Nico", "##l", "(", "Scotland", ")", "beat", "Julian", "Well", "##ings", "(", "England", ")", "15", "-", "8" ], "ids": [ 125, 118, 10979, 44557, 10161, 113, 16901, 114, 27868, 23154, 37025, 18800, 113, 11701, 114, 10208, 118, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "7", "15", "-", "6" ], "ids": [ 10208, 118, 128, 10208, 118, 127 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Derek", "Ryan", "(", "Ireland", ")", "beat", "5", "-", "Simon", "Parke", "(", "England", ")", "15", "-", "11", "15", "-", "11" ], "ids": [ 30815, 16466, 113, 14637, 114, 27868, 126, 118, 12237, 104039, 113, 11701, 114, 10208, 118, 10193, 10208, 118, 10193 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "15", "15", "-", "11" ], "ids": [ 123, 118, 10208, 10208, 118, 10193 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "Chris", "Walker", "(", "England", ")", "beat", "Julien", "Bone", "##tat", "(", "France", ")", "15", "-", "12" ], "ids": [ 128, 118, 13151, 15432, 113, 11701, 114, 27868, 26726, 52035, 13485, 113, 10688, 114, 10208, 118, 10186 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "6", "15", "-", "2" ], "ids": [ 10208, 118, 127, 10208, 118, 123 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jon", "##ath", "##on", "Power", "(", "Canada", ")", "beat", "Ahmed", "Bara", "##da", "(", "Egypt", ")", "11", "-", "15", "8", "-", "15" ], "ids": [ 17749, 44196, 10263, 12952, 113, 11635, 114, 27868, 25530, 95901, 10229, 113, 20440, 114, 10193, 118, 10208, 129, 118, 10208 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "13", "15", "-", "11", "15", "-", "2" ], "ids": [ 10208, 118, 10249, 10208, 118, 10193, 10208, 118, 123 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Am", "##r", "Sha", "##bana", "(", "Egypt", ")", "beat", "John", "White", "(", "Australia", ")", "10", "-", "15", "15", "-", "9" ], "ids": [ 11500, 10129, 106583, 31380, 113, 20440, 114, 27868, 10421, 12136, 113, 11729, 114, 10150, 118, 10208, 10208, 118, 130 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "10", "16", "-", "17", "15", "-", "1" ], "ids": [ 10208, 118, 10150, 10250, 118, 10273, 10208, 118, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paul", "Johnson", "(", "England", ")", "beat", "Tony", "Hands", "(", "England", ")", "12", "-", "15", "15", "-", "11" ], "ids": [ 10772, 13241, 113, 11701, 114, 27868, 13749, 50526, 113, 11701, 114, 10186, 118, 10208, 10208, 118, 10193 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "15", "15", "-", "6", "15", "-", "11" ], "ids": [ 128, 118, 10208, 10208, 118, 127, 10208, 118, 10193 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zu", "##bai", "##r", "Ja", "##han", "Khan", "(", "Pakistan", ")", "beat", "Fa", "##hee", "##m", "Khan", "(", "Hong", "Kong", ")", "12", "-", "15" ], "ids": [ 16229, 47727, 10129, 28248, 11781, 16324, 113, 15437, 114, 27868, 44271, 110151, 10147, 16324, 113, 15078, 14577, 114, 10186, 118, 10208 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "10", "15", "-", "10", "15", "-", "10" ], "ids": [ 10208, 118, 10150, 10208, 118, 10150, 10208, 118, 10150 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R" ], "ids": [ 155 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "BA", "##S", "##K", "##ET", "##BA", "##LL", "-", "FOR", "##M", "##UL", "##A", "SH", "##EL", "##L", "W", "##IN", "GA", "##ME", "ONE", "IN", "P", "##HI", "##L", "##IP", "##P", "##INE", "##S", "." ], "ids": [ 39999, 10731, 11733, 52338, 35999, 82834, 118, 109544, 11517, 100673, 10738, 38702, 68999, 11369, 160, 27128, 74212, 42424, 57929, 36351, 153, 108880, 11369, 30331, 11127, 83198, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##IL", "##A", "1996", "-", "08", "-", "28" ], "ids": [ 73020, 38850, 10738, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "game", "one", "of", "the", "Philippine", "Basketball", "Association", "second", "conference", "finals", "on", "Tuesday", ":" ], "ids": [ 32070, 16203, 10108, 11661, 10464, 10108, 10105, 28893, 25693, 11751, 11132, 25029, 21758, 10135, 70245, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Formula", "Shell", "beat", "Alaska", "Milk", "85", "-", "82", "(", "36", "-", "46", ")" ], "ids": [ 21459, 47581, 27868, 20588, 61459, 12017, 118, 12180, 113, 11055, 118, 11528, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Formula", "Shell", "leads", "best", "-", "of", "-", "seven", "series", "1", "-", "0", ")" ], "ids": [ 113, 21459, 47581, 34868, 12504, 118, 10108, 118, 15767, 11366, 122, 118, 121, 114 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "IS", "##RA", "##EL", "##I", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 40214, 29990, 68999, 11281, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "28" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "first", "division" ], "ids": [ 33036, 10108, 10422, 13751 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "soccer", "matches", "played", "over", "the", "weekend", "and", "Tuesday", ":" ], "ids": [ 41356, 18258, 11553, 10491, 10105, 43440, 10111, 70245, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ha", "##po", "##el", "K", "##far", "Sava", "0", "Ha", "##po", "##el", "Za", "##frir", "##im", "Ho", "##lon", "1" ], "ids": [ 13740, 13520, 10570, 148, 29731, 81941, 121, 13740, 13520, 10570, 14074, 104410, 11759, 20220, 15709, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Ha", "##po", "##el", "Tel", "Aviv", "1", "Maccabi", "Haifa", "3" ], "ids": [ 13740, 13520, 10570, 25369, 35057, 122, 92387, 78403, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Ha", "##po", "##el", "Jerusalem", "0", "Ha", "##po", "##el", "Pet", "##ah", "Ti", "##kva", "3" ], "ids": [ 13740, 13520, 10570, 20599, 121, 13740, 13520, 10570, 60556, 12257, 29033, 86177, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Ha", "##po", "##el", "Iron", "##i", "R", "##ish", "##on", "Le", "##zion", "3", "Ha", "##po", "##el", "Tai", "##be", "1" ], "ids": [ 13740, 13520, 10570, 19247, 10116, 155, 15529, 10263, 10281, 40307, 124, 13740, 13520, 10570, 25633, 11044, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Ha", "##po", "##el", "Bei", "##t", "She", "'", "an", "0", "Ha", "##po", "##el", "Bei", "##t", "She", "'", "an", "1" ], "ids": [ 13740, 13520, 10570, 12664, 10123, 11149, 112, 10151, 121, 13740, 13520, 10570, 12664, 10123, 11149, 112, 10151, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Maccabi", "Pet", "##ah", "Ti", "##kva", "0", "Beta", "##r", "Jerusalem", "3" ], "ids": [ 92387, 60556, 12257, 29033, 86177, 121, 40392, 10129, 20599, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Ha", "##po", "##el", "Haifa", "3", "Maccabi", "Tel", "Aviv", "1" ], "ids": [ 13740, 13520, 10570, 78403, 124, 92387, 25369, 35057, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Ha", "##po", "##el", "Beer", "##sheva", "2", "Maccabi", "Herz", "##liya", "0" ], "ids": [ 13740, 13520, 10570, 49989, 109637, 123, 92387, 48480, 83090, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "SE", "##LE", "##S", "H", "##AS", "W", "##AL", "##KO", "##VE", "##R", "TO", "U", ".", "S", ".", "OP", "##EN", "T", "##HI", "##RD", "R", "##O", "##UN", "##D", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 23056, 51036, 10731, 145, 38025, 160, 32002, 57277, 68560, 11273, 58573, 158, 119, 156, 119, 55355, 50655, 157, 108880, 84444, 155, 11403, 69849, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "seed", "and", "co", "-", "world", "number", "one", "Monica", "Se", "##les", "advanced", "to", "the", "third", "round", "of", "the", "U", ".", "S", ".", "Open", "Tennis", "Championships", "without", "hitting", "a", "ball", "on", "Wednesday", "." ], "ids": [ 14181, 49282, 10111, 11170, 118, 11356, 11487, 10464, 29242, 11045, 11268, 27072, 10114, 10105, 12628, 13569, 10108, 10105, 158, 119, 156, 119, 11919, 27380, 17264, 13663, 88998, 169, 20724, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Se", "##les", ",", "the", "1991", "and", "1992", "champion", "who", "dropped", "just", "one", "game", "in", "her", "opening", "match", ",", "was", "scheduled", "to", "play", "Laurence", "Court", "##ois", "of", "Belgium", "We", "##dne", "##say", "night", "." ], "ids": [ 11045, 11268, 117, 10105, 10442, 10111, 10450, 17689, 10479, 30241, 12820, 10464, 11661, 10106, 10485, 17975, 12356, 117, 10134, 34081, 10114, 12253, 34946, 14100, 19636, 10108, 26519, 12865, 20714, 73788, 16903, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "tournament", "officials", "announced", "about", "four", "-", "and", "-", "a", "-", "half", "hours", "before", "the", "match", "that", "Court", "##ois", "had", "pulled", "out", "due", "to", "a", "left", "knee", "bone", "in", "##f", "##lam", "##mation", ",", "moving", "Se", "##les", "into", "the", "next", "round", "on", "a", "walk", "##over", "." ], "ids": [ 16976, 17390, 27730, 13854, 10978, 11598, 118, 10111, 118, 169, 118, 13877, 19573, 11360, 10105, 12356, 10189, 14100, 19636, 10374, 65884, 10950, 10850, 10114, 169, 12153, 75217, 57254, 10106, 10575, 21114, 41856, 117, 23557, 11045, 11268, 10708, 10105, 13451, 13569, 10135, 169, 33734, 16666, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "SE", "##RI", "##O", "##US", "ME", "##D", "##VE", "##DE", "##V", "IS", "H", "##AV", "##ING", "F", "##UN", "AG", "##A", "##IN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 23056, 46876, 11403, 32612, 47430, 11490, 68560, 60675, 11779, 40214, 145, 99903, 50183, 143, 69849, 17935, 10738, 27128, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Richard", "Finn" ], "ids": [ 11118, 37051 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Out", "##sp", "##oken", "Andrei", "Medvedev", "exchange", "##d", "his", "reputation", "as", "the", "c", "##low", "##n", "prince", "of", "tennis", "on", "Wednesday", "for", "a", "new", "no", "-", "non", "##sens", "##e", "attitude", "that", "has", "made", "life", "on", "the", "courts", "fun", "again", "." ], "ids": [ 14504, 54609, 91556, 40594, 91681, 27714, 10162, 10226, 44214, 10146, 10105, 171, 27863, 10115, 24112, 10108, 20944, 10135, 57611, 10142, 169, 10751, 10192, 118, 10446, 59077, 10112, 54039, 10189, 10393, 11019, 12103, 10135, 10105, 32860, 41807, 13123, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "think", "I", "'", "m", "much", "more", "focused", "on", "what", "I", "have", "to", "do", ",", "and", "that", "'", "s", "playing", "tennis", ",", "\"", "Medvedev", "said", "after", "ro", "##uting", "French", "##man", "Jean", "-", "Philippe", "Fl", "##eur", "##ian", "6", "-", "2", "6", "-", "0", "6", "-", "1", "in", "the", "opening", "round", "of", "the", "U", ".", "S", ".", "Open", "." ], "ids": [ 107, 146, 27874, 146, 112, 181, 13172, 10798, 31293, 10135, 12976, 146, 10529, 10114, 10149, 117, 10111, 10189, 112, 187, 14879, 20944, 117, 107, 91681, 12415, 10662, 25470, 92609, 11894, 10589, 10766, 118, 15408, 29981, 12986, 11630, 127, 118, 123, 127, 118, 121, 127, 118, 122, 10106, 10105, 17975, 13569, 10108, 10105, 158, 119, 156, 119, 11919, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 2, 6, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "It", "was", "Medvedev", "'", "s", "sixth", "victory", "in", "a", "row", "after", "winning", "his", "first", "tournament", "of", "the", "year", "last", "week", "at", "the", "Hamlet", "Cup", "." ], "ids": [ 10377, 10134, 91681, 112, 187, 28913, 19735, 10106, 169, 45006, 10662, 16542, 10226, 10422, 17390, 10108, 10105, 10924, 12469, 16118, 10160, 10105, 48334, 11544, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "\"", "I", "real", "##ised", "this", "year", ",", "that", "without", "putting", "99", ".", "9", "percent", "of", "your", "mind", "into", "tennis", ",", "I", "do", "n", "'", "t", "think", "you", "can", "successful", ",", "\"", "said", "the", "22", "-", "year", "-", "old", "Medvedev", "." ], "ids": [ 107, 146, 13486, 20666, 10531, 10924, 117, 10189, 13663, 71028, 12187, 119, 130, 22362, 10108, 20442, 21133, 10708, 20944, 117, 146, 10149, 182, 112, 188, 27874, 13028, 10944, 17330, 117, 107, 12415, 10105, 10306, 118, 10924, 118, 12898, 91681, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "\"", "The", "whole", "day", "I", "'", "m", "thinking", "ab", "##nout", "tennis", "." ], "ids": [ 107, 10117, 21047, 11940, 146, 112, 181, 56294, 11357, 47455, 20944, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "felt", "that", "all", "the", "other", "things", "I", "was", "doing", "the", "years", "before", ",", "they", "were", "dis", "##tract", "##ing", "me", ",", "they", "were", "not", "helping", "me", "at", "all", ".", "\"" ], "ids": [ 146, 24666, 10189, 10435, 10105, 10684, 24682, 146, 10134, 30918, 10105, 10855, 11360, 117, 10689, 10309, 27920, 94666, 10230, 10911, 117, 10689, 10309, 10472, 45752, 10911, 10160, 10435, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "Medvedev", "that", "meant", "confini", "##ng", "his", "post", "-", "match", "comments", "to", "tennis", "and", "not", "going", "off", "on", "tira", "##des", "about", "about", "per", "##ip", "##hera", "##l", "issues", "such", "as", "the", "poor", "quality", "of", "food", "in", "the", "players", "lo", "##unge", ",", "an", "enter", "##taining", "ran", "##t", "that", "took", "his", "mind", "off", "the", "task", "at", "hand", "." ], "ids": [ 11399, 91681, 10189, 31580, 77354, 10376, 10226, 11841, 118, 12356, 61565, 10114, 20944, 10111, 10472, 19090, 11898, 10135, 102770, 10920, 10978, 10978, 10178, 17437, 73995, 10161, 17850, 11049, 10146, 10105, 23247, 21905, 10108, 18301, 10106, 10105, 16021, 10406, 37948, 117, 10151, 31006, 70700, 17044, 10123, 10189, 12149, 10226, 21133, 11898, 10105, 37758, 10160, 15230, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "know", "what", "I", "'", "m", "here", "for", ",", "\"", "said", "Medvedev", ",", "who", "lost", "in", "the", "second", "round", "of", "the", "Open", "the", "last", "two", "years", "after", "reaching", "the", "quarters", "in", "1993", ",", "the", "same", "year", "he", "tried", "his", "hand", "as", "a", "restaurant", "critic", "." ], "ids": [ 107, 146, 21852, 12976, 146, 112, 181, 19353, 10142, 117, 107, 12415, 91681, 117, 10479, 14172, 10106, 10105, 11132, 13569, 10108, 10105, 11919, 10105, 12469, 10551, 10855, 10662, 34186, 10105, 79322, 10106, 10463, 117, 10105, 11561, 10924, 10261, 27156, 10226, 15230, 10146, 169, 26234, 39727, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "'", "m", "not", "here", "to", "fight", "the", "press", "or", "talk", "about", "the", "food", "or", "enter", "##tain", "the", "people", "off", "the", "court", "." ], "ids": [ 107, 146, 112, 181, 10472, 19353, 10114, 20780, 10105, 21040, 10345, 31311, 10978, 10105, 18301, 10345, 31006, 37879, 10105, 11426, 11898, 10105, 14866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "'", "m", "here", "to", "play", "tennis", "and", "to", "win", "." ], "ids": [ 146, 112, 181, 19353, 10114, 12253, 20944, 10111, 10114, 14125, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "have", "much", "less", "fun", "off", "the", "court", "." ], "ids": [ 146, 10529, 13172, 15306, 41807, 11898, 10105, 14866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "have", "much", "more", "fun", "on", "the", "court", ",", "\"", "he", "said", "." ], "ids": [ 146, 10529, 13172, 10798, 41807, 10135, 10105, 14866, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Just", "three", "years", "ago", "Medvedev", "was", "one", "of", "the", "world", "'", "s", "best", ",", "with", "a", "ranking", "of", "six", "after", "reaching", "the", "French", "Open", "semifinal", "and", "winning", "three", "tournaments", "." ], "ids": [ 17116, 11003, 10855, 36390, 91681, 10134, 10464, 10108, 10105, 11356, 112, 187, 12504, 117, 10169, 169, 27153, 10108, 12449, 10662, 34186, 10105, 11894, 11919, 65085, 10111, 16542, 11003, 67330, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Medvedev", "'", "s", "ranking", "slowly", "began", "to", "drop", "last", "year", "as", "he", "struggled", "with", "a", "w", "##rist", "injury", "." ], "ids": [ 16976, 91681, 112, 187, 27153, 63088, 11941, 10114, 36365, 12469, 10924, 10146, 10261, 96142, 10169, 169, 191, 24953, 27443, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Ukrainian", "finally", "hit", "a", "low", "of", "44", "##th", "two", "months", "ago", "." ], "ids": [ 10117, 30718, 21256, 14946, 169, 15626, 10108, 11126, 11143, 10551, 15555, 36390, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "some", "##where", "where", "I", "would", "n", "'", "t", "like", "to", "stay", "very", "long", ",", "\"", "Medvedev", "said", "of", "his", "current", "ranking", "of", "36", ".", "\"" ], "ids": [ 107, 10377, 112, 187, 11152, 30935, 10940, 146, 10894, 182, 112, 188, 11850, 10114, 29597, 12558, 11695, 117, 107, 91681, 12415, 10108, 10226, 14978, 27153, 10108, 11055, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "a", "part", "of", "the", "penalty", "that", "I", "have", "to", "accept", ".", "\"" ], "ids": [ 10377, 112, 187, 169, 10668, 10108, 10105, 40924, 10189, 146, 10529, 10114, 45218, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "part", "of", "his", "new", "business", "##like", "approach", ",", "Medvedev", "hired", "Australian", "coach", "Bob", "Brett", "at", "the", "start", "of", "this", "year", "and", "the", "partnership", "is", "beginning", "to", "pay", "off", "." ], "ids": [ 10882, 10668, 10108, 10226, 10751, 14155, 15805, 23068, 117, 91681, 35444, 12829, 15701, 13583, 43719, 10160, 10105, 15148, 10108, 10531, 10924, 10111, 10105, 36944, 10124, 17967, 10114, 16868, 11898, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 2, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "At", "the", "beginning", "of", "the", "year", "we", "started", "from", "zero", ",", "\"", "said", "Medvedev", ".", "\"" ], "ids": [ 107, 11699, 10105, 17967, 10108, 10105, 10924, 11951, 13457, 10188, 28375, 117, 107, 12415, 91681, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "Win", "##ning", "in", "Long", "Island", "(", "last", "week", ")", "was", "like", "winning", "for", "the", "first", "time", ".", "\"" ], "ids": [ 60987, 11269, 10106, 13307, 11848, 113, 12469, 16118, 114, 10134, 11850, 16542, 10142, 10105, 10422, 10635, 119, 107 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "Medvedev", "'", "s", "77", "-", "minute", "rom", "##p", "past", "Fl", "##eur", "##ian", "was", "rather", "ordinary", ",", "the", "fact", "that", "the", "two", "were", "playing", "each", "other", "was", "rather", "remarkable", "." ], "ids": [ 14600, 91681, 112, 187, 12527, 118, 21760, 86945, 10410, 17781, 29981, 12986, 11630, 10134, 16863, 64481, 117, 10105, 18638, 10189, 10105, 10551, 10309, 14879, 11948, 10684, 10134, 16863, 88916, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "original", "draw", ",", "Medvedev", "and", "Fl", "##eur", "##ian", "were", "slott", "##ed", "to", "play", "each", "other", "." ], "ids": [ 10167, 10105, 11364, 25974, 117, 91681, 10111, 29981, 12986, 11630, 10309, 79733, 10336, 10114, 12253, 11948, 10684, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "controversy", "forced", "the", "draw", "to", "be", "done", "over", "-", "-", "against", "odd", "##s", "of", "151", "-", "to", "-", "1", "-", "-", "Medvedev", "and", "Fl", "##eur", "##ian", "drew", "each", "other", "a", "second", "time", "." ], "ids": [ 12242, 46373, 20054, 10105, 25974, 10114, 10347, 20378, 10491, 118, 118, 11327, 104356, 10107, 10108, 20330, 118, 10114, 118, 122, 118, 118, 91681, 10111, 29981, 12986, 11630, 49098, 11948, 10684, 169, 11132, 10635, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "When", "I", "saw", "the", "new", "draw", "I", "did", "n", "'", "t", "have", "to", "change", "my", "preparation", ",", "\"", "Medvedev", "said", ".", "\"" ], "ids": [ 107, 12242, 146, 17112, 10105, 10751, 25974, 146, 12172, 182, 112, 188, 10529, 10114, 15453, 15127, 59386, 117, 107, 91681, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "I", "think", "it", "'", "s", "des", "##tine", "##d", "that", "it", "turned", "out", "for", "me", ".", "\"" ], "ids": [ 146, 27874, 10271, 112, 187, 10139, 28830, 10162, 10189, 10271, 21031, 10950, 10142, 10911, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "W", "##ED", "##NE", "##SD", "##A", "##Y", "'", "S", "RE", "##SU", "##L", "##TS", "FR", "##OM", "THE", "U", ".", "S", ".", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 160, 33809, 93280, 83452, 10738, 14703, 112, 156, 71033, 88592, 11369, 36545, 64655, 37079, 17443, 158, 119, 156, 119, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Wednesday", "'", "s", "matches", "in", "the", "U", ".", "S", ".", "Open", "Tennis", "Championships", "at", "the", "National", "Tennis", "Centre", "(", "pre", "##fix", "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 33036, 10108, 57611, 112, 187, 18258, 10106, 10105, 158, 119, 156, 119, 11919, 27380, 17264, 10160, 10105, 10655, 27380, 12838, 113, 12229, 57014, 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "-", "Gabriela", "Saba", "##tini", "(", "Argentina", ")", "beat", "Ann", "Gross", "##man", "(", "U", ".", "S", ".", ")", "6", "-", "2", "6", "-", "3" ], "ids": [ 10208, 118, 51311, 86627, 29619, 113, 12853, 114, 27868, 15879, 50557, 10589, 113, 158, 119, 156, 119, 114, 127, 118, 123, 127, 118, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Irina", "Sp", "##ir", "##lea", "(", "Romania", ")", "beat", "Maria", "Jose", "Ga", "##idan", "##o", "(", "Argentina", ")", "6", "-", "1", "6", "-", "2" ], "ids": [ 60862, 46361, 10835, 25277, 113, 13927, 114, 27868, 11066, 23029, 69699, 52299, 10133, 113, 12853, 114, 127, 118, 122, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", "-", "Lindsay", "Davenport", "(", "U", ".", "S", ".", ")", "beat", "Henrietta", "Nagy", "##ova", "(", "Slovakia", ")", "6", "-", "0", "6", "-", "4" ], "ids": [ 129, 118, 42228, 74533, 113, 158, 119, 156, 119, 114, 27868, 104889, 26551, 12804, 113, 43031, 114, 127, 118, 121, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anne", "-", "Ga", "##elle", "Sid", "##ot", "(", "France", ")", "beat", "Wang", "Shi", "-", "Tin", "##g", "(", "Taiwan", ")", "6", "-", "4", "3", "-", "6", "6", "-", "3" ], "ids": [ 13490, 118, 69699, 14000, 31091, 11290, 113, 10688, 114, 27868, 17250, 44795, 118, 48800, 10240, 113, 19449, 114, 127, 118, 125, 124, 118, 127, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sand", "##rine", "Test", "##ud", "(", "France", ")", "beat", "Cristina", "Torre", "##ns", "-", "Vale", "##ro", "(", "Spain", ")", "6", "-", "2", "6", "-", "1" ], "ids": [ 35071, 28728, 22495, 11679, 113, 10688, 114, 27868, 28286, 20630, 10891, 118, 32286, 10567, 113, 16149, 114, 127, 118, 123, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "first", "round" ], "ids": [ 13026, 112, 187, 20527, 117, 10422, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Andrei", "Medvedev", "(", "Ukraine", ")", "beat", "Jean", "-", "Philippe", "Fl", "##eur", "##ian", "(", "France", ")", "6", "-", "2", "6", "-", "0", "6", "-", "1" ], "ids": [ 40594, 91681, 113, 19883, 114, 27868, 10766, 118, 15408, 29981, 12986, 11630, 113, 10688, 114, 127, 118, 123, 127, 118, 121, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "David", "Na", "##inkin", "(", "South", "Africa", ")", "beat", "9", "-", "Wayne", "Ferreira", "(", "South", "Africa", ")", "6", "-", "4", "6", "-", "4", "2", "-", "6", "7", "-", "5" ], "ids": [ 10804, 10685, 106014, 113, 11056, 12880, 114, 27868, 130, 118, 18547, 39227, 113, 11056, 12880, 114, 127, 118, 125, 127, 118, 125, 123, 118, 127, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "David", "R", "##ik", "##l", "(", "Czech", "Republic", ")", "beat", "Hi", "##cha", "##m", "Ara", "##zi", "(", "Morocco", ")", "6", "-", "4", "7", "-", "5", "6", "-", "2" ], "ids": [ 10804, 155, 10896, 10161, 113, 22148, 13681, 114, 27868, 20065, 12964, 10147, 54789, 11282, 113, 57295, 114, 127, 118, 125, 128, 118, 126, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Andrea", "Ga", "##uden", "##zi", "(", "Italy", ")", "beat", "Shu", "##zo", "Mats", "##uo", "##ka", "(", "Japan", ")", "7", "-", "6", "(", "7", "-", "4", ")", "6", "-", "2", "6", "-", "3" ], "ids": [ 16101, 69699, 23280, 11282, 113, 11619, 114, 27868, 56448, 12096, 86768, 21187, 10371, 113, 11891, 114, 128, 118, 127, 113, 128, 118, 125, 114, 127, 118, 123, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "first", "round" ], "ids": [ 13026, 112, 187, 20527, 117, 10422, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "17", "-", "Felix", "Man", "##til", "##la", "(", "Spain", ")", "beat", "Fernando", "Mel", "##igen", "##i", "(", "Brazil", ")", "6", "-", "1", "6", "-", "7", "(", "2", "-", "7", ")", "7", "-", "6", "(", "7", "-", "5", ")", "6", "-", "3" ], "ids": [ 10273, 118, 21683, 11343, 19156, 10330, 113, 16149, 114, 27868, 14022, 40060, 13741, 10116, 113, 16765, 114, 127, 118, 122, 127, 118, 128, 113, 123, 118, 128, 114, 128, 118, 127, 113, 128, 118, 126, 114, 127, 118, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jonas", "B", "##jor", "##km", "##an", "(", "Sweden", ")", "beat", "Karol", "Ku", "##cera", "(", "Slovakia", ")", "6", "-", "2", "5", "-", "7", "7", "-", "6", "(", "7", "-", "3", ")", "7", "-", "5" ], "ids": [ 22653, 139, 100248, 23440, 10206, 113, 20937, 114, 27868, 40129, 49869, 28568, 113, 43031, 114, 127, 118, 123, 126, 118, 128, 128, 118, 127, 113, 128, 118, 124, 114, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jan", "Kr", "##os", "##lak", "(", "Slovakia", ")", "beat", "Chris", "Wood", "##ruf", "##f", "(", "U", ".", "S", ".", ")", "2", "-", "6", "6", "-", "4", "3", "-", "6", "6", "-", "2", "7", "-", "6", "(", "7", "-", "1", ")" ], "ids": [ 11806, 17640, 10310, 21995, 113, 43031, 114, 27868, 13151, 18315, 59459, 10575, 113, 158, 119, 156, 119, 114, 123, 118, 127, 127, 118, 125, 124, 118, 127, 127, 118, 123, 128, 118, 127, 113, 128, 118, 122, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Amanda", "Co", "##etz", "##er", "(", "South", "Africa", ")", "beat", "Maria", "##an", "de", "S", "##ward", "##t", "(", "South", "Africa", ")", "6", "-", "2", "7", "-", "5" ], "ids": [ 30380, 13098, 75065, 10165, 113, 11056, 12880, 114, 27868, 11066, 10206, 10104, 156, 16988, 10123, 113, 11056, 12880, 114, 127, 118, 123, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Linda", "Wild", "(", "U", ".", "S", ".", ")", "beat", "Kris", "##tie", "Boo", "##gert", "(", "Netherlands", ")", "5", "-", "7", "6", "-", "3", "6", "-", "3" ], "ids": [ 22227, 15899, 113, 158, 119, 156, 119, 114, 27868, 69041, 14859, 102498, 57241, 113, 22043, 114, 126, 118, 128, 127, 118, 124, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kimberly", "Po", "(", "U", ".", "S", ".", ")", "beat", "Kristina", "Brand", "##i", "(", "U", ".", "S", ".", ")", "6", "-", "1", "6", "-", "4" ], "ids": [ 106840, 11255, 113, 158, 119, 156, 119, 114, 27868, 61902, 28887, 10116, 113, 158, 119, 156, 119, 114, 127, 118, 122, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Helena", "Su", "##kova", "(", "Czech", "Republic", ")", "beat", "Paola", "Sua", "##rez", "(", "Argentina", ")", "6", "-", "4", "7", "-", "6", "(", "7", "-", "2", ")" ], "ids": [ 22295, 12271, 61653, 113, 22148, 13681, 114, 27868, 57699, 24157, 34305, 113, 12853, 114, 127, 118, 125, 128, 118, 127, 113, 128, 118, 123, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "Monica", "Se", "##les", "(", "U", ".", "S", ".", ")", "beat", "Laurence", "Court", "##ois", "(", "Belgium", ")", "by", "walk", "##over", "(", "knee", "injury", ")" ], "ids": [ 123, 118, 29242, 11045, 11268, 113, 158, 119, 156, 119, 114, 27868, 34946, 14100, 19636, 113, 26519, 114, 10155, 33734, 16666, 113, 75217, 27443, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dall", "##y", "Rand", "##rian", "##te", "##fy", "(", "Madagascar", ")", "beat", "Jane", "Chi", "(", "U", ".", "S", ".", ")", "6", "-", "3", "6", "-", "1" ], "ids": [ 46005, 10157, 33483, 20764, 10216, 24203, 113, 25998, 114, 27868, 15549, 21946, 113, 158, 119, 156, 119, 114, 127, 118, 124, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##es", "Go", "##rro", "##chat", "##egu", "##i", "(", "Argentina", ")", "beat", "Aleksandra", "Ol", "##sza", "(", "Poland", ")", "6", "-", "1", "6", "-", "1" ], "ids": [ 10167, 10171, 14439, 38692, 73267, 40876, 10116, 113, 12853, 114, 27868, 39537, 60160, 22555, 113, 17879, 114, 127, 118, 122, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "first", "round" ], "ids": [ 13026, 112, 187, 20527, 117, 10422, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "12", "-", "Todd", "Martin", "(", "U", ".", "S", ".", ")", "beat", "You", "##nes", "El", "Ayn", "##ao", "##ui", "(", "Morocco", ")", "6", "-", "3", "6", "-", "2", "4", "-", "6", "6", "-", "4" ], "ids": [ 10186, 118, 24708, 11235, 113, 158, 119, 156, 119, 114, 27868, 11065, 11496, 10224, 79011, 14875, 11990, 113, 57295, 114, 127, 118, 124, 127, 118, 123, 125, 118, 127, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##jeng", "Schalke", "##n", "(", "Netherlands", ")", "beat", "Gilbert", "Sc", "##halle", "##r", "(", "Austria", ")", "6", "-", "3", "6", "-", "4", "6", "-", "7", "(", "6", "-", "8", ")", "6", "-", "3" ], "ids": [ 156, 85159, 87909, 10115, 113, 22043, 114, 27868, 18608, 55260, 47371, 10129, 113, 14479, 114, 127, 118, 124, 127, 118, 125, 127, 118, 128, 113, 127, 118, 129, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "first", "round" ], "ids": [ 13026, 112, 187, 20527, 117, 10422, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "Te", "##bb", "##utt", "(", "Australia", ")", "beat", "Rich", "##ey", "Rene", "##berg", "(", "U", ".", "S", ".", ")", "3", "-", "6" ], "ids": [ 10631, 21452, 14496, 66117, 113, 11729, 114, 27868, 27948, 13005, 91790, 11348, 113, 158, 119, 156, 119, 114, 124, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "1", "3", "-", "6", "7", "-", "5", "6", "-", "3" ], "ids": [ 127, 118, 122, 124, 118, 127, 128, 118, 126, 127, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paul", "Haar", "##huis", "(", "Netherlands", ")", "beat", "Michael", "Joyce", "(", "U", ".", "S", ")", "6", "-", "7" ], "ids": [ 10772, 41005, 31280, 113, 22043, 114, 27868, 10631, 35088, 113, 158, 119, 156, 114, 127, 118, 128 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "(", "5", "-", "7", ")", "7", "-", "6", "(", "8", "-", "6", ")", "1", "-", "6", "6", "-", "2", "6", "-", "2" ], "ids": [ 113, 126, 118, 128, 114, 128, 118, 127, 113, 129, 118, 127, 114, 122, 118, 127, 127, 118, 123, 127, 118, 123 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barbara", "R", "##itt", "##ner", "(", "Germany", ")", "beat", "13", "-", "Brenda", "Schultz", "-", "McCarthy", "(" ], "ids": [ 16010, 155, 25249, 11129, 113, 12775, 114, 27868, 10249, 118, 61185, 61712, 118, 42816, 113 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Netherlands", ")", "6", "-", "2", "6", "-", "1" ], "ids": [ 22043, 114, 127, 118, 123, 127, 118, 122 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "first", "round" ], "ids": [ 13026, 112, 187, 20527, 117, 10422, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Guy", "Forget", "(", "France", ")", "beat", "Grant", "Stafford", "(", "South", "Africa", ")", "3", "-", "6", "2", "-", "6", "6", "-", "4", "7", "-", "6", "(", "7", "-", "2", ")", "6", "-", "3" ], "ids": [ 16358, 90179, 113, 10688, 114, 27868, 17606, 68463, 113, 11056, 12880, 114, 124, 118, 127, 123, 118, 127, 127, 118, 125, 128, 118, 127, 113, 128, 118, 123, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "End", "first", "round", ")" ], "ids": [ 113, 16777, 10422, 13569, 114 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lisa", "Raymond", "(", "U", ".", "S", ".", ")", "beat", "Sarah", "Pit", "##kowski", "(", "France", ")", "6", "-", "2", "6", "-", "0" ], "ids": [ 19589, 17326, 113, 158, 119, 156, 119, 114, 27868, 16548, 79321, 36567, 113, 10688, 114, 127, 118, 123, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Asa", "Carl", "##sson", "(", "Sweden", ")", "beat", "Barbara", "Sc", "##het", "##t", "(", "Austria", ")", "6", "-", "2", "3", "-", "1", "retired", "(", "Th", "##igh", "injury", ")" ], "ids": [ 96536, 12225, 14650, 113, 20937, 114, 27868, 16010, 55260, 13358, 10123, 113, 14479, 114, 127, 118, 123, 124, 118, 122, 18675, 113, 51635, 26009, 27443, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "AF", "##TER", "TU", "##ES", "##DA", "##Y", "'", "S", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 55640, 99552, 94747, 25054, 36382, 14703, 112, 156, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "League", "Baseball" ], "ids": [ 14988, 11074, 27084 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "standing", "##s", "after", "games", "played", "on", "Tuesday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 32173, 10107, 10662, 13332, 11553, 10135, 70245, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "winning", "percentage", "and", "games", "behind", ")", ":" ], "ids": [ 14172, 117, 16542, 46971, 10111, 13332, 17155, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ER", "##IC", "##AN", "LE", "##AG", "##UE" ], "ids": [ 24339, 24093, 30889, 41275, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "74", "57", ".", "565", "-" ], "ids": [ 86607, 13034, 162, 42622, 11733, 12535, 11817, 119, 44522, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "70", "61", ".", "534", "4" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 10923, 12314, 119, 43177, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "68", "65", ".", "511", "7" ], "ids": [ 139, 21793, 60493, 11537, 12370, 10843, 119, 40867, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "62", "71", ".", "466", "13" ], "ids": [ 58573, 35066, 77261, 11403, 12066, 12513, 119, 48443, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "47", "85", ".", "356", "27", "1", "/", "2" ], "ids": [ 25067, 11090, 35066, 37611, 11413, 12017, 119, 33303, 10365, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "79", "53", ".", "598", "-" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 12791, 11756, 119, 59066, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "70", "64", ".", "522", "10" ], "ids": [ 39774, 30889, 109865, 11403, 10923, 11295, 119, 47305, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "66", "66", ".", "500", "13" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 12215, 12215, 119, 10757, 10249 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "64", "69", ".", "481", "15", "1", "/", "2" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 11295, 12573, 119, 47657, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "60", "73", ".", "451", "19", "1", "/", "2" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 10709, 12545, 119, 34443, 10270, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "75", "57", ".", "568", "-" ], "ids": [ 157, 11259, 12674, 38025, 11417, 11817, 119, 54879, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "68", "63", ".", "519", "6", "1", "/", "2" ], "ids": [ 23056, 32071, 11090, 51036, 12370, 12256, 119, 52224, 127, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "63", "72", ".", "467", "13", "1", "/", "2" ], "ids": [ 152, 10738, 11733, 44376, 58521, 12256, 12120, 119, 47763, 10249, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "61", "71", ".", "462", "14" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 12314, 12513, 119, 44574, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ED", "##NE", "##SD", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "28", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 160, 33809, 93280, 83452, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10348, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "AT", "DE", "##T", "##RO", "##IT" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 30554, 25067, 11090, 35066, 37611 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "AT", "CH", "##IC", "##AG", "##O" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 30554, 39774, 30889, 109865, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "AT", "BA", "##L", "##TI", "##M", "##OR", "##E" ], "ids": [ 152, 10738, 11733, 44376, 58521, 30554, 39999, 11369, 72286, 11517, 42622, 11259 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "AT", "TO", "##RO", "##NT", "##O" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 30554, 58573, 35066, 77261, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "AT", "KA", "##NS", "##AS", "C", "##IT", "##Y" ], "ids": [ 157, 11259, 12674, 38025, 30554, 85314, 69196, 38025, 140, 37611, 14703 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "AT", "CA", "##L", "##IF", "##OR", "##NI", "##A" ], "ids": [ 139, 21793, 60493, 11537, 30554, 24707, 11369, 53668, 42622, 52898, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "AT", "SE", "##AT", "##T", "##LE" ], "ids": [ 86607, 13034, 162, 42622, 11733, 30554, 23056, 32071, 11090, 51036 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "NA", "##TION", "##AL", "LE", "##AG", "##UE" ], "ids": [ 56586, 98207, 32002, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "81", "49", ".", "623", "-" ], "ids": [ 30554, 44376, 77261, 10738, 12324, 11580, 119, 57080, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "70", "60", ".", "538", "11" ], "ids": [ 102059, 77261, 66014, 32002, 10923, 10709, 119, 45677, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "62", "70", ".", "470", "20" ], "ids": [ 83243, 42622, 28895, 10738, 12066, 10923, 119, 29231, 10197 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "59", "73", ".", "447", "23" ], "ids": [ 86607, 13034, 162, 42622, 11733, 11867, 12545, 119, 42873, 10328 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "54", "79", ".", "406", "28", "1", "/", "2" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 11653, 12791, 119, 28081, 10348, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "71", "62", ".", "534", "-" ], "ids": [ 145, 11403, 32612, 60493, 11537, 12513, 12066, 119, 43177, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "69", "63", ".", "523", "1", "1", "/", "2" ], "ids": [ 53317, 149, 11403, 83259, 10731, 12573, 12256, 119, 50564, 122, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "65", "66", ".", "496", "5" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 10843, 12215, 119, 42498, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "64", "65", ".", "496", "5" ], "ids": [ 39774, 30889, 109865, 11403, 11295, 10843, 119, 42498, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "56", "75", ".", "427", "14" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 11628, 11417, 119, 37848, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "73", "60", ".", "549", "-" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 12545, 10709, 119, 53713, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "71", "60", ".", "542", "1" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 12513, 10709, 119, 51620, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "69", "64", ".", "519", "4" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 12573, 11295, 119, 52224, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "56", "74", ".", "431", "15", "1", "/", "2" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 11628, 12535, 119, 36191, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ED", "##NE", "##SD", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "28", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 160, 33809, 93280, 83452, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10348, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "AT", "CO", "##L", "##OR", "##AD", "##O" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 30554, 32992, 11369, 42622, 55538, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "AT", "MO", "##NT", "##RE", "##AL" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 30554, 102059, 77261, 66014, 32002 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "AT", "P", "##IT", "##TS", "##BU", "##R", "##G", "##H" ], "ids": [ 30554, 44376, 77261, 10738, 30554, 153, 37611, 36545, 108865, 11273, 11447, 12396 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "AT", "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 30554, 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "AT", "H", "##O", "##US", "##TO", "##N" ], "ids": [ 39774, 30889, 109865, 11403, 30554, 145, 11403, 32612, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "AT", "ST", "L", "##O", "##UI", "##S" ], "ids": [ 83243, 42622, 28895, 10738, 30554, 53317, 149, 11403, 83259, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "AT", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 30554, 21318, 11537, 64655, 41275, 89955, 36175, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "TU", "##ES", "##DA", "##Y", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 94747, 25054, 36382, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Major", "League" ], "ids": [ 33036, 10108, 14988, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "Baseball", "games", "played", "on", "Tuesday", "(", "home", "team", "in", "CA", "##PS", ")", ":" ], "ids": [ 27084, 13332, 11553, 10135, 70245, 113, 11816, 11121, 10106, 24707, 46983, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "National", "League" ], "ids": [ 10655, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "Philadelphia", "3", "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "2" ], "ids": [ 15979, 124, 21318, 11537, 64655, 41275, 89955, 36175, 11403, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Los", "Angeles", "5", "MO", "##NT", "##RE", "##AL", "1" ], "ids": [ 10630, 12233, 126, 102059, 77261, 66014, 32002, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "3", "Atlanta", "2" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 124, 19600, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "San", "Diego", "4", "NE", "##W", "Y", "##OR", "##K", "3" ], "ids": [ 10469, 14665, 125, 86607, 13034, 162, 42622, 11733, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "6", "Chicago", "5" ], "ids": [ 145, 11403, 32612, 60493, 11537, 127, 12317, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Florida", "6", "ST", "L", "##O", "##UI", "##S", "3" ], "ids": [ 13668, 127, 53317, 149, 11403, 83259, 10731, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Cincinnati", "4", "CO", "##L", "##OR", "##AD", "##O", "3" ], "ids": [ 31257, 125, 32992, 11369, 42622, 55538, 11403, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "American", "League" ], "ids": [ 10536, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "Cleveland", "12", "DE", "##T", "##RO", "##IT", "2" ], "ids": [ 21342, 10186, 25067, 11090, 35066, 37611, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "3", "Oakland", "1" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 124, 38340, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Minnesota", "6", "TO", "##RO", "##NT", "##O", "4" ], "ids": [ 16306, 127, 58573, 35066, 77261, 11403, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Milwaukee", "4", "CH", "##IC", "##AG", "##O", "2" ], "ids": [ 36413, 125, 39774, 30889, 109865, 11403, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "4", "Texas", "3", "(", "10", "innings", ")" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 125, 12466, 124, 113, 10150, 48974, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Boston", "2", "CA", "##L", "##IF", "##OR", "##NI", "##A", "1" ], "ids": [ 13683, 123, 24707, 11369, 53668, 42622, 52898, 10738, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "7", "New", "York", "4" ], "ids": [ 23056, 32071, 11090, 51036, 128, 10287, 10482, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "GR", "##AF", "W", "##OR", "##KS", "H", "##AR", "##D", "FOR", "F", "##IR", "##ST", "-", "R", "##O", "##UN", "##D", "W", "##IN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 58787, 49196, 160, 42622, 62828, 145, 52188, 11490, 109544, 143, 73522, 32995, 118, 155, 11403, 69849, 11490, 160, 27128, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bill", "Be", "##rk", "##rot" ], "ids": [ 13160, 14321, 16299, 28636 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "n", "'", "t", "supposed", "to", "be", "this", "hard", "for", "defending", "champion", "St", "##ef", "##fi", "Graf", "to", "win", "her", "opening", "match", "at", "the", "U", ".", "S", ".", "Open", "on", "Tuesday", "night", "." ], "ids": [ 10377, 10134, 182, 112, 188, 59516, 10114, 10347, 10531, 19118, 10142, 53730, 17689, 10838, 16822, 14403, 20617, 10114, 14125, 10485, 17975, 12356, 10160, 10105, 158, 119, 156, 119, 11919, 10135, 70245, 16903, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "script", "that", "called", "for", "the", "usual", "first", "-", "round", "demo", "##lition", "by", "the", "top", "-", "ranked", "top", "seed", "was", "re", "##wr", "##itten", "by", "29", "##th", "-", "ranked", "Indonesian", "Ya", "##yu", "##k", "Bas", "##uki", "playing", "with", "nothing", "to", "lose", "abandon", "." ], "ids": [ 16976, 10105, 31810, 10189, 11552, 10142, 10105, 49176, 10422, 118, 13569, 30776, 91177, 10155, 10105, 12364, 118, 25250, 12364, 49282, 10134, 11639, 21428, 99483, 10155, 10386, 11143, 118, 25250, 47340, 25148, 25285, 10174, 21237, 39821, 14879, 10169, 33338, 10114, 48742, 56566, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Graf", ",", "of", "course", ",", "pre", "##vai", "##led", "6", "-", "3", "7", "-", "6", ",", "but", "not", "before", "some", "ten", "##se", "moments", "that", "even", "had", "the", "German", "super", "##star", "thinking", "the", "match", "was", "going", "three", "sets", "." ], "ids": [ 20617, 117, 10108, 15348, 117, 12229, 37557, 16376, 127, 118, 124, 128, 118, 127, 117, 10473, 10472, 11360, 11152, 11769, 10341, 47641, 10189, 13246, 10374, 10105, 12026, 25212, 25969, 56294, 10105, 12356, 10134, 19090, 11003, 23597, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "won", "the", "second", "set", ",", "which", "I", "did", "n", "'", "t", "think", "I", "would", "do", ",", "being", "down", "5", "-", "2", "and", "the", "chances", "she", "had", "at", "6", "-", "5", ",", "\"", "Graf", "recalled", "." ], "ids": [ 107, 146, 11367, 10105, 11132, 11847, 117, 10319, 146, 12172, 182, 112, 188, 27874, 146, 10894, 10149, 117, 11223, 12935, 126, 118, 123, 10111, 10105, 84632, 10833, 10374, 10160, 127, 118, 126, 117, 107, 20617, 68117, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "Several", "of", "the", "other", "women", "'", "s", "seeds", "ea", "##sed", "into", "the", "second", "round", "with", "more", "typical", "Graf", "-", "like", "efficiency", "Tuesday", "." ], "ids": [ 28604, 10108, 10105, 10684, 13190, 112, 187, 68488, 22257, 16219, 10708, 10105, 11132, 13569, 10169, 10798, 36772, 20617, 118, 11850, 64416, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "As", "afternoon", "turned", "to", "evening", ",", "fourth", "-", "seed", "##ed", "Spania", "##rd", "Con", "##chi", "##ta", "Martinez", "took", "apart", "Romanian", "R", "##ux", "##andra", "Drago", "##mir", "in", "58", "minutes", "with", "the", "loss", "of", "just", "two", "games", ",", "one", "more", "than", "second", "seed", "Monica", "Se", "##les", ",", "who", "opened", "the", "second", "-", "day", "programme", "by", "c", "##rush", "##ing", "American", "Anne", "Miller", "6", "-", "0", "6", "-", "1", "." ], "ids": [ 10882, 73213, 21031, 10114, 42135, 117, 16918, 118, 49282, 10336, 42751, 12023, 12845, 12806, 10213, 50203, 12149, 43084, 29543, 155, 11855, 90332, 98650, 20825, 10106, 11824, 15304, 10169, 10105, 18576, 10108, 12820, 10551, 13332, 117, 10464, 10798, 11084, 11132, 49282, 29242, 11045, 11268, 117, 10479, 14377, 10105, 11132, 118, 11940, 19611, 10155, 171, 60796, 10230, 10536, 13490, 14615, 127, 118, 121, 127, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 8, 9, 9, 2, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Third", "seed", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", ",", "the", "1994", "champion", ",", "and", "eighth", "-", "seed", "##ed", "Olympic", "gold", "medal", "##ist", "Lindsay", "Davenport", "dropped", "three", "game", "each", "en", "route", "to", "the", "second", "round", "." ], "ids": [ 16788, 49282, 54789, 10368, 14220, 66007, 39574, 16780, 117, 10105, 10444, 17689, 117, 10111, 46758, 118, 49282, 10336, 17952, 18128, 16531, 11293, 42228, 74533, 30241, 11003, 11661, 11948, 10110, 13933, 10114, 10105, 11132, 13569, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "day", "was", "not", "without", "its", "seed", "##ed", "casualties", "on", "the", "women", "'", "s", "side", "." ], "ids": [ 16976, 10105, 11940, 10134, 10472, 13663, 10474, 49282, 10336, 69297, 10135, 10105, 13190, 112, 187, 12250, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fifth", "-", "seed", "I", "##va", "Maj", "##oli", "of", "Croatia", "was", "picked", "off", "by", "Austrian", "Judith", "Wie", "##sne", "##r", "and", "Wimbledon", "semifinali", "##st", "Kimi", "##ko", "Date", "of", "Japan", ",", "the", "10th", "seed", ",", "fell", "6", "-", "2", "7", "-", "5", "to", "53", "##rd", "-", "ranked", "American", "Kimberly", "Po", "." ], "ids": [ 47412, 118, 49282, 146, 10362, 72180, 15847, 10108, 34993, 10134, 52289, 11898, 10155, 32201, 35043, 23789, 28395, 10129, 10111, 37932, 71380, 10562, 63038, 10440, 29897, 10108, 11891, 117, 10105, 31004, 49282, 117, 25194, 127, 118, 123, 128, 118, 126, 10114, 11756, 12023, 118, 25250, 10536, 106840, 11255, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 2, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 9 ] }, { "tokens": [ "Date", "'", "s", "defeat", "left", "no", "other", "seed", "##ed", "players", "in", "Se", "##les", "'", "s", "quarter", "of", "the", "draw", ",", "which", "lost", "An", "##ke", "Huber", "(", "6", ")", "and", "Maggie", "Male", "##eva", "(", "12", ")", "on", "Monday", "." ], "ids": [ 29897, 112, 187, 24800, 12153, 10192, 10684, 49282, 10336, 16021, 10106, 11045, 11268, 112, 187, 28330, 10108, 10105, 25974, 117, 10319, 14172, 10313, 10550, 46398, 113, 127, 114, 10111, 38951, 36172, 18085, 113, 10186, 114, 10135, 40714, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Graf", ",", "winner", "of", "20", "Grand", "Slam", "titles", ",", "was", "not", "about", "to", "join", "that", "list", "." ], "ids": [ 16976, 20617, 117, 20826, 10108, 10197, 11319, 33445, 26492, 117, 10134, 10472, 10978, 10114, 23707, 10189, 13416, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "At", "some", "points", "I", "felt", "a", "little", "ner", "##vous", ",", "\"", "she", "admitted", ".", "\"" ], "ids": [ 107, 11699, 11152, 12789, 146, 24666, 169, 16745, 59097, 61211, 117, 107, 10833, 40345, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "it", "came", "down", "to", "the", "important", "points", ",", "I", "felt", "more", "con", "##fi", "##dent", ".", "\"" ], "ids": [ 12242, 10271, 13383, 12935, 10114, 10105, 12452, 12789, 117, 146, 24666, 10798, 10173, 14403, 21029, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bas", "##uki", ",", "a", "first", "-", "round", "loser", "here", "for", "the", "fifth", "consecutive", "year", ",", "was", "clearly", "going", "for", "winners", ",", "hitting", "the", "lines", "and", "running", "Graf", "around", "the", "court", "as", "she", "broke", "the", "top", "seed", "twice", "in", "the", "second", "set", "to", "gra", "##b", "that", "shock", "##ing", "5", "-", "2", "lead", "." ], "ids": [ 21237, 39821, 117, 169, 10422, 118, 13569, 55526, 19353, 10142, 10105, 22237, 29864, 10924, 117, 10134, 52340, 19090, 10142, 33525, 117, 88998, 10105, 19515, 10111, 18020, 20617, 12166, 10105, 14866, 10146, 10833, 30500, 10105, 12364, 49282, 26261, 10106, 10105, 11132, 11847, 10114, 63706, 10457, 10189, 62868, 10230, 126, 118, 123, 14107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Graf", "ran", "off", "the", "next", "three", "games", "to", "restore", "some", "sembla", "##nce", "of", "order", "." ], "ids": [ 20617, 17044, 11898, 10105, 13451, 11003, 13332, 10114, 76873, 11152, 61649, 12150, 10108, 12990, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Bas", "##uki", ",", "her", "long", "black", "po", "##nyt", "##ail", "flying", "as", "she", "race", "##d", "for", "shots", ",", "held", "her", "serve", "and", "twice", "had", "set", "point", "on", "Graf", "'", "s", "serve", "at", "6", "-", "5", "before", "the", "German", "un", "##lea", "##shed", "a", "for", "##ehan", "##d", "pass", "to", "force", "the", "tie", "-", "break", "." ], "ids": [ 16976, 21237, 39821, 117, 10485, 11695, 15045, 10514, 25631, 35240, 34676, 10146, 10833, 14025, 10162, 10142, 74437, 117, 11991, 10485, 19430, 10111, 26261, 10374, 11847, 12331, 10135, 20617, 112, 187, 19430, 10160, 127, 118, 126, 11360, 10105, 12026, 10119, 25277, 42253, 169, 10142, 79788, 10162, 23392, 10114, 15031, 10105, 27916, 118, 24194, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "lost", "the", "moment", ",", "\"", "la", "##mente", "##d", "Bas", "##uki", ",", "who", "has", "reached", "the", "fourth", "round", "at", "Wimbledon", "four", "times", "and", "was", "a", "semifinali", "##st", "in", "Montreal", "earlier", "this", "month", "." ], "ids": [ 107, 146, 14172, 10105, 14316, 117, 107, 10109, 10611, 10162, 21237, 39821, 117, 10479, 10393, 17087, 10105, 16918, 13569, 10160, 37932, 11598, 13465, 10111, 10134, 169, 71380, 10562, 10106, 20990, 18905, 10531, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Still", ",", "the", "fe", "##isty", "Indonesian", "got", "off", "to", "a", "3", "-", "0", "lead", "in", "the", "tie", "-", "break", "##er", "before", "a", "pair", "of", "cost", "##ly", "double", "fault", "##s", "gave", "Graf", "her", "chance", "to", "avoid", "a", "third", "set", "." ], "ids": [ 27567, 117, 10105, 34778, 87706, 47340, 19556, 11898, 10114, 169, 124, 118, 121, 14107, 10106, 10105, 27916, 118, 24194, 10165, 11360, 169, 27643, 10108, 18849, 10454, 15790, 110640, 10107, 15362, 20617, 10485, 27893, 10114, 33253, 169, 12628, 11847, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Us", "##ually", "in", "the", "first", "one", "or", "two", "matches", ",", "you", "want", "to", "find", "your", "rhythm", "and", "want", "to", "get", "into", "it", ",", "\"", "said", "Graf", ",", "who", "won", "seven", "of", "the", "last", "eight", "points", "in", "the", "break", "##er", "." ], "ids": [ 107, 27582, 79090, 10106, 10105, 10422, 10464, 10345, 10551, 18258, 117, 13028, 21528, 10114, 17860, 20442, 51720, 10111, 21528, 10114, 15329, 10708, 10271, 117, 107, 12415, 20617, 117, 10479, 11367, 15767, 10108, 10105, 12469, 16222, 12789, 10106, 10105, 24194, 10165, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "To", "be", "in", "that", "situation", "today", ",", "a", "couple", "of", "times", "having", "to", "play", "well", ",", "get", "down", "and", "play", "point", "-", "by", "-", "point", ",", "def", "##inite", "##ly", "is", "a", "good", "start", ".", "\"" ], "ids": [ 107, 11469, 10347, 10106, 10189, 18586, 18745, 117, 169, 20969, 10108, 13465, 13677, 10114, 12253, 11206, 117, 15329, 12935, 10111, 12253, 12331, 118, 10155, 118, 12331, 117, 100745, 100240, 10454, 10124, 169, 15198, 15148, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "SOS", "##A", "H", "##AS", "SU", "##R", "##GE", "##R", "##Y", ",", "O", "##UT", "UP", "TO", "SI", "##X", "W", "##EE", "##KS", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 78646, 10738, 145, 38025, 86643, 11273, 58719, 11273, 14703, 117, 152, 65729, 53197, 58573, 39675, 12674, 160, 95825, 62828, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "27" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chicago", "Cubs", "right", "field", "##er", "Sammy", "So", "##sa", "underwent", "surgery", "on", "Monday", "to", "remove", "a", "frac", "##ture", "##d", "bone", "from", "his", "right", "hand", "and", "will", "miss", "four", "to", "six", "weeks", ",", "the", "club", "announced", "Tuesday", "." ], "ids": [ 12317, 97605, 13448, 13939, 10165, 59859, 12882, 10466, 78074, 44811, 10135, 40714, 10114, 51600, 169, 25038, 16023, 10162, 57254, 10188, 10226, 13448, 15230, 10111, 11337, 88237, 11598, 10114, 12449, 20750, 117, 10105, 11111, 13854, 70245, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##sa", ",", "a", "leading", "candidate", "for", "National", "League", "Most", "Val", "##uable", "Player", "honours", ",", "was", "injured", "August", "20th", "when", "he", "was", "hit", "by", "a", "Mark", "Hutton", "pitch", "in", "the", "first", "inning", "of", "an", "8", "-", "1", "victory", "over", "the", "Florida", "Mar", "##lins", "." ], "ids": [ 12882, 10466, 117, 169, 16018, 22102, 10142, 10655, 11074, 14361, 16190, 101305, 22443, 106111, 117, 10134, 36081, 10735, 18604, 10841, 10261, 10134, 14946, 10155, 169, 11997, 84219, 50892, 10106, 10105, 10422, 110505, 10108, 10151, 129, 118, 122, 19735, 10491, 10105, 13668, 15734, 68541, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 2, 6, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "27", "-", "year", "-", "old", "So", "##sa", "leads", "the", "league", "with", "40", "home", "##rs", "and", "is", "tied", "for", "10th", "with", "100", "RB", "##I", "." ], "ids": [ 10117, 10365, 118, 10924, 118, 12898, 12882, 10466, 34868, 10105, 15616, 10169, 10533, 11816, 10943, 10111, 10124, 42780, 10142, 31004, 10169, 10407, 71201, 11281, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "The", "loss", "of", "So", "##sa", ",", "who", "appeared", "in", "all", "124", "games", "this", "season", ",", "is", "a", "huge", "blow", "to", "the", "Cubs", "'", "playoff", "hopes", "." ], "ids": [ 10117, 18576, 10108, 12882, 10466, 117, 10479, 14565, 10106, 10435, 17944, 13332, 10531, 11226, 117, 10124, 169, 42126, 106194, 10114, 10105, 97605, 112, 38127, 82467, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "MA", "##RC", "##EL", "##O", "H", "##AT", "-", "TR", "##IC", "##K", "K", "##EE", "##PS", "PSV", "AT", "TOP", "OF", "D", "##UT", "##CH", "LE", "##AG", "##UE", "." ], "ids": [ 71020, 65622, 24093, 118, 27277, 52932, 68999, 11403, 145, 32071, 118, 80047, 30889, 11733, 148, 95825, 46983, 66922, 30554, 98151, 23240, 141, 65729, 86448, 84977, 109865, 62674, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "28" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazilian", "striker", "Marcelo", "scored", "a", "hat", "-", "trick", "as", "PSV", "Eindhoven", "maintained", "their", "100", "percent", "record", "and", "stayed", "on", "top", "of", "the", "Dutch", "first", "division", "with", "a", "3", "-", "1", "win", "at", "Vol", "##enda", "##m", "on", "Wednesday", "." ], "ids": [ 32818, 103325, 38165, 17233, 169, 11250, 118, 71662, 10146, 66922, 55552, 32974, 10455, 10407, 22362, 12410, 10111, 42296, 10135, 12364, 10108, 10105, 17693, 10422, 13751, 10169, 169, 124, 118, 122, 14125, 10160, 12546, 27808, 10147, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "PSV", "'", "s", "main", "rivals", "for", "the", "title", ",", "defending", "champions", "Ajax", "Amsterdam", ",", "celebrated", "the", "novel", "##ty", "of", "having", "the", "roof", "of", "their", "new", "51", ",", "000", "seat", "stadium", "closed", "against", "the", "rain", ",", "with", "a", "1", "-", "0", "win", "over", "AZ", "Al", "##km", "##aar", "." ], "ids": [ 66922, 112, 187, 12126, 71908, 10142, 10105, 12887, 117, 53730, 27745, 37057, 14017, 117, 42710, 10105, 14671, 11195, 10108, 13677, 10105, 33347, 10108, 10455, 10751, 11524, 117, 10259, 17687, 27915, 18440, 11327, 10105, 50939, 117, 10169, 169, 122, 118, 121, 14125, 10491, 81705, 10883, 23440, 21960, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Ajax", "were", "missing", "six", "first", "-", "team", "players", "but", "Frank", "de", "Boer", "shot", "home", "the", "winner", "from", "a", "20", "-", "metre", "free", "kick", "in", "the", "30th", "minute", "of", "a", "du", "##ll", "game", "." ], "ids": [ 37057, 10309, 39542, 12449, 10422, 118, 11121, 16021, 10473, 11872, 10104, 80109, 19508, 11816, 10105, 20826, 10188, 169, 10197, 118, 35843, 13961, 55321, 10106, 10105, 95539, 21760, 10108, 169, 10168, 11231, 11661, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Marcelo", ",", "signed", "in", "close", "season", "to", "replace", "com", "##pat", "##riot", "Ronaldo", "who", "left", "to", "play", "for", "Barcelona", ",", "opened", "the", "PSV", "scoring", "in", "the", "19th", "minute", "when", "he", "fired", "home", "after", "good", "work", "from", "Rene", "Ei", "##jke", "##lka", "##mp", "." ], "ids": [ 38165, 117, 14775, 10106, 16065, 11226, 10114, 37156, 10212, 18115, 92113, 56937, 10479, 12153, 10114, 12253, 10142, 12113, 117, 14377, 10105, 66922, 27346, 10106, 10105, 19794, 21760, 10841, 10261, 38903, 11816, 10662, 15198, 11424, 10188, 91790, 35278, 36646, 30509, 18573, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 3, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "The", "Brazilian", "found", "the", "mark", "again", "two", "minutes", "after", "half", "##time", "and", "again", "in", "the", "56", "##th", "minute", "before", "midfielder", "Pascal", "Jong", "##sma", "scored", "a", "con", "##sola", "##tion", "goal", "for", "Vol", "##enda", "##m", "five", "minutes", "from", "time", "." ], "ids": [ 10117, 32818, 11823, 10105, 29221, 13123, 10551, 15304, 10662, 13877, 18086, 10111, 13123, 10106, 10105, 11628, 11143, 21760, 11360, 68049, 26543, 33459, 24188, 17233, 169, 10173, 50293, 10822, 16586, 10142, 12546, 27808, 10147, 12403, 15304, 10188, 10635, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Feyenoord", "Rotterdam", "suffered", "an", "early", "shock", "when", "they", "went", "1", "-", "0", "down", "after", "four", "minutes", "against", "de", "G", "##raaf", "##schap", "Doe", "##tin", "##chem", "." ], "ids": [ 103340, 25136, 26090, 10151, 11732, 62868, 10841, 10689, 13446, 122, 118, 121, 12935, 10662, 11598, 15304, 11327, 10104, 144, 71647, 21289, 71335, 15364, 34884, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "The", "equal", "##iser", "came", "in", "the", "73", "##rd", "minute", "when", "Swedish", "international", "Henk", "##e", "Larsson", "scored", "from", "close", "range", "and", "10", "minutes", "later", "Jean", "-", "Paul", "van", "Gast", "##el", "gave", "Feyenoord", "a", "2", "-", "1", "victory", "from", "the", "penalty", "spot", "." ], "ids": [ 10117, 32943, 25004, 13383, 10106, 10105, 12545, 12023, 21760, 10841, 21381, 12533, 90615, 10112, 59396, 17233, 10188, 16065, 15601, 10111, 10150, 15304, 10873, 10766, 118, 10772, 10145, 99260, 10570, 15362, 103340, 169, 123, 118, 122, 19735, 10188, 10105, 40924, 28504, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "three", "matches", "PSV", "lead", "the", "first", "division", "with", "nine", "points", ",", "three", "points", "clear", "of", "fifth", "-", "placed", "Ajax", "." ], "ids": [ 11301, 11003, 18258, 66922, 14107, 10105, 10422, 13751, 10169, 19964, 12789, 117, 11003, 12789, 24866, 10108, 22237, 118, 16906, 37057, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "R", "##O", "##BS", "##ON", "W", "##IN", "##S", "F", "##IR", "##ST", "TR", "##OP", "##H", "##Y", "W", "##IT", "##H", "BA", "##RC", "##EL", "##ON", "##A", "." ], "ids": [ 71020, 65622, 24093, 118, 155, 11403, 51535, 30118, 160, 27128, 10731, 143, 73522, 32995, 80047, 44917, 12396, 14703, 160, 37611, 12396, 39999, 52932, 68999, 30118, 10738, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "MA", "##D", "##RI", "##D", "1996", "-", "08", "-", "28" ], "ids": [ 27277, 11490, 46876, 11490, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "England", "manager", "Bobby", "Robson", "enjoyed", "his", "first", "success", "in", "charge", "of", "Barcelona", "as", "his", "team", "weather", "##ed", "90", "minutes", "of", "non", "-", "stop", "At", "##leti", "##co", "Madrid", "pressure", "to", "win", "the", "Spanish", "Super", "Cup", "6", "-", "5", "on", "aggregate", "on", "Wednesday", "." ], "ids": [ 42355, 11701, 16935, 19371, 78446, 52072, 10226, 10422, 17001, 10106, 18163, 10108, 12113, 10146, 10226, 11121, 35660, 10336, 10919, 15304, 10108, 10446, 118, 20517, 11699, 42136, 10812, 11727, 23460, 10114, 14125, 10105, 14661, 12786, 11544, 127, 118, 126, 10135, 75063, 10135, 57611, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 2, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barcelona", "had", "won", "the", "first", "leg", "5", "-", "2", "but", "the", "second", "leg", "was", "a", "different", "story", "." ], "ids": [ 12113, 10374, 11367, 10105, 10422, 33810, 126, 118, 123, 10473, 10105, 11132, 33810, 10134, 169, 12902, 13617, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##leti", "##co", "came", "within", "a", "w", "##his", "##ker", "of", "taking", "the", "Cup", "on", "the", "away", "-", "goal", "rule", "but", "sq", "##uan", "##dere", "##d", "several", "chances", "after", "going", "3", "-", "1", "ahead", "15", "minutes", "from", "the", "end", "." ], "ids": [ 11699, 42136, 10812, 13383, 12381, 169, 191, 49311, 11880, 10108, 18084, 10105, 11544, 10135, 10105, 14942, 118, 16586, 21983, 10473, 27164, 16093, 20861, 10162, 11736, 84632, 10662, 19090, 124, 118, 122, 35629, 10208, 15304, 10188, 10105, 11572, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Juan", "Lopez", "gave", "At", "##leti", "##co", "the", "lead", "mid", "##way", "through", "the", "first", "half", "after", "Barcelona", "full", "##back", "Albert", "Ferrer", "and", "substitute", "goalkeeper", "Jul", "##en", "Lo", "##pet", "##egu", "##i", "failed", "to", "clear", "a", "Mil", "##inko", "Pan", "##tic", "cross", "." ], "ids": [ 11686, 34054, 15362, 11699, 42136, 10812, 10105, 14107, 15607, 14132, 11222, 10105, 10422, 13877, 10662, 12113, 13375, 18666, 12422, 45239, 10111, 58808, 84159, 65855, 10136, 13069, 19094, 40876, 10116, 20775, 10114, 24866, 169, 75311, 107113, 18661, 13275, 19630, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "Barcelona", "'", "s", "Hr", "##isto", "St", "##oi", "##ch", "##kov", "made", "his", "only", "significant", "contribution", "of", "the", "evening", "10", "minutes", "after", "half", "##time", "when", "Ser", "##gi", "Bar", "##juan", "broke", "down", "the", "right", "to", "set", "up", "the", "fie", "##ry", "Bulgarian", "with", "a", "simple", "equal", "##iser", "." ], "ids": [ 12113, 112, 187, 74968, 27773, 10838, 14638, 10269, 16433, 11019, 10226, 10893, 17912, 34967, 10108, 10105, 42135, 10150, 15304, 10662, 13877, 18086, 10841, 39759, 11210, 20698, 40135, 30500, 12935, 10105, 13448, 10114, 11847, 10741, 10105, 29959, 10908, 43680, 10169, 169, 16205, 32943, 25004, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "At", "##leti", "##co", "struck", "back", "almost", "immediately", "through", "new", "signing", "Juan", "Eduardo", "Es", "##nai", "##der", "and", "then", "Serbian", "set", "-", "piece", "specialist", "Pan", "##tic", "made", "it", "3", "-", "1", "with", "a", "super", "##b", "free", "-", "kick", "in", "the", "75", "##th", "minute", "." ], "ids": [ 16976, 11699, 42136, 10812, 45622, 12014, 17122, 24029, 11222, 10751, 46529, 11686, 19131, 10912, 32191, 11304, 10111, 11059, 37952, 11847, 118, 26767, 64956, 18661, 13275, 11019, 10271, 124, 118, 122, 10169, 169, 25212, 10457, 13961, 118, 55321, 10106, 10105, 11417, 11143, 21760, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 2, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Robson", "praised", "At", "##leti", "##co", "after", "the", "game", ",", "which", "was", "played", "in", "the", "Community", "of", "Madrid", "athletic", "stadium", "because", "of", "pitch", "problems", "at", "the", "Vicente", "Calder", "##on", "ground", "." ], "ids": [ 78446, 38394, 11699, 42136, 10812, 10662, 10105, 11661, 117, 10319, 10134, 11553, 10106, 10105, 18553, 10108, 11727, 74331, 27915, 12373, 10108, 50892, 20390, 10160, 10105, 21089, 95519, 10263, 16912, 119 ], "entity": [ "B-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 4, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 4, 1, 5, 9, 9 ] }, { "tokens": [ "The", "venue", "of", "At", "##leti", "##co", "'", "s", "first", "league", "game", ",", "scheduled", "for", "Sunday", ",", "is", "still", "in", "doubt", "with", "the", "Real", "Madrid", "'", "s", "Santiago", "Berna", "##be", "##u", "a", "distinct", "possibility", "." ], "ids": [ 10117, 39975, 10108, 11699, 42136, 10812, 112, 187, 10422, 15616, 11661, 117, 34081, 10142, 19731, 117, 10124, 12647, 10106, 86697, 10169, 10105, 12384, 11727, 112, 187, 12336, 89971, 11044, 10138, 169, 35428, 53510, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SU", "##MM", "##AR", "##Y", "OF", "SP", "##AN", "##IS", "##H", "SU", "##PER", "C", "##UP", "." ], "ids": [ 71020, 65622, 24093, 118, 86643, 93252, 52188, 14703, 23240, 22570, 41275, 19088, 12396, 86643, 108408, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 2, 6, 6, 6, 9 ] }, { "tokens": [ "MA", "##D", "##RI", "##D", "1996", "-", "08", "-", "28" ], "ids": [ 27277, 11490, 46876, 11490, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "the", "Spanish", "Super", "Cup", ",", "second", "leg", ",", "played", "on", "Wednesday", ":" ], "ids": [ 42027, 10108, 10105, 14661, 12786, 11544, 117, 11132, 33810, 117, 11553, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##leti", "##co", "Madrid", "3", "(", "Juan", "Lopez", "28", "##th", "minute", ",", "Juan", "Es", "##nai", "##der", "58", "##th", ",", "Mil", "##inko", "Pan", "##tic", "75", "##th", ")", "Barcelona", "1", "(", "Hr", "##isto", "St", "##oi", "##ch", "##kov", "55", "##th", ")", "." ], "ids": [ 11699, 42136, 10812, 11727, 124, 113, 11686, 34054, 10348, 11143, 21760, 117, 11686, 10912, 32191, 11304, 11824, 11143, 117, 75311, 107113, 18661, 13275, 11417, 11143, 114, 12113, 122, 113, 74968, 27773, 10838, 14638, 10269, 16433, 11358, 11143, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "1", "-", "0", "." ], "ids": [ 33100, 18086, 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "11", ",", "000", "." ], "ids": [ 46080, 10193, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Barcelona", "win", "6", "-", "5", "on", "aggregate", ")", "." ], "ids": [ 113, 12113, 14125, 127, 118, 126, 10135, 75063, 114, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "BA", "##RC", "##EL", "##ON", "##A", "W", "##IN", "SP", "##AN", "##IS", "##H", "SU", "##PER", "C", "##UP", "." ], "ids": [ 71020, 65622, 24093, 118, 39999, 52932, 68999, 30118, 10738, 160, 27128, 22570, 41275, 19088, 12396, 86643, 108408, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 2, 6, 6, 6, 2, 6, 6, 6, 9 ] }, { "tokens": [ "MA", "##D", "##RI", "##D", "1996", "-", "08", "-", "28" ], "ids": [ 27277, 11490, 46876, 11490, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "the", "Spanish", "Super", "Cup", ",", "second", "leg", ",", "played", "on", "Wednesday", ":" ], "ids": [ 32070, 16203, 10108, 10105, 14661, 12786, 11544, 117, 11132, 33810, 117, 11553, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "B-MISC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "##leti", "##co", "Madrid", "3", "Barcelona", "1" ], "ids": [ 11699, 42136, 10812, 11727, 124, 12113, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "(", "Barcelona", "win", "6", "-", "5", "on", "aggregate", ")" ], "ids": [ 113, 12113, 14125, 127, 118, 126, 10135, 75063, 114 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "AJ", "##AX", "SI", "##G", "##N", "AR", "##GE", "##NT", "##INE", "ST", "##RI", "##K", "##ER", "GA", "##B", "##RI", "##CH", "." ], "ids": [ 71020, 65622, 24093, 118, 41191, 83026, 39675, 11447, 11537, 50884, 58719, 77261, 83198, 53317, 46876, 11733, 24093, 74212, 11274, 46876, 86448, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "28" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Argentine", "striker", "Iwan", "Cesar", "Ga", "##bric", "##h", "signed", "a", "five", "year", "contract", "with", "Dutch", "champions", "Ajax", "Amsterdam", "on", "Wednesday", "." ], "ids": [ 31469, 103325, 74830, 70418, 69699, 95989, 10237, 14775, 169, 12403, 10924, 16108, 10169, 17693, 27745, 37057, 14017, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "The", "24", "-", "year", "-", "old", "Ga", "##bric", "##h", ",", "who", "signed", "for", "an", "und", "##is", "##closed", "fee", "from", "the", "Argentine", "side", "Newell", "Old", "Boys", ",", "is", "set", "to", "join", "Dutch", "international", "Patrick", "K", "##lui", "##vert", "in", "the", "Ajax", "forward", "line", "." ], "ids": [ 10117, 10233, 118, 10924, 118, 12898, 69699, 95989, 10237, 117, 10479, 14775, 10142, 10151, 10130, 10291, 75379, 54524, 10188, 10105, 31469, 12250, 97829, 13773, 16432, 117, 10124, 11847, 10114, 23707, 17693, 12533, 13867, 148, 14417, 30013, 10106, 10105, 37057, 23307, 12117, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 3, 7, 7, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "He", "is", "Ajax", "'", "s", "sixth", "new", "signing", "this", "year", ",", "joining", "midfielder", "Richard", "Wit", "##sch", "##ge", ",", "defender", "##s", "John", "Ve", "##ld", "##man", "and", "Mariano", "Juan", "and", "striker", "##s", "Ti", "##j", "##jan", "##i", "Baba", "##ngi", "##da", "and", "Dani", "." ], "ids": [ 10357, 10124, 37057, 112, 187, 28913, 10751, 46529, 10531, 10924, 117, 36135, 68049, 11118, 83735, 12044, 10525, 117, 36426, 10107, 10421, 19561, 12620, 10589, 10111, 32494, 11686, 10111, 103325, 10107, 29033, 10418, 14376, 10116, 36364, 31681, 10229, 10111, 65595, 119 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 4, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "PA", "##R", "##MA", ",", "ROM", "##A", "AND", "UD", "##INE", "##SE", "O", "##UT", "OF", "IT", "##AL", "##IA", "##N", "C", "##UP", "." ], "ids": [ 71020, 65622, 24093, 118, 32349, 11273, 30696, 117, 41068, 10738, 52428, 85627, 83198, 39039, 152, 65729, 23240, 26956, 32002, 35976, 11537, 140, 57487, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 3, 7, 7, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "ROM", "##E", "1996", "-", "08", "-", "28" ], "ids": [ 41068, 11259, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "UEFA", "Cup", "hope", "##ful", "##s", "Parma", "and", "Roma", ",", "under", "new", "coaches", "this", "season", ",", "crashed", "out", "of", "the", "Italian", "Cup", "to", "second", "division", "opponents", "on", "Wednesday", "while", "league", "champions", "Milan", "could", "only", "draw", "1", "-", "1", "at", "hu", "##mble", "Em", "##poli", "." ], "ids": [ 13528, 11544, 50725, 14446, 10107, 29157, 10111, 11794, 117, 10571, 10751, 70246, 10531, 11226, 117, 91126, 10950, 10108, 10105, 11667, 11544, 10114, 11132, 13751, 63568, 10135, 57611, 11371, 15616, 27745, 15807, 12174, 10893, 25974, 122, 118, 122, 10160, 26506, 48272, 11289, 29378, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 3, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "We", "##alt", "##hy", "Parma", ",", "now", "coached", "by", "the", "former", "Italian", "international", "Carlo", "An", "##cel", "##otti", ",", "were", "without", "new", "striker", "Enrico", "Chiesa", "and", "went", "down", "3", "-", "1", "at", "serie", "B", "club", "Pescara", "in", "their", "second", "round", "c", "##lash", "." ], "ids": [ 12865, 22897, 19275, 29157, 117, 11858, 71909, 10155, 10105, 11775, 11667, 12533, 14437, 10313, 32942, 36198, 117, 10309, 13663, 10751, 103325, 24297, 21591, 10111, 13446, 12935, 124, 118, 122, 10160, 11185, 139, 11111, 91120, 10106, 10455, 11132, 13569, 171, 25297, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pescara", "'", "s", "Ott", "##avio", "Pal", "##ladi", "##ni", "sh", "##atte", "##red", "Parma", "with", "goals", "in", "the", "second", "and", "fourth", "minutes", "." ], "ids": [ 91120, 112, 187, 103401, 60206, 78722, 28645, 10342, 48201, 43961, 15711, 29157, 10169, 18173, 10106, 10105, 11132, 10111, 16918, 15304, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mid", "##field", "##er", "Marco", "Gia", "##mpa", "##olo", "made", "it", "3", "-", "0", "in", "the", "38", "##th", "minute", "and", "Parma", "'", "s", "Alessandro", "Mel", "##li", "pulled", "back", "a", "late", "goal", "six", "minutes", "from", "time", "." ], "ids": [ 42234, 13408, 10165, 14160, 42106, 31285, 19139, 11019, 10271, 124, 118, 121, 10106, 10105, 11171, 11143, 21760, 10111, 29157, 112, 187, 21771, 40060, 10390, 65884, 12014, 169, 13002, 16586, 12449, 15304, 10188, 10635, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "second", "round", "was", "the", "entry", "point", "for", "the", "bulk", "of", "the", "serie", "A", "sides", "with", "the", "winners", "going", "through", "." ], "ids": [ 10117, 11132, 13569, 10134, 10105, 14722, 12331, 10142, 10105, 91415, 10108, 10105, 11185, 138, 27263, 10169, 10105, 33525, 19090, 11222, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "later", "stages", "of", "the", "cup", "are", "played", "over", "two", "legs", "." ], "ids": [ 10117, 10873, 35023, 10108, 10105, 41506, 10301, 11553, 10491, 10551, 51863, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Parma", "'", "s", "defeat", "was", "a", "repeat", "of", "last", "season", "'", "s", "fia", "##sco", "when", "they", "lost", "their", "opening", "cup", "match", "3", "-", "0", "to", "Palermo", "." ], "ids": [ 29157, 112, 187, 24800, 10134, 169, 107832, 10108, 12469, 11226, 112, 187, 26908, 22402, 10841, 10689, 14172, 10455, 17975, 41506, 12356, 124, 118, 121, 10114, 26588, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Roma", ",", "now", "coached", "by", "Argentine", "Carlos", "Bianchi", "and", "watched", "by", "Italian", "national", "coach", "Ar", "##rigo", "Sa", "##cchi", ",", "lost", "3", "-", "1", "to", "Ces", "##ena", "-", "-", "another", "repeat", "of", "last", "season", "when", "the", "Rome", "club", "also", "went", "out", "at", "the", "first", "hur", "##dle", "." ], "ids": [ 11794, 117, 11858, 71909, 10155, 31469, 12050, 59126, 10111, 92147, 10155, 11667, 11844, 15701, 18484, 80057, 12404, 24555, 117, 14172, 124, 118, 122, 10114, 17340, 13032, 118, 118, 12864, 107832, 10108, 12469, 11226, 10841, 10105, 14592, 11111, 10379, 13446, 10950, 10160, 10105, 10422, 52824, 27477, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 2, 4, 8, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Udine", "##se", ",", "with", "Germany", "'", "s", "Euro", "'", "96", "hero", "Oliver", "Bi", "##er", "##hoff", "in", "their", "lineup", ",", "completed", "the", "hat", "-", "trick", "of", "beaten", "serie", "A", "sides", "when", "they", "went", "under", "2", "-", "1", "to", "newly", "relegated", "C", "##remo", "##nese", "." ], "ids": [ 73569, 10341, 117, 10169, 12775, 112, 187, 17526, 112, 12308, 51670, 16875, 31156, 10165, 36425, 10106, 10455, 90223, 117, 15782, 10105, 11250, 118, 71662, 10108, 74075, 11185, 138, 27263, 10841, 10689, 13446, 10571, 123, 118, 122, 10114, 26574, 62212, 140, 94976, 33550, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 9, 1, 9, 9, 2, 6, 6, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Milan", "'", "s", "new", "Uruguay", "##an", "coach", "Oscar", "Ta", "##bare", "##z", "avoid", "##ed", "the", "night", "##mare", "of", "defeat", "but", "faces", "a", "rep", "##lay", "at", "home", "next", "Sunday", "." ], "ids": [ 15807, 112, 187, 10751, 20541, 10206, 15701, 14036, 14248, 19693, 10305, 33253, 10336, 10105, 16903, 34918, 10108, 24800, 10473, 48343, 169, 76456, 21768, 10160, 11816, 13451, 19731, 119 ], "entity": [ "B-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 2, 6, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cup", "holder", "##s", "Fiorentina", "easily", "beat", "Co", "##senza", "3", "-", "1", "while", "European", "Cup", "holder", "##s", "Juventus", "also", "cruise", "##d", "through", "with", "a", "2", "-", "0", "win", "at", "small", "southern", "club", "Fidel", "##is", "And", "##ria", "." ], "ids": [ 11544, 48938, 10107, 85774, 35024, 27868, 13098, 99037, 124, 118, 122, 11371, 11914, 11544, 48938, 10107, 33176, 10379, 101148, 10162, 11222, 10169, 169, 123, 118, 121, 14125, 10160, 12474, 17156, 11111, 66299, 10291, 12689, 11021, 119 ], "entity": [ "B-MISC", "O", "O", "B-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 9, 3, 9, 9, 3, 7, 9, 9, 9, 9, 2, 6, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Two", "other", "serie", "A", "sides", "lost", "at", "the", "weekend", "-", "-", "Piacenza", "and", "last", "year", "'", "s", "losing", "finalist", "##s", "Ata", "##lanta", "." ], "ids": [ 13214, 10684, 11185, 138, 27263, 14172, 10160, 10105, 43440, 118, 118, 75951, 10111, 12469, 10924, 112, 187, 27817, 78096, 10107, 68795, 83018, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Two", "cup", "matches", "could", "not", "be", "played", "on", "Wednesday", "due", "to", "argument", "over", "first", "round", "results", "." ], "ids": [ 13214, 41506, 18258, 12174, 10472, 10347, 11553, 10135, 57611, 10850, 10114, 36847, 10491, 10422, 13569, 17466, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lecce", "'", "s", "3", "-", "0", "weekend", "defeat", "of", "Genoa", "was", "expected", "to", "be", "over", "##tur", "##ned", "by", "a", "sporting", "judge", "on", "Thursday", "after", "the", "home", "club", "field", "##ed", "an", "in", "##elig", "##ible", "player", "." ], "ids": [ 79419, 112, 187, 124, 118, 121, 43440, 24800, 10108, 63362, 10134, 25973, 10114, 10347, 10491, 15698, 17021, 10155, 169, 89476, 31624, 10135, 67067, 10662, 10105, 11816, 11111, 13939, 10336, 10151, 10106, 44134, 22529, 12928, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "would", "set", "Genoa", "up", "for", "a", "second", "round", "match", "against", "local", "rivals", "Sam", "##p", "##doria", "." ], "ids": [ 13646, 10894, 11847, 63362, 10741, 10142, 169, 11132, 13569, 12356, 11327, 11436, 71908, 14268, 10410, 101233, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "No", "##cer", "##ina", "'", "s", "4", "-", "3", "defeat", "of", "Piacenza", "was", "also", "subject", "to", "a", "com", "##plain", "##t", ",", "later", "removed", ",", "that", "forced", "their", "second", "round", "match", "against", "serie", "A", "new", "##come", "##rs", "Perugia", "to", "be", "delayed", "." ], "ids": [ 10657, 17505, 11067, 112, 187, 125, 118, 124, 24800, 10108, 75951, 10134, 10379, 20036, 10114, 169, 10212, 88975, 10123, 117, 10873, 23898, 117, 10189, 20054, 10455, 11132, 13569, 12356, 11327, 11185, 138, 10751, 61643, 10943, 56465, 10114, 10347, 67058, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "BA", "##Y", "##ER", "##N", "H", "##IT", "F", "##O", "##UR", "TO", "TA", "##K", "##E", "B", "##UN", "##DE", "##SL", "##IG", "##A", "TOP", "SP", "##OT", "." ], "ids": [ 71020, 65622, 24093, 118, 39999, 14703, 24093, 11537, 145, 37611, 143, 11403, 98348, 58573, 91075, 11733, 11259, 139, 69849, 60675, 51960, 89696, 10738, 98151, 22570, 62146, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Goals", "from", "Thomas", "Helm", "##er", "and", "Ju", "##erg", "##en", "K", "##lins", "##mann", "helped", "Bayern", "Munich", "to", "a", "4", "-", "2", "home", "win", "over", "Bayer", "Leverkusen", "on", "Wednesday", "and", "powered", "them", "to", "the", "top", "of", "the", "Bundesliga", "." ], "ids": [ 109675, 10188, 11096, 76973, 10165, 10111, 45031, 69248, 10136, 148, 68541, 12350, 20890, 17200, 27349, 10114, 169, 125, 118, 123, 11816, 14125, 10491, 42806, 84961, 10135, 57611, 10111, 42668, 11345, 10114, 10105, 12364, 10108, 10105, 21436, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "The", "com", "##fortable", "victory", "gave", "Bayern", "10", "points", "from", "their", "first", "four", "games", ",", "a", "point", "ahead", "of", "second", "-", "placed", "Stuttgart", ",", "who", "have", "a", "game", "in", "hand", "." ], "ids": [ 10117, 10212, 81587, 19735, 15362, 17200, 10150, 12789, 10188, 10455, 10422, 11598, 13332, 117, 169, 12331, 35629, 10108, 11132, 118, 16906, 16048, 117, 10479, 10529, 169, 11661, 10106, 15230, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazilian", "midfielder", "Paulo", "Sergio", "put", "Leverkusen", "ahead", "in", "the", "25th", "minute", "but", "Alexander", "Zi", "##ckle", "##r", "equal", "##ised", "just", "a", "minute", "later", "." ], "ids": [ 32818, 68049, 13360, 22135, 14499, 84961, 35629, 10106, 10105, 71542, 21760, 10473, 12063, 99890, 87683, 10129, 32943, 20666, 12820, 169, 21760, 10873, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 9, 3, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "head", "##er", "from", "Helm", "##er", "and", "an", "ac", "##ro", "##bati", "##c", "strike", "from", "K", "##lins", "##mann", "gave", "Bayern", "a", "two", "-", "goal", "cu", "##shi", "##on", "at", "half", "##time", "." ], "ids": [ 138, 13578, 10165, 10188, 76973, 10165, 10111, 10151, 13621, 10567, 90322, 10350, 37456, 10188, 148, 68541, 12350, 15362, 17200, 169, 10551, 118, 16586, 10854, 16119, 10263, 10160, 13877, 18086, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "pick", "of", "the", "13", "-", "times", "champions", "'", "goals", "came", "from", "Ruggiero", "R", "##iz", "##zite", "##lli", ",", "who", "beat", "three", "defender", "##s", "to", "put", "Bayern", "4", "-", "1", "up", "." ], "ids": [ 16976, 10105, 36833, 10108, 10105, 10249, 118, 13465, 27745, 112, 18173, 13383, 10188, 55416, 155, 15834, 90344, 14088, 117, 10479, 27868, 11003, 36426, 10107, 10114, 14499, 17200, 125, 118, 122, 10741, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Markus", "Feld", "##hoff", "hit", "a", "con", "##sola", "##tion", "goal", "for", "Leverkusen", "." ], "ids": [ 32568, 53709, 36425, 14946, 169, 10173, 50293, 10822, 16586, 10142, 84961, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Hansa", "Rostock", "brought", "Cologne", "'", "s", "100", "percent", "record", "to", "an", "end", "with", "a", "2", "-", "0", "win", "over", "the", "Rhine", "##side", "club", "while", "a", "Sean", "Dundee", "hat", "-", "trick", "inside", "seven", "minutes", "stood", "out", "in", "Karlsruhe", "'", "s", "4", "-", "0", "demo", "##lition", "of", "St", "Pauli", "." ], "ids": [ 77740, 47090, 17327, 52577, 112, 187, 10407, 22362, 12410, 10114, 10151, 11572, 10169, 169, 123, 118, 121, 14125, 10491, 10105, 66227, 18103, 11111, 11371, 169, 21286, 60426, 11250, 118, 71662, 22978, 15767, 15304, 39320, 10950, 10106, 36954, 112, 187, 125, 118, 121, 30776, 91177, 10108, 10838, 54583, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "IT", "##AL", "##IA", "##N", "C", "##UP", "SEC", "##ON", "##D", "R", "##O", "##UN", "##D", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 26956, 32002, 35976, 11537, 140, 57487, 92031, 30118, 11490, 155, 11403, 69849, 11490, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ROM", "##E", "1996", "-", "08", "-", "28" ], "ids": [ 41068, 11259, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Italian", "Cup", "second", "round" ], "ids": [ 33036, 10108, 11667, 11544, 11132, 13569 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "matches", "played", "on", "Wednesday", ":" ], "ids": [ 18258, 11553, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Em", "##poli", "1", "Milan", "1" ], "ids": [ 11289, 29378, 122, 15807, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Spa", "##l", "2", "Reg", "##gian", "##a", "4" ], "ids": [ 64766, 10161, 123, 107990, 38531, 10113, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Luc", "##ches", "##e", "1", "Vicenza", "2" ], "ids": [ 26589, 16272, 10112, 122, 57780, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "C", "##remo", "##nese", "2", "Udine", "##se", "1" ], "ids": [ 140, 94976, 33550, 123, 73569, 10341, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Ces", "##ena", "3", "Roma", "1" ], "ids": [ 17340, 13032, 124, 11794, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Bologna", "2", "Torino", "1" ], "ids": [ 22615, 123, 19744, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Co", "##senza", "1", "Fiorentina", "3" ], "ids": [ 13098, 99037, 122, 85774, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Ave", "##llino", "0", "Lazio", "1" ], "ids": [ 50998, 82783, 121, 39001, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Bari", "1", "Verona", "1" ], "ids": [ 35536, 122, 31755, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Pescara", "3", "Parma", "1" ], "ids": [ 91120, 124, 29157, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Monza", "0", "Napoli", "1" ], "ids": [ 61788, 121, 19467, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Chi", "##evo", "2", "Cagliari", "3" ], "ids": [ 21946, 36237, 123, 58782, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Ravenna", "0", "Inter", "1" ], "ids": [ 55919, 121, 24362, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Fidel", "##is", "And", "##ria", "0", "Juventus", "2" ], "ids": [ 66299, 10291, 12689, 11021, 121, 33176, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##IE", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 71655, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##mmar", "##ies", "of", "Wednesday", "'", "s", "German" ], "ids": [ 12271, 100620, 11624, 10108, 57611, 112, 187, 12026 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "first", "division", "soccer", "matches", ":" ], "ids": [ 10422, 13751, 41356, 18258, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karlsruhe", "4", "(", "Keller", "18th", "minute", ",", "Dundee", "56", "##th", "59", "##th", "and", "64", "##th", ")" ], "ids": [ 36954, 125, 113, 38294, 27669, 21760, 117, 60426, 11628, 11143, 11867, 11143, 10111, 11295, 11143, 114 ], "entity": [ "B-ORG", "O", "O", "B-PER", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "0", "." ], "ids": [ 10838, 54583, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9 ] }, { "tokens": [ "Half", "##time", "1", "-", "0", "." ], "ids": [ 33100, 18086, 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "27", ",", "600", "." ], "ids": [ 46080, 10365, 117, 11796, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayern", "Munich", "4", "(", "Zi", "##ckle", "##r", "26", "##th", ",", "Helm", "##er", "37", "##th", ",", "K", "##lins", "##mann", "44", "##th", "," ], "ids": [ 17200, 27349, 125, 113, 99890, 87683, 10129, 10314, 11143, 117, 76973, 10165, 11204, 11143, 117, 148, 68541, 12350, 11126, 11143, 117 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "R", "##iz", "##zite", "##lli", "48", "##th", ")", "Bayer", "Leverkusen", "2", "(", "Sergio", "25th", ",", "Feld", "##hoff" ], "ids": [ 155, 15834, 90344, 14088, 11300, 11143, 114, 42806, 84961, 123, 113, 22135, 71542, 117, 53709, 36425 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 3, 7, 9, 9, 4, 9, 9, 4, 8 ] }, { "tokens": [ "54", "##th", ")", "." ], "ids": [ 11653, 11143, 114, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "1", "." ], "ids": [ 124, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "48", ",", "000", "." ], "ids": [ 11300, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Cologne", "0", "Hansa", "Rostock", "2", "(", "Ak", "##po", "##bori", "##e", "5th", "and", "59", "##th", ")", "." ], "ids": [ 52577, 121, 77740, 47090, 123, 113, 71275, 13520, 95933, 10112, 23255, 10111, 11867, 11143, 114, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "1", "." ], "ids": [ 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "27", ",", "000", "." ], "ids": [ 10365, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Due", "##ssel", "##dorf", "0", "1860", "Munich", "0", "." ], "ids": [ 59890, 20896, 49235, 16631, 121, 13336, 27349, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "11", ",", "500", "." ], "ids": [ 10193, 117, 10757, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Armin", "##ia", "Bielefeld", "1", "(", "Von", "Hee", "##sen", "56", "##th", ")", "Duisburg", "1", "(", "Hirsch", "65", "##th", ")", "." ], "ids": [ 78283, 10280, 67943, 122, 113, 12273, 107443, 10917, 11628, 11143, 114, 65064, 122, 113, 76403, 10843, 11143, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 8, 9, 9, 9, 3, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "0", "." ], "ids": [ 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "15", ",", "000", "." ], "ids": [ 10208, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "LE", "##AD", "##ING", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "SC", "##OR", "##ER", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 84977, 55538, 50183, 64655, 50655, 86448, 84977, 109865, 62674, 18137, 42622, 24093, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "scorer", "##s", "in", "the", "French" ], "ids": [ 100085, 99782, 10107, 10106, 10105, 11894 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "first", "division", "after", "Wednesday", "'", "s", "matches", ":" ], "ids": [ 10422, 13751, 10662, 57611, 112, 187, 18258, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "Anton", "Dr", "##ob", "##njak", "(", "Bastia", ")", ",", "Vladimir", "Sm", "##ice", "##r", "(", "Lens", ")", ",", "Mil", "##adi", "##n" ], "ids": [ 124, 118, 16242, 11612, 31165, 108805, 113, 107497, 114, 117, 18124, 41922, 11918, 10129, 113, 72008, 114, 117, 75311, 18974, 10115 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8 ] }, { "tokens": [ "Be", "##cano", "##vic", "(", "Lille", ")", ",", "Alain", "Cave", "##glia", "(", "Lyon", ")", ",", "Xavier", "Grave", "##laine" ], "ids": [ 14321, 25498, 48175, 113, 28372, 114, 117, 20444, 43502, 27965, 113, 17980, 114, 117, 23766, 44430, 67320 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Marseille", ")", ",", "Robert", "Pi", "##res", "(", "Metz", ")", ",", "Thierry", "Henry", "(", "Monaco", ")" ], "ids": [ 113, 25016, 114, 117, 10820, 38329, 11234, 113, 32434, 114, 117, 35754, 11601, 113, 24661, 114 ], "entity": [ "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 3, 9, 9, 4, 8, 8, 9, 3, 9, 9, 4, 8, 9, 3, 9 ] }, { "tokens": [ "2", "-", "Christopher", "W", "##re", "##h", "(", "G", "##uing", "##amp", ")", ",", "Marc", "-", "Vi", "##vien", "F", "##oe", "(", "Lens", ")", ",", "Enzo" ], "ids": [ 123, 118, 15244, 160, 10246, 10237, 113, 144, 94213, 53692, 114, 117, 15254, 118, 31826, 24844, 143, 20085, 113, 72008, 114, 117, 50734 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 9, 9, 4 ] }, { "tokens": [ "Sci", "##fo", "(", "Monaco", ")", ",", "James", "De", "##bba", "##h", "(", "Nice", ")", ",", "Patrice", "Lok", "##o", "(", "PS", "##G", ")", "," ], "ids": [ 23359, 21330, 113, 24661, 114, 117, 10900, 10190, 55350, 10237, 113, 26918, 114, 117, 63953, 63998, 10133, 113, 21290, 11447, 114, 117 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 9, 3, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Stephan", "##e", "G", "##ui", "##var", "##ch", "(", "Rennes", ")" ], "ids": [ 31556, 10112, 144, 11990, 16648, 10269, 113, 42288, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 3, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "SM", "##IC", "##ER", "'", "S", "LA", "##ST", "-", "GA", "##SP", "GO", "##AL", "K", "##EE", "##PS", "LE", "##NS", "IN", "THE", "LE", "##AD", "." ], "ids": [ 71020, 65622, 24093, 118, 17713, 30889, 24093, 112, 156, 29079, 32995, 118, 74212, 86001, 41525, 32002, 148, 95825, 46983, 84977, 69196, 36351, 17443, 84977, 55538, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Euro", "96", "star", "Vladimir", "Sm", "##ice", "##r", "of", "the", "Czech", "Republic", "scored", "at", "the", "last", "second", "for", "Lens", ",", "allowing", "them", "to", "retain", "the", "lead", "in", "the", "French", "soccer", "league", "on", "Wednesday", "." ], "ids": [ 17526, 12308, 16624, 18124, 41922, 11918, 10129, 10108, 10105, 22148, 13681, 17233, 10160, 10105, 12469, 11132, 10142, 72008, 117, 28357, 11345, 10114, 76863, 10105, 14107, 10106, 10105, 11894, 41356, 15616, 10135, 57611, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 4, 8, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sm", "##ice", "##r", "pushed", "the", "ball", "home", "in", "injury", "time", "to", "lead", "his", "team", "to", "a", "3", "-", "2", "victory", "over", "Montpellier", ",", "who", "were", "leading", "2", "-", "1", "until", "Cameroon", "'", "s", "Marc", "-", "Vi", "##vien", "F", "##oe", "equal", "##ised", "on", "a", "head", "##er", "in", "the", "85", "##th", "minute", "." ], "ids": [ 41922, 11918, 10129, 70157, 10105, 20724, 11816, 10106, 27443, 10635, 10114, 14107, 10226, 11121, 10114, 169, 124, 118, 123, 19735, 10491, 38069, 117, 10479, 10309, 16018, 123, 118, 122, 11444, 77812, 112, 187, 15254, 118, 31826, 24844, 143, 20085, 32943, 20666, 10135, 169, 13578, 10165, 10106, 10105, 12017, 11143, 21760, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "win", "was", "the", "fourth", "in", "as", "many", "matches", "this", "season", "for", "Lens", ",", "who", "lead", "the", "table", "on", "12", "points", "." ], "ids": [ 10117, 14125, 10134, 10105, 16918, 10106, 10146, 11299, 18258, 10531, 11226, 10142, 72008, 117, 10479, 14107, 10105, 21783, 10135, 10186, 12789, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "-", "form", "Paris", "St", "Germain", ",", "who", "dismissed", "Nantes", "1", "-", "0", ",", "are", "second", "with", "10", "points", "." ], "ids": [ 10167, 118, 12188, 10728, 10838, 26289, 117, 10479, 59379, 32134, 122, 118, 121, 117, 10301, 11132, 10169, 10150, 12789, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Along", "with", "Sm", "##ice", "##r", ",", "Robert", "Pi", "##res", "was", "the", "star", "of", "the", "night", "in", "France", ",", "scoring", "the", "first", "hat", "-", "trick", "of", "the", "league", "season", "in", "Metz", "'", "s", "3", "-", "1", "home", "victory", "over", "neighbouring", "Strasbourg", "." ], "ids": [ 40545, 10169, 41922, 11918, 10129, 117, 10820, 38329, 11234, 10134, 10105, 16624, 10108, 10105, 16903, 10106, 10688, 117, 27346, 10105, 10422, 11250, 118, 71662, 10108, 10105, 15616, 11226, 10106, 32434, 112, 187, 124, 118, 122, 11816, 19735, 10491, 79475, 30300, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Pi", "##res", ",", "one", "of", "the", "most", "pro", "##mising", "striker", "##s", "in", "the", "country", ",", "was", "called", "up", "for", "the", "first", "time", "this", "week", "by", "French", "manager", "Ai", "##me", "Ja", "##cque", "##t", "for", "a", "friendly", "against", "Mexico", "on", "Saturday", "at", "the", "Parc", "des", "Prince", "##s", "." ], "ids": [ 38329, 11234, 117, 10464, 10108, 10105, 10992, 11284, 81654, 103325, 10107, 10106, 10105, 12723, 117, 10134, 11552, 10741, 10142, 10105, 10422, 10635, 10531, 16118, 10155, 11894, 16935, 19672, 10627, 28248, 97980, 10123, 10142, 169, 43941, 11327, 10490, 10135, 24848, 10160, 10105, 29875, 10139, 14185, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "Pi", "##res", "scored", "first", "with", "a", "powerful", "shot", "in", "the", "35", "##th", "minute", "before", "striking", "again", "from", "close", "range", "just", "before", "the", "break", "." ], "ids": [ 38329, 11234, 17233, 10422, 10169, 169, 29481, 19508, 10106, 10105, 10803, 11143, 21760, 11360, 87894, 13123, 10188, 16065, 15601, 12820, 11360, 10105, 24194, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "soli", "##tary", "raid", "allowed", "him", "to", "score", "his", "third", "in", "the", "74", "##th", "." ], "ids": [ 138, 36766, 65597, 52152, 18162, 10957, 10114, 17704, 10226, 12628, 10106, 10105, 12535, 11143, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sm", "##ice", "##r", "'", "s", "goal", "was", "as", "hard", "-", "won", "as", "his", "team", "'", "s", "victory", "." ], "ids": [ 41922, 11918, 10129, 112, 187, 16586, 10134, 10146, 19118, 118, 11367, 10146, 10226, 11121, 112, 187, 19735, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spur", "##red", "by", "F", "##oe", "'", "s", "level", "##ler", "five", "minutes", "before", ",", "Lens", "presse", "##d", "hard", "and", "F", "##oe", "hit", "the", "cross", "##bar", "in", "the", "dying", "seconds", "on", "another", "head", "##er", "." ], "ids": [ 89046, 15711, 10155, 143, 20085, 112, 187, 13277, 10815, 12403, 15304, 11360, 117, 72008, 33834, 10162, 19118, 10111, 143, 20085, 14946, 10105, 19630, 12867, 10106, 10105, 84769, 34290, 10135, 12864, 13578, 10165, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ball", "bou", "##nce", "##d", "back", "to", "Sm", "##ice", "##r", "'", "s", "feet", "and", "he", "scored", "." ], "ids": [ 10117, 20724, 94335, 12150, 10162, 12014, 10114, 41922, 11918, 10129, 112, 187, 17296, 10111, 10261, 17233, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Montpellier", "seized", "an", "une", "##xpected", "lead", "thanks", "to", "Kader", "Fe", "##r", "##ha", "##ou", "##i", "in", "the", "fourth", "minute", "after", "a", "blu", "##nder", "from", "Lens", "goalkeeper", "Jean", "-", "Claude", "Nad", "##on", "." ], "ids": [ 38069, 80176, 10151, 10231, 101239, 14107, 69892, 10114, 53361, 20187, 10129, 10921, 11010, 10116, 10106, 10105, 16918, 21760, 10662, 169, 57965, 16497, 10188, 72008, 84159, 10766, 118, 14318, 51726, 10263, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "The", "side", "from", "northern", "France", ",", "forced", "to", "fight", "an", "up", "##hill", "battle", "from", "then", "on", ",", "pulled", "level", "thanks", "to", "Tony", "Vai", "##relle", "##s", "in", "the", "eighth", "minute", "but", "young", "striker", "Fa", "##bien", "Le", "##fe", "##vre", "made", "it", "two", "for", "Montpellier", "five", "minutes", "later", "." ], "ids": [ 10117, 12250, 10188, 17335, 10688, 117, 20054, 10114, 20780, 10151, 10741, 32049, 18758, 10188, 11059, 10135, 117, 65884, 13277, 69892, 10114, 13749, 98978, 79638, 10107, 10106, 10105, 46758, 21760, 10473, 14739, 103325, 44271, 42200, 10281, 14601, 18994, 11019, 10271, 10551, 10142, 38069, 12403, 15304, 10873, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "League", "favourite", "##s", "PS", "##G", "scored", "a", "con", "##vin", "##cing", "1", "-", "0", "win", "over", "Nantes", "and", "confirmed", "they", "would", "again", "be", "the", "team", "to", "beat", "this", "season", "." ], "ids": [ 11074, 80494, 10107, 21290, 11447, 17233, 169, 10173, 15478, 19113, 122, 118, 121, 14125, 10491, 32134, 10111, 27347, 10689, 10894, 13123, 10347, 10105, 11121, 10114, 27868, 10531, 11226, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iron", "##ically", ",", "PS", "##G", "'", "s", "victory", "o", "##wed", "a", "lot", "to", "two", "former", "Nantes", "players", ",", "striker", "Patrice", "Lok", "##o", ",", "who", "scored", "on", "a", "br", "##ill", "##iant", "shot", "in", "the", "33", "##rd", "minute", ",", "and", "defender", "Benoit", "Ca", "##uet", ",", "who", "started", "the", "one", "-", "two", "which", "allowed", "Lok", "##o", "to", "score", "." ], "ids": [ 19247, 52917, 117, 21290, 11447, 112, 187, 19735, 183, 48854, 169, 19826, 10114, 10551, 11775, 32134, 16021, 117, 103325, 63953, 63998, 10133, 117, 10479, 17233, 10135, 169, 33989, 19503, 24096, 19508, 10106, 10105, 11000, 12023, 21760, 117, 10111, 36426, 76359, 26037, 58054, 117, 10479, 13457, 10105, 10464, 118, 10551, 10319, 18162, 63998, 10133, 10114, 17704, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "The", "Paris", "##ians", ",", "who", "have", "yet", "to", "con", "##cede", "a", "goal", ",", "were", "without", "Brazil", "'", "s", "Leonardo", "and", "Panama", "'", "s", "Julio", "Cesar", "Del", "##y", "Val", "##des", ",", "both", "called", "up", "by", "their", "national", "sides", "." ], "ids": [ 10117, 10728, 34615, 117, 10479, 10529, 21833, 10114, 10173, 46701, 169, 16586, 117, 10309, 13663, 16765, 112, 187, 22573, 10111, 25003, 112, 187, 23617, 70418, 15973, 10157, 16190, 10920, 117, 11408, 11552, 10741, 10155, 10455, 11844, 27263, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "Nantes", ",", "who", "shock", "##ed", "PS", "##G", "to", "win", "the", "league", "crown", "two", "years", "ago", ",", "the", "fall", "is", "very", "pain", "##ful", "." ], "ids": [ 11399, 32134, 117, 10479, 62868, 10336, 21290, 11447, 10114, 14125, 10105, 15616, 52990, 10551, 10855, 36390, 117, 10105, 18042, 10124, 12558, 38576, 14446, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Can", "##aries", ",", "who", "lost", "most", "of", "their", "key", "players", "within", "two", "years", ",", "have", "yet", "to", "win", "a", "match", "this", "season", "." ], "ids": [ 10117, 14820, 26445, 117, 10479, 14172, 10992, 10108, 10455, 18444, 16021, 12381, 10551, 10855, 117, 10529, 21833, 10114, 14125, 169, 12356, 10531, 11226, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reign", "##ing", "champions", "Auxerre", "had", "to", "settle", "for", "a", "goal", "##less", "draw", "against", "Marseille", "on", "Tuesday", "." ], "ids": [ 96156, 10230, 27745, 86186, 10374, 10114, 90424, 10142, 169, 16586, 14985, 25974, 11327, 25016, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##IE", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 71655, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "28" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "Dutch", "first", "division" ], "ids": [ 42027, 10108, 17693, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "played", "on", "Wednesday", ":" ], "ids": [ 41356, 11553, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Willem", "II", "Til", "##burg", "1", "(", "Van", "Hi", "##ntu", "##m", "69", "##th", "penalty", ")", "RK", "##C", "W", "##aal", "##ijk", "2" ], "ids": [ 20903, 10335, 27853, 12248, 122, 113, 11474, 20065, 40468, 10147, 12573, 11143, 40924, 114, 105546, 10858, 160, 19641, 34799, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "(", "Sc", "##hre", "##uder", "39", "##th", ",", "Van", "Ar", "##um", "76", "##th", ",", "83", "##rd", ")", "." ], "ids": [ 113, 55260, 32206, 84009, 11303, 11143, 117, 11474, 18484, 10465, 12428, 11143, 117, 12408, 12023, 114, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "1", "." ], "ids": [ 33100, 18086, 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance" ], "ids": [ 46080 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "6", ",", "150", "." ], "ids": [ 127, 117, 11766, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Vi", "##tesse", "Arnhem", "1", "(", "Vier", "##kla", "##u", "85", "##th", ")", "Sparta", "Rotterdam", "1", "(", "Gerard" ], "ids": [ 31826, 100319, 76323, 122, 113, 49410, 22444, 10138, 12017, 11143, 114, 36354, 25136, 122, 113, 31882 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 8, 9, 9, 9, 3, 7, 9, 9, 4 ] }, { "tokens": [ "de", "No", "##oi", "##jer", "80", "##th", ")", "." ], "ids": [ 10104, 10657, 14638, 17792, 10832, 11143, 114, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "0", "." ], "ids": [ 33100, 18086, 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "5", ",", "696", "." ], "ids": [ 46080, 126, 117, 68865, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Utrecht", "0", "Twente", "En", "##sche", "##de", "0", "." ], "ids": [ 24890, 121, 104879, 10243, 12279, 10253, 121, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Attendance", "9", ",", "000", "." ], "ids": [ 46080, 130, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Groningen", "1", "(", "Go", "##rre", "66", "##th", ")", "Roda", "JC", "Kerk", "##rade", "1", "(", "Vu", "##rens", "3rd", ")" ], "ids": [ 36806, 122, 113, 14439, 19243, 12215, 11143, 114, 97751, 76199, 36156, 18752, 122, 113, 100154, 74111, 16800, 114 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 3, 7, 7, 7, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "1", "." ], "ids": [ 33100, 18086, 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "10", ",", "000", "." ], "ids": [ 46080, 10150, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Feyenoord", "2", "(", "Larsson", "73", "##rd", ",", "Van", "Gast", "##el", "83", "##rd", "penalty", ")", "G", "##raaf", "##schap" ], "ids": [ 103340, 123, 113, 59396, 12545, 12023, 117, 11474, 99260, 10570, 12408, 12023, 40924, 114, 144, 71647, 21289 ], "entity": [ "B-ORG", "O", "O", "B-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 9, 9, 4, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 3, 7, 7 ] }, { "tokens": [ "Doe", "##tin", "##chem", "1", "(", "Schultz", "4th", ")", "." ], "ids": [ 71335, 15364, 34884, 122, 113, 61712, 20393, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "1", "." ], "ids": [ 33100, 18086, 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "22", ",", "434", "." ], "ids": [ 46080, 10306, 117, 44726, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vol", "##enda", "##m", "1", "(", "Jong", "##sma", "85", "##th", ")", "PSV", "Eindhoven", "3", "(", "Marcelo", "19th", ",", "47", "##th", "," ], "ids": [ 12546, 27808, 10147, 122, 113, 33459, 24188, 12017, 11143, 114, 66922, 55552, 124, 113, 38165, 19794, 117, 11413, 11143, 117 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 9, 9, 9, 3, 7, 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "56", "##rd", ")", "." ], "ids": [ 11628, 12023, 114, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "0", "-", "1", "." ], "ids": [ 33100, 18086, 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "6", ",", "000", "." ], "ids": [ 46080, 127, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ajax", "Amsterdam", "1", "(", "Frank", "de", "Boer", "30th", ")", "AZ", "Al", "##km", "##aar", "0", "." ], "ids": [ 37057, 14017, 122, 113, 11872, 10104, 80109, 95539, 114, 81705, 10883, 23440, 21960, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 9, 9, 3, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Half", "##time" ], "ids": [ 33100, 18086 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "48", ",", "123", "." ], "ids": [ 46080, 11300, 117, 16968, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Play", "##ed", "on", "Tuesday", "." ], "ids": [ 17712, 10336, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Sitt", "##ard", "2", "(", "Jeffrey", "7th", ",", "R", "##oes", "##t", "33", "##rd", ")", "Heer", "##en", "##veen", "4" ], "ids": [ 59890, 105987, 13167, 123, 113, 29323, 15582, 117, 155, 47125, 10123, 11000, 12023, 114, 49764, 10136, 53467, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 9, 9, 4, 8, 8, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "(", "Korn", "##ee", "##v", "15th", ",", "Hans", "##ma", "24", "##th", ",", "Wo", "##uden", "70", "##th", ",", "90", "##th", ")", "." ], "ids": [ 113, 96287, 13321, 10477, 36293, 117, 11768, 10369, 10233, 11143, 117, 102204, 23280, 10923, 11143, 117, 10919, 11143, 114, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "2", "-", "2", "." ], "ids": [ 33100, 18086, 123, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "4", ",", "000", "." ], "ids": [ 46080, 125, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GE", "##R", "##MA", "##N", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 62997, 11273, 30696, 11537, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "German", "first", "division" ], "ids": [ 33036, 10108, 12026, 10422, 13751 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "soccer", "matches", "on", "Wednesday", ":" ], "ids": [ 41356, 18258, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karlsruhe", "4", "St", "Pauli", "0" ], "ids": [ 36954, 125, 10838, 54583, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Bayern", "Munich", "4", "Bayer", "Leverkusen", "2" ], "ids": [ 17200, 27349, 125, 42806, 84961, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Cologne", "0", "Hansa", "Rostock", "2" ], "ids": [ 52577, 121, 77740, 47090, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Fortuna", "Due", "##ssel", "##dorf", "0", "1860", "Munich", "0" ], "ids": [ 59890, 20896, 49235, 16631, 121, 13336, 27349, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Armin", "##ia", "Bielefeld", "1", "Duisburg", "1" ], "ids": [ 78283, 10280, 67943, 122, 65064, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulated", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 37725, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayern", "Munich", "4", "3", "1", "0", "11", "4", "10" ], "ids": [ 17200, 27349, 125, 124, 122, 121, 10193, 125, 10150 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VfB", "Stuttgart", "3", "3", "0", "0", "10", "1", "9" ], "ids": [ 76227, 16048, 124, 124, 121, 121, 10150, 122, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Dortmund", "4", "3", "0", "1", "12", "6", "9" ], "ids": [ 48007, 33962, 125, 124, 121, 122, 10186, 127, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cologne", "4", "3", "0", "1", "7", "3", "9" ], "ids": [ 52577, 125, 124, 121, 122, 128, 124, 130 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Karlsruhe", "3", "2", "1", "0", "9", "3", "7" ], "ids": [ 36954, 124, 123, 122, 121, 130, 124, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bayer", "Leverkusen", "4", "2", "0", "2", "9", "8", "6" ], "ids": [ 42806, 84961, 125, 123, 121, 123, 130, 129, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VfL", "Bochum", "4", "1", "3", "0", "4", "3", "6" ], "ids": [ 77307, 63359, 125, 122, 124, 121, 125, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SV", "Hamburg", "4", "2", "0", "2", "7", "7", "6" ], "ids": [ 25452, 15021, 125, 123, 121, 123, 128, 128, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hansa", "Rostock", "4", "1", "2", "1", "5", "4", "5" ], "ids": [ 77740, 47090, 125, 122, 123, 122, 126, 125, 126 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Werder", "Bremen", "4", "1", "1", "2", "5", "6", "4" ], "ids": [ 89919, 21360, 125, 122, 122, 123, 126, 127, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Munich", "1860", "4", "1", "1", "2", "3", "5", "4" ], "ids": [ 27349, 13336, 125, 122, 122, 123, 124, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "Pauli", "4", "1", "1", "2", "7", "11", "4" ], "ids": [ 10838, 54583, 125, 122, 122, 123, 128, 10193, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Due", "##ssel", "##dorf", "4", "1", "1", "2", "1", "7", "4" ], "ids": [ 59890, 20896, 49235, 16631, 125, 122, 122, 123, 122, 128, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Armin", "##ia", "Bielefeld", "4", "0", "3", "1", "3", "4", "3" ], "ids": [ 78283, 10280, 67943, 125, 121, 124, 122, 124, 125, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Schalke", "04", "4", "0", "3", "1", "5", "9", "3" ], "ids": [ 87909, 10814, 125, 121, 124, 122, 126, 130, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Freiburg", "4", "1", "0", "3", "6", "13", "3" ], "ids": [ 29283, 125, 122, 121, 124, 127, 10249, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Borussia", "Moe", "##nche", "##ng", "##lad", "##bach", "4", "0", "2", "2", "1", "4", "2" ], "ids": [ 48007, 80790, 49457, 10376, 19505, 14135, 125, 121, 123, 123, 122, 125, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Duisburg", "4", "0", "1", "3", "2", "9", "1" ], "ids": [ 65064, 125, 121, 122, 124, 123, 130, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "SU", "##MM", "##AR", "##IE", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 84977, 109865, 62674, 86643, 93252, 52188, 71655, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##mmar", "##ies", "of", "French", "first", "division" ], "ids": [ 12271, 100620, 11624, 10108, 11894, 10422, 13751 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "matches", "on", "Wednesday", ":" ], "ids": [ 18258, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Bastia", "0", "Lille", "0", "." ], "ids": [ 107497, 121, 28372, 121, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 9, 3, 9, 9 ] }, { "tokens": [ "0", "-", "0", "." ], "ids": [ 121, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "5", ",", "000", "." ], "ids": [ 126, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Cannes", "0", "Monaco", "2", "(", "Henry", "26", "##th", ",", "71", "##st", ")", "." ], "ids": [ 27615, 121, 24661, 123, 113, 11601, 10314, 11143, 117, 12513, 10562, 114, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "1", "." ], "ids": [ 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "7", ",", "000", "." ], "ids": [ 128, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Le", "Havre", "1", "(", "Samson", "24", "##th", ")", "Caen", "1", "(", "Etienne", "Men", "##dy", "4th", ")", "." ], "ids": [ 10281, 59887, 122, 113, 63350, 10233, 11143, 114, 51011, 122, 113, 64339, 13026, 12355, 20393, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 9, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "1", "-", "1", "." ], "ids": [ 122, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "12", ",", "000", "." ], "ids": [ 10186, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Lens", "3", "(", "Vai", "##relle", "##s", "8th", ",", "F", "##oe", "85", "##th", ",", "Sm", "##ice", "##r", "90", "##th", ")", "Montpellier", "2" ], "ids": [ 72008, 124, 113, 98978, 79638, 10107, 32074, 117, 143, 20085, 12017, 11143, 117, 41922, 11918, 10129, 10919, 11143, 114, 38069, 123 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 3, 9 ] }, { "tokens": [ "(", "Fe", "##r", "##ha", "##ou", "##i", "4th", ",", "Le", "##fe", "##vre", "13th", ")", "." ], "ids": [ 113, 20187, 10129, 10921, 11010, 10116, 20393, 117, 10281, 14601, 18994, 33937, 114, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "1", "-", "2", "." ], "ids": [ 122, 118, 123, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "30", ",", "000", "." ], "ids": [ 10244, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Lyon", "2", "(", "Cave", "##glia", "23", "##rd", ",", "G", "##iul", "##y", "30th", ")", "Nancy", "0", "." ], "ids": [ 17980, 123, 113, 43502, 27965, 10328, 12023, 117, 144, 66328, 10157, 95539, 114, 20073, 121, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 3, 9, 9 ] }, { "tokens": [ "2", "-", "0", "." ], "ids": [ 123, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "15", ",", "000", "." ], "ids": [ 10208, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Metz", "3", "(", "Pi", "##res", "35", "##th", ",", "48", "##th", ",", "74", "##th", ")", "Strasbourg", "1", "(", "Rodriguez", "56", "##th", ")", "." ], "ids": [ 32434, 124, 113, 38329, 11234, 10803, 11143, 117, 11300, 11143, 117, 12535, 11143, 114, 30300, 122, 113, 41778, 11628, 11143, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "14", ",", "000", "." ], "ids": [ 10247, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Nice", "1", "(", "Chao", "##uch", "64", "##th", ")", "G", "##uing", "##amp", "2", "(", "Roux", "##el", "10th", ",", "Bare", "##t", "89", "##th", ")", "." ], "ids": [ 26918, 122, 113, 62866, 20591, 11295, 11143, 114, 144, 94213, 53692, 123, 113, 67911, 10570, 31004, 117, 104412, 10123, 12642, 11143, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 9, 9, 9, 3, 7, 7, 9, 9, 4, 8, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "0", "-", "1", "." ], "ids": [ 121, 118, 122, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "4", ",", "000", "." ], "ids": [ 125, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "St", "Germain", "1", "(", "Lok", "##o", "33", "##rd", ")", "Nantes", "0", "." ], "ids": [ 10728, 10838, 26289, 122, 113, 63998, 10133, 11000, 12023, 114, 32134, 121, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "30", ",", "000", "." ], "ids": [ 10244, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Rennes", "1", "(", "G", "##ui", "##var", "##ch", "27", "##th", ")", "Bordeaux", "1", "(", "Colle", "##ter", "86", "##th", ")", "." ], "ids": [ 42288, 122, 113, 144, 11990, 16648, 10269, 10365, 11143, 114, 25169, 122, 113, 97461, 10877, 12224, 11143, 114, 119 ], "entity": [ "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 4, 8, 8, 8, 9, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "0", "." ], "ids": [ 122, 118, 121, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "16", ",", "000", "." ], "ids": [ 10250, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "in", "the", "French", "first" ], "ids": [ 58592, 10107, 10106, 10105, 11894, 10422 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "after", "Wednesday", "'", "s", "matches", "(", "tab", "##ulate", "under", "played", ",", "won", "," ], "ids": [ 13751, 10662, 57611, 112, 187, 18258, 113, 100781, 70863, 10571, 11553, 117, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "drawn", ",", "lost", ",", "goals", "for", ",", "against", ",", "points", ")", ":" ], "ids": [ 34788, 117, 14172, 117, 18173, 10142, 117, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lens", "4", "4", "0", "0", "9", "3", "12" ], "ids": [ 72008, 125, 125, 121, 121, 130, 124, 10186 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "Saint", "-", "Germain", "4", "3", "1", "0", "4", "0", "10" ], "ids": [ 10728, 10602, 118, 26289, 125, 124, 122, 121, 125, 121, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bastia", "4", "2", "2", "0", "4", "1", "8" ], "ids": [ 107497, 125, 123, 123, 121, 125, 122, 129 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Auxerre", "4", "2", "2", "0", "3", "0", "8" ], "ids": [ 86186, 125, 123, 123, 121, 124, 121, 129 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Monaco", "4", "2", "1", "1", "7", "4", "7" ], "ids": [ 24661, 125, 123, 122, 122, 128, 125, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lyon", "4", "2", "1", "1", "6", "4", "7" ], "ids": [ 17980, 125, 123, 122, 122, 127, 125, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Metz", "4", "2", "1", "1", "6", "4", "7" ], "ids": [ 32434, 125, 123, 122, 122, 127, 125, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lille", "4", "2", "1", "1", "4", "3", "7" ], "ids": [ 28372, 125, 123, 122, 122, 125, 124, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##uing", "##amp", "4", "2", "1", "1", "4", "3", "7" ], "ids": [ 144, 94213, 53692, 125, 123, 122, 122, 125, 124, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cannes", "4", "2", "1", "1", "4", "4", "7" ], "ids": [ 27615, 125, 123, 122, 122, 125, 125, 128 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bordeaux", "4", "1", "3", "0", "3", "2", "6" ], "ids": [ 25169, 125, 122, 124, 121, 124, 123, 127 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Marseille", "4", "1", "2", "1", "5", "4", "5" ], "ids": [ 25016, 125, 122, 123, 122, 126, 125, 126 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rennes", "4", "1", "1", "2", "5", "7", "4" ], "ids": [ 42288, 125, 122, 122, 123, 126, 128, 125 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Strasbourg", "4", "1", "0", "3", "2", "7", "3" ], "ids": [ 30300, 125, 122, 121, 124, 123, 128, 124 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Montpellier", "4", "0", "2", "2", "3", "5", "2" ], "ids": [ 38069, 125, 121, 123, 123, 124, 126, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Le", "Havre", "4", "0", "2", "2", "2", "4", "2" ], "ids": [ 10281, 59887, 125, 121, 123, 123, 123, 125, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Caen", "4", "0", "2", "2", "2", "6", "2" ], "ids": [ 51011, 125, 121, 123, 123, 123, 127, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nice", "4", "0", "1", "3", "3", "7", "1" ], "ids": [ 26918, 125, 121, 122, 124, 124, 128, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nantes", "4", "0", "1", "3", "2", "6", "1" ], "ids": [ 32134, 125, 121, 122, 124, 123, 127, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nancy", "4", "0", "1", "3", "2", "7", "1" ], "ids": [ 20073, 125, 121, 122, 124, 123, 128, 122 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "first", "division", "soccer" ], "ids": [ 11894, 10422, 13751, 41356 ], "entity": [ "B-MISC", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9 ] }, { "tokens": [ "matches", "on", "Wednesday", ":" ], "ids": [ 18258, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Paris", "SG", "1", "Nantes", "0" ], "ids": [ 10728, 34415, 122, 32134, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Lens", "3", "Montpellier", "2" ], "ids": [ 72008, 124, 38069, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Bastia", "0", "Lille", "0" ], "ids": [ 107497, 121, 28372, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Cannes", "0", "Monaco", "2" ], "ids": [ 27615, 121, 24661, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Rennes", "1", "Bordeaux", "1" ], "ids": [ 42288, 122, 25169, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Lyon", "2", "Nancy", "0" ], "ids": [ 17980, 123, 20073, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Nice", "1", "G", "##uing", "##amp", "2" ], "ids": [ 26918, 122, 144, 94213, 53692, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Metz", "3", "Strasbourg", "1" ], "ids": [ 32434, 124, 30300, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Le", "Havre", "1", "Caen", "1" ], "ids": [ 10281, 59887, 122, 51011, 122 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "Play", "##ed", "Tuesday", ":" ], "ids": [ 17712, 10336, 70245, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Auxerre", "0", "Marseille", "0" ], "ids": [ 86186, 121, 25016, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "CH", "##RI", "##ST", "##IE", "AND", "J", "##OH", "##NS", "##ON", "AS", "##K", "##ED", "TO", "J", "##O", "##IN", "O", "##W", "##EN", "##S", "'", "TR", "##IB", "##UT", "##E", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 39774, 46876, 32995, 71655, 52428, 147, 55859, 69196, 30118, 17421, 11733, 33809, 58573, 147, 11403, 27128, 152, 13034, 50655, 10731, 112, 80047, 72918, 65729, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Adrian", "Warner" ], "ids": [ 23928, 17853 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Organ", "##iser", "##s", "hope", "to", "pers", "##ua", "##de", "Britain", "'", "s", "former", "Olympic", "100", "metres", "champion", "Lin", "##ford", "Christie", "to", "join", "a", "\"", "Dream", "Team", "\"", "sprint", "relay", "in", "a", "special", "tribute", "to", "Jesse", "Owens", "at", "Friday", "'", "s", "Berlin", "grand", "prix", "." ], "ids": [ 72154, 25004, 10107, 50725, 10114, 108839, 11908, 10253, 16032, 112, 187, 11775, 17952, 10407, 16393, 17689, 35207, 13387, 34964, 10114, 23707, 169, 107, 17316, 12140, 107, 42707, 74973, 10106, 169, 14478, 51903, 10114, 27213, 58551, 10160, 30767, 112, 187, 11193, 13023, 18236, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Christie", ",", "who", "is", "retiring", "from", "international", "competition", "at", "the", "end", "of", "the", "season", ",", "was", "not", "due", "to", "compete", "in", "the", "German", "capital", "but", "Berlin", "promote", "##r", "Rudi", "Th", "##iel", "said", ":", "\"", "We", "are", "still", "hope", "##ful", "of", "getting", "him", "to", "come", ".", "\"" ], "ids": [ 34964, 117, 10479, 10124, 75933, 10188, 12533, 16622, 10160, 10105, 11572, 10108, 10105, 11226, 117, 10134, 10472, 10850, 10114, 33400, 10106, 10105, 12026, 12185, 10473, 11193, 32807, 10129, 74202, 51635, 19428, 12415, 131, 107, 12865, 10301, 12647, 50725, 14446, 10108, 34875, 10957, 10114, 10678, 119, 107 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Th", "##iel", "has", "managed", "to", "get", "most", "of", "the", "Olympic", "100", "metres", "champions", "since", "1948", "to", "attend", "the", "meeting", ",", "which", "is", "being", "held", "in", "the", "stadium", "where", "Owens", "won", "four", "gold", "medals", "60", "years", "ago", "at", "the", "Berlin", "Olympics", "." ], "ids": [ 51635, 19428, 10393, 22391, 10114, 15329, 10992, 10108, 10105, 17952, 10407, 16393, 27745, 11764, 11004, 10114, 34465, 10105, 19822, 117, 10319, 10124, 11223, 11991, 10106, 10105, 27915, 10940, 58551, 11367, 11598, 18128, 48512, 10709, 10855, 36390, 10160, 10105, 11193, 19185, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "B-MISC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 2, 9 ] }, { "tokens": [ "Canada", "'", "s", "Donovan", "Bailey", ",", "the", "Olympic", "100", "metres", "champion", "and", "world", "record", "holder", ",", "and", "Namibia", "##n", "Frankie", "Frederick", "##s", ",", "the", "silver", "medal", "##list", "at", "the", "recent", "Atlanta", "Games", ",", "have", "already", "agreed", "to", "run", "in", "the", "4", "##X", "##100", "metres", "team", "." ], "ids": [ 11635, 112, 187, 55072, 29761, 117, 10105, 17952, 10407, 16393, 17689, 10111, 11356, 12410, 48938, 117, 10111, 46670, 10115, 51059, 17132, 10107, 117, 10105, 23394, 16531, 21476, 10160, 10105, 19037, 19600, 14501, 117, 10529, 19034, 25577, 10114, 14095, 10106, 10105, 125, 12674, 49025, 16393, 11121, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Th", "##iel", "said", "on", "Wednesday", "that", "he", "had", "also", "asked", "Olympic", "200", "and", "400", "champion", "Michael", "Johnson", "to", "run", "as", "well", "as", "Christie", "." ], "ids": [ 51635, 19428, 12415, 10135, 57611, 10189, 10261, 10374, 10379, 22151, 17952, 10777, 10111, 11176, 17689, 10631, 13241, 10114, 14095, 10146, 11206, 10146, 34964, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "\"", "Most", "of", "the", "Olympic", "champions", "of", "the", "past", "are", "coming", "including", "Britain", "'", "s", "(", "1980", "champion", ")", "Allan", "Wells", "." ], "ids": [ 107, 14361, 10108, 10105, 17952, 27745, 10108, 10105, 17781, 10301, 23959, 11198, 16032, 112, 187, 113, 10538, 17689, 114, 18750, 25325, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Christie", "belongs", "to", "them", "." ], "ids": [ 34964, 61437, 10114, 11345, 119 ], "entity": [ "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9 ] }, { "tokens": [ "It", "would", "be", "great", "to", "have", "him", "here", "." ], "ids": [ 10377, 10894, 10347, 14772, 10114, 10529, 10957, 19353, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "is", "a", "good", "offer", ".", ".", ".", "." ], "ids": [ 107, 11723, 10124, 169, 15198, 24443, 119, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "My", "minimum", "would", "be", "that", "he", "just", "ran", "the", "relay", ",", "\"", "he", "said", "." ], "ids": [ 11590, 26503, 10894, 10347, 10189, 10261, 12820, 17044, 10105, 74973, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "36", "-", "year", "-", "old", "Brit", "##on", "is", "still", "considering", "the", "offer", "and", "is", "expected", "to", "anno", "##unce", "his", "decision", "later", "on", "Wednesday", "." ], "ids": [ 10117, 11055, 118, 10924, 118, 12898, 68447, 10263, 10124, 12647, 81243, 10105, 24443, 10111, 10124, 25973, 10114, 11671, 93050, 10226, 19231, 10873, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Owens", "'", "s", "widow", "Ruth", "is", "not", "well", "enough", "to", "attend", "but", "a", "message", "from", "her", "will", "be", "read", "out", "during", "the", "meeting", "and", "one", "of", "the", "sprint", "##er", "'", "s", "relatives", "is", "expected", "to", "attend", "." ], "ids": [ 58551, 112, 187, 71598, 23979, 10124, 10472, 11206, 21408, 10114, 34465, 10473, 169, 30514, 10188, 10485, 11337, 10347, 24944, 10950, 10939, 10105, 19822, 10111, 10464, 10108, 10105, 42707, 10165, 112, 187, 51893, 10124, 25973, 10114, 34465, 119 ], "entity": [ "B-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "relay", "race", ",", "which", "will", "include", "squad", "##s", "from", "Africa", ",", "the", "United", "States", "and", "Europe", "as", "well", "as", "the", "Owens", "'", "quart", "##et", ",", "will", "be", "held", "at", "the", "end", "of", "the", "meeting", "." ], "ids": [ 10117, 74973, 14025, 117, 10319, 11337, 12363, 30580, 10107, 10188, 12880, 117, 10105, 10609, 10859, 10111, 11767, 10146, 11206, 10146, 10105, 58551, 112, 49461, 10308, 117, 11337, 10347, 11991, 10160, 10105, 11572, 10108, 10105, 19822, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Organ", "##iser", "##s", "had", "hoped", "to", "include", "1984", "and", "1988", "champion", "Carl", "Lewis", "in", "the", "squad", "but", "he", "injured", "himself", "in", "Brussels", "last", "Friday", "." ], "ids": [ 72154, 25004, 10107, 10374, 84245, 10114, 12363, 10597, 10111, 10548, 17689, 12225, 13759, 10106, 10105, 30580, 10473, 10261, 36081, 14764, 10106, 41239, 12469, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "NE", "##W", "CA", "##P", "##TA", "##IN", "T", "##EN", "##D", "##UL", "##KA", "##R", "UP", "##ST", "##AG", "##ED", "BY", "120", "FR", "##OM", "JA", "##Y", "##AS", "##UR", "##I", "##Y", "##A", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 86607, 13034, 24707, 11127, 24951, 27128, 157, 50655, 11490, 100673, 67813, 11273, 53197, 32995, 109865, 33809, 66710, 12048, 64655, 37079, 53399, 14703, 38025, 98348, 11281, 14703, 10738, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sa", "##chin", "Ten", "##dul", "##kar", "marked", "his", "debut", "as", "Indian", "captain", "with", "a", "patient", "110", "on", "Wednesday", ",", "but", "was", "ups", "##tage", "##d", "by", "das", "##hing", "Sri", "Lanka", "##n", "open", "##er", "Sanat", "##h", "Jaya", "##sur", "##iya", "whose", "120", "st", "##eer", "##ed", "the", "world", "champions", "to", "a", "nine", "-", "wi", "##cket", "Singer", "Cup", "win", "." ], "ids": [ 12404, 43849, 16411, 42918, 15190, 26981, 10226, 13424, 10146, 12544, 28157, 10169, 169, 38607, 13057, 10135, 57611, 117, 10473, 10134, 107717, 42767, 10162, 10155, 10242, 30809, 16098, 20828, 10115, 14087, 10165, 89536, 10237, 44240, 66679, 14990, 16879, 12048, 28780, 23869, 10336, 10105, 11356, 27745, 10114, 169, 19964, 118, 23040, 28721, 29842, 11544, 14125, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Sri", "Lanka", ",", "playing", "in", "front", "of", "their", "home", "crowd", "for", "the", "first", "time", "since", "winning", "the", "World", "Cup", "last", "March", ",", "com", "##fort", "##ably", "passed", "India", "'", "s", "modest", "226", "-", "5", "from", "50", "over", "##s", "in", "44", ".", "2", "over", "##s", "." ], "ids": [ 16098, 20828, 117, 14879, 10106, 14589, 10108, 10455, 11816, 50059, 10142, 10105, 10422, 10635, 11764, 16542, 10105, 10315, 11544, 12469, 11144, 117, 10212, 23044, 38565, 20006, 11098, 112, 187, 106608, 23776, 118, 126, 10188, 10462, 10491, 10107, 10106, 11126, 119, 123, 10491, 10107, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "de", "##vas", "##tati", "##ng", "opening", "pair", "of", "Jaya", "##sur", "##iya", "and", "Rome", "##sh", "Ka", "##lu", "##wit", "##hara", "##na", "shared", "a", "fine", "first", "wi", "##cket", "stand", "of", "129", "to", "the", "del", "##ight", "of", "the", "25", ",", "000", "fans", "." ], "ids": [ 10117, 10104, 14139, 26119, 10376, 17975, 27643, 10108, 44240, 66679, 14990, 10111, 14592, 13264, 25444, 11435, 56082, 32169, 10219, 29054, 169, 13435, 10422, 23040, 28721, 14603, 10108, 18336, 10114, 10105, 10127, 27521, 10108, 10105, 10258, 117, 10259, 20950, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jaya", "##sur", "##iya", ",", "whose", "first", "50", "included", "three", "six", "##es", "and", "three", "four", "##s", ",", "went", "on", "to", "an", "un", "##beat", "##en", "120", "and", "the", "man", "-", "of", "-", "the", "-", "match", "award", "." ], "ids": [ 44240, 66679, 14990, 117, 16879, 10422, 10462, 12742, 11003, 12449, 10171, 10111, 11003, 11598, 10107, 117, 13446, 10135, 10114, 10151, 10119, 68939, 10136, 12048, 10111, 10105, 10817, 118, 10108, 118, 10105, 118, 12356, 17725, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ka", "##lu", "##wit", "##hara", "##na", ",", "slow", "in", "comparison", ",", "was", "bowl", "##ed", "by", "Ten", "##dul", "##kar", "for", "53", ",", "but", "Ara", "##vind", "##a", "de", "Silva", "with", "49", "not", "out", "helped", "see", "Sri", "Lanka", "home", "." ], "ids": [ 25444, 11435, 56082, 32169, 10219, 117, 41573, 10106, 56542, 117, 10134, 99380, 10336, 10155, 16411, 42918, 15190, 10142, 11756, 117, 10473, 54789, 48153, 10113, 10104, 17719, 10169, 11580, 10472, 10950, 20890, 12888, 16098, 20828, 11816, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "Earl", "##ier", ",", "Ten", "##dul", "##kar", "completed", "his", "ninth", "century", "in", "one", "-", "day", "cricket", ",", "taking", "138", "balls", "to", "do", "it", "before", "being", "run", "out", "." ], "ids": [ 18877, 11709, 117, 16411, 42918, 15190, 15782, 10226, 54905, 11943, 10106, 10464, 118, 11940, 32289, 117, 18084, 19462, 88301, 10114, 10149, 10271, 11360, 11223, 14095, 10950, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rest", "of", "the", "Indian", "batting", "was", "generally", "tied", "down", "by", "br", "##ill", "##iant", "field", "##ing", "and", "some", "fairly", "tight", "bowling", ",", "although", "ex", "-", "captain", "Mohamed", "Az", "##haru", "##ddin", "chip", "##ped", "in", "with", "58", ",", "adding", "129", "with", "Ten", "##dul", "##kar", "off", "28", "over", "##s", ",", "before", "being", "st", "##ump", "##ed", "." ], "ids": [ 10117, 17333, 10108, 10105, 12544, 86152, 10134, 18081, 42780, 12935, 10155, 33989, 19503, 24096, 13939, 10230, 10111, 11152, 76281, 85202, 97228, 117, 14779, 11419, 118, 28157, 31790, 11122, 65734, 51256, 64008, 16898, 10106, 10169, 11824, 117, 44841, 18336, 10169, 16411, 42918, 15190, 11898, 10348, 10491, 10107, 117, 11360, 11223, 28780, 67299, 10336, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "next", "match", "in", "the", "four", "-", "nation", "tournament", "is", "on", "Friday", "when", "Sri", "Lanka", "play", "Australia", "in", "a", "repeat", "of", "the", "World", "Cup", "final", "in", "Lahore", "where", "Sri", "Lanka", "won", "by", "seven", "wickets", "." ], "ids": [ 10117, 13451, 12356, 10106, 10105, 11598, 118, 22274, 17390, 10124, 10135, 30767, 10841, 16098, 20828, 12253, 11729, 10106, 169, 107832, 10108, 10105, 10315, 11544, 11070, 10106, 76624, 10940, 16098, 20828, 11367, 10155, 15767, 83839, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "SR", "##I", "LAN", "##KA", "BE", "##AT", "IN", "##DI", "##A", "BY", "9", "W", "##IC", "##K", "##ET", "##S", "IN", "ONE", "-", "DA", "##Y", "MA", "##TC", "##H", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 23032, 11281, 94057, 67813, 46291, 32071, 36351, 58730, 10738, 66710, 130, 160, 30889, 11733, 52338, 10731, 36351, 57929, 118, 47855, 14703, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sri", "Lanka", "beat", "India", "by", "nine", "wickets", "in", "the", "second", "match", "of", "the", "Singer", "World", "Series", "one", "-", "day", "(", "50", "over", "##s", ")", "cricket", "tournament", "on", "Monday", "." ], "ids": [ 16098, 20828, 27868, 11098, 10155, 19964, 83839, 10106, 10105, 11132, 12356, 10108, 10105, 29842, 10315, 13239, 10464, 118, 11940, 113, 10462, 10491, 10107, 114, 32289, 17390, 10135, 40714, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", ":", "India", "226", "-", "5", "in", "50", "over", "##s", ",", "Sri", "Lanka", "230", "-", "1", "in", "44", ".", "2", "over", "##s", "." ], "ids": [ 66875, 10107, 131, 11098, 23776, 118, 126, 10106, 10462, 10491, 10107, 117, 16098, 20828, 16888, 118, 122, 10106, 11126, 119, 123, 10491, 10107, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "IN", "##DI", "##A", "V", "SR", "##I", "LAN", "##KA", "SC", "##OR", "##EB", "##O", "##AR", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 36351, 58730, 10738, 159, 23032, 11281, 94057, 67813, 18137, 42622, 89922, 11403, 52188, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##board", "of", "the", "second", "Singer" ], "ids": [ 66875, 25690, 10108, 10105, 11132, 29842 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "World", "Series", "cricket", "match", "between", "India", "and", "Sri", "Lanka", "on" ], "ids": [ 10315, 13239, 32289, 12356, 10948, 11098, 10111, 16098, 20828, 10135 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 1, 9, 1, 5, 9 ] }, { "tokens": [ "Wednesday", ":" ], "ids": [ 57611, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "India" ], "ids": [ 11098 ], "entity": [ "B-LOC" ], "entity_ids": [ 1 ] }, { "tokens": [ "A", ".", "Jade", "##ja", "run", "out", "0" ], "ids": [ 138, 119, 60913, 10320, 14095, 10950, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "S", ".", "Ten", "##dul", "##kar", "run", "out", "110" ], "ids": [ 156, 119, 16411, 42918, 15190, 14095, 10950, 13057 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "S", ".", "Gang", "##ul", "##y", "c", "de", "Silva", "b", "Dharma", "##sena", "16" ], "ids": [ 156, 119, 31192, 10604, 10157, 171, 10104, 17719, 170, 80344, 62191, 10250 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 9 ] }, { "tokens": [ "M", ".", "Az", "##haru", "##ddin", "st", "Ka", "##lu", "##wit", "##hara", "##na", "b", "Jaya", "##sur", "##iya", "58" ], "ids": [ 150, 119, 11122, 65734, 51256, 28780, 25444, 11435, 56082, 32169, 10219, 170, 44240, 66679, 14990, 11824 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "V", ".", "Ka", "##mb", "##li", "run", "out", "18" ], "ids": [ 159, 119, 25444, 27012, 10390, 14095, 10950, 10218 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "R", ".", "Dr", "##avi", "##d", "not", "out", "7" ], "ids": [ 155, 119, 11612, 30266, 10162, 10472, 10950, 128 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "J", ".", "Sri", "##nat", "##h", "not", "out", "1" ], "ids": [ 147, 119, 16098, 20909, 10237, 10472, 10950, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "b", "-", "1", "lb", "-", "3", "w", "-", "9", "n", "##b", "-", "3", ")", "16" ], "ids": [ 50821, 10107, 113, 170, 118, 122, 23989, 118, 124, 191, 118, 130, 182, 10457, 118, 124, 114, 10250 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "5", "wickets", ",", "50", "over", "##s", ")", "226" ], "ids": [ 25220, 113, 126, 83839, 117, 10462, 10491, 10107, 114, 23776 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "4", "2", "-", "57", "3", "-", "186", "4", "-", "217", "5", "-", "217", "." ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 125, 123, 118, 11817, 124, 118, 23298, 125, 118, 21651, 126, 118, 21651, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Did", "not", "bat", ":", "A", ".", "Ku", "##mble", ",", "N", ".", "Mon", "##gia", ",", "V", ".", "Pr", "##asa", "##d", ",", "A", ".", "Kapoor", "." ], "ids": [ 50133, 10472, 11519, 131, 138, 119, 49869, 48272, 117, 151, 119, 39473, 15414, 117, 159, 119, 106482, 23031, 10162, 117, 138, 119, 76026, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Bowling", ":", "Vas", "##s", "9", "-", "2", "-", "35", "-", "0", ",", "P", "##ush", "##pak", "##uma", "##ra", "6", "-", "0", "-", "23", "-", "0", ",", "Dharma", "##sena" ], "ids": [ 100017, 131, 98242, 10107, 130, 118, 123, 118, 10803, 118, 121, 117, 153, 37026, 28686, 16746, 10288, 127, 118, 121, 118, 10328, 118, 121, 117, 80344, 62191 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "10", "-", "0", "-", "59", "-", "1", "Mur", "##ali", "##tha", "##ran", "10", "-", "0", "-", "42", "-", "0", ",", "Jaya", "##sur", "##iya", "10", "-", "1", "-", "39", "-", "1", ",", "de", "Silva" ], "ids": [ 10150, 118, 121, 118, 11867, 118, 122, 103192, 13133, 25388, 12111, 10150, 118, 121, 118, 11276, 118, 121, 117, 44240, 66679, 14990, 10150, 118, 122, 118, 11303, 118, 122, 117, 10104, 17719 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "5", "-", "0", "-", "24", "-", "0", "." ], "ids": [ 126, 118, 121, 118, 10233, 118, 121, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sri", "Lanka" ], "ids": [ 16098, 20828 ], "entity": [ "B-LOC", "I-LOC" ], "entity_ids": [ 1, 5 ] }, { "tokens": [ "S", ".", "Jaya", "##sur", "##iya", "not", "out", "120" ], "ids": [ 156, 119, 44240, 66679, 14990, 10472, 10950, 12048 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "R", ".", "Ka", "##lu", "##wit", "##hara", "##na", "b", "Ten", "##dul", "##kar", "53" ], "ids": [ 155, 119, 25444, 11435, 56082, 32169, 10219, 170, 16411, 42918, 15190, 11756 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "A", ".", "de", "Silva", "not", "out", "49" ], "ids": [ 138, 119, 10104, 17719, 10472, 10950, 11580 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "lb", "-", "3", "n", "##b", "-", "3", "w", "-", "2", ")", "8" ], "ids": [ 50821, 10107, 113, 23989, 118, 124, 182, 10457, 118, 124, 191, 118, 123, 114, 129 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "one", "wi", "##cket", "-", "44", ".", "2", "over", "##s", ")", "230" ], "ids": [ 25220, 113, 10142, 10464, 23040, 28721, 118, 11126, 119, 123, 10491, 10107, 114, 16888 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wi", "##cket", ":", "1", "-", "129" ], "ids": [ 15750, 10108, 23040, 28721, 131, 122, 118, 18336 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Did", "not", "bat", ":", "Ar", "##juna", "Rana", "##tung", "##a", ",", "Asa", "##nka", "Guru", "##sin", "##ha", ",", "Has", "##han" ], "ids": [ 50133, 10472, 11519, 131, 18484, 93748, 60970, 23091, 10113, 117, 96536, 24854, 38674, 15371, 10921, 117, 45896, 11781 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8 ] }, { "tokens": [ "Till", "##eker", "##at", "##ne", ",", "Ros", "##han", "Maha", "##nama", ",", "Kumar", "##a", "Dharma", "##sena", ",", "Cham", "##inda", "Va", "##as", "," ], "ids": [ 32259, 89708, 10526, 10238, 117, 109292, 11781, 77085, 57905, 117, 38686, 10113, 80344, 62191, 117, 96727, 30291, 14723, 10403, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Mu", "##thi", "##ah", "Mur", "##ali", "##tha", "##ran", ",", "Ravi", "##ndra", "P", "##ush", "##pak", "##uma", "##ra" ], "ids": [ 49056, 53504, 12257, 103192, 13133, 25388, 12111, 117, 93511, 50201, 153, 37026, 28686, 16746, 10288 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8 ] }, { "tokens": [ "Bowling", ":", "Ku", "##mble", "10", "-", "1", "-", "40", "-", "0", ",", "Pr", "##asa", "##d", "6", "-", "0", "-", "47", "-", "0", ",", "Sri", "##nat", "##h" ], "ids": [ 100017, 131, 49869, 48272, 10150, 118, 122, 118, 10533, 118, 121, 117, 106482, 23031, 10162, 127, 118, 121, 118, 11413, 118, 121, 117, 16098, 20909, 10237 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "8", "-", "0", "-", "33", "-", "0", ",", "Ten", "##dul", "##kar", "6", "-", "0", "-", "29", "-", "1", ",", "Kapoor", "10", "-", "2", "-", "51", "-", "0", ",", "Jade", "##ja" ], "ids": [ 129, 118, 121, 118, 11000, 118, 121, 117, 16411, 42918, 15190, 127, 118, 121, 118, 10386, 118, 122, 117, 76026, 10150, 118, 123, 118, 11524, 118, 121, 117, 60913, 10320 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "2", ".", "2", "-", "0", "-", "13", "-", "0", ",", "Gang", "##ul", "##y", "2", "-", "0", "-", "14", "-", "0" ], "ids": [ 123, 119, 123, 118, 121, 118, 10249, 118, 121, 117, 31192, 10604, 10157, 123, 118, 121, 118, 10247, 118, 121 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", ":", "Sri", "Lanka", "won", "by", "9", "wickets" ], "ids": [ 32070, 16203, 131, 16098, 20828, 11367, 10155, 130, 83839 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Man", "-", "of", "-", "the", "-", "Match", ":", "Sanat", "##h", "Jaya", "##sur", "##iya" ], "ids": [ 11343, 118, 10108, 118, 10105, 118, 26151, 131, 89536, 10237, 44240, 66679, 14990 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "IN", "##DI", "##A", "W", "##IN", "TO", "##SS", "AND", "BA", "##T", "AG", "##A", "##IN", "##ST", "SR", "##I", "LAN", "##KA", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 36351, 58730, 10738, 160, 27128, 58573, 49248, 52428, 39999, 11090, 17935, 10738, 27128, 32995, 23032, 11281, 94057, 67813, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "won", "the", "tos", "##s", "and", "elected", "to", "bat", "against", "Sri", "Lanka", "in", "the", "second", "day", "-", "night", "limited", "over", "##s", "cricket", "match", "of", "the", "Singer", "World", "Series", "tournament", "on", "Wednesday", "." ], "ids": [ 11098, 11367, 10105, 84686, 10107, 10111, 14254, 10114, 11519, 11327, 16098, 20828, 10106, 10105, 11132, 11940, 118, 16903, 19264, 10491, 10107, 32289, 12356, 10108, 10105, 29842, 10315, 13239, 17390, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Teams", ":" ], "ids": [ 25754, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "India", "-", "Sa", "##chin", "Ten", "##dul", "##kar", "(", "captain", ")", ",", "Ani", "##l", "Ku", "##mble", ",", "A", "##jay", "Jade", "##ja", ",", "So", "##ura", "##v", "Gang", "##ul", "##y", ",", "Mohamed", "Az", "##haru", "##ddin", ",", "Vi", "##nod", "Ka", "##mb", "##li", ",", "Ra", "##hul", "Dr", "##avi", "##d", ",", "Na", "##yan", "Mon", "##gia", ",", "Java", "##gal", "Sri", "##nat", "##h", ",", "Ve", "##nka", "##tes", "##h", "Pr", "##asa", "##d", ",", "Ash", "##ish", "Kapoor", "." ], "ids": [ 11098, 118, 12404, 43849, 16411, 42918, 15190, 113, 28157, 114, 117, 90796, 10161, 49869, 48272, 117, 138, 78761, 60913, 10320, 117, 12882, 11465, 10477, 31192, 10604, 10157, 117, 31790, 11122, 65734, 51256, 117, 31826, 42826, 25444, 27012, 10390, 117, 38571, 45624, 11612, 30266, 10162, 117, 10685, 15976, 39473, 15414, 117, 18507, 17026, 16098, 20909, 10237, 117, 19561, 24854, 11197, 10237, 106482, 23031, 10162, 117, 45707, 15529, 76026, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Sri", "Lanka", "-", "Ar", "##juna", "Rana", "##tung", "##a", "(", "captain", ")", ",", "Sanat", "##h", "Jaya", "##sur", "##iya", ",", "Rome", "##sh", "Ka", "##lu", "##wit", "##hara", "##na", ",", "Asa", "##nka", "Guru", "##sin", "##ha", ",", "Ara", "##vind", "##a", "de", "Silva", ",", "Has", "##han", "Till", "##eker", "##at", "##ne", ",", "Ros", "##han", "Maha", "##nama", ",", "Kumar", "##a", "Dharma", "##sena", ",", "Cham", "##inda", "Va", "##as", ",", "Mu", "##thi", "##ah", "Mur", "##ali", "##tha", "##ran", ",", "Ravi", "##ndra", "P", "##ush", "##pak", "##uma", "##ra", "." ], "ids": [ 16098, 20828, 118, 18484, 93748, 60970, 23091, 10113, 113, 28157, 114, 117, 89536, 10237, 44240, 66679, 14990, 117, 14592, 13264, 25444, 11435, 56082, 32169, 10219, 117, 96536, 24854, 38674, 15371, 10921, 117, 54789, 48153, 10113, 10104, 17719, 117, 45896, 11781, 32259, 89708, 10526, 10238, 117, 109292, 11781, 77085, 57905, 117, 38686, 10113, 80344, 62191, 117, 96727, 30291, 14723, 10403, 117, 49056, 53504, 12257, 103192, 13133, 25388, 12111, 117, 93511, 50201, 153, 37026, 28686, 16746, 10288, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 5, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "AN", "##GO", "##LA", "-", "AU", "##G", "28", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 50972, 83821, 44376, 118, 29088, 11447, 10348, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##U", "##AN", "##DA", "1996", "-", "08", "-", "28" ], "ids": [ 149, 12022, 41275, 36382, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "the", "leading", "stories", "in", "the", "Angola", "##n", "press", "on", "Wednesday", "." ], "ids": [ 13252, 10301, 10105, 16018, 21158, 10106, 10105, 21149, 10115, 21040, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##OR", "##NA", "##L", "DE", "AN", "##GO", "##LA" ], "ids": [ 147, 42622, 36742, 11369, 25067, 50972, 83821, 44376 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Princeton", "Lyman", ",", "the", "U", ".", "S", ".", "Under", "-", "Secretary", "of", "State", "for", "International", "Organisation", "##s", ",", "will", "on", "Wednesday", "continue", "his", "work", "in", "Angola", "visiting", "Bai", "##lund", "##o", ",", "where", "he", "should", "be", "received", "by", "Jonas", "Sa", "##vim", "##bi", ",", "leader", "of", "Unit", "##a", "." ], "ids": [ 118, 14511, 93672, 117, 10105, 158, 119, 156, 119, 12594, 118, 19382, 10108, 11104, 10142, 10771, 22223, 10107, 117, 11337, 10135, 57611, 17734, 10226, 11424, 10106, 21149, 48780, 85172, 33782, 10133, 117, 10940, 10261, 14819, 10347, 12296, 10155, 22653, 12404, 54009, 11645, 117, 15014, 10108, 19919, 10113, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "On", "Tuesday", "Lyman", "participated", "in", "a", "meeting", "of", "a", "joint", "-", "commission", "where", "he", "considered", "that", "the", "Angola", "##n", "politicians", "should", "advance", "faster", "and", "find", "a", "way", "to", "co", "##oper", "##ate", "." ], "ids": [ 10576, 70245, 93672, 24146, 10106, 169, 19822, 10108, 169, 25680, 118, 26568, 10940, 10261, 14289, 10189, 10105, 21149, 10115, 75284, 14819, 34809, 66109, 10111, 17860, 169, 13170, 10114, 11170, 56361, 12436, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "his", "opinion", "the", "quarter", "##ing", "of", "Unit", "##a", "forces", "must", "be", "concluded", "in", "all", "the", "Angola", "##n", "territory", "and", "the", "troops", "must", "be", "selected", "and", "integrated", "in", "the", "armed", "forces", ",", "the", "government", "forces", "must", "be", "concentrated", "in", "the", "principal", "units", "and", "the", "free", "circulation", "of", "people", "and", "goods", "must", "be", "reality", "in", "all", "the", "country", "." ], "ids": [ 10167, 10226, 32282, 10105, 28330, 10230, 10108, 19919, 10113, 13729, 14982, 10347, 37074, 10106, 10435, 10105, 21149, 10115, 24399, 10111, 10105, 20836, 14982, 10347, 19546, 10111, 47833, 10106, 10105, 34174, 13729, 117, 10105, 12047, 13729, 14982, 10347, 80018, 10106, 10105, 11652, 17163, 10111, 10105, 13961, 40774, 10108, 11426, 10111, 36931, 14982, 10347, 26926, 10106, 10435, 10105, 12723, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", ".", "AF", "##RI", "##CA", "##N", "TR", "##UT", "##H", "B", "##OD", "##Y", "TO", "SU", "##MM", "##ON", "AP", "##AR", "##TH", "##E", "##ID", "P", "##OL", "##IC", "##E", "." ], "ids": [ 156, 119, 55640, 46876, 46900, 11537, 80047, 65729, 12396, 139, 77836, 14703, 58573, 86643, 93252, 30118, 30909, 52188, 109166, 11259, 28895, 153, 39272, 30889, 11259, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##P", "##E", "TO", "##WN", "1996", "-", "08", "-", "28" ], "ids": [ 24707, 11127, 11259, 58573, 105844, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Africa", "'", "s", "Truth", "and", "Rec", "##on", "##ciliation", "Commission", "said", "on", "Wednesday", "it", "would", "sub", "##po", "##ena", "persons", "accused", "of", "human", "rights", "violation", "##s", "to", "appear", "before", "it", "." ], "ids": [ 11056, 12880, 112, 187, 31925, 10111, 97200, 10263, 98956, 14941, 12415, 10135, 57611, 10271, 10894, 13987, 13520, 13032, 34759, 37303, 10108, 14179, 16691, 88993, 10107, 10114, 22641, 11360, 10271, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "can", "sub", "##po", "##ena", "anyone", "we", "want", "to", ",", "even", "the", "president", "of", "the", "country", ",", "\"", "spoke", "##sman", "John", "Allen", "told", "Reuters", ".", "\"" ], "ids": [ 107, 12865, 10944, 13987, 13520, 13032, 51747, 11951, 21528, 10114, 117, 13246, 10105, 12931, 10108, 10105, 12723, 117, 107, 50005, 24305, 10421, 15101, 21937, 46617, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 3, 9, 9 ] }, { "tokens": [ "Sub", "##po", "##enas", "are", "due", "to", "be", "served", "on", "a", "number", "of", "people", "this", "week", ".", "\"" ], "ids": [ 24358, 13520, 48123, 10301, 10850, 10114, 10347, 12325, 10135, 169, 11487, 10108, 11426, 10531, 16118, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Media", "reports", "have", "sp", "##ecu", "##lated", "that", "the", "commission", ",", "which", "is", "trying", "to", "he", "##al", "the", "wound", "##s", "of", "apartheid", "by", "confronti", "##ng", "the", "past", ",", "could", "sub", "##po", "##ena", "apartheid", "-", "era", "President", "P", ".", "W", ".", "Both", "##a", "and", "former", "police", "generals", "Bas", "##ie", "Sm", "##it", "and", "Johan", "Van", "Der", "Mer", "##we", "." ], "ids": [ 13341, 26610, 10529, 32650, 97038, 50476, 10189, 10105, 26568, 117, 10319, 10124, 32862, 10114, 10261, 10415, 10105, 109205, 10107, 10108, 84330, 10155, 49538, 10376, 10105, 17781, 117, 12174, 13987, 13520, 13032, 84330, 118, 10411, 12811, 153, 119, 160, 119, 20973, 10113, 10111, 11775, 15034, 64739, 21237, 10400, 41922, 10486, 10111, 15706, 11474, 10445, 10734, 12577, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "In", "sub", "##mission", "##s", "last", "week", "to", "the", "commission", "National", "Party", "leader", "and", "former", "president", "F", ".", "W", ".", "De", "K", "##ler", "##k", "said", "he", "had", "received", "no", "co", "-", "operation", "from", "Both", "##a", "in", "com", "##pili", "##ng", "his", "party", "'", "s", "report", "." ], "ids": [ 10167, 13987, 27551, 10107, 12469, 16118, 10114, 10105, 26568, 10655, 12529, 15014, 10111, 11775, 12931, 143, 119, 160, 119, 10190, 148, 10815, 10174, 12415, 10261, 10374, 12296, 10192, 11170, 118, 20080, 10188, 20973, 10113, 10106, 10212, 85283, 10376, 10226, 14039, 112, 187, 17553, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Since", "it", "began", "work", "in", "April", "the", "commission", "has", "been", "hearing", "harr", "##owi", "##ng", "tales", "from", "the", "victims", "of", "apartheid", "-", "era", "abuse", "##s", ",", "by", "both", "the", "white", "minority", "regime", "and", "its", "opponents", "." ], "ids": [ 15591, 10271, 11941, 11424, 10106, 10780, 10105, 26568, 10393, 10590, 51191, 46934, 22578, 10376, 24464, 10188, 10105, 41205, 10108, 84330, 118, 10411, 51401, 10107, 117, 10155, 11408, 10105, 15263, 54147, 24807, 10111, 10474, 63568, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "also", "wants", "to", "hear", "from", "those", "who", "committed", "the", "abuse", "##s", ",", "to", "whom", "it", "can", "offer", "am", "##nes", "##ty", "in", "return", "for", "fra", "##nk", "##ness", "." ], "ids": [ 10377, 10379, 45769, 10114, 62064, 10188, 12676, 10479, 38184, 10105, 51401, 10107, 117, 10114, 18104, 10271, 10944, 24443, 10392, 11496, 11195, 10106, 15079, 10142, 10628, 17761, 14010, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hope", "##s", "that", "reform", "##ed", "per", "##pet", "##rators", "would", "come", "forward", "vol", "##unta", "##rily", "have", "fa", "##ded", "but", "the", "commission", "has", "the", "legal", "power", "to", "force", "them", "to", "appear", "." ], "ids": [ 22091, 10107, 10189, 34800, 10336, 10178, 19094, 94721, 10894, 10678, 23307, 12714, 27682, 103866, 10529, 12211, 21597, 10473, 10105, 26568, 10393, 10105, 17139, 13183, 10114, 15031, 11345, 10114, 22641, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Allen", "declined", "to", "give", "say", "who", "would", "be", "sub", "##po", "##ena", "##ed", "." ], "ids": [ 15101, 44948, 10114, 18090, 23763, 10479, 10894, 10347, 13987, 13520, 13032, 10336, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "At", "the", "moment", "we", "have", "a", "preliminary", "list", "of", "less", "than", "10", "people", ",", "but", "this", "is", "just", "the", "beginning", ",", "\"", "he", "said", "." ], "ids": [ 107, 11699, 10105, 14316, 11951, 10529, 169, 68097, 13416, 10108, 15306, 11084, 10150, 11426, 117, 10473, 10531, 10124, 12820, 10105, 17967, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "commission", "was", "set", "up", "last", "year", "to", "probe", "30", "years", "of", "human", "-", "rights", "violation", "##s", "during", "the", "apartheid", "era", "." ], "ids": [ 10117, 26568, 10134, 11847, 10741, 12469, 10924, 10114, 110239, 10244, 10855, 10108, 14179, 118, 16691, 88993, 10107, 10939, 10105, 84330, 10411, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "chair", "##ed", "by", "Nobel", "Peace", "winner", ",", "retired", "Archbishop", "Desmond", "Tu", "##tu", "." ], "ids": [ 10377, 10124, 40006, 10336, 10155, 16280, 20705, 20826, 117, 18675, 49823, 54033, 20108, 10991, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Allen", "said", "the", "commission", "could", "anno", "##unce", "the", "names", "of", "sub", "##po", "##ena", "##ed", "persons", "on", "Monday", "next", "week", "." ], "ids": [ 15101, 12415, 10105, 26568, 12174, 11671, 93050, 10105, 17978, 10108, 13987, 13520, 13032, 10336, 34759, 10135, 40714, 13451, 16118, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TU", "##R", "##KI", "##SH", "AI", "##R", "##P", "##LA", "##NE", "LAN", "##DS", "IN", "SO", "##F", "##IA", "ON", "B", "##OM", "##B", "T", "##H", "##RE", "##AT", "." ], "ids": [ 94747, 11273, 59879, 64091, 62405, 11273, 11127, 44376, 93280, 94057, 33953, 36351, 71020, 11565, 35976, 49339, 139, 37079, 11274, 157, 12396, 66014, 32071, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##F", "##IA", "1996", "-", "08", "-", "28" ], "ids": [ 71020, 11565, 35976, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Turkish", "airline", "##r", "on", "flight", "from", "Istanbul", "to", "Vienna", "on", "Wednesday", "landed", "in", "emergency", "at", "Sofia", "airport", "after", "receiving", "a", "bomb", "threat", ",", "said", "an", "airport", "official", "." ], "ids": [ 138, 22814, 67878, 10129, 10135, 23578, 10188, 25218, 10114, 20590, 10135, 57611, 58961, 10106, 44461, 10160, 21416, 28460, 10662, 31391, 169, 41654, 41256, 117, 12415, 10151, 28460, 14731, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "plane", "landed", "at", "Sofia", "airport", "at", "1503", "(", "1203", "GMT", ")", "after", "receiving", "a", "signal", "that", "there", "is", "an", "ex", "##plosive", "on", "board", ",", "\"", "the", "official", ",", "who", "declined", "to", "be", "named", "told", "Reuters", "." ], "ids": [ 107, 10117, 35007, 58961, 10160, 21416, 28460, 10160, 50871, 113, 108608, 20362, 114, 10662, 31391, 169, 25495, 10189, 11155, 10124, 10151, 11419, 83655, 10135, 17936, 117, 107, 10105, 14731, 117, 10479, 44948, 10114, 10347, 12038, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "The", "plane", ",", "surrounded", "by", "11", "fire", "-", "engines", ",", "is", "being", "check", "##ed", "for", "ex", "##plosive", "##s", "at", "the", "moment", "." ], "ids": [ 10117, 35007, 117, 45785, 10155, 10193, 13559, 118, 34073, 117, 10124, 11223, 43662, 10336, 10142, 11419, 83655, 10107, 10160, 10105, 14316, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nothing", "has", "been", "found", "so", "far", ",", "added", "the", "official", "." ], "ids": [ 31507, 10393, 10590, 11823, 10380, 13301, 117, 16288, 10105, 14731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "March", "a", "Turkish", "C", "##y", "##pri", "##ot", "airline", "##r", "hija", "##cked", "while", "on", "a", "flight", "from", "northern", "Cyprus", "to", "Istanbul", "landed", "in", "Sofia", "airport", "to", "ref", "##uel", "before", "landing", "in", "Munich", ",", "where", "the", "hija", "##cker", "was", "arrested", "." ], "ids": [ 10167, 11144, 169, 22814, 140, 10157, 101319, 11290, 67878, 10129, 26429, 72333, 11371, 10135, 169, 23578, 10188, 17335, 45639, 10114, 25218, 58961, 10106, 21416, 28460, 10114, 48056, 27043, 11360, 37798, 10106, 27349, 117, 10940, 10105, 26429, 19153, 10134, 29479, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arch", "Alberta", "well", "tests", "1", ",", "100", "b", "##bl", "/", "day", "." ], "ids": [ 54770, 25488, 11206, 34926, 122, 117, 10407, 170, 31766, 120, 11940, 119 ], "entity": [ "B-ORG", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FOR", "##T", "W", "##OR", "##TH", ",", "Texas", "1996", "-", "08", "-", "28" ], "ids": [ 109544, 11090, 160, 42622, 109166, 117, 12466, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arch", "Petroleum", "Inc", "said", "Wednesday", "an", "ex", "##plo", "##rator", "##y", "well", "in", "Alberta", "'", "s", "Mori", "##n", "##ville", "area", "tested", "in", "excess", "of", "1", ",", "100", "barrel", "##s", "daily", "and", "will", "begin", "production", "immediately", "." ], "ids": [ 54770, 89589, 13604, 12415, 57611, 10151, 11419, 46128, 38711, 10157, 11206, 10106, 25488, 112, 187, 62077, 10115, 12043, 11168, 65984, 10106, 93317, 10108, 122, 117, 10407, 93397, 10107, 27636, 10111, 11337, 16135, 12116, 24029, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "said", "the", "90", "percent", "owned", "Tra", "##x", "et", "al", "Mori", "##n", "##ville", "10", "-", "23", "log", "##ged", "28", "feet", "of", "product", "##ive", "Led", "##uc", "Reef", "at", "5", ",", "350", "feet", "." ], "ids": [ 10117, 12100, 12415, 10105, 10919, 22362, 17012, 21469, 10686, 10131, 10164, 62077, 10115, 12043, 10150, 118, 10328, 49316, 18832, 10348, 17296, 10108, 21535, 11942, 47922, 43805, 92834, 10160, 126, 117, 14992, 17296, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reserve", "estimates", "from", "this", "well", "are", "at", "250", ",", "000", "gross", "barrel", "##s", "of", "oil", "." ], "ids": [ 23120, 45870, 10188, 10531, 11206, 10301, 10160, 12214, 117, 10259, 92746, 93397, 10107, 10108, 21073, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Tra", "##x", "well", "is", "one", "of", "the", "pro", "##spects", "developed", "by", "Arch", "through", "its", "early", "1996", "purchase", "of", "Tra", "##x", "Petroleum", "##s", "Ltd", ",", "the", "company", "said", "." ], "ids": [ 10117, 21469, 10686, 11206, 10124, 10464, 10108, 10105, 11284, 105335, 14628, 10155, 54770, 11222, 10474, 11732, 10389, 37891, 10108, 21469, 10686, 89589, 10107, 15129, 117, 10105, 12100, 12415, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "another", ",", "the", "Comet", "##ra", "et", "al", "Mori", "##n", "##ville", "11", "-", "13", ",", "has", "log", "##ged", "128", "feet", "of", "product", "##ive", "Led", "##uc", "Reef", "at", "5", ",", "400", "feet", "and", "is", "flowing", "water", "free", "at", "the", "rate", "of", "590", "barrel", "##s", "of", "oil", "per", "day", "on", "a", "15", "/", "64", "##ths", "-", "inch", "cho", "##ke", "." ], "ids": [ 10377, 12415, 12864, 117, 10105, 89943, 10288, 10131, 10164, 62077, 10115, 12043, 10193, 118, 10249, 117, 10393, 49316, 18832, 16196, 17296, 10108, 21535, 11942, 47922, 43805, 92834, 10160, 126, 117, 11176, 17296, 10111, 10124, 109769, 12286, 13961, 10160, 10105, 18344, 10108, 36143, 93397, 10107, 10108, 21073, 10178, 11940, 10135, 169, 10208, 120, 11295, 91893, 118, 34397, 11257, 10550, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arch", "owns", "a", "16", "percent", "working", "interest", "in", "this", "well", "with", "most", "of", "the", "rest", "held", "by", "the", "privately", "owned", "operator", "." ], "ids": [ 54770, 76282, 169, 10250, 22362, 14616, 17644, 10106, 10531, 11206, 10169, 10992, 10108, 10105, 17333, 11991, 10155, 10105, 81411, 17012, 36935, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arch", "said", "full", "production", "has", "begun", "and", "initial", "estimates", "of", "gross", "reserves", "att", "##rib", "##uta", "##ble", "to", "this", "well", "range", "up", "to", "one", "million", "barrel", "##s", "of", "oil", "." ], "ids": [ 54770, 12415, 13375, 12116, 10393, 49510, 10111, 21713, 45870, 10108, 92746, 60405, 10788, 47116, 14118, 11203, 10114, 10531, 11206, 15601, 10741, 10114, 10464, 12473, 93397, 10107, 10108, 21073, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "third", "well", "dr", "##ille", "##d", "in", "this", "area", ",", "the", "Tra", "##x", "et", "al", "Mori", "##n", "##ville", "2", "-", "25", ",", "encountered", "the", "Led", "##uc", "Reef", "but", "tested", "wet", "." ], "ids": [ 138, 12628, 11206, 17094, 14420, 10162, 10106, 10531, 11168, 117, 10105, 21469, 10686, 10131, 10164, 62077, 10115, 12043, 123, 118, 10258, 117, 80975, 10105, 47922, 43805, 92834, 10473, 65984, 41115, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "At", "the", "company", "'", "s", "Nord", "##egg", "pro", "##spect", ",", "the", "Apache", "et", "al", "Saunders", "14", "-", "28", ",", "has", "reached", "total", "depth", "in", "the", "Led", "##uc", "Reef", "at", "approximately", "3", ",", "800", "feet", "and", "has", "been", "abandoned", ",", "Arch", "said", "." ], "ids": [ 11699, 10105, 12100, 112, 187, 12004, 91600, 11284, 77229, 117, 10105, 44488, 10131, 10164, 49046, 10247, 118, 10348, 117, 10393, 17087, 11339, 41098, 10106, 10105, 47922, 43805, 92834, 10160, 17384, 124, 117, 11900, 17296, 10111, 10393, 10590, 32296, 117, 54770, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "It", "said", "this", "acre", "##age", "earning", "well", "brought", "an", "interest", "in", "an", "additional", "5", ",", "120", "acres", ",", "building", "the", "company", "'", "s", "gross", "land", "position", "in", "this", "area", "to", "8", ",", "320", "acres", "." ], "ids": [ 10377, 12415, 10531, 54290, 12276, 56981, 11206, 17327, 10151, 17644, 10106, 10151, 18568, 126, 117, 12048, 26043, 117, 12585, 10105, 12100, 112, 187, 92746, 11773, 12956, 10106, 10531, 11168, 10114, 129, 117, 18920, 26043, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "the", "Butte", "pro", "##spect", ",", "the", "Ga", "##rri", "##ngton", "4", "-", "8", "has", "reached", "total", "depth", "of", "11", ",", "500", "and", "has", "log", "##ged", "278", "feet", "of", "Led", "##uc", "Reef", "." ], "ids": [ 11699, 10105, 105527, 11284, 77229, 117, 10105, 69699, 24874, 86098, 125, 118, 129, 10393, 17087, 11339, 41098, 10108, 10193, 117, 10757, 10111, 10393, 49316, 18832, 29417, 17296, 10108, 47922, 43805, 92834, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Test", "##ing", "has", "begun", "and", "results", "will", "be", "announced", "within", "the", "next", "several", "days", ",", "Arch", "said", "." ], "ids": [ 22495, 10230, 10393, 49510, 10111, 17466, 11337, 10347, 13854, 12381, 10105, 13451, 11736, 13990, 117, 54770, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "Inc", "##lu", "##ding", "the", "costs", "of", "the", "two", "abandoned", "well", "##s", ",", "the", "company", "said", ",", "these", "first", "pro", "##spects", "have", "added", "to", "reserves", "at", "a", "finding", "cost", "of", "about", "U", ".", "S", ".", "$", "2", "per", "barrel", "of", "oil", "equivalent", "." ], "ids": [ 13604, 11435, 13971, 10105, 34495, 10108, 10105, 10551, 32296, 11206, 10107, 117, 10105, 12100, 12415, 117, 11762, 10422, 11284, 105335, 10529, 16288, 10114, 60405, 10160, 169, 43977, 18849, 10108, 10978, 158, 119, 156, 119, 109, 123, 10178, 93397, 10108, 21073, 30647, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Jim", "Br", "##umm", "212", "-", "859", "-", "1710", "." ], "ids": [ 118, 118, 14178, 38508, 87951, 22023, 118, 80786, 118, 33397, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "judge", "orders", "Bio", "##gen", ",", "Be", "##rle", "##x", "officials", "de", "##posed", "." ], "ids": [ 158, 119, 156, 119, 31624, 31303, 30429, 11280, 117, 14321, 43539, 10686, 27730, 10104, 76996, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 3, 7, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Leslie", "G", "##evi", "##rt", "##z" ], "ids": [ 25944, 144, 44082, 10976, 10305 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 139, 21793, 60493, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "order", "to", "help", "him", "decide", "whether", "he", "should", "hear", "the", "case", ",", "a", "U", ".", "S", ".", "District", "Court", "judge", "Wednesday", "ordered", "the", "legal", "co", "##unsel", "##s", "of", "Bio", "##gen", "Inc", "and", "Be", "##rle", "##x", "Labor", "##atories", ",", "a", "subsidiary", "of", "Sc", "##her", "##ing", "AG", ",", "de", "##posed", "." ], "ids": [ 10167, 12990, 10114, 15217, 10957, 19068, 21883, 10261, 14819, 62064, 10105, 13474, 117, 169, 158, 119, 156, 119, 11958, 14100, 31624, 57611, 23782, 10105, 17139, 11170, 78067, 10107, 10108, 30429, 11280, 13604, 10111, 14321, 43539, 10686, 31017, 67429, 117, 169, 53898, 10108, 55260, 14206, 10230, 17935, 117, 10104, 76996, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "temp", "##est", "beyond", "the", "test", "tube", "involves", "allegations", "that", "the", "U", ".", "S", ".", "Food", "and", "Drug", "Administration", "viola", "##ted", "the", "Or", "##pha", "##n", "Drug", "law", "by", "allowing", "Bio", "##gen", "the", "right", "to", "sell", "its", "multiple", "s", "##cle", "##ros", "##is", "drug", "Avon", "##ex", "." ], "ids": [ 10117, 101986, 13051, 28569, 10105, 15839, 45245, 53963, 85190, 10189, 10105, 158, 119, 156, 119, 24182, 10111, 33977, 22002, 49698, 11912, 10105, 19372, 37590, 10115, 33977, 13255, 10155, 28357, 30429, 11280, 10105, 13448, 10114, 36300, 10474, 19865, 187, 19478, 12333, 10291, 20998, 71543, 28580, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Be", "##rle", "##x", "also", "charges", "that", "Avon", "##ex", "is", "so", "similar", "to", "its", "MS", "drug", ",", "Beta", "##sero", "##n", ",", "that", "it", "is", "a", "patent", "in", "##fr", "##inge", "##ment", "." ], "ids": [ 14321, 43539, 10686, 10379, 31128, 10189, 71543, 28580, 10124, 10380, 13213, 10114, 10474, 21018, 20998, 117, 40392, 48224, 10115, 117, 10189, 10271, 10124, 169, 45352, 10106, 71843, 35604, 10426, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "drugs", "are", "types", "of", "inter", "##fero", "##n", "." ], "ids": [ 20973, 40421, 10301, 19164, 10108, 22021, 52875, 10115, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "anal", "##yst", "said", "sales", "of", "Avon", "##ex", "had", "already", "cut", "into", "Beta", "##sero", "##n", "market", "share", "." ], "ids": [ 11340, 106615, 62769, 12415, 23857, 10108, 71543, 28580, 10374, 19034, 21610, 10708, 40392, 48224, 10115, 17313, 23867, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Bio", "##V", "##est", "Research", ",", "Inc", "'", "s", "anal", "##yst", "Eddie", "He", "##day", "##a", "said", ",", "\"", "Be", "##rle", "##x", "sales", "are", "losing", "share", "like", "ma", "##d", ".", ".", "." ], "ids": [ 30429, 11779, 13051, 12959, 117, 13604, 112, 187, 106615, 62769, 19414, 10357, 24558, 10113, 12415, 117, 107, 14321, 43539, 10686, 23857, 10301, 27817, 23867, 11850, 10824, 10162, 119, 119, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "my", "understanding", "of", "the", "market", "##place", "is", "that", "they", "'", "re", "below", "ex", "##pectations", ".", "\"" ], "ids": [ 15127, 37149, 10108, 10105, 17313, 30236, 10124, 10189, 10689, 112, 11639, 17544, 11419, 96815, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "added", "Chi", "##ron", "Corp", "reported", "its", "sales", "of", "inventor", "##y", "to", "Be", "##rle", "##x", "was", "down", "." ], "ids": [ 10357, 16288, 21946, 11620, 44687, 15943, 10474, 23857, 10108, 63204, 10157, 10114, 14321, 43539, 10686, 10134, 12935, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Chi", "##ron", "makes", "Beta", "##sero", "##n", ";", "Be", "##rle", "##x", "markets", "it", ",", "he", "said", "." ], "ids": [ 21946, 11620, 20562, 40392, 48224, 10115, 132, 14321, 43539, 10686, 42893, 10271, 117, 10261, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 2, 6, 6, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bio", "##gen", ",", "in", "its", "Sec", "##urities", "and", "Exchange", "Commission", "quarter", "##ly", "report", "for", "the", "period", "ending", "June", "30", ",", "said", "it", "had", "earned", "$", "6", ".", "1", "million", "from", "Avon", "##ex", "sales", "during", "the", "drugs", "first", "six", "weeks", "on", "the", "market", "." ], "ids": [ 30429, 11280, 117, 10106, 10474, 109754, 82073, 10111, 32424, 14941, 28330, 10454, 17553, 10142, 10105, 13127, 29077, 11120, 10244, 117, 12415, 10271, 10374, 21293, 109, 127, 119, 122, 12473, 10188, 71543, 28580, 23857, 10939, 10105, 40421, 10422, 12449, 20750, 10135, 10105, 17313, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "it", "approved", "Avon", "##ex", "in", "May", ",", "the", "FDA", "said", "both", "Bio", "##gen", "'", "s", "product", "and", "Beta", "##sero", "##n", "were", "developed", "under", "the", "in", "##cent", "##ives", "of", "the", "Op", "##hra", "##n", "Drug", "Act", "which", "provides", "seven", "years", "of", "marketing", "ex", "##clu", "##siv", "##ity", "for", "products", "that", "treat", "rare", "diseases", "." ], "ids": [ 12242, 10271, 29855, 71543, 28580, 10106, 10725, 117, 10105, 64431, 12415, 11408, 30429, 11280, 112, 187, 21535, 10111, 40392, 48224, 10115, 10309, 14628, 10571, 10105, 10106, 25907, 24407, 10108, 10105, 12160, 36274, 10115, 33977, 13968, 10319, 20245, 15767, 10855, 10108, 29465, 11419, 78225, 81684, 11949, 10142, 20895, 10189, 81634, 23902, 54231, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 3, 9, 9, 3, 7, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Avon", "##ex", "\"", "has", "been", "allowed", "to", "enter", "the", "market", "because", "it", "differ", "##s", "from", "inter", "##fero", "##n", "beta", "-", "1", "##b", "(", "Beta", "##sero", "##n", ")", ".", "." ], "ids": [ 71543, 28580, 107, 10393, 10590, 18162, 10114, 31006, 10105, 17313, 12373, 10271, 101300, 10107, 10188, 22021, 52875, 10115, 26249, 118, 122, 10457, 113, 40392, 48224, 10115, 114, 119, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ ".", "\"" ], "ids": [ 119, 107 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "the", "FDA", "said", "." ], "ids": [ 10105, 64431, 12415, 119 ], "entity": [ "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 3, 9, 9 ] }, { "tokens": [ "Now", ",", "U", ".", "S", ".", "District", "Judge", "Mark", "Wolf", "has", "ordered", "the", "chief", "co", "##unsel", "for", "Bio", "##gen", ",", "Michael", "As", "##tru", "##e", ",", "and", "Robert", "Cha", "##bora", ",", "his", "counter", "##part", "at", "Be", "##rle", "##x", "be", "de", "##posed", "about", "a", "May", "21", "meeting", "the", "two", "men", "attended", "to", "help", "him", "determine", "whether", "the", "lawsuit", "filed", "by", "Bio", "##gen", "against", "Be", "##rle", "##x", "should", "be", "heard", "in", "Massachusetts", "." ], "ids": [ 17121, 117, 158, 119, 156, 119, 11958, 31617, 11997, 17970, 10393, 23782, 10105, 19421, 11170, 78067, 10142, 30429, 11280, 117, 10631, 10882, 45388, 10112, 117, 10111, 10820, 53453, 22337, 117, 10226, 46298, 48433, 10160, 14321, 43539, 10686, 10347, 10104, 76996, 10978, 169, 10725, 10296, 19822, 10105, 10551, 10588, 17696, 10114, 15217, 10957, 37284, 21883, 10105, 83706, 45959, 10155, 30429, 11280, 11327, 14321, 43539, 10686, 14819, 10347, 32240, 10106, 15123, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 7, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Be", "##rle", "##x", "filed", "a", "lawsuit", "against", "Bio", "##gen", "in", "U", ".", "S", ".", "District", "Court", "in", "Newark", ",", "N", ".", "J", ".", "in", "July", ",", "but", "Bio", "##gen", "had", "already", "filed", "a", "suit", "against", "Be", "##rle", "##x", "in", "Massachusetts", "in", "May", "." ], "ids": [ 14321, 43539, 10686, 45959, 169, 83706, 11327, 30429, 11280, 10106, 158, 119, 156, 119, 11958, 14100, 10106, 63157, 117, 151, 119, 147, 119, 10106, 11112, 117, 10473, 30429, 11280, 10374, 19034, 45959, 169, 26315, 11327, 14321, 43539, 10686, 10106, 15123, 10106, 10725, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 3, 7, 9, 3, 7, 7, 7, 7, 7, 9, 1, 9, 1, 5, 5, 5, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Wolf", "ordered", "the", "de", "##position", "##s", "to", "determine", "if", "he", "or", "U", ".", "S", ".", "District", "Judge", "John", "Bis", "##sell", "of", "Newark", "should", "pre", "##side", "over", "the", "case", "." ], "ids": [ 17970, 23782, 10105, 10104, 33487, 10107, 10114, 37284, 12277, 10261, 10345, 158, 119, 156, 119, 11958, 31617, 10421, 18516, 68915, 10108, 63157, 14819, 12229, 18103, 10491, 10105, 13474, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Treasury", "balance", "##s", "at", "Fed", "rose", "on", "Aug", "27", "." ], "ids": [ 158, 119, 156, 119, 77201, 40162, 10107, 10160, 91335, 29467, 10135, 53012, 10365, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Treasury", "balance", "##s", "at", "Federal", "Reserve", "based", "on", "Treasury", "Department", "'", "s", "latest", "budget", "statement", "." ], "ids": [ 158, 119, 156, 119, 77201, 40162, 10107, 10160, 14492, 23120, 11610, 10135, 77201, 12933, 112, 187, 50908, 25293, 33311, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 3, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "B", "##IL", "##L", "##ION", "##S", "OF", "DL", "##RS", ")" ], "ids": [ 113, 139, 38850, 11369, 52980, 10731, 23240, 27956, 39469, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aug", "27", "Aug", "26" ], "ids": [ 53012, 10365, 53012, 10314 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Fed", "ac", "##ct", "5", ".", "208", "4", ".", "425" ], "ids": [ 91335, 13621, 14526, 126, 119, 21881, 125, 119, 33437 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tax", "/", "loan", "note", "ac", "##ct", "14", ".", "828", "15", ".", "687" ], "ids": [ 81839, 120, 33390, 19864, 13621, 14526, 10247, 119, 57721, 10208, 119, 64549 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cash", "balance", "20", ".", "036", "20", ".", "112" ], "ids": [ 41286, 40162, 10197, 119, 109077, 10197, 119, 16129 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-" ], "ids": [ 118, 118, 118 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Total", "public", "debt", "," ], "ids": [ 25220, 11683, 55869, 117 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "subject", "to", "limit", "5", ",", "124", ".", "05", "##3", "5", ",", "122", ".", "08", "##4" ], "ids": [ 20036, 10114, 34316, 126, 117, 17944, 119, 10831, 10884, 126, 117, 17484, 119, 11052, 11011 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "COM", "##E", "##X", "copper", "ends", "higher", "after", "late", "recovery", "." ], "ids": [ 80645, 11259, 12674, 61576, 29047, 17981, 10662, 13002, 61958, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "COM", "##E", "##X", "copper", "ended", "higher", "after", "a", "late", ",", "modest", "recovery", "drag", "##ged", "the", "market", "from", "the", "low", "##s", ",", "but", "trade", "##rs", "sh", "##rug", "##ged", "-", "off", "an", "im", "##minent", "strike", "at", "Code", "##lco", "'", "s", "Salvador", "mine", "in", "Chile", "." ], "ids": [ 80645, 11259, 12674, 61576, 18428, 17981, 10662, 169, 13002, 117, 106608, 61958, 71840, 18832, 10105, 17313, 10188, 10105, 15626, 10107, 117, 10473, 18908, 10943, 48201, 58550, 18832, 118, 11898, 10151, 10211, 98510, 37456, 10160, 16277, 82115, 112, 187, 16837, 27546, 10106, 13218, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 9, 9, 1, 9 ] }, { "tokens": [ "The", "market", "was", "also", "waiting", "for", "Friday", "'", "s", "LM", "##E", "stock", "report", "which", "will", "include", "figures", "delayed", "from", "Tuesday", "because", "of", "the", "U", ".", "K", ".", "public", "holiday", "on", "Monday", "when", "the", "LM", "##E", "was", "closed", "." ], "ids": [ 10117, 17313, 10134, 10379, 62052, 10142, 30767, 112, 187, 107879, 11259, 20511, 17553, 10319, 11337, 12363, 21068, 67058, 10188, 70245, 12373, 10108, 10105, 158, 119, 148, 119, 11683, 71806, 10135, 40714, 10841, 10105, 107879, 11259, 10134, 18440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "are", "in", "the", "late", "stages", "of", "the", "weak", "##er", "period", "of", "the", "market", ",", "and", "as", "we", "get", "to", "the", "post", "Labor", "Day", "market", "we", "will", "start", "to", "see", "more", "consumer", "interest", "and", "the", "demand", "side", "of", "the", "market", "will", "start", "to", "firm", "prices", "up", ",", "\"", "said", "William", "O", "'", "Neill", "of", "Merrill", "Lynch", "." ], "ids": [ 107, 12865, 10301, 10106, 10105, 13002, 35023, 10108, 10105, 61285, 10165, 13127, 10108, 10105, 17313, 117, 10111, 10146, 11951, 15329, 10114, 10105, 11841, 31017, 12360, 17313, 11951, 11337, 15148, 10114, 12888, 10798, 64580, 17644, 10111, 10105, 34394, 12250, 10108, 10105, 17313, 11337, 15148, 10114, 23410, 57476, 10741, 117, 107, 12415, 10694, 152, 112, 38269, 10108, 59905, 32703, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 3, 7, 9 ] }, { "tokens": [ "December", "COM", "##E", "##X", "settled", "0", ".", "35", "cent", "higher", "at", "90", ".", "20", "cents", ",", "traded", "90", ".", "50", "to", "89", ".", "40", "cents", "." ], "ids": [ 11288, 80645, 11259, 12674, 29014, 121, 119, 10803, 32882, 17981, 10160, 10919, 119, 10197, 63487, 117, 52696, 10919, 119, 10462, 10114, 12642, 119, 10533, 63487, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "September", "went", "out", "0", ".", "05", "cent", "lower", "at", "91", ".", "05", "." ], "ids": [ 10596, 13446, 10950, 121, 119, 10831, 32882, 18165, 10160, 12519, 119, 10831, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "August", "contract", "ex", "##pired", "at", "0", ".", "85", "cent", "down", "at", "90", ".", "85", "cents", "." ], "ids": [ 10117, 10735, 16108, 11419, 110603, 10160, 121, 119, 12017, 32882, 12935, 10160, 10919, 119, 12017, 63487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Volume", "was", "estimated", "at", "8", ",", "000", "lots", "." ], "ids": [ 15239, 10134, 25267, 10160, 129, 117, 10259, 87202, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Workers", "at", "Salvador", "voted", "to", "strike", "from", "Saturday", ",", "and", "it", "was", "not", "clear", "when", "further", "talks", "between", "the", "unions", "and", "management", "would", "take", "place", "." ], "ids": [ 52896, 10160, 16837, 34584, 10114, 37456, 10188, 24848, 117, 10111, 10271, 10134, 10472, 24866, 10841, 14586, 56672, 10948, 10105, 76841, 10111, 17150, 10894, 13574, 11192, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Salvador", "is", "a", "small", "facility", ",", "and", "the", "pro", "##spects", "are", "that", "if", "there", "will", "be", "a", "strike", ",", "it", "will", "not", "be", "a", "long", "strike", ",", "\"", "O", "'", "Neill", "said", "." ], "ids": [ 107, 16837, 10124, 169, 12474, 27774, 117, 10111, 10105, 11284, 105335, 10301, 10189, 12277, 11155, 11337, 10347, 169, 37456, 117, 10271, 11337, 10472, 10347, 169, 11695, 37456, 117, 107, 152, 112, 38269, 12415, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "-", "-", "Hu", "##w", "Jones", ",", "New", "York", "Com", "##mo", "##diti", "##es", "212", "-", "859", "-", "1646" ], "ids": [ 118, 118, 43707, 10874, 12298, 117, 10287, 10482, 16680, 11033, 63203, 10171, 22023, 118, 80786, 118, 44635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "copper", "service", "center", "ship", "##ments", "stable", "-", "CBS", "##A", "." ], "ids": [ 158, 119, 156, 119, 61576, 11989, 15630, 17309, 14542, 38430, 118, 18875, 10738, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ave", "##rage", "daily", "ship", "##ments", "from", "U", ".", "S", ".", "copper", "service", "centers", "in", "July", "fell", "three", "percent", "from", "the", "previous", "month", ",", "but", "were", "higher", "than", "in", "July", "1995", ",", "the", "Copper", "and", "Brass", "Service", "##nter", "Association", "reported", "." ], "ids": [ 50998, 40696, 27636, 17309, 14542, 10188, 158, 119, 156, 119, 61576, 11989, 44924, 10106, 11112, 25194, 11003, 22362, 10188, 10105, 16741, 14064, 117, 10473, 10309, 17981, 11084, 10106, 11112, 10436, 117, 10105, 98715, 10111, 79134, 13489, 25446, 11751, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "\"", "July", "was", "still", "above", "the", "historic", "average", "for", "that", "month", ",", "\"", "the", "CBS", "##A", "said", "." ], "ids": [ 107, 11112, 10134, 12647, 16038, 10105, 23704, 13551, 10142, 10189, 14064, 117, 107, 10105, 18875, 10738, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "In", "the", "first", "seven", "months", "of", "1996", ",", "ship", "##ments", "of", "copper", "sheet", ",", "coi", "##l", "and", "strip", "were", "2", ".", "2", "percent", "ahead", "of", "the", "same", "period", "last", "year", "." ], "ids": [ 10167, 10105, 10422, 15767, 15555, 10108, 10389, 117, 17309, 14542, 10108, 61576, 55030, 117, 26434, 10161, 10111, 44445, 10309, 123, 119, 123, 22362, 35629, 10108, 10105, 11561, 13127, 12469, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "##oy", "ship", "##ments", ",", "however", ",", "were", "7", ".", "5", "percent", "down", "." ], "ids": [ 11101, 20712, 17309, 14542, 117, 13800, 117, 10309, 128, 119, 126, 22362, 12935, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Several", "service", "centers", "indicated", "that", "while", "their", "volume", "of", "orders", "remains", "constant", ",", "the", "size", "-", "per", "-", "order", "continues", "to", "be", "smaller", "than", "what", "was", "real", "##ised", "during", "the", "first", "five", "months", "of", "the", "year", ",", "\"", "the", "CBS", "##A", "said", "." ], "ids": [ 107, 28604, 11989, 44924, 37944, 10189, 11371, 10455, 15901, 10108, 31303, 19602, 29152, 117, 10105, 15851, 118, 10178, 118, 12990, 25266, 10114, 10347, 23309, 11084, 12976, 10134, 13486, 20666, 10939, 10105, 10422, 12403, 15555, 10108, 10105, 10924, 117, 107, 10105, 18875, 10738, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Service", "centers", "continued", "to", "lower", "their", "inventor", "##ies", "in", "July", "when", "total", "copper", "stock", "##s", "were", "off", "two", "percent", "and", "allo", "##y", "products", "down", "1", ".", "9", "percent", "." ], "ids": [ 13489, 44924, 14278, 10114, 18165, 10455, 63204, 11624, 10106, 11112, 10841, 11339, 61576, 20511, 10107, 10309, 11898, 10551, 22362, 10111, 20779, 10157, 20895, 12935, 122, 119, 130, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "New", "York", "Com", "##mo", "##diti", "##es", "212", "-", "859", "-", "1646" ], "ids": [ 118, 118, 10287, 10482, 16680, 11033, 63203, 10171, 22023, 118, 80786, 118, 44635 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Harley", "##sville", "Group", "ups", "q", "##rt", "##ly", "divide", "##n", "##D", "." ], "ids": [ 65721, 49180, 12054, 107717, 185, 10976, 10454, 41430, 10115, 11490, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##AR", "##LE", "##YS", "##VI", "##LL", "##E", ",", "Pa", "." ], "ids": [ 145, 52188, 51036, 93202, 90939, 82834, 11259, 117, 26907, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "28" ], "ids": [ 10389, 118, 11052, 118, 10348 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Quarterly" ], "ids": [ 55268 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Late", "##st", "Prior" ], "ids": [ 25139, 10562, 29376 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Am", "##oun", "##t", "$", "0", ".", "21", "$", "0", ".", "19" ], "ids": [ 11500, 43971, 10123, 109, 121, 119, 10296, 109, 121, 119, 10270 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pay", "Sept", "30" ], "ids": [ 88031, 51768, 10244 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Record", "Sept", "16" ], "ids": [ 18814, 51768, 10250 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Chile", "'", "s", "EN", "##AP", "buy", "##s", "Oriente", ",", "Es", "##cra", "##vos", "c", "##rude", "for", "Oct", "." ], "ids": [ 13218, 112, 187, 31278, 38423, 47715, 10107, 30353, 117, 10912, 40333, 15404, 171, 97417, 10142, 45442, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 9, 9, 3, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chile", "'", "s", "state", "oil", "company", "Em", "##presa", "Nacional", "del", "Petro", "##leo", "(", "EN", "##AP", ")", "bought", "a", "second", "spot", "cargo", "of", "Oriente", "and", "nearly", "one", "million", "barrel", "##s", "of", "Es", "##cra", "##vos", "in", "a", "recent", "tender", ",", "trade", "##rs", "said", "Wednesday", "." ], "ids": [ 13218, 112, 187, 11388, 21073, 12100, 11289, 44520, 11526, 10127, 82470, 83822, 113, 31278, 38423, 114, 28870, 169, 11132, 28504, 15856, 10108, 30353, 10111, 21377, 10464, 12473, 93397, 10107, 10108, 10912, 40333, 15404, 10106, 169, 19037, 96486, 117, 18908, 10943, 12415, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "400", ",", "000", "barrel", "cargo", "of", "Ecuador", "##ian", "Oriente", "and", "960", ",", "000", "barrel", "##s", "of", "Nigerian", "Es", "##cra", "##vos", "was", "awarded", "in", "a", "tender", "for", "Oct", "15", "-", "18", "late", "last", "week", ",", "but", "price", "information", "remains", "vague", "." ], "ids": [ 138, 11176, 117, 10259, 93397, 15856, 10108, 20475, 11630, 30353, 10111, 36832, 117, 10259, 93397, 10107, 10108, 85012, 10912, 40333, 15404, 10134, 16150, 10106, 169, 96486, 10142, 45442, 10208, 118, 10218, 13002, 12469, 16118, 117, 10473, 30839, 12929, 19602, 94777, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 2, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Oriente", "will", "be", "supplied", "by", "the", "same", "selle", "##r", "at", "a", "small", "premiu", "##m", "to", "formula", ",", "\"", "a", "trade", "source", "said", ",", "referring", "to", "the", "first", "October", "cargo", "sold", "two", "weeks", "ago", "at", "Petro", "##ecu", "##ador", "'", "s", "sale", "formula", "plus", "five", "cents", "f", "##ob", "." ], "ids": [ 107, 10117, 30353, 11337, 10347, 65194, 10155, 10105, 11561, 22154, 10129, 10160, 169, 12474, 93244, 10147, 10114, 29659, 117, 107, 169, 18908, 15247, 12415, 117, 69299, 10114, 10105, 10422, 11212, 15856, 15337, 10551, 20750, 36390, 10160, 82470, 97038, 18368, 112, 187, 15488, 29659, 10563, 12403, 63487, 174, 31165, 119 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Es", "##cra", "##vos", "was", "sold", "on", "a", "Date", "##d", "Brent", "related", "basis", ",", "with", "premiu", "##ms", "for", "the", "light", "grade", "seen", "in", "the", "low", "50", "-", "cent", "range", "." ], "ids": [ 10912, 40333, 15404, 10134, 15337, 10135, 169, 29897, 10162, 56333, 16382, 17172, 117, 10169, 93244, 12387, 10142, 10105, 15765, 21958, 15652, 10106, 10105, 15626, 10462, 118, 32882, 15601, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "next", "purchase", "tender", "from", "EN", "##AP", "is", "expected", "for", "late", "October", "or", "early", "November", "c", "##rude", ",", "trade", "##rs", "said", "." ], "ids": [ 10117, 13451, 37891, 96486, 10188, 31278, 38423, 10124, 25973, 10142, 13002, 11212, 10345, 11732, 10819, 171, 97417, 117, 18908, 10943, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Jacqueline", "Wong", ",", "New", "York", "Energy", "Des", "##k", "+", "1", "212", "859", "1620" ], "ids": [ 118, 118, 42237, 35572, 117, 10287, 10482, 21058, 13810, 10174, 116, 122, 22023, 80786, 33299 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "historical", "calendar", "-", "September", "4", "." ], "ids": [ 46617, 19871, 61637, 118, 10596, 125, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "are", "some", "of", "the", "major", "events", "to", "have", "occurred", "on", "September", "4", "in", "history", "." ], "ids": [ 18317, 10301, 11152, 10108, 10105, 11922, 15284, 10114, 10529, 25738, 10135, 10596, 125, 10106, 11486, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1241", "-", "Alexander", "III", ",", "King", "of", "Scotland", ",", "born", "." ], "ids": [ 65620, 118, 12063, 10652, 117, 11515, 10108, 16901, 117, 11175, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "King", "from", "1249", "-", "1286", ",", "he", "con", "##solidated", "royal", "power", ",", "leaving", "Scotland", "united", "and", "independent", "." ], "ids": [ 11515, 10188, 105180, 118, 108069, 117, 10261, 10173, 69302, 23954, 13183, 117, 21005, 16901, 89284, 10111, 16584, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "1260", "-", "The", "G", "##hibe", "##llin", "##es", "ret", "##ook", "the", "city", "of", "Florence", "from", "the", "Flor", "##enti", "##ne", "G", "##uel", "##fs", "at", "the", "battle", "of", "Monte", "A", "##perto", "." ], "ids": [ 54993, 118, 10117, 144, 78706, 85129, 10171, 62893, 46921, 10105, 11584, 10108, 23283, 10188, 10105, 69113, 21688, 10238, 144, 27043, 25743, 10160, 10105, 18758, 10108, 14915, 138, 68200, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "1768", "-", "Francois", "-", "Rene", "(", "Vic", "##om", "##te", "de", ")", "Chat", "##eau", "##bria", "##nd", "born", "." ], "ids": [ 26829, 118, 93684, 118, 91790, 113, 39574, 10692, 10216, 10104, 114, 103205, 19713, 32152, 11534, 11175, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "He", "was", "a", "politician", ",", "one", "of", "the", "first", "French", "romantic", "writers", "and", "ambassador", "to", "the", "British", "court", "." ], "ids": [ 10357, 10134, 169, 20354, 117, 10464, 10108, 10105, 10422, 11894, 57349, 35729, 10111, 74853, 10114, 10105, 11160, 14866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "He", "wrote", "\"", "Rene", "\"", ",", "a", "semi", "##nal", "work", "in", "the", "French", "romantic", "movement", "and", "a", "famous", "autobiography", "\"", "Mem", "##oire", "##s", "d", "'", "Outre", "Tomb", "##e", "\"", "." ], "ids": [ 10357, 13954, 107, 91790, 107, 117, 169, 15900, 17661, 11424, 10106, 10105, 11894, 57349, 17123, 10111, 169, 18689, 100710, 107, 83086, 43908, 10107, 172, 112, 74815, 72076, 10112, 107, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9, 9 ] }, { "tokens": [ "1781", "-", "Los", "Angeles", "was", "founded", "by", "Spanish", "settlers", "and", "named", "\"", "El", "Pueblo", "de", "Nuestra", "Sen", "##ora", "La", "Reina", "de", "Los", "Angeles", "\"", "(", "The", "Town", "of", "Our", "Lady", "the", "Queen", "of", "the", "Angels", ")", "." ], "ids": [ 24956, 118, 10630, 12233, 10134, 14078, 10155, 14661, 54709, 10111, 12038, 107, 10224, 44255, 10104, 42832, 18082, 14945, 10159, 38657, 10104, 10630, 12233, 107, 113, 10117, 14380, 10108, 18465, 14005, 10105, 13704, 10108, 10105, 28132, 114, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 9, 9, 1, 5, 5, 5, 5, 5, 5, 5, 5, 5, 9, 9 ] }, { "tokens": [ "1824", "-", "Anton", "Br", "##uck", "##ner", "born", "." ], "ids": [ 17831, 118, 16242, 38508, 31746, 11129, 11175, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "Austrian", "composer", "and", "organist", ",", "he", "wrote", "nine", "sy", "##mp", "##hon", "##ies", "on", "a", "huge", "scale", "and", "three", "grand", "masses", "in", "the", "romantic", "tradition", "." ], "ids": [ 32201, 26474, 10111, 82840, 117, 10261, 13954, 19964, 12261, 18573, 19792, 11624, 10135, 169, 42126, 19707, 10111, 11003, 13023, 72271, 10106, 10105, 57349, 20049, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1870", "-", "In", "France", ",", "the", "Second", "Empire", "was", "ended", "and", "Napoleon", "III", "was", "de", "##posed", "after", "his", "surrender", "two", "days", "earlier", "in", "the", "Franco", "-", "Prussian", "war", "." ], "ids": [ 12799, 118, 10167, 10688, 117, 10105, 14181, 13642, 10134, 18428, 10111, 21464, 10652, 10134, 10104, 76996, 10662, 10226, 75614, 10551, 13990, 18905, 10106, 10105, 16644, 118, 89279, 10338, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "1886", "-", "At", "S", "##kel", "##eton", "Canyon", "in", "Arizona", ",", "G", "##eron", "##imo", ",", "Apache", "chief", "and", "leader", "of", "the", "last", "great", "Red", "Indian", "rebellion", "finally", "surrendered", "to", "General", "Nelson", "Miles", "." ], "ids": [ 12896, 118, 11699, 156, 14510, 102709, 35679, 10106, 17099, 117, 144, 22958, 15487, 117, 44488, 19421, 10111, 15014, 10108, 10105, 12469, 14772, 11641, 12544, 75746, 21256, 104330, 10114, 11220, 15962, 23603, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 5, 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "1892", "-", "Pro", "##lifi", "##c", "French", "moderni", "##st", "composer", "Darius", "Mil", "##hau", "##d", "born", "." ], "ids": [ 12967, 118, 14021, 80237, 10350, 11894, 84984, 10562, 26474, 76384, 75311, 52332, 10162, 11175, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "He", "wrote", "a", "jazz", "ballet", "\"", "La", "Creation", "du", "Monde", "\"", "and", "scores", "for", "many", "films", "including", "an", "early", "version", "of", "\"", "Madame", "Bo", "##var", "##y", "\"", "." ], "ids": [ 10357, 13954, 169, 17554, 45110, 107, 10159, 29938, 10168, 33074, 107, 10111, 49931, 10142, 11299, 14280, 11198, 10151, 11732, 11674, 10108, 107, 25894, 27622, 16648, 10157, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "1906", "-", "German", "-", "born", "U", ".", "S", ".", "bio", "##logist", "Max", "Del", "##bru", "##ck", "born", "." ], "ids": [ 11932, 118, 12026, 118, 11175, 158, 119, 156, 119, 12297, 62572, 12854, 15973, 40309, 11263, 11175, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "Winner", "of", "the", "1969", "Nobel", "Prize", "for", "ph", "##ys", "##iology", "or", "medicine", "for", "work", "on", "the", "genetic", "structure", "of", "virus", "##es", "that", "in", "##fect", "bacteria", "." ], "ids": [ 40815, 10108, 10105, 10764, 16280, 17017, 10142, 99142, 12682, 80477, 10345, 28219, 10142, 11424, 10135, 10105, 48751, 13926, 10108, 20399, 10171, 10189, 10106, 84732, 63318, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1907", "-", "Edvard", "G", "##rieg", ",", "Norwegian", "composer", "best", "known", "for", "his", "\"", "Peer", "G", "##ynt", "Suite", "\"", "and", "his", "Piano", "Concerto", ",", "died", "in", "Bergen", "." ], "ids": [ 11853, 118, 44212, 144, 91271, 117, 24783, 26474, 12504, 11053, 10142, 10226, 107, 71883, 144, 61174, 31669, 107, 10111, 10226, 24336, 35623, 117, 12482, 10106, 19511, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 2, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "1908", "-", "U", ".", "S", ".", "film", "director", "Edward", "D", "##my", "##tryk", "born", "." ], "ids": [ 11819, 118, 158, 119, 156, 119, 10458, 12461, 11984, 141, 14996, 102699, 11175, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "Best", "known", "for", "his", "films", "\"", "Cross", "##fire", "\"", "-", "one", "of", "Hollywood", "'", "s", "first", "attempts", "to", "deal", "with", "racial", "discrimination", "and", "\"", "Farewell", "My", "love", "##ly", "\"", "." ], "ids": [ 11730, 11053, 10142, 10226, 14280, 107, 15666, 38990, 107, 118, 10464, 10108, 14642, 112, 187, 10422, 30406, 10114, 19918, 10169, 33377, 66191, 10111, 107, 103111, 11590, 16138, 10454, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "1909", "-", "The", "world", "'", "s", "first", "Boy", "Scout", "Rally", "was", "held", "at", "Crystal", "Palace", "near", "London", "." ], "ids": [ 11944, 118, 10117, 11356, 112, 187, 10422, 15384, 51215, 42161, 10134, 11991, 10160, 28459, 22015, 12883, 10829, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 3, 7, 9, 1, 9 ] }, { "tokens": [ "1944", "-", "Brussels", "and", "Antwerp", "in", "Belgium", "were", "libera", "##ted", "by", "British", "and", "Canadian", "troops", "in", "World", "War", "Two", "." ], "ids": [ 10825, 118, 41239, 10111, 85332, 10106, 26519, 10309, 49437, 11912, 10155, 11160, 10111, 14023, 20836, 10106, 10315, 11277, 13214, 119 ], "entity": [ "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "B-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 1, 9, 1, 9, 1, 9, 9, 9, 9, 2, 9, 2, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "1948", "-", "Wilhelmina", ",", "Queen", "of", "the", "Netherlands", "from", "1890", "and", "throughout", "World", "Wars", "One", "and", "Two", "ab", "##dicated", "in", "favour", "of", "her", "daughter", "Juliana", "." ], "ids": [ 11004, 118, 96074, 117, 13704, 10108, 10105, 22043, 10188, 12313, 10111, 15916, 10315, 19178, 11340, 10111, 13214, 11357, 82187, 10106, 61264, 10108, 10485, 15243, 69048, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 6, 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "1963", "-", "Robert", "Sc", "##hum", "##an", ",", "French", "states", "##man", ",", "Prime", "Minister", "1947", "-", "48", "and", "Foreign", "Minister", "1948", "-", "52", ",", "died", "." ], "ids": [ 10904, 118, 10820, 55260, 43504, 10206, 117, 11894, 16316, 10589, 117, 19924, 14355, 11113, 118, 11300, 10111, 20277, 14355, 11004, 118, 11525, 117, 12482, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "responsible", "for", "the", "establishment", "of", "the", "European", "Coal", "and", "Steel", "Community", "." ], "ids": [ 10357, 10134, 21586, 10142, 10105, 31989, 10108, 10105, 11914, 82587, 10111, 27450, 18553, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "1964", "-", "The", "Fort", "##h", "Road", "Bridge", "in", "Scotland", ",", "measuring", "615", "##6", "ft", ",", "and", "with", "a", "centre", "span", "of", "330", "##0", "ft", ",", "was", "opened", "by", "Her", "Majesty", "the", "Queen", "." ], "ids": [ 10856, 118, 10117, 14326, 10237, 12648, 17426, 10106, 16901, 117, 92267, 50036, 11211, 13786, 117, 10111, 10169, 169, 12672, 51551, 10108, 20564, 10929, 13786, 117, 10134, 14377, 10155, 13229, 71298, 10105, 13704, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1965", "-", "Albert", "Sc", "##h", "##weit", "##zer", ",", "theo", "##logia", "##n", ",", "philosopher", "and", "organist", "died", "in", "Gabon", "where", "he", "had", "set", "up", "a", "hospital", "in", "1913", "." ], "ids": [ 10839, 118, 12422, 55260, 10237, 34693, 14210, 117, 13951, 16772, 10115, 117, 84797, 10111, 82840, 12482, 10106, 54573, 10940, 10261, 10374, 11847, 10741, 169, 18141, 10106, 11606, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##cc", "##lai", "##med", "for", "his", "interpretation", "##s", "of", "J", ".", "S", ".", "Bach", "'", "s", "works", ",", "he", "also", "won", "the", "Nobel", "Peace", "Prize", "for", "his", "efforts", "on", "behalf", "of", "the", "\"", "Brotherhood", "of", "Nations", "\"", "in", "1952", "." ], "ids": [ 138, 28044, 31181, 21986, 10142, 10226, 55760, 10107, 10108, 147, 119, 156, 119, 18965, 112, 187, 14009, 117, 10261, 10379, 11367, 10105, 16280, 20705, 17017, 10142, 10226, 22116, 10135, 50683, 10108, 10105, 107, 89434, 10108, 15145, 107, 10106, 11100, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "1972", "-", "At", "the", "Olympic", "Games", ",", "U", ".", "S", ".", "s", "##wimmer", "Mark", "Sp", "##itz", "won", "his", "seventh", "gold", "medal", ",", "a", "record", "for", "a", "single", "Olympia", "##d", "." ], "ids": [ 10677, 118, 11699, 10105, 17952, 14501, 117, 158, 119, 156, 119, 187, 87608, 11997, 46361, 18848, 11367, 10226, 37192, 18128, 16531, 117, 169, 12410, 10142, 169, 11376, 39624, 10162, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "1974", "-", "East", "Germany", "and", "the", "United", "States", "established", "formal", "diplomatic", "relations", "for", "the", "first", "time", "." ], "ids": [ 10723, 118, 11830, 12775, 10111, 10105, 10609, 10859, 13245, 23129, 64838, 19824, 10142, 10105, 10422, 10635, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1977", "-", "E", ".", "F", ".", "(", "Fritz", ")", "Schumacher", ",", "economic", "guru", "and", "author", "of", "the", "best", "selle", "##r", "\"", "Small", "is", "Beautiful", "\"", ",", "died", "on", "his", "way", "to", "a", "conference", "in", "Switzerland", "." ], "ids": [ 10722, 118, 142, 119, 143, 119, 113, 17314, 114, 37761, 117, 13925, 31097, 10111, 17034, 10108, 10105, 12504, 22154, 10129, 107, 15539, 10124, 26820, 107, 117, 12482, 10135, 10226, 13170, 10114, 169, 25029, 10106, 26002, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "1989", "-", "Georges", "Sim", "##eno", "##n", ",", "writer", "of", "84", "books", "based", "on", "the", "detective", "character", "Inspector", "Maigret", ",", "died", "." ], "ids": [ 10524, 118, 14952, 103695, 16818, 10115, 117, 17556, 10108, 11761, 15174, 11610, 10135, 10105, 57127, 15092, 53966, 107445, 117, 12482, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "1992", "-", "Bulgaria", "'", "s", "former", "Communist", "leader", "Todo", "##r", "Z", "##hi", "##v", "##kov", ",", "de", "##posed", "in", "1989", ",", "was", "sentenced", "to", "seven", "years", "in", "prison", "after", "being", "found", "guilty", "of", "em", "##be", "##zz", "##ling", "state", "funds", "." ], "ids": [ 10450, 118, 21935, 112, 187, 11775, 33065, 15014, 49156, 10129, 163, 11924, 10477, 16433, 117, 10104, 76996, 10106, 10524, 117, 10134, 53365, 10114, 15767, 10855, 10106, 20538, 10662, 11223, 11823, 56044, 10108, 10266, 11044, 46671, 11945, 11388, 32067, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 2, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1995", "-", "Dec", "##lari", "##ng", "\"", "united", "Jerusalem", "is", "our", "##s", "\"", ",", "Israel", "launched", "a", "15", "-", "month", "celebration", "of", "the", "3", ",", "000", "##th", "anniversary", "of", "King", "David", "'", "s", "pro", "##clamation", "of", "the", "city", "as", "the", "capital", "of", "the", "Jewish", "people", "." ], "ids": [ 10436, 118, 46147, 15187, 10376, 107, 89284, 20599, 10124, 17446, 10107, 107, 117, 12991, 18850, 169, 10208, 118, 14064, 69173, 10108, 10105, 124, 117, 10259, 11143, 37157, 10108, 11515, 10804, 112, 187, 11284, 106026, 10108, 10105, 11584, 10146, 10105, 12185, 10108, 10105, 17119, 11426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "1995", "-", "The", "Fourth", "World", "Conference", "on", "Women", ",", "the", "biggest", "U", ".", "N", ".", "gathering", "in", "history", ",", "began", "in", "China", "'", "s", "Great", "Hall", "of", "the", "People", "with", "a", "U", ".", "N", ".", "declaration", "that", "sexual", "equality", "was", "the", "last", "great", "project", "of", "the", "20th", "century", "." ], "ids": [ 10436, 118, 10117, 38536, 10315, 16424, 10135, 13536, 117, 10105, 36304, 158, 119, 151, 119, 88666, 10106, 11486, 117, 11941, 10106, 11593, 112, 187, 12592, 11763, 10108, 10105, 14235, 10169, 169, 158, 119, 151, 119, 105108, 10189, 19616, 106411, 10134, 10105, 12469, 14772, 13920, 10108, 10105, 18604, 11943, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 5, 5, 5, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "UK", "lower", "##s", "noise", "limits", "for", "three", "London", "airport", "##s", "." ], "ids": [ 10523, 18165, 10107, 58638, 47418, 10142, 11003, 10829, 28460, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "British", "government", "on", "Wednesday", "lower", "##ed", "the", "noise", "limits", "for", "London", "'", "s", "Heath", "##row", ",", "Ga", "##tw", "##ick", "and", "Stan", "##sted", "airport", "##s", "and", "announced", "it", "would", "make", "a", "bigger", "effort", "in", "det", "##ect", "##ing", "and", "fini", "##ng", "viola", "##tors", "." ], "ids": [ 10117, 11160, 12047, 10135, 57611, 18165, 10336, 10105, 58638, 47418, 10142, 10829, 112, 187, 42676, 21454, 117, 69699, 76797, 20898, 10111, 26637, 36018, 28460, 10107, 10111, 13854, 10271, 10894, 13086, 169, 110102, 24912, 10106, 10349, 56906, 10230, 10111, 59222, 10376, 49698, 24324, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 1, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "limits", ",", "effective", "from", "January", "1", ",", "1997", ",", "are", "reduced", "as", "much", "as", "possible", "while", "still", "com", "##ply", "##ing", "with", "international", "obligations", ",", "a", "spoke", "##sman", "for", "the", "Department", "of", "Transport", "said", "." ], "ids": [ 10117, 47418, 117, 26874, 10188, 11238, 122, 117, 10391, 117, 10301, 25724, 10146, 13172, 10146, 14128, 11371, 12647, 10212, 59146, 10230, 10169, 12533, 101549, 117, 169, 50005, 24305, 10142, 10105, 12933, 10108, 21817, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "The", "maximum", "noise", "level", "during", "the", "day", "is", "trim", "##med", "by", "three", "de", "##ci", "##bel", "##s", "to", "94", ",", "while", "the", "night", "time", "level", "is", "reduced", "by", "two", "de", "##ci", "##bel", "##s", "to", "87", "." ], "ids": [ 10117, 22393, 58638, 13277, 10939, 10105, 11940, 10124, 102859, 21986, 10155, 11003, 10104, 10598, 13770, 10107, 10114, 12749, 117, 11371, 10105, 16903, 10635, 13277, 10124, 25724, 10155, 10551, 10104, 10598, 13770, 10107, 10114, 12581, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "a", "smaller", "reduction", "in", "terms", "of", "lo", "##ud", "##ness", "than", "was", "sought", "by", "local", "people", "." ], "ids": [ 107, 10377, 10124, 169, 23309, 51608, 10106, 18873, 10108, 10406, 11679, 14010, 11084, 10134, 32570, 10155, 11436, 11426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nevertheless", "I", "am", "sat", "##isfied", "that", "the", "overall", "benefits", "will", "be", "worth", "##wil", "##e", ",", "\"", "Lord", "Go", "##schen", ",", "minister", "for", "aviation", ",", "said", "in", "a", "statement", "." ], "ids": [ 71823, 146, 10392, 20694, 108813, 10189, 10105, 20947, 48297, 11337, 10347, 43509, 70185, 10112, 117, 107, 13440, 14439, 12770, 117, 16930, 10142, 45559, 117, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ministry", "said", "it", "believed", "the", "new", "limits", "could", "be", "met", "with", "existing", "aircraft", ".", "\"" ], "ids": [ 10117, 65338, 12415, 10271, 20718, 10105, 10751, 47418, 12174, 10347, 10428, 10169, 26636, 16167, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "can", "be", "flow", "##n", "in", "quiet", "##er", "ways", ",", "\"", "a", "spoke", "##sman", "said", "." ], "ids": [ 11696, 10944, 10347, 30676, 10115, 10106, 104951, 10165, 30360, 117, 107, 169, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "reduction", "in", "noise", "levels", "is", "the", "same", "as", "proposed", "in", "a", "consulta", "##tion", "paper", "which", "was", "published", "in", "October", "1995", "." ], "ids": [ 10117, 51608, 10106, 58638, 21559, 10124, 10105, 11561, 10146, 21622, 10106, 169, 86153, 10822, 17895, 10319, 10134, 12304, 10106, 11212, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "present", "noise", "levels", "have", "applied", "at", "Heath", "##row", ",", "one", "of", "the", "world", "'", "s", "bus", "##iest", "airport", "##s", ",", "since", "1959", "and", "at", "Ga", "##tw", "##ick", "since", "1968", "." ], "ids": [ 10117, 12254, 58638, 21559, 10529, 26850, 10160, 42676, 21454, 117, 10464, 10108, 10105, 11356, 112, 187, 19369, 66820, 28460, 10107, 117, 11764, 10980, 10111, 10160, 69699, 76797, 20898, 11764, 10698, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "The", "number", "of", "monitor", "##s", "will", "be", "increased", "and", "some", "will", "be", "rep", "##osi", "##tion", "##ed", "to", "det", "##ect", "noi", "##sy", "planes", "." ], "ids": [ 10117, 11487, 10108, 60774, 10107, 11337, 10347, 19299, 10111, 11152, 11337, 10347, 76456, 20316, 10822, 10336, 10114, 10349, 56906, 37390, 16105, 39972, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "London", "News", "##room", "+", "44", "171", "542", "771", "##7" ], "ids": [ 118, 118, 10829, 12219, 25525, 116, 11126, 22478, 51620, 65580, 11305 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tennis", "-", "Philipp", "##ous", "##sis", "beats", "Wood", "##ford", "##e", "in", "U", ".", "S", ".", "Open", "." ], "ids": [ 27380, 118, 23293, 13499, 13109, 97257, 18315, 13387, 10112, 10106, 158, 119, 156, 119, 11919, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Philipp", "##ous", "##sis", "beat", "fellow", "Australian", "Mark", "Wood", "##ford", "##e", "6", "-", "7", "(", "6", "-", "8", ")", "6", "-", "3", "6", "-", "3", "6", "-", "3", "in", "a", "men", "'", "s", "singles", "first", "round", "match", "at", "the", "U", ".", "S", ".", "Open", "on", "Tuesday", "." ], "ids": [ 11997, 23293, 13499, 13109, 27868, 24619, 12829, 11997, 18315, 13387, 10112, 127, 118, 128, 113, 127, 118, 129, 114, 127, 118, 124, 127, 118, 124, 127, 118, 124, 10106, 169, 10588, 112, 187, 20527, 10422, 13569, 12356, 10160, 10105, 158, 119, 156, 119, 11919, 10135, 70245, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "The", "two", "Davis", "Cup", "team", "-", "mate", "##s", "were", "pit", "##ted", "against", "each", "other", "after", "last", "week", "'", "s", "controversial", "red", "##ra", "##w", "of", "the", "men", "'", "s", "singles", "competition", "." ], "ids": [ 10117, 10551, 14281, 11544, 11121, 118, 43465, 10107, 10309, 55277, 11912, 11327, 11948, 10684, 10662, 12469, 16118, 112, 187, 45475, 10680, 10288, 10874, 10108, 10105, 10588, 112, 187, 20527, 16622, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Philipp", "##ous", "##sis", "is", "on", "course", "for", "a", "third", "round", "meeting", "with", "world", "number", "one", "Pete", "Sam", "##pra", "##s", "of", "the", "United", "States", ",", "whom", "he", "beat", "at", "the", "Australian", "Open", "last", "January", "." ], "ids": [ 23293, 13499, 13109, 10124, 10135, 15348, 10142, 169, 12628, 13569, 19822, 10169, 11356, 11487, 10464, 23107, 14268, 30631, 10107, 10108, 10105, 10609, 10859, 117, 18104, 10261, 27868, 10160, 10105, 12829, 11919, 12469, 11238, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rugby", "union", "-", "England", "given", "final", "chance", "to", "stay", "in", "Five", "Nations", "." ], "ids": [ 21803, 20763, 118, 11701, 13507, 11070, 27893, 10114, 29597, 10106, 19268, 15145, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "have", "been", "given", "a", "final", "chance", "to", "remain", "in", "the", "Five", "Nations", "'", "championship", "despite", "striking", "an", "exclusive", "television", "deal", "with", "Rupert", "Murdoch", "'", "s", "Sky", "television", "." ], "ids": [ 11701, 10529, 10590, 13507, 169, 11070, 27893, 10114, 25430, 10106, 10105, 19268, 15145, 112, 20755, 22087, 87894, 10151, 50007, 14162, 19918, 10169, 44706, 98283, 112, 187, 13842, 14162, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 3, 9, 9 ] }, { "tokens": [ "In", "a", "statement", "on", "Wednesday", ",", "the", "Four", "Nations", "TV", "Committee", "said", "dates", "had", "been", "set", "for", "a", "competition", "involving", "Scotland", ",", "Wales", ",", "Ireland", "and", "France", "next", "year", "." ], "ids": [ 10167, 169, 33311, 10135, 57611, 117, 10105, 16773, 15145, 10813, 14481, 12415, 27722, 10374, 10590, 11847, 10142, 169, 16622, 40368, 16901, 117, 14137, 117, 14637, 10111, 10688, 13451, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 9, 1, 9, 9, 9 ] }, { "tokens": [ "\"", "Between", "now", "and", "then", ",", "discussions", "will", "take", "place", "in", "one", "final", "attempt", "to", "pers", "##ua", "##de", "the", "Rugby", "Football", "Union", "to", "save", "the", "Five", "Nations", "'", "championship", "in", "its", "current", "form", ",", "\"", "the", "statement", "said", "." ], "ids": [ 107, 22036, 11858, 10111, 11059, 117, 66608, 11337, 13574, 11192, 10106, 10464, 11070, 21395, 10114, 108839, 11908, 10253, 10105, 21803, 12499, 11457, 10114, 32635, 10105, 19268, 15145, 112, 20755, 10106, 10474, 14978, 12188, 117, 107, 10105, 33311, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "further", "details", "were", "immediately", "available", "." ], "ids": [ 10657, 14586, 29500, 10309, 24029, 14579, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "in", "##fur", "##iated", "their", "championship", "colleagues", "when", "they", "decided", "to", "sign", "a", "87", ".", "5", "million", "pounds", "ster", "##ling", "(", "$", "135", ".", "8", "million", ")", "deal", "giving", "Sky", "television", "exclusive", "rights", "to", "rugby", "union", "matches", "in", "England", "." ], "ids": [ 11701, 10106, 33874, 89771, 10455, 20755, 75312, 10841, 10689, 17270, 10114, 26794, 169, 12581, 119, 126, 12473, 61982, 78342, 11945, 113, 109, 16364, 119, 129, 12473, 114, 19918, 24426, 13842, 14162, 50007, 16691, 10114, 19812, 20763, 18258, 10106, 11701, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "present", "contract", "with", "the", "British", "Broadcasting", "Corporation", "was", "shared", "between", "the", "four", "home", "nations", "while", "France", "have", "their", "own", "television", "deal", "." ], "ids": [ 10117, 12254, 16108, 10169, 10105, 11160, 28362, 14456, 10134, 29054, 10948, 10105, 11598, 11816, 30683, 11371, 10688, 10529, 10455, 12542, 14162, 19918, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "month", "Five", "Nations", "'", "committee", "chairman", "Tom", "Ki", "##erna", "##n", "said", "England", "would", "be", "thrown", "out", "of", "the", "competition", "\"", "unless", "circumstances", "change", "in", "the", "near", "future", "\"", "." ], "ids": [ 14812, 14064, 19268, 15145, 112, 27634, 27627, 12275, 28941, 19753, 10115, 12415, 11701, 10894, 10347, 88590, 10950, 10108, 10105, 16622, 107, 60015, 54186, 15453, 10106, 10105, 12883, 16711, 107, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cricket", "-", "NZ", "face", "tou", "##gh", "schedule", "at", "home", "and", "abroad", "." ], "ids": [ 31125, 118, 105920, 13295, 52586, 15774, 52561, 10160, 11816, 10111, 50901, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "World", "Cup", "cricket", "champions", "Sri", "Lanka", "will", "play", "two", "tests", "and", "three", "one", "-", "day", "international", "##s", "in", "a", "tour", "of", "New", "Zealand", "next", "March", ",", "officials", "said", "on", "Wednesday", "." ], "ids": [ 10315, 11544, 32289, 27745, 16098, 20828, 11337, 12253, 10551, 34926, 10111, 11003, 10464, 118, 11940, 12533, 10107, 10106, 169, 12842, 10108, 10287, 14451, 13451, 11144, 117, 27730, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "Zealand", "Cricket", "said", "the", "Sri", "Lanka", "##ns", "would", "play", "tests", "in", "Hamilton", "and", "Wellington", "and", "one", "-", "day", "##ers", "in", "Auckland", ",", "Christchurch", "and", "Du", "##ned", "##in", ",", "following", "hard", "on", "the", "heel", "##s", "of", "a", "tour", "by", "England", "." ], "ids": [ 10287, 14451, 31125, 12415, 10105, 16098, 20828, 10891, 10894, 12253, 34926, 10106, 15846, 10111, 28557, 10111, 10464, 118, 11940, 10901, 10106, 33920, 117, 90380, 10111, 14925, 17021, 10245, 117, 11901, 19118, 10135, 10105, 39965, 10107, 10108, 169, 12842, 10155, 11701, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "New", "Zealand", "will", "also", "line", "up", "against", "Sri", "Lanka", "and", "Pakistan", "this", "November", "in", "a", "one", "-", "day", "champions", "trophy", "competition", "in", "Sha", "##rja", "##h", "." ], "ids": [ 10287, 14451, 11337, 10379, 12117, 10741, 11327, 16098, 20828, 10111, 15437, 10531, 10819, 10106, 169, 10464, 118, 11940, 27745, 103045, 16622, 10106, 106583, 26914, 10237, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "team", "will", "go", "one", "to", "tour", "Pakistan", ",", "playing", "two", "tests", "and", "three", "one", "-", "day", "international", "##s", "." ], "ids": [ 10117, 11121, 11337, 11783, 10464, 10114, 12842, 15437, 117, 14879, 10551, 34926, 10111, 11003, 10464, 118, 11940, 12533, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Soccer", "-", "Burundi", "dis", "##qual", "##ification", "from", "African", "Cup", "confirmed", "." ], "ids": [ 25914, 118, 57824, 27920, 102260, 29748, 10188, 13839, 11544, 27347, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "CA", "##IR", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 24707, 73522, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "African", "Football", "Confederation", "(", "CAF", ")", "on", "Wednesday", "formally", "confirmed", "Burundi", "'", "s", "dis", "##qual", "##ification", "from", "the", "African", "Nations", "Cup", "following", "the", "team", "'", "s", "ina", "##bility", "to", "travel", "for", "a", "qualifier", "against", "Central", "African", "Republic", "." ], "ids": [ 10117, 13839, 12499, 85398, 113, 67853, 114, 10135, 57611, 43082, 27347, 57824, 112, 187, 27920, 102260, 29748, 10188, 10105, 13839, 15145, 11544, 11901, 10105, 11121, 112, 187, 22944, 20838, 10114, 23595, 10142, 169, 96076, 11327, 11885, 13839, 13681, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 3, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "Burundi", "team", "were", "unable", "to", "leave", "their", "trouble", "##d", "country", "for", "a", "preliminary", "round", "first", "leg", "match", "in", "Bang", "##ui", "earlier", "this", "month", "because", "of", "an", "air", "ban", "imposed", "in", "a", "recent", "set", "of", "internationally", "-", "sponsored", "san", "##ctions", "." ], "ids": [ 10117, 57824, 11121, 10309, 30553, 10114, 21964, 10455, 58285, 10162, 12723, 10142, 169, 68097, 13569, 10422, 33810, 12356, 10106, 24453, 11990, 18905, 10531, 14064, 12373, 10108, 10151, 12566, 11915, 83358, 10106, 169, 19037, 11847, 10108, 58504, 118, 44747, 14608, 42068, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Central", "African", "Republic", "qualified", "on", "a", "walk", "##over", "to", "play", "in", "group", "four", "with", "Guinea", ",", "Sierra", "Leone", "and", "Tunisia", "." ], "ids": [ 10117, 11885, 13839, 13681, 32244, 10135, 169, 33734, 16666, 10114, 12253, 10106, 11795, 11598, 10169, 17209, 117, 16899, 29578, 10111, 51173, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ "\"", "After", "ex", "##ami", "##ning", "the", "dossier", "of", "the", "Burundi", "-", "Central", "Africa", "match", ",", "we", "decided", ".", ".", "." ], "ids": [ 107, 11301, 11419, 13311, 11269, 10105, 104554, 10108, 10105, 57824, 118, 11885, 12880, 12356, 117, 11951, 17270, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "to", "dis", "##qual", "##ify", "the", "national", "team", "of", "Burundi", "from", "the", "21st", "African", "Cup", "of", "Nations", ".", ".", "." ], "ids": [ 10114, 27920, 102260, 48281, 10105, 11844, 11121, 10108, 57824, 10188, 10105, 38408, 13839, 11544, 10108, 15145, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "as", "a", "result", "of", "the", "absence", "of", "this", "team", "from", "the", "match", ",", "\"", "CAF", "said", "in", "a", "statement", "." ], "ids": [ 10146, 169, 14493, 10108, 10105, 28589, 10108, 10531, 11121, 10188, 10105, 12356, 117, 107, 67853, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cricket", "-", "India", "226", "-", "5", "in", "50", "over", "##s", "v", "Sri", "Lanka", "." ], "ids": [ 31125, 118, 11098, 23776, 118, 126, 10106, 10462, 10491, 10107, 190, 16098, 20828, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "scored", "226", "for", "five", "wickets", "in", "their", "50", "over", "##s", "against", "Sri", "Lanka", "in", "the", "second", "day", "-", "night", "limited", "over", "##s", "match", "of", "the", "Singer", "World", "Series", "tournament", "on", "Wednesday", "." ], "ids": [ 11098, 17233, 23776, 10142, 12403, 83839, 10106, 10455, 10462, 10491, 10107, 11327, 16098, 20828, 10106, 10105, 11132, 11940, 118, 16903, 19264, 10491, 10107, 12356, 10108, 10105, 29842, 10315, 13239, 17390, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Canada", "fast", "-", "tracks", "Chinese", "as", "##ylum", "-", "seek", "##ers", "-", "report", "." ], "ids": [ 11635, 15040, 118, 17965, 13299, 10146, 54716, 118, 48394, 10901, 118, 17553, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VA", "##NC", "##O", "##U", "##VE", "##R", ",", "British", "Columbia", "1996", "-", "08", "-", "28" ], "ids": [ 69342, 100230, 11403, 12022, 68560, 11273, 117, 11160, 13469, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Canada", "is", "fast", "-", "tracking", "immigration", "applications", "from", "Chinese", "dis", "##siden", "##ts", "in", "Hong", "Kong", "before", "the", "British", "colony", "rev", "##erts", "to", "China", "'", "s", "control", "next", "year", ",", "the", "Vancouver", "Sun", "reported", "on", "Wednesday", "." ], "ids": [ 11635, 10124, 15040, 118, 108307, 55031, 26066, 10188, 13299, 27920, 42323, 10806, 10106, 15078, 14577, 11360, 10105, 11160, 48968, 86095, 64115, 10114, 11593, 112, 187, 12608, 13451, 10924, 117, 10105, 21541, 13967, 15943, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "applications", "are", "being", "\"", "fast", "-", "track", "##ed", "in", "the", "sense", "that", "we", "are", "processing", "them", "and", "the", "ones", "who", "have", "been", "referred", "to", "us", "have", "been", "interviewed", ",", "\"", "the", "newspaper", "quoted", "Garrett", "Lambert", ",", "Canada", "'", "s", "high", "commissione", "##r", "in", "Hong", "Kong", ",", "as", "saying", "." ], "ids": [ 10117, 26066, 10301, 11223, 107, 15040, 118, 14310, 10336, 10106, 10105, 15495, 10189, 11951, 10301, 42375, 11345, 10111, 10105, 35688, 10479, 10529, 10590, 19884, 10114, 19626, 10529, 10590, 94501, 117, 107, 10105, 22047, 70676, 48209, 28093, 117, 11635, 112, 187, 11846, 96579, 10129, 10106, 15078, 14577, 117, 10146, 22807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "A", "small", "number", "already", "have", "preliminary", "indication", "##s", "as", "to", "what", "the", "disposition", "of", "their", "cases", "are", "and", "so", "I", "su", "##ppo", "##se", "in", "that", "sense", ",", "I", "gu", "##ess", "we", "have", "given", "them", "some", "pre", "##fere", "##ntial", "treatment", ",", "\"", "Lambert", "said", "." ], "ids": [ 107, 138, 12474, 11487, 19034, 10529, 68097, 102383, 10107, 10146, 10114, 12976, 10105, 65842, 10108, 10455, 16480, 10301, 10111, 10380, 146, 10198, 45565, 10341, 10106, 10189, 15495, 117, 146, 75980, 22094, 11951, 10529, 13507, 11345, 11152, 12229, 50544, 109902, 21379, 117, 107, 28093, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "He", "declined", "to", "say", "how", "many", "people", "were", "being", "considered", "for", "as", "##ylum", "." ], "ids": [ 10357, 44948, 10114, 23763, 14796, 11299, 11426, 10309, 11223, 14289, 10142, 10146, 54716, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Canada", "'", "s", "ministry", "of", "foreign", "affairs", "in", "Ottawa", "had", "no", "immediate", "comment", "on", "the", "report", "." ], "ids": [ 11635, 112, 187, 65338, 10108, 20796, 43417, 10106, 13731, 10374, 10192, 46938, 49641, 10135, 10105, 17553, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "About", "80", "Chinese", "dis", "##siden", "##ts", "are", "believed", "to", "be", "living", "in", "exile", "in", "Hong", "Kong", "." ], "ids": [ 16260, 10832, 13299, 27920, 42323, 10806, 10301, 20718, 10114, 10347, 14625, 10106, 67696, 10106, 15078, 14577, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Their", "fate", "after", "the", "territory", "rev", "##erts", "to", "Chinese", "rule", "is", "unclear", "." ], "ids": [ 17551, 75633, 10662, 10105, 24399, 86095, 64115, 10114, 13299, 21983, 10124, 94475, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "hands", "Hong", "Kong", "back", "to", "China", "at", "mid", "##night", "on", "June", "30", ",", "1997", ",", "after", "150", "years", "of", "colonial", "rule", "." ], "ids": [ 16032, 27925, 15078, 14577, 12014, 10114, 11593, 10160, 15607, 45217, 10135, 11120, 10244, 117, 10391, 117, 10662, 11766, 10855, 10108, 26098, 21983, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Canada", "'", "s", "Minister", "of", "Foreign", "Affairs", "Lloyd", "A", "##x", "##worthy", "said", "after", "meeting", "Hong", "Kong", "Go", "##v", "." ], "ids": [ 11635, 112, 187, 14355, 10108, 20277, 20891, 19345, 138, 10686, 102786, 12415, 10662, 19822, 15078, 14577, 14439, 10477, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Chris", "Pat", "##ten", "last", "month", "that", "Canada", "may", "grant", "as", "##ylum", "to", "dis", "##siden", "##ts", "who", "have", "fled", "to", "Hong", "Kong", "from", "China", "." ], "ids": [ 13151, 24714, 10681, 12469, 14064, 10189, 11635, 11387, 41100, 10146, 54716, 10114, 27920, 42323, 10806, 10479, 10529, 56598, 10114, 15078, 14577, 10188, 11593, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ "Chinese", "officials", "have", "said", "such", "dis", "##siden", "##ts", "may", "not", "become", "Hong", "Kong", "permanent", "residents", "since", "they", "entered", "the", "territory", "illegal", "##ly", "but", "have", "also", "said", "their", "status", "would", "be", "decided", "by", "the", "post", "-", "1997", "local", "Hong", "Kong", "administration", "." ], "ids": [ 13299, 27730, 10529, 12415, 11049, 27920, 42323, 10806, 11387, 10472, 13461, 15078, 14577, 21295, 22058, 11764, 10689, 19226, 10105, 24399, 39806, 10454, 10473, 10529, 10379, 12415, 10455, 14042, 10894, 10347, 17270, 10155, 10105, 11841, 118, 10391, 11436, 15078, 14577, 17941, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "Ivo", "##rian", "journalist", "held", ",", "asked", "to", "reveal", "source", "." ], "ids": [ 46024, 20764, 22655, 11991, 117, 22151, 10114, 75790, 15247, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AB", "##ID", "##J", "##AN", "1996", "-", "08", "-", "28" ], "ids": [ 21644, 28895, 15417, 41275, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Ivo", "##rian", "journalist", "spent", "a", "third", "day", "in", "custody", "on", "Wednesday", "and", "in", "##vesti", "##gator", "##s", "were", "demand", "##ing", "that", "he", "reveal", "the", "source", "of", "an", "official", "document", "published", "in", "his", "newspaper", ",", "colleagues", "said", "." ], "ids": [ 10313, 46024, 20764, 22655, 18571, 169, 12628, 11940, 10106, 103772, 10135, 57611, 10111, 10106, 63996, 75791, 10107, 10309, 34394, 10230, 10189, 10261, 75790, 10105, 15247, 10108, 10151, 14731, 25166, 12304, 10106, 10226, 22047, 117, 75312, 12415, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Raphael", "La", "##p", "##ke", ",", "publication", "director", "of", "Ivo", "##rian", "newspaper", "Le", "Pop", "##ulaire", ",", "was", "taken", "in", "for", "question", "##ing", "on", "Monday", "over", "an", "article", "about", "the", "public", "prose", "##cutor", "and", "has", "been", "det", "##ained", "since", "then", "." ], "ids": [ 58514, 10159, 10410, 10550, 117, 16877, 12461, 10108, 46024, 20764, 22047, 10281, 17565, 41578, 117, 10134, 15109, 10106, 10142, 20210, 10230, 10135, 40714, 10491, 10151, 13262, 10978, 10105, 11683, 84145, 98957, 10111, 10393, 10590, 10349, 65804, 11764, 11059, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 2, 6, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colle", "##agu", "##es", "said", "he", "had", "been", "charged", "with", "the", "##ft", "of", "administrative", "documents", ".", "\"" ], "ids": [ 97461, 47540, 10171, 12415, 10261, 10374, 10590, 38253, 10169, 10105, 12961, 10108, 18401, 21784, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "is", "being", "asked", "for", "the", "source", "of", "his", "information", "and", "who", "gave", "him", "this", "con", "##fi", "##dent", "##ial", "document", ",", "\"", "one", "coll", "##eague", "told", "Reuters", "." ], "ids": [ 10357, 10124, 11223, 22151, 10142, 10105, 15247, 10108, 10226, 12929, 10111, 10479, 15362, 10957, 10531, 10173, 14403, 21029, 15619, 25166, 117, 107, 10464, 28552, 85352, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Three", "journalists", "from", "the", "Ivo", "##rian", "opposition", "daily", "La", "Vo", "##ie", "are", "serving", "two", "-", "year", "prison", "terms", "for", "ins", "##ult", "##ing", "President", "Henri", "Ko", "##nan", "Bed", "##ie", "." ], "ids": [ 15139, 85851, 10188, 10105, 46024, 20764, 21227, 27636, 10159, 59482, 10400, 10301, 20252, 10551, 118, 10924, 20538, 18873, 10142, 15498, 16203, 10230, 12811, 13612, 30186, 13470, 76757, 10400, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "A", "court", "sentenced", "two", "in", "December", "and", "the", "third", "in", "January", "." ], "ids": [ 138, 14866, 53365, 10551, 10106, 11288, 10111, 10105, 12628, 10106, 11238, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "La", "Vo", "##ie", "published", "an", "article", "suggesting", "the", "presence", "of", "Bed", "##ie", "had", "brought", "local", "team", "AS", "##EC", "bad", "lu", "##ck", "during", "their", "defeat", "by", "Orlando", "Pirates", "of", "South", "Africa", "in", "the", "final", "of", "the", "African", "Champions", "Cup", "in", "December", "." ], "ids": [ 10159, 59482, 10400, 12304, 10151, 13262, 85404, 10105, 25599, 10108, 76757, 10400, 10374, 17327, 11436, 11121, 17421, 35826, 15838, 14657, 11263, 10939, 10455, 24800, 10155, 25978, 41839, 10108, 11056, 12880, 10106, 10105, 11070, 10108, 10105, 13839, 17441, 11544, 10106, 11288, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 1, 5, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "The", "United", "States", "em", "##bas", "##sy", "in", "Abi", "##djan", "and", "international", "press", "organisations", "den", "##oun", "##ced", "the", "sentence", "##s", "as", "excessive", "." ], "ids": [ 10117, 10609, 10859, 10266, 21322, 16105, 10106, 101604, 69062, 10111, 12533, 21040, 41536, 10140, 43971, 38039, 10105, 49219, 10107, 10146, 101215, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "year", ",", "Bed", "##ie", "par", "##done", "##d", "four", "journalists", "jail", "##ed", "for", "the", "same", "or", "similar", "offen", "##ces", "." ], "ids": [ 14812, 10924, 117, 76757, 10400, 10248, 99726, 10162, 11598, 85851, 75934, 10336, 10142, 10105, 11561, 10345, 13213, 84646, 14585, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "included", "one", "of", "the", "three", "La", "Vo", "##ie", "journalists", "." ], "ids": [ 11696, 12742, 10464, 10108, 10105, 11003, 10159, 59482, 10400, 85851, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Bed", "##ie", "par", "##done", "##d", "two", "other", "journalists", "jail", "##ed", "for", "in", "##cite", "##ment", "to", "dis", "##tur", "##b", "public", "order", "." ], "ids": [ 76757, 10400, 10248, 99726, 10162, 10551, 10684, 85851, 75934, 10336, 10142, 10106, 46963, 10426, 10114, 27920, 15698, 10457, 11683, 12990, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Village", "attack", "kills", "38", "in", "eastern", "Sierra", "Leone", "." ], "ids": [ 15216, 16342, 69179, 11171, 10106, 18677, 16899, 29578, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "FR", "##EE", "##TO", "##WN", "1996", "-", "08", "-", "28" ], "ids": [ 64655, 95825, 60493, 105844, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sierra", "Leone", "##an", "rebels", "killed", "31", "village", "##rs", "and", "seven", "soldiers", "in", "an", "attack", "on", "the", "eastern", "village", "of", "Foi", "##ndu", ",", "Eastern", "Region", "Brigade", "Commander", "Major", "Fall", "##ah", "Se", "##wa", "said", "on", "Wednesday", "." ], "ids": [ 16899, 29578, 10206, 57545, 15875, 10413, 11607, 10943, 10111, 15767, 23324, 10106, 10151, 16342, 10135, 10105, 18677, 11607, 10108, 13727, 56913, 117, 16311, 13919, 21909, 25783, 14988, 15750, 12257, 11045, 11037, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 3, 7, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Se", "##wa", "said", "the", "rebels", "over", "##ran", "Foi", "##ndu", "despite", "the", "presence", "of", "government", "troops", "in", "the", "village", "on", "the", "highway", "between", "Man", "##o", "Junction", "and", "the", "dia", "##mond", "town", "of", "Tong", "##o", "Field", "." ], "ids": [ 11045, 11037, 12415, 10105, 57545, 10491, 12111, 13727, 56913, 22087, 10105, 25599, 10108, 12047, 20836, 10106, 10105, 11607, 10135, 10105, 31729, 10948, 11343, 10133, 39573, 10111, 10105, 10671, 25677, 12221, 10108, 67119, 10133, 16003, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "An", "army", "spoke", "##sman", "in", "Free", "##town", "said", "Monday", "night", "'", "s", "attack", "was", "the", "third", "on", "a", "military", "post", "in", "the", "past", "week", "." ], "ids": [ 10313, 17977, 50005, 24305, 10106, 16122, 17915, 12415, 40714, 16903, 112, 187, 16342, 10134, 10105, 12628, 10135, 169, 14041, 11841, 10106, 10105, 17781, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rebel", "##s", "of", "the", "Revolutionary", "United", "Front", "agreed", "a", "cea", "##sef", "##ire", "in", "April", "." ], "ids": [ 54470, 10107, 10108, 10105, 52514, 10609, 19241, 25577, 169, 25578, 107749, 11627, 10106, 10780, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Conti", "##nu", "##ing", "attacks", "are", "generally", "as", "##cribed", "to", "ren", "##ega", "##de", "soldiers", "or", "un", "##con", "##tro", "##lle", "##d", "bands", "of", "rebels", "and", "refugees", "dis", "##placed", "by", "the", "fighting", "starting", "to", "return", "to", "their", "homes", "." ], "ids": [ 68918, 11147, 10230, 26483, 10301, 18081, 10146, 66427, 10114, 63256, 19172, 10253, 23324, 10345, 10119, 23486, 14239, 11270, 10162, 28781, 10108, 57545, 10111, 71797, 27920, 93570, 10155, 10105, 27535, 21868, 10114, 15079, 10114, 10455, 14154, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peace", "talks", "in", "Ivory", "Coast", "began", "in", "February", "." ], "ids": [ 20705, 56672, 10106, 83233, 17498, 11941, 10106, 11508, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Diplomat", "##s", "say", "they", "are", "dead", "##locke", "##d", "over", "the", "R", "##UF", "'", "s", "ins", "##isten", "##ce", "that", "foreign", "troops", "helping", "the", "government", "army", "should", "leave", ",", "and", "that", "they", "should", "have", "some", "say", "in", "the", "allo", "##cation", "of", "budget", "spending", "." ], "ids": [ 101849, 10107, 23763, 10689, 10301, 23457, 93986, 10162, 10491, 10105, 155, 103104, 112, 187, 15498, 17146, 10419, 10189, 20796, 20836, 45752, 10105, 12047, 17977, 14819, 21964, 117, 10111, 10189, 10689, 14819, 10529, 11152, 23763, 10106, 10105, 20779, 26287, 10108, 25293, 51163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aid", "agency", "says", "Sudan", "mission", "##aries", "released", "." ], "ids": [ 68407, 34649, 22153, 28407, 17032, 26445, 11539, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##IR", "##O", "##B", "##I", "1996", "-", "08", "-", "28" ], "ids": [ 56586, 73522, 11403, 11274, 11281, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "aid", "agency", "said", "six", "Roman", "Catholic", "mission", "##aries", ",", "including", "three", "Australian", "nun", "##s", ",", "were", "free", "##d", "by", "rebels", "in", "southern", "Sudan", "on", "Wednesday", "after", "being", "held", "for", "nearly", "two", "weeks", "." ], "ids": [ 10313, 19778, 34649, 12415, 12449, 12359, 15473, 17032, 26445, 117, 11198, 11003, 12829, 11715, 10107, 117, 10309, 13961, 10162, 10155, 57545, 10106, 17156, 28407, 10135, 57611, 10662, 11223, 11991, 10142, 21377, 10551, 20750, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Catholic", "church", "officials", "said", "they", "had", "no", "con", "##firmation", "of", "the", "report", "and", "would", "have", "to", "wait", "until", "Thursday", "to", "be", "sure", "." ], "ids": [ 16976, 15473, 14201, 27730, 12415, 10689, 10374, 10192, 10173, 80735, 10108, 10105, 17553, 10111, 10894, 10529, 10114, 83279, 11444, 67067, 10114, 10347, 62452, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zambia", "'", "s", "Chi", "##lub", "##a", "shu", "##ffle", "##s", "cabinet", "to", "fill", "va", "##can", "##cy", "." ], "ids": [ 53937, 112, 187, 21946, 63488, 10113, 73495, 66267, 10107, 33801, 10114, 20241, 10321, 24154, 11710, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##US", "##A", "##KA", "1996", "-", "08", "-", "28" ], "ids": [ 149, 32612, 10738, 67813, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Zambia", "##n", "President", "Frederick", "Chi", "##lub", "##a", "shu", "##ffle", "##d", "his", "cabinet", "on", "Wednesday", "to", "fill", "a", "va", "##can", "##cy", "left", "after", "the", "sac", "##king", "of", "Legal", "Affairs", "Minister", "Re", "##mmy", "Mus", "##hota", "." ], "ids": [ 53937, 10115, 12811, 17132, 21946, 63488, 10113, 73495, 66267, 10162, 10226, 33801, 10135, 57611, 10114, 20241, 169, 10321, 24154, 11710, 12153, 10662, 10105, 109436, 15629, 10108, 43109, 20891, 14355, 20304, 73549, 31013, 86931, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Mus", "##hota", "was", "fired", "a", "month", "ago", "after", "a", "government", "tribunal", "found", "he", "tried", "to", "withdraw", "cash", "from", "state", "co", "##ffers", "without", "authority", "." ], "ids": [ 31013, 86931, 10134, 38903, 169, 14064, 36390, 10662, 169, 12047, 35376, 11823, 10261, 27156, 10114, 100987, 52828, 10188, 11388, 11170, 85779, 13663, 26772, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "president", "'", "s", "office", "said", "in", "a", "statement", "that", "Lands", "Minister", "Lu", "##min", "##zu", "Shi", "##ma", "##pon", "##da", "had", "been", "appointed", "Legal", "Affairs", "Minister", ",", "while", "Deputy", "Foreign", "Minister", "Peter", "Mach", "##ung", "##wa", "would", "take", "over", "from", "Shi", "##ma", "##pon", "##da", "." ], "ids": [ 10117, 12931, 112, 187, 14301, 12415, 10106, 169, 33311, 10189, 79847, 14355, 23859, 14956, 13078, 44795, 10369, 27119, 10229, 10374, 10590, 14896, 43109, 20891, 14355, 117, 11371, 32389, 20277, 14355, 10979, 65654, 10716, 11037, 10894, 13574, 10491, 10188, 44795, 10369, 27119, 10229, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Guinea", "launch", "##es", "war", "on", "fi", "##cti", "##tio", "##us", "civil", "servant", "##s", "." ], "ids": [ 17209, 29227, 10171, 10338, 10135, 14045, 76344, 24008, 10251, 14161, 53211, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##NA", "##K", "##R", "##Y", "1996", "-", "08", "-", "28" ], "ids": [ 32992, 36742, 11733, 11273, 14703, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Guinea", "launched", "a", "drive", "on", "Wednesday", "to", "ri", "##d", "the", "civil", "service", "pay", "##roll", "of", "fi", "##cti", "##tio", "##us", "workers", "as", "part", "of", "new", "prime", "minister", "Sidi", "##a", "Tour", "##e", "'", "s", "campaign", "to", "cut", "government", "spending", "." ], "ids": [ 17209, 18850, 169, 23806, 10135, 57611, 10114, 29956, 10162, 10105, 14161, 11989, 16868, 51091, 10108, 14045, 76344, 24008, 10251, 23829, 10146, 10668, 10108, 10751, 19287, 16930, 56501, 10113, 11595, 10112, 112, 187, 17323, 10114, 21610, 12047, 51163, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deputy", "Minister", "for", "Finance", "Ou", "##sman", "##e", "Ka", "##ba", "said", "teams", "of", "inspector", "##s", "would", "check", "government", "offices", "in", "the", "capital", "and", "the", "provinces", "to", "root", "out", "civil", "servant", "##s", "who", "drew", "sala", "##ries", "but", "had", "left", "their", "jobs", ",", "were", "dead", ",", "or", "had", "never", "existed", "." ], "ids": [ 32389, 14355, 10142, 38533, 47060, 24305, 10112, 25444, 10537, 12415, 14404, 10108, 104701, 10107, 10894, 43662, 12047, 29918, 10106, 10105, 12185, 10111, 10105, 31209, 10114, 47887, 10950, 14161, 53211, 10107, 10479, 49098, 20509, 15388, 10473, 10374, 12153, 10455, 45083, 117, 10309, 23457, 117, 10345, 10374, 14794, 45548, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "50", "million", "Guinea", "##n", "francs", "(", "$", "50", ",", "000", ")", "has", "been", "pump", "##ed", "into", "the", "exercise", "to", "det", "##er", "the", "inspector", "##s", "from", "taking", "br", "##ibes", "." ], "ids": [ 13885, 10462, 12473, 17209, 10115, 49303, 113, 109, 10462, 117, 10259, 114, 10393, 10590, 106392, 10336, 10708, 10105, 56120, 10114, 10349, 10165, 10105, 104701, 10107, 10188, 18084, 33989, 74844, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ka", "##ba", "told", "reporter", "##s", "the", "annual", "wa", "##ge", "bill", "of", "171", "billion", "Guinea", "##n", "francs", "represented", "50", "percent", "of", "current", "state", "ex", "##pend", "##itur", "##e", ",", "\"", "whereas", "the", "accept", "##able", "proportion", "in", "countries", "similar", "to", "our", "##s", "is", "one", "third", "\"", "." ], "ids": [ 25444, 10537, 21937, 41408, 10107, 10105, 19246, 11471, 10525, 34497, 10108, 22478, 25848, 17209, 10115, 49303, 18839, 10462, 22362, 10108, 14978, 11388, 11419, 63592, 96065, 10112, 117, 107, 47761, 10105, 45218, 13096, 66410, 10106, 15911, 13213, 10114, 17446, 10107, 10124, 10464, 12628, 107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tour", "##e", ",", "who", "took", "office", "last", "month", ",", "has", "said", "he", "plans", "to", "cut", "public", "service", "spending", "by", "30", "percent", "by", "the", "end", "of", "the", "year", "as", "part", "of", "measures", "to", "rev", "##ive", "the", "economy", "." ], "ids": [ 11595, 10112, 117, 10479, 12149, 14301, 12469, 14064, 117, 10393, 12415, 10261, 18195, 10114, 21610, 11683, 11989, 51163, 10155, 10244, 22362, 10155, 10105, 11572, 10108, 10105, 10924, 10146, 10668, 10108, 38606, 10114, 86095, 11942, 10105, 27570, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Guinea", "is", "rich", "in", "minerals", "and", "has", "a", "vast", "potential", "for", "hyd", "##roe", "##lec", "##tric", "power", "generation", "but", "it", "faces", "st", "##iff", "competition", "from", "its", "West", "African", "nei", "##gh", "##bours", "for", "foreign", "investment", "." ], "ids": [ 17209, 10124, 33250, 10106, 73388, 10111, 10393, 169, 35472, 23078, 10142, 56888, 86564, 42507, 45463, 13183, 25601, 10473, 10271, 48343, 28780, 31025, 16622, 10188, 10474, 11164, 13839, 11888, 15774, 97497, 10142, 20796, 37933, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Lan", "##sana", "Conte", "appointed", "Tour", "##e", ",", "a", "former", "senior", "civil", "servant", "in", "Ivory", "Coast", ",", "last", "month", "to", "clean", "up", "the", "administration", "and", "reform", "the", "economy", "following", "February", "'", "s", "blood", "##y", "army", "revolt", "." ], "ids": [ 12811, 19670, 51308, 49082, 14896, 11595, 10112, 117, 169, 11775, 17843, 14161, 53211, 10106, 83233, 17498, 117, 12469, 14064, 10114, 55911, 10741, 10105, 17941, 10111, 34800, 10105, 27570, 11901, 11508, 112, 187, 24911, 10157, 17977, 99737, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "$", "=", "1", ",", "000", "Guinea", "##n", "francs", ")" ], "ids": [ 113, 109, 134, 122, 117, 10259, 17209, 10115, 49303, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "New", "Liberia", "Council", "chief", "to", "be", "installed", "Tuesday", "." ], "ids": [ 10287, 59169, 12821, 19421, 10114, 10347, 34398, 70245, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NR", "##O", "##VI", "##A", "1996", "-", "08", "-", "28" ], "ids": [ 102059, 93776, 11403, 90939, 10738, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ruth", "Perry", ",", "the", "woman", "with", "the", "task", "of", "unit", "##ing", "Liberia", "'", "s", "sq", "##ua", "##bb", "##ling", "faction", "##s", "around", "the", "latest", "peace", "plan", ",", "will", "be", "formally", "installed", "as", "head", "of", "the", "ruling", "State", "Council", "next", "Tuesday", ",", "a", "Council", "statement", "said", "." ], "ids": [ 23979, 20191, 117, 10105, 18299, 10169, 10105, 37758, 10108, 16511, 10230, 59169, 112, 187, 27164, 11908, 14496, 11945, 84395, 10107, 12166, 10105, 50908, 28101, 13065, 117, 11337, 10347, 43082, 34398, 10146, 13578, 10108, 10105, 50788, 11104, 12821, 13451, 70245, 117, 169, 12821, 33311, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "Perry", ",", "a", "Liberia", "##n", "Senate", "member", "during", "the", "1980s", ",", "returned", "to", "Mon", "##rov", "##ia", "on", "August", "22", "after", "West", "African", "leaders", "nominated", "her", "for", "the", "job", "under", "a", "peace", "deal", "signed", "in", "Nigeria", "'", "s", "capital", "Abu", "##ja", "five", "days", "earlier", "." ], "ids": [ 20191, 117, 169, 59169, 10115, 22294, 12008, 10939, 10105, 21215, 117, 14030, 10114, 39473, 23229, 10280, 10135, 10735, 10306, 10662, 11164, 13839, 24155, 25906, 10485, 10142, 10105, 23627, 10571, 169, 28101, 19918, 14775, 10106, 22045, 112, 187, 12185, 18332, 10320, 12403, 13990, 18905, 119 ], "entity": [ "B-PER", "O", "O", "B-MISC", "I-MISC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 2, 6, 3, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "The", "formal", "inauguration", "had", "been", "due", "to", "take", "place", "this", "week", "but", "was", "put", "back", "." ], "ids": [ 10117, 23129, 98587, 10374, 10590, 10850, 10114, 13574, 11192, 10531, 16118, 10473, 10134, 14499, 12014, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "no", "official", "explanation", "but", "politicians", "said", "faction", "leaders", "and", "State", "Council", "vice", "-", "chair", "##men", "Charles", "Taylor", "and", "Al", "##had", "##ji", "Kr", "##oma", "##h", "were", "unable", "to", "attend", "because", "they", "were", "travelling", "." ], "ids": [ 11723, 10134, 10192, 14731, 88840, 10473, 75284, 12415, 84395, 24155, 10111, 11104, 12821, 16543, 118, 40006, 11418, 10925, 13399, 10111, 10883, 33796, 10775, 17640, 17039, 10237, 10309, 30553, 10114, 34465, 12373, 10689, 10309, 81353, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Liberia", "'", "s", "civil", "war", ",", "launched", "by", "Taylor", "in", "1989", ",", "has", "killed", "well", "over", "150", ",", "000", "people", "." ], "ids": [ 59169, 112, 187, 14161, 10338, 117, 18850, 10155, 13399, 10106, 10524, 117, 10393, 15875, 11206, 10491, 11766, 117, 10259, 11426, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fact", "##ion", "fighting", "and", "an", "org", "##y", "of", "lo", "##oti", "##ng", "in", "the", "capital", "Mon", "##rov", "##ia", "in", "April", "and", "May", "killed", "hundreds", "of", "people", "." ], "ids": [ 85245, 11046, 27535, 10111, 10151, 10733, 10157, 10108, 10406, 23841, 10376, 10106, 10105, 12185, 39473, 23229, 10280, 10106, 10780, 10111, 10725, 15875, 48329, 10108, 11426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "a", "dozen", "peace", "deals", "have", "collapsed", "." ], "ids": [ 15704, 169, 84956, 28101, 78037, 10529, 93621, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "latest", "sets", "a", "time", "##table", "for", "disa", "##rma", "##ment", "by", "the", "end", "of", "January", "and", "elections", "by", "May", "30", "." ], "ids": [ 10117, 50908, 23597, 169, 10635, 30434, 10142, 36474, 25248, 10426, 10155, 10105, 11572, 10108, 11238, 10111, 22054, 10155, 10725, 10244, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "West", "African", "leaders", "have", "threatened", "individual", "san", "##ctions", "against", "faction", "leaders", "to", "ensure", "com", "##pliance", "." ], "ids": [ 11164, 13839, 24155, 10529, 44593, 16080, 14608, 42068, 11327, 84395, 24155, 10114, 40781, 10212, 107826, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Free", "##d", "American", "slaves", "founded", "Liberia", "in", "1847", "." ], "ids": [ 16122, 10162, 10536, 56221, 14078, 59169, 10106, 15760, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Nigeria", "rights", "group", "says", "four", "academic", "##s", "arrested", "." ], "ids": [ 22045, 16691, 11795, 22153, 11598, 23765, 10107, 29479, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##GO", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 29079, 83821, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Nigerian", "human", "rights", "group", "said", "on", "Wednesday", "that", "four", "members", "of", "a", "recently", "banned", "university", "union", "had", "been", "arrested", "." ], "ids": [ 138, 85012, 14179, 16691, 11795, 12415, 10135, 57611, 10189, 11598, 12464, 10108, 169, 23746, 58587, 19756, 20763, 10374, 10590, 29479, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Constitutional", "Rights", "Project", "(", "CR", "##P", ")", "believes", "that", "William", "Ist", "##afa", "##nus", ",", "Eli", "##sha", "Sha", "##may", ",", "O", ".", "K", ".", "Li", "##kka", "##son", "and", "Jerome", "E", "##gur", "##ug", "##be", "were", "arrested", "because", "of", "their", "role", "in", "the", "ongoing", "AS", "##U", "##U", "(", "Academic", "Staff", "Union", "of", "Universities", ")", "strike", ",", "\"", "the", "group", "said", "in", "a", "statement", "." ], "ids": [ 107, 10117, 86816, 22305, 14300, 113, 44912, 11127, 114, 56920, 10189, 10694, 80013, 90804, 14101, 117, 51243, 23315, 106583, 77913, 117, 152, 119, 148, 119, 13258, 20878, 11599, 10111, 43325, 142, 34869, 19951, 11044, 10309, 29479, 12373, 10108, 10455, 12971, 10106, 10105, 57626, 17421, 12022, 12022, 113, 27131, 29017, 11457, 10108, 67401, 114, 37456, 117, 107, 10105, 11795, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "CR", "##P", "said", "the", "four", "were", "arrested", "on", "Monday", "night", "at", "the", "northeastern", "Ta", "##fa", "##wa", "Bale", "##wa", "University", "." ], "ids": [ 10117, 44912, 11127, 12415, 10105, 11598, 10309, 29479, 10135, 40714, 16903, 10160, 10105, 81029, 14248, 13369, 11037, 109250, 11037, 10404, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "The", "main", "academic", "union", ",", "AS", "##U", "##U", ",", "along", "with", "two", "smaller", "university", "unions", ",", "was", "banned", "by", "Nigeria", "'", "s", "military", "government", "last", "week", ",", "because", "of", "a", "four", "-", "month", "strike", "by", "teachers", "for", "better", "working", "conditions", "." ], "ids": [ 10117, 12126, 23765, 20763, 117, 17421, 12022, 12022, 117, 12400, 10169, 10551, 23309, 19756, 76841, 117, 10134, 58587, 10155, 22045, 112, 187, 14041, 12047, 12469, 16118, 117, 12373, 10108, 169, 11598, 118, 14064, 37456, 10155, 38160, 10142, 18322, 14616, 17315, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nigeria", "is", "under", "fire", "from", "many", "Western", "countries", "for", "human", "rights", "abuse", "##s", "and", "lack", "of", "democracy", "." ], "ids": [ 22045, 10124, 10571, 13559, 10188, 11299, 13163, 15911, 10142, 14179, 16691, 51401, 10107, 10111, 23582, 10108, 67519, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Do", "##zen", "##s", "of", "people", "opposed", "to", "the", "government", "are", "in", "det", "##ention", "." ], "ids": [ 11791, 11985, 10107, 10108, 11426, 30488, 10114, 10105, 12047, 10301, 10106, 10349, 90372, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Commonwealth", "foreign", "ministers", "are", "to", "meet", "in", "London", "on", "Wednesday", "to", "discuss", "what", "action", "to", "take", ",", "after", "a", "visit", "to", "Nigeria", "was", "called", "off", "when", "the", "government", "imposed", "strict", "rules", "on", "whom", "the", "mission", "would", "be", "allowed", "to", "see", "." ], "ids": [ 22603, 20796, 66281, 10301, 10114, 23267, 10106, 10829, 10135, 57611, 10114, 71695, 12976, 14204, 10114, 13574, 117, 10662, 169, 27541, 10114, 22045, 10134, 11552, 11898, 10841, 10105, 12047, 83358, 68930, 23123, 10135, 18104, 10105, 17032, 10894, 10347, 18162, 10114, 12888, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nigeria", "was", "suspended", "from", "the", "club", "of", "Britain", "and", "its", "former", "colonies", "in", "November", "after", "the", "hang", "##ing", "of", "nine", "minority", "rights", "activists", "for", "murder", "in", "spite", "of", "international", "pl", "##eas", "for", "c", "##lemen", "##cy", "." ], "ids": [ 22045, 10134, 49799, 10188, 10105, 11111, 10108, 16032, 10111, 10474, 11775, 44975, 10106, 10819, 10662, 10105, 60083, 10230, 10108, 19964, 54147, 16691, 84024, 10142, 29448, 10106, 102845, 10108, 12533, 20648, 42658, 10142, 171, 54657, 11710, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Du", "##tro", "##ux", "suspected", "in", "murder", "of", "Slovak", "woman", "." ], "ids": [ 14925, 14239, 11855, 80337, 10106, 29448, 10108, 78425, 18299, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Peter", "Lac", "##a" ], "ids": [ 10979, 12602, 10113 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "BR", "##AT", "##IS", "##LA", "##VA", "1996", "-", "08", "-", "28" ], "ids": [ 49351, 32071, 19088, 44376, 47172, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Marc", "Du", "##tro", "##ux", ",", "the", "chief", "accused", "in", "a", "Belgian", "child", "murder", "and", "sex", "abuse", "scandal", ",", "is", "suspected", "of", "murder", "##ing", "a", "young", "Slovak", "woman", ",", "the", "Slovak", "office", "of", "Inter", "##pol", "said", "on", "Wednesday", "." ], "ids": [ 15254, 14925, 14239, 11855, 117, 10105, 19421, 37303, 10106, 169, 36652, 18048, 29448, 10111, 18549, 51401, 83458, 117, 10124, 80337, 10108, 29448, 10230, 169, 14739, 78425, 18299, 117, 10105, 78425, 14301, 10108, 24362, 28924, 12415, 10135, 57611, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 2, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Rudolf", "Ga", "##jd", "##os", ",", "head", "of", "Slovak", "Inter", "##pol", ",", "told", "a", "news", "conference", "Du", "##tro", "##ux", "was", "also", "believed", "to", "have", "planned", "the", "ki", "##dna", "##pping", "of", "at", "least", "one", "Slovak", "woman", "." ], "ids": [ 16204, 69699, 31134, 10310, 117, 13578, 10108, 78425, 24362, 28924, 117, 21937, 169, 14424, 25029, 14925, 14239, 11855, 10134, 10379, 20718, 10114, 10529, 24292, 10105, 10879, 35630, 53570, 10108, 10160, 16298, 10464, 78425, 18299, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 2, 3, 7, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "\"", "One", "of", "the", "police", "versions", "in", "the", "case", "of", "the", "murder", "of", "young", "g", "##y", "##ps", "##y", "woman", "in", "Top", "##olc", "##any", ",", "western", "Slovakia", ",", "this", "July", ",", "is", "a", "sus", "##pic", "##ion", "that", "Mark", "Du", "##tro", "##ux", "could", "have", "been", "involved", "in", "the", "murder", ",", "\"", "Ga", "##jd", "##os", "said", "without", "ela", "##bora", "##ting", "on", "the", "age", "of", "the", "victim", "and", "on", "the", "other", "versions", "." ], "ids": [ 107, 11340, 10108, 10105, 15034, 20713, 10106, 10105, 13474, 10108, 10105, 29448, 10108, 14739, 175, 10157, 13221, 10157, 18299, 10106, 12685, 86553, 17415, 117, 16672, 43031, 117, 10531, 11112, 117, 10124, 169, 10846, 34891, 11046, 10189, 11997, 14925, 14239, 11855, 12174, 10529, 10590, 16247, 10106, 10105, 29448, 117, 107, 69699, 31134, 10310, 12415, 13663, 12593, 22337, 12141, 10135, 10105, 12089, 10108, 10105, 62585, 10111, 10135, 10105, 10684, 20713, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Slovak", "police", ",", "Inter", "##pol", ",", "and", "Belgian", "police", "have", "been", "following", "leads", "on", "Du", "##tro", "##ux", "'", "s", "activities", "in", "Slovakia", "and", "the", "neighbouring", "Czech", "Republic", "where", "he", "is", "known", "to", "have", "made", "frequent", "visits", "." ], "ids": [ 78425, 15034, 117, 24362, 28924, 117, 10111, 36652, 15034, 10529, 10590, 11901, 34868, 10135, 14925, 14239, 11855, 112, 187, 19286, 10106, 43031, 10111, 10105, 79475, 22148, 13681, 10940, 10261, 10124, 11053, 10114, 10529, 11019, 49975, 64058, 119 ], "entity": [ "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 3, 7, 9, 9, 2, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ga", "##jd", "##os", "said", "the", "police", "sketch", "of", "the", "suspected", "murder", "##er", "was", "\"", "60", "percent", "identical", "with", "Du", "##tro", "##ux", "'", "s", "portrait", "\"", ",", "and", "that", "Du", "##tro", "##ux", "was", "known", "to", "have", "been", "in", "Top", "##olc", "##any", "around", "the", "time", "of", "the", "woman", "'", "s", "murder", "." ], "ids": [ 69699, 31134, 10310, 12415, 10105, 15034, 83413, 10108, 10105, 80337, 29448, 10165, 10134, 107, 10709, 22362, 58000, 10169, 14925, 14239, 11855, 112, 187, 39254, 107, 117, 10111, 10189, 14925, 14239, 11855, 10134, 11053, 10114, 10529, 10590, 10106, 12685, 86553, 17415, 12166, 10105, 10635, 10108, 10105, 18299, 112, 187, 29448, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Top", "##olc", "##any", "and", "the", "area", "around", "this", "town", "were", "reported", "to", "have", "been", "the", "most", "visited", "places", "by", "Du", "##tro", "##ux", "and", "his", "ac", "##com", "##plice", "##s", "in", "Slovakia", ",", "\"", "Ga", "##jd", "##os", "said", "." ], "ids": [ 107, 12685, 86553, 17415, 10111, 10105, 11168, 12166, 10531, 12221, 10309, 15943, 10114, 10529, 10590, 10105, 10992, 30270, 19261, 10155, 14925, 14239, 11855, 10111, 10226, 13621, 22530, 62631, 10107, 10106, 43031, 117, 107, 69699, 31134, 10310, 12415, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Du", "##tro", "##ux", ",", "a", "convicted", "child", "rap", "##ist", "and", "une", "##mp", "##lo", "##yed", "father", "-", "of", "-", "three", ",", "led", "police", "11", "days", "ago", "to", "the", "bodies", "of", "eight", "-", "year", "-", "old", "##s", "Julie", "Le", "##je", "##une", "and", "Melissa", "Russo", "in", "the", "garden", "of", "another", "of", "the", "six", "houses", "he", "owns", "around", "the", "southern", "Belgian", "city", "of", "Charleroi", "." ], "ids": [ 14925, 14239, 11855, 117, 169, 61487, 18048, 35562, 11293, 10111, 10231, 18573, 10715, 68159, 13194, 118, 10108, 118, 11003, 117, 12857, 15034, 10193, 13990, 36390, 10114, 10105, 34106, 10108, 16222, 118, 10924, 118, 12898, 10107, 18152, 10281, 10381, 19659, 10111, 42409, 48183, 10106, 10105, 35651, 10108, 12864, 10108, 10105, 12449, 21174, 10261, 76282, 12166, 10105, 17156, 36652, 11584, 10108, 88011, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "The", "Belgian", "police", "also", "informed", "us", "that", "Du", "##tro", "##ux", ",", "together", "with", "one", "other", "man", ",", "had", "(", "also", ")", "planned", "the", "ki", "##dna", "##pping", "of", "at", "least", "one", "Slovak", "woman", ",", "\"", "Ga", "##jd", "##os", "said", "." ], "ids": [ 107, 10117, 36652, 15034, 10379, 64330, 19626, 10189, 14925, 14239, 11855, 117, 14229, 10169, 10464, 10684, 10817, 117, 10374, 113, 10379, 114, 24292, 10105, 10879, 35630, 53570, 10108, 10160, 16298, 10464, 78425, 18299, 117, 107, 69699, 31134, 10310, 12415, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "The", "plan", "apparently", "failed", "due", "to", "difficulties", "in", "crossing", "the", "border", ",", "\"", "he", "added", ",", "but", "did", "not", "elaborate", "." ], "ids": [ 107, 10117, 13065, 47731, 20775, 10850, 10114, 64557, 10106, 41031, 10105, 20949, 117, 107, 10261, 16288, 117, 10473, 12172, 10472, 90052, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Slovak", "police", "are", "also", "in", "##vesti", "##gating", "visits", "by", "about", "10", "Slovak", "women", ",", "aged", "17", "to", "22", ",", "to", "Belgium", ",", "at", "the", "invitation", "of", "Du", "##tro", "##ux", "." ], "ids": [ 10117, 78425, 15034, 10301, 10379, 10106, 63996, 91045, 64058, 10155, 10978, 10150, 78425, 13190, 117, 30262, 10273, 10114, 10306, 117, 10114, 26519, 117, 10160, 10105, 77674, 10108, 14925, 14239, 11855, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "The", "women", "said", "they", "went", "to", "Belgium", "vol", "##unta", "##rily", "and", "police", "suspect", "they", "were", "used", "to", "act", "in", "por", "##nog", "##raphic", "films", ",", "Ga", "##jd", "##os", "said", "earlier", "this", "week", "." ], "ids": [ 10117, 13190, 12415, 10689, 13446, 10114, 26519, 12714, 27682, 103866, 10111, 15034, 97881, 10689, 10309, 11031, 10114, 19833, 10106, 10183, 14567, 48532, 14280, 117, 69699, 31134, 10310, 12415, 18905, 10531, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "he", "added", "they", "had", "difficulty", "remember", "##ing", "what", "happened", "during", "their", "visits", "to", "Belgium", ",", "perhaps", "because", "of", "drugs", ",", "and", "were", "unsur", "##e", "whether", "they", "were", "filmed", "for", "por", "##nog", "##raphy", "." ], "ids": [ 16976, 10261, 16288, 10689, 10374, 66178, 93161, 10230, 12976, 44936, 10939, 10455, 64058, 10114, 26519, 117, 36981, 12373, 10108, 40421, 117, 10111, 10309, 51027, 10112, 21883, 10689, 10309, 43729, 10142, 10183, 14567, 81503, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Du", "##tro", "##ux", ",", "39", ",", "who", "was", "charged", "last", "week", "with", "the", "ab", "##duction", "and", "illegal", "imprisonment", "of", "two", "girls", "aged", "14", "and", "12", ",", "is", "also", "suspected", "in", "the", "disa", "##ppe", "##aran", "##ce", "of", "Belgian", "##s", "An", "March", "##al", ",", "19", ",", "and", "E", "##ef", "##je", "Lamb", "##reck", "##s", ",", "17", ",", "who", "went", "missing", "a", "year", "ago", "." ], "ids": [ 14925, 14239, 11855, 117, 11303, 117, 10479, 10134, 38253, 12469, 16118, 10169, 10105, 11357, 54366, 10111, 39806, 91044, 10108, 10551, 27833, 30262, 10247, 10111, 10186, 117, 10124, 10379, 80337, 10106, 10105, 36474, 21092, 24367, 10419, 10108, 36652, 10107, 10313, 11144, 10415, 117, 10270, 117, 10111, 142, 16822, 10381, 60005, 80442, 10107, 117, 10273, 117, 10479, 13446, 39542, 169, 10924, 36390, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##ni", "##fe", "##man", "kills", "Polish", "beauty", "queen", ",", "wound", "##s", "husband", "." ], "ids": [ 148, 10342, 14601, 10589, 69179, 19870, 54883, 62343, 117, 109205, 10107, 19634, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AR", "##SA", "##W", "1996", "-", "08", "-", "28" ], "ids": [ 160, 52188, 27138, 13034, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "man", "kn", "##ife", "##d", "to", "death", "international", "model", "Agnieszka", "Kot", "##lars", "##ka", "outside", "her", "home", "in", "W", "##roc", "##law", ",", "western", "Poland", ",", "Polish", "television", "said", "on", "Wednesday", "." ], "ids": [ 138, 10817, 96820, 46072, 10162, 10114, 12557, 12533, 13192, 99413, 59214, 100792, 10371, 17555, 10485, 11816, 10106, 160, 87015, 37811, 117, 16672, 17879, 117, 19870, 14162, 12415, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "man", ",", "who", "said", "he", "had", "once", "been", "engaged", "to", "her", ",", "first", "kn", "##ife", "##d", "Kot", "##lars", "##ka", "'", "s", "husband", "in", "the", "leg", ",", "then", "sta", "##bbed", "her", "three", "times", "in", "the", "chest", "when", "she", "tried", "to", "inter", "##vene", "during", "the", "incident", "on", "Tuesday", "." ], "ids": [ 10117, 10817, 117, 10479, 12415, 10261, 10374, 14907, 10590, 34377, 10114, 10485, 117, 10422, 96820, 46072, 10162, 59214, 100792, 10371, 112, 187, 19634, 10106, 10105, 33810, 117, 11059, 16527, 98091, 10485, 11003, 13465, 10106, 10105, 94230, 10841, 10833, 27156, 10114, 22021, 61190, 10939, 10105, 28005, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "died", "in", "hospital", "." ], "ids": [ 11149, 12482, 10106, 18141, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kot", "##lars", "##ka", ",", "who", "was", "24", "and", "had", "a", "three", "-", "year", "-", "old", "child", ",", "was", "Miss", "Poland", "in", "1991", "and", "went", "on", "to", "a", "U", ".", "S", ".", "-", "based", "modelli", "##ng", "career", "that", "included", "working", "with", "Italian", "designer", "Gianni", "Vers", "##ace", "and", "Vogue", "magazine", ",", "the", "Gazeta", "W", "##y", "##bor", "##cza", "newspaper", "said", "." ], "ids": [ 59214, 100792, 10371, 117, 10479, 10134, 10233, 10111, 10374, 169, 11003, 118, 10924, 118, 12898, 18048, 117, 10134, 14247, 17879, 10106, 10442, 10111, 13446, 10135, 10114, 169, 158, 119, 156, 119, 118, 11610, 56304, 10376, 13021, 10189, 12742, 14616, 10169, 11667, 32682, 43750, 46744, 19929, 10111, 56694, 15438, 117, 10105, 88343, 160, 10157, 16368, 25135, 22047, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 9, 3, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9 ] }, { "tokens": [ "She", "had", "been", "due", "to", "fly", "on", "a", "T", "##WA", "airline", "##r", "which", "ex", "##plo", "##ded", "near", "New", "York", "last", "month", ",", "but", "had", "cancelled", "her", "book", "##ing", ",", "the", "newspaper", "said", "." ], "ids": [ 11149, 10374, 10590, 10850, 10114, 26155, 10135, 169, 157, 42196, 67878, 10129, 10319, 11419, 46128, 21597, 12883, 10287, 10482, 12469, 14064, 117, 10473, 10374, 60557, 10485, 12748, 10230, 117, 10105, 22047, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Her", "attack", "##er", ",", "identified", "only", "as", "Jerzy", "L", ".", ",", "36", ",", "was", "arrested", "by", "police", "and", "will", "appear", "in", "court", "on", "Thursday", "morning", ",", "television", "reported", "." ], "ids": [ 13229, 16342, 10165, 117, 26121, 10893, 10146, 31658, 149, 119, 117, 11055, 117, 10134, 29479, 10155, 15034, 10111, 11337, 22641, 10106, 14866, 10135, 67067, 28757, 117, 14162, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "he", "had", "admitted", "the", "attack", "but", "had", "denied", "inte", "##nding", "to", "kill", "Kot", "##lars", "##ka", "." ], "ids": [ 10377, 12415, 10261, 10374, 40345, 10105, 16342, 10473, 10374, 47467, 14168, 61029, 10114, 32099, 59214, 100792, 10371, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Russian", "shares", "sl", "##ip", "in", "thin", "volume", "." ], "ids": [ 13463, 45751, 38523, 17437, 10106, 61470, 15901, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "28" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "Russian", "shares", "edge", "##d", "down", "on", "Wednesday", "in", "thin", "volume", "in", "the", "absence", "of", "Western", "orders", ",", "trade", "##rs", "said", "." ], "ids": [ 100085, 13463, 45751, 30599, 10162, 12935, 10135, 57611, 10106, 61470, 15901, 10106, 10105, 28589, 10108, 13163, 31303, 117, 18908, 10943, 12415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Russian", "Trading", "System", "index", "of", "21", "issues", "fell", "1", ".", "64", "percent", "to", "180", ".", "38", "on", "volume", "of", "$", "4", ".", "38", "million", "." ], "ids": [ 10117, 13463, 110260, 11512, 19776, 10108, 10296, 17850, 25194, 122, 119, 11295, 22362, 10114, 13912, 119, 11171, 10135, 15901, 10108, 109, 125, 119, 11171, 12473, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "market", "was", "extremely", "quiet", "today", ",", "some", "profit", "-", "taking", "locally", ",", "no", "Western", "orders", ",", "\"", "said", "Nick", "Mo", "##kh", "##off", ",", "director", "of", "sales", "and", "trade", "at", "Alliance", "-", "Men", "##ate", "##p", ".", "\"" ], "ids": [ 107, 10117, 17313, 10134, 38136, 104951, 18745, 117, 11152, 25081, 118, 18084, 52472, 117, 10192, 13163, 31303, 117, 107, 12415, 16126, 34987, 48502, 20584, 117, 12461, 10108, 23857, 10111, 18908, 10160, 21892, 118, 13026, 12436, 10410, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "We", "are", "just", "a", "bit", "lower", "with", "a", "lot", "of", "ina", "##cti", "##vity", "during", "the", "whole", "day", ".", "\"" ], "ids": [ 12865, 10301, 12820, 169, 17684, 18165, 10169, 169, 19826, 10108, 22944, 76344, 45545, 10939, 10105, 21047, 11940, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alexander", "Baba", "##yan", ",", "managing", "director", "at", "Cent", "##r", "##I", "##n", "##vest", "Sec", "##urities", ",", "said", "the", "volume", "of", "orders", "was", "four", "to", "five", "times", "lower", "than", "a", "week", "ago", "." ], "ids": [ 12063, 36364, 15976, 117, 61274, 12461, 10160, 52013, 10129, 11281, 10115, 34592, 109754, 82073, 117, 12415, 10105, 15901, 10108, 31303, 10134, 11598, 10114, 12403, 13465, 18165, 11084, 169, 16118, 36390, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "often", ",", "the", "most", "volume", "was", "in", "UE", "##S", "." ], "ids": [ 10882, 12899, 117, 10105, 10992, 15901, 10134, 10106, 44693, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "\"", "Uni", "##fied", "is", "one", "of", "the", "blue", "chip", "##s", ",", "which", "has", "more", "pro", "##spects", "than", "any", "##body", "else", "does", ",", "because", "they", "have", "AD", "##R", "##s", "supposed", "##ly", "coming", "up", ",", "\"", "Mo", "##kh", "##off", "said", "." ], "ids": [ 107, 22966, 19907, 10124, 10464, 10108, 10105, 23254, 64008, 10107, 117, 10319, 10393, 10798, 11284, 105335, 11084, 11178, 38078, 40843, 15107, 117, 12373, 10689, 10529, 22992, 11273, 10107, 59516, 10454, 23959, 10741, 117, 107, 34987, 48502, 20584, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "UE", "##S", "officials", "said", "last", "week", "the", "board", "had", "not", "yet", "approved", "the", "final", "version", "of", "its", "application", "to", "the", "U", ".", "S", ".", "Sec", "##urities", "and", "Exchange", "Commission", "to", "issue", "AD", "##R", "##s", "." ], "ids": [ 44693, 10731, 27730, 12415, 12469, 16118, 10105, 17936, 10374, 10472, 21833, 29855, 10105, 11070, 11674, 10108, 10474, 19800, 10114, 10105, 158, 119, 156, 119, 109754, 82073, 10111, 32424, 14941, 10114, 15557, 22992, 11273, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "UE", "##S", "fell", "to", "$", "0", ".", "08", "##17", "from", "$", "0", ".", "08", "##22", "at", "Tuesday", "'", "s", "close", "with", "8", ".", "90", "million", "shares", "changing", "hands", "." ], "ids": [ 44693, 10731, 25194, 10114, 109, 121, 119, 11052, 34264, 10188, 109, 121, 119, 11052, 71793, 10160, 70245, 112, 187, 16065, 10169, 129, 119, 10919, 12473, 45751, 43068, 27925, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ga", "##z", "##pro", "##m", "was", "the", "loser", "of", "the", "day", "with", "prices", "closing", "at", "$", "0", ".", "300", ",", "down", "from", "$", "0", ".", "355", "on", "Tuesday", "and", "$", "0", ".", "445", "on", "Monday", "." ], "ids": [ 69699, 10305, 73099, 10147, 10134, 10105, 55526, 10108, 10105, 11940, 10169, 57476, 57409, 10160, 109, 121, 119, 11093, 117, 12935, 10188, 109, 121, 119, 33195, 10135, 70245, 10111, 109, 121, 119, 41063, 10135, 40714, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mo", "##kh", "##off", "said", "uncertain", "##ty", "about", "when", "Ga", "##z", "##pro", "##m", "would", "issue", "AD", "##R", "##s", "and", "about", "whether", "shares", "from", "the", "Russian", "market", "could", "be", "converted", "into", "AD", "##R", "##s", "had", "hur", "##t", "prices", "." ], "ids": [ 34987, 48502, 20584, 12415, 108308, 11195, 10978, 10841, 69699, 10305, 73099, 10147, 10894, 15557, 22992, 11273, 10107, 10111, 10978, 21883, 45751, 10188, 10105, 13463, 17313, 12174, 10347, 30827, 10708, 22992, 11273, 10107, 10374, 52824, 10123, 57476, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Western", "investors", ".", ".", ".", "will", "be", "in", "##vesti", "##ng", "in", "AD", "##R", "##s", "and", "I", "do", "not", "think", "people", "in", "Russia", "will", "be", "able", "to", "come", "up", "with", "the", "money", "for", "the", "underlying", "shares", "to", "drive", "the", "Russian", "shares", "to", "those", "levels", ",", "\"", "Mo", "##kh", "##off", "said", "." ], "ids": [ 107, 13163, 83795, 119, 119, 119, 11337, 10347, 10106, 63996, 10376, 10106, 22992, 11273, 10107, 10111, 146, 10149, 10472, 27874, 11426, 10106, 14664, 11337, 10347, 16197, 10114, 10678, 10741, 10169, 10105, 17920, 10142, 10105, 93680, 45751, 10114, 23806, 10105, 13463, 45751, 10114, 12676, 21559, 117, 107, 34987, 48502, 20584, 12415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Ga", "##z", "##pro", "##m", "has", "also", "tight", "##ened", "the", "rules", "rest", "##ric", "##ting", "share", "##hole", "##rs", "'", "rights", "to", "trade", "its", "shares", "." ], "ids": [ 69699, 10305, 73099, 10147, 10393, 10379, 85202, 27867, 10105, 23123, 17333, 18570, 12141, 23867, 84569, 10943, 112, 16691, 10114, 18908, 10474, 45751, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mo", "##sene", "##rgo", "closed", "at", "at", "$", "0", ".", "958", "after", "$", "0", ".", "966", ",", "Ros", "##tele", "##kom", "fell", "to", "$", "2", ".", "56", "from", "$", "2", ".", "58", "and", "L", "##U", "##K", "##oi", "##l", "was", "$", "9", ".", "82", "after", "$", "9", ".", "85", "." ], "ids": [ 34987, 83345, 69518, 18440, 10160, 10160, 109, 121, 119, 70088, 10662, 109, 121, 119, 47013, 117, 109292, 30788, 12910, 25194, 10114, 109, 123, 119, 11628, 10188, 109, 123, 119, 11824, 10111, 149, 12022, 11733, 14638, 10161, 10134, 109, 130, 119, 12180, 10662, 109, 130, 119, 12017, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Julie", "Tol", "##kach", "##eva", ",", "Moscow", "News", "##room", ",", "+", "709", "##5", "941", "852", "##0" ], "ids": [ 118, 118, 18152, 91845, 28070, 18085, 117, 18744, 12219, 25525, 117, 116, 67432, 11166, 82944, 70072, 10929 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Albania", "asks", "Greece", "to", "explain", "de", "##portation", "##s", "." ], "ids": [ 28931, 54031, 25154, 10114, 67004, 10104, 104984, 10107, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##IR", "##AN", "##A", "1996", "-", "08", "-", "28" ], "ids": [ 157, 73522, 41275, 10738, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Albania", "asked", "Greece", "on", "Wednesday", "to", "explain", "why", "it", "was", "de", "##port", "##ing", "more", "Albanian", "immigrants", ",", "Foreign", "Minister", "Tri", "##tan", "She", "##hu", "said", "." ], "ids": [ 28931, 22151, 25154, 10135, 57611, 10114, 67004, 31237, 10271, 10134, 10104, 15520, 10230, 10798, 54257, 44736, 117, 20277, 14355, 36642, 12059, 11149, 13723, 12415, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "The", "Albanian", "daily", "Ko", "##ha", "Jon", "##e", "reported", "earlier", "that", "Greece", "had", "deporte", "##d", "about", "5", ",", "000", "Albanian", "##s", "in", "the", "last", "five", "days", "." ], "ids": [ 10117, 54257, 27636, 30186, 10921, 17749, 10112, 15943, 18905, 10189, 25154, 10374, 65827, 10162, 10978, 126, 117, 10259, 54257, 10107, 10106, 10105, 12469, 12403, 13990, 119 ], "entity": [ "O", "B-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 3, 7, 7, 7, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Foreign", "Ministry", "is", "trying", "to", "find", "out", "from", "the", "Greek", "em", "##bas", "##sy", "why", "Albanian", "refugees", "have", "been", "deporte", "##d", "from", "Greece", ",", "\"", "She", "##hu", "told", "Reuters", "." ], "ids": [ 107, 10117, 20277, 19170, 10124, 32862, 10114, 17860, 10950, 10188, 10105, 15286, 10266, 21322, 16105, 31237, 54257, 71797, 10529, 10590, 65827, 10162, 10188, 25154, 117, 107, 11149, 13723, 21937, 46617, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9, 3, 9 ] }, { "tokens": [ "Athens", "and", "Tirana", "signed", "an", "accord", "in", "May", "to", "legal", "##ise", "the", "status", "of", "Albanian", "immigrant", "workers", ",", "estimated", "at", "350", ",", "000", ",", "and", "remove", "a", "long", "-", "standing", "st", "##um", "##bling", "block", "in", "relations", "between", "the", "two", "Balkan", "nei", "##gh", "##bours", "." ], "ids": [ 33765, 10111, 59272, 14775, 10151, 35233, 10106, 10725, 10114, 17139, 13041, 10105, 14042, 10108, 54257, 98839, 23829, 117, 25267, 10160, 14992, 117, 10259, 117, 10111, 51600, 169, 11695, 118, 32173, 28780, 10465, 38245, 27242, 10106, 19824, 10948, 10105, 10551, 31442, 11888, 15774, 97497, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Bulgarian", "##s", "recover", "75", "p", "##ct", "of", "con", "##fis", "##cated", "land", "." ], "ids": [ 43680, 10107, 94962, 11417, 184, 14526, 10108, 10173, 65702, 57736, 11773, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##F", "##IA", "1996", "-", "08", "-", "28" ], "ids": [ 71020, 11565, 35976, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bulgaria", "has", "restored", "ownership", "rights", "to", "pre", "-", "communist", "private", "owners", "of", "75", "percent", "of", "the", "arab", "##le", "land", "or", "around", "four", "million", "hectares", ",", "an", "Agriculture", "Ministry", "official", "said", "on", "Wednesday", "." ], "ids": [ 21935, 10393, 39256, 41354, 16691, 10114, 12229, 118, 64574, 14591, 38437, 10108, 11417, 22362, 10108, 10105, 45131, 10284, 11773, 10345, 12166, 11598, 12473, 33130, 117, 10151, 30954, 19170, 14731, 12415, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "So", "far", "75", "percent", "has", "been", "returned", "with", "the", "land", "resti", "##tuti", "##on", "almost", "completed", "in", "some", "regions", "like", "Southeast", "##ern", "Bulgaria", "but", "lag", "##ging", "behind", "in", "other", "areas", ",", "predominantly", "in", "the", "mountains", ",", "\"", "the", "official", "told", "a", "news", "conference", "." ], "ids": [ 107, 12882, 13301, 11417, 22362, 10393, 10590, 14030, 10169, 10105, 11773, 57676, 80513, 10263, 17122, 15782, 10106, 11152, 21721, 11850, 42975, 13979, 21935, 10473, 14587, 13808, 17155, 10106, 10684, 14544, 117, 71748, 10106, 10105, 44623, 117, 107, 10105, 14731, 21937, 169, 14424, 25029, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ministry", "has", "said", "that", "it", "planned", "to", "return", "96", ".", "6", "percent", "of", "the", "arab", "##le", "land", "or", "5", ".", "2", "million", "hectares", "to", "its", "original", "owners", "by", "the", "end", "of", "this", "year", "." ], "ids": [ 10117, 65338, 10393, 12415, 10189, 10271, 24292, 10114, 15079, 12308, 119, 127, 22362, 10108, 10105, 45131, 10284, 11773, 10345, 126, 119, 123, 12473, 33130, 10114, 10474, 11364, 38437, 10155, 10105, 11572, 10108, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "land", "reform", "act", "passed", "four", "years", "ago", "abolished", "Soviet", "-", "style", "collective", "farms", ",", "allowing", "the", "return", "of", "5", ".", "4", "million", "hectares", "to", "original", "owners", "or", "their", "heir", "##s", "." ], "ids": [ 138, 11773, 34800, 19833, 20006, 11598, 10855, 36390, 69483, 15277, 118, 13351, 49417, 83951, 117, 28357, 10105, 15079, 10108, 126, 119, 125, 12473, 33130, 10114, 11364, 38437, 10345, 10455, 72143, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sofia", "News", "##room", ",", "(", "+", "+", "359", "-", "2", ")", "981", "856", "##9" ], "ids": [ 118, 118, 21416, 12219, 25525, 117, 113, 116, 116, 35403, 118, 123, 114, 69950, 81163, 11373 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "chance", "##llo", "##r", "to", "meet", "Ye", "##lts", "##in", "Sept", "7", "-", "Inter", "##fa", "##x", "." ], "ids": [ 12026, 27893, 13660, 10129, 10114, 23267, 20567, 72847, 10245, 51768, 128, 118, 24362, 13369, 10686, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "28" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "Chancellor", "Helmut", "Kohl", ",", "who", "spoke", "to", "President", "Boris", "Ye", "##lts", "##in", "by", "telephone", "on", "Wednesday", ",", "plans", "a", "trip", "to", "Moscow", "on", "September", "7", "and", "will", "visit", "Ye", "##lts", "##in", "at", "his", "va", "##cation", "home", "near", "Moscow", ",", "Inter", "##fa", "##x", "news", "agency", "said", "." ], "ids": [ 12026, 59109, 25970, 106563, 117, 10479, 50005, 10114, 12811, 21463, 20567, 72847, 10245, 10155, 69009, 10135, 57611, 117, 18195, 169, 37307, 10114, 18744, 10135, 10596, 128, 10111, 11337, 27541, 20567, 72847, 10245, 10160, 10226, 10321, 26287, 11816, 12883, 18744, 117, 24362, 13369, 10686, 14424, 34649, 12415, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Inter", "##fa", "##x", ",", "quo", "##ting", "Ye", "##lts", "##in", "press", "secretary", "Sergei", "Ya", "##str", "##zh", "##em", "##bs", "##ky", ",", "said", "Ye", "##lts", "##in", "and", "Kohl", "had", "discussed", "bila", "##teral", "relations", "and", "international", "issues", "on", "the", "telephone", "." ], "ids": [ 24362, 13369, 10686, 117, 48718, 12141, 20567, 72847, 10245, 21040, 37664, 42794, 25148, 53142, 15104, 10451, 19528, 11445, 117, 12415, 20567, 72847, 10245, 10111, 106563, 10374, 55424, 12517, 98161, 19824, 10111, 12533, 17850, 10135, 10105, 69009, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 4, 8, 8, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", "had", "told", "Kohl", "about", "efforts", "to", "find", "a", "political", "solution", "to", "the", "conflict", "in", "Russia", "'", "s", "break", "##away", "Che", "##chny", "##a", "region", ",", "Inter", "##fa", "##x", "added", "." ], "ids": [ 20567, 72847, 10245, 10374, 21937, 106563, 10978, 22116, 10114, 17860, 169, 13736, 28502, 10114, 10105, 24620, 10106, 14664, 112, 187, 24194, 38249, 44131, 95063, 10113, 12220, 117, 24362, 13369, 10686, 16288, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 5, 5, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", ",", "who", "left", "on", "va", "##cation", "on", "Monday", ",", "is", "stay", "##ing", "at", "an", "exclusive", "private", "hunting", "lod", "##ge", "some", "100", "km", "(", "60", "miles", ")", "from", "Moscow", "." ], "ids": [ 20567, 72847, 10245, 117, 10479, 12153, 10135, 10321, 26287, 10135, 40714, 117, 10124, 29597, 10230, 10160, 10151, 50007, 14591, 57232, 108850, 10525, 11152, 10407, 10204, 113, 10709, 14148, 114, 10188, 18744, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Germany", "has", "been", "one", "of", "the", "lo", "##udes", "##t", "critics", "of", "Russia", "'", "s", "military", "intervention", "in", "Che", "##chny", "##a", ",", "a", "20", "-", "month", "-", "old", "conflict", "in", "which", "ten", "##s", "of", "thousands", "of", "people", "have", "been", "killed", "." ], "ids": [ 12775, 10393, 10590, 10464, 10108, 10105, 10406, 40663, 10123, 29832, 10108, 14664, 112, 187, 14041, 40152, 10106, 44131, 95063, 10113, 117, 169, 10197, 118, 14064, 118, 12898, 24620, 10106, 10319, 11769, 10107, 10108, 39966, 10108, 11426, 10529, 10590, 15875, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Exil", "##ed", "Bosnia", "##ns", "protest", "con", "##fus", "##ing", "voting", "rules", "." ], "ids": [ 105797, 10336, 29634, 10891, 36627, 10173, 55729, 10230, 48814, 23123, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Duncan", "Shi", "##els" ], "ids": [ 27964, 44795, 18338 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "NA", "##G", "##Y", "##AT", "##AD", ",", "Hungary", "1996", "-", "08", "-", "28" ], "ids": [ 56586, 11447, 14703, 32071, 55538, 117, 24601, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bosnia", "##n", "refugees", "in", "Hungary", ",", "the", "first", "to", "vote", "last", "weekend", "in", "their", "country", "'", "s", "first", "post", "-", "war", "election", ",", "found", "the", "rules", "con", "##fus", "##ing", "and", "some", "had", "no", "idea", "who", "they", "voted", "for", ",", "refugees", "and", "officials", "said", "on", "Wednesday", "." ], "ids": [ 29634, 10115, 71797, 10106, 24601, 117, 10105, 10422, 10114, 18926, 12469, 43440, 10106, 10455, 12723, 112, 187, 10422, 11841, 118, 10338, 13685, 117, 11823, 10105, 23123, 10173, 55729, 10230, 10111, 11152, 10374, 10192, 14932, 10479, 10689, 34584, 10142, 117, 71797, 10111, 27730, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "For", "the", "most", "part", "they", "really", "did", "n", "'", "t", "understand", "what", "was", "going", "on", ",", "\"", "the", "director", "of", "the", "Nagy", "##ata", "##d", "camp", "Lajos", "Ho", "##rva", "##th", "told", "Reuters", "on", "Wednesday", "." ], "ids": [ 107, 11399, 10105, 10992, 10668, 10689, 30181, 12172, 182, 112, 188, 49151, 12976, 10134, 19090, 10135, 117, 107, 10105, 12461, 10108, 10105, 26551, 11952, 10162, 16700, 33142, 20220, 36017, 11143, 21937, 46617, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 4, 8, 8, 8, 9, 3, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "was", "con", "##fus", "##ing", ",", "they", "had", "no", "experience", "of", "voting", ",", "many", "of", "the", "refugees", "are", "only", "semi", "-", "liter", "##ate", "and", "none", "of", "them", "knew", "anything", "about", "the", "candidates", ",", "\"", "he", "said", "." ], "ids": [ 107, 10377, 10134, 10173, 55729, 10230, 117, 10689, 10374, 10192, 20627, 10108, 48814, 117, 11299, 10108, 10105, 71797, 10301, 10893, 15900, 118, 58722, 12436, 10111, 46638, 10108, 11345, 46000, 42819, 10978, 10105, 33439, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "just", "voted", "along", "ethnic", "lines", "where", "they", "could", ".", "\"" ], "ids": [ 107, 11696, 12820, 34584, 12400, 34216, 19515, 10940, 10689, 12174, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Bosnia", "##n", "election", "is", "set", "for", "September", "14", "and", "voting", "began", "on", "Wednesday", "for", "most", "of", "the", "600", ",", "000", "Bosnia", "##ns", "living", "abroad", "." ], "ids": [ 10117, 29634, 10115, 13685, 10124, 11847, 10142, 10596, 10247, 10111, 48814, 11941, 10135, 57611, 10142, 10992, 10108, 10105, 11796, 117, 10259, 29634, 10891, 14625, 50901, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "The", "Organisation", "for", "Security", "and", "Cooperation", "in", "Europe", ",", "which", "is", "running", "the", "election", ",", "allowed", "the", "ballot", "to", "be", "held", "on", "Sunday", "in", "four", "Hungarian", "refuge", "##e", "camps", "." ], "ids": [ 10117, 22223, 10142, 20924, 10111, 97225, 10106, 11767, 117, 10319, 10124, 18020, 10105, 13685, 117, 18162, 10105, 93339, 10114, 10347, 11991, 10135, 19731, 10106, 11598, 24364, 63655, 10112, 33978, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "Mo", "##sle", "##m", "refugees", "among", "the", "385", "registered", "voters", "Hungary", "'", "s", "largest", "camp", "Nagy", "##ata", "##d", "have", "written", "to", "the", "OS", "##CE", "com", "##plain", "##ing", "that", "they", "were", "unable", "to", "vote", "in", "contest", "##s", "for", "the", "president", "or", "assembly", "of", "the", "Bosnia", "##n", "-", "C", "##roat", "Federation", ",", "where", "most", "Mo", "##sle", "##ms", "live", "." ], "ids": [ 13885, 34987, 42176, 10147, 71797, 13328, 10105, 31548, 33712, 55450, 24601, 112, 187, 15363, 16700, 26551, 11952, 10162, 10529, 13398, 10114, 10105, 18398, 43161, 10212, 88975, 10230, 10189, 10689, 10309, 30553, 10114, 18926, 10106, 37596, 10107, 10142, 10105, 12931, 10345, 38946, 10108, 10105, 29634, 10115, 118, 140, 64825, 18975, 117, 10940, 10992, 34987, 42176, 12387, 12962, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "This", "was", "because", "their", "pre", "-", "war", "homes", "are", "now", "in", "the", "Ser", "##b", "-", "controlled", "territory", ",", "so", "they", "were", "voting", "for", "the", "national", "assembly", "of", "the", "Republika", "Sr", "##bs", "##ka", ",", "most", "of", "the", "candidates", "for", "which", "are", "Ser", "##bs", "." ], "ids": [ 10747, 10134, 12373, 10455, 12229, 118, 10338, 14154, 10301, 11858, 10106, 10105, 39759, 10457, 118, 29050, 24399, 117, 10380, 10689, 10309, 48814, 10142, 10105, 11844, 38946, 10108, 10105, 20747, 26064, 19528, 10371, 117, 10992, 10108, 10105, 33439, 10142, 10319, 10301, 39759, 19528, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "For", "the", "foreign", "powers", "which", "back", "last", "year", "'", "s", "Dayton", "peace", "agreement", ",", "the", "main", "point", "of", "the", "election", "rules", "is", "that", "by", "voting", "as", "though", "they", "were", "still", "in", "their", "pre", "-", "war", "homes", ",", "Bosnia", "##ns", "should", "over", "##ride", "the", "effects", "of", "ethnic", "clean", "##sing", "and", "reas", "##sert", "the", "concept", "of", "a", "single", "multi", "-", "ethnic", "state", "." ], "ids": [ 11399, 10105, 20796, 32043, 10319, 12014, 12469, 10924, 112, 187, 74767, 28101, 25432, 117, 10105, 12126, 12331, 10108, 10105, 13685, 23123, 10124, 10189, 10155, 48814, 10146, 15102, 10689, 10309, 12647, 10106, 10455, 12229, 118, 10338, 14154, 117, 29634, 10891, 14819, 10491, 61943, 10105, 21274, 10108, 34216, 55911, 16357, 10111, 36120, 37368, 10105, 19228, 10108, 169, 11376, 21247, 118, 34216, 11388, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Ad", "##em", "Ho", "##dzi", "##c", ",", "one", "of", "the", "refugees", "who", "signed", "the", "letter", "of", "com", "##plain", "##t", ",", "told", "Reuters", ":" ], "ids": [ 16976, 25474, 10451, 20220, 45637, 10350, 117, 10464, 10108, 10105, 71797, 10479, 14775, 10105, 19310, 10108, 10212, 88975, 10123, 117, 21937, 46617, 131 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "\"", "We", "only", "real", "##ised", "after", "voting", "that", "we", "were", "being", "denied", "the", "rights", "of", "other", "Bosnia", "##n", "Mo", "##sle", "##ms", "to", "choose", "our", "president", "." ], "ids": [ 107, 12865, 10893, 13486, 20666, 10662, 48814, 10189, 11951, 10309, 11223, 47467, 10105, 16691, 10108, 10684, 29634, 10115, 34987, 42176, 12387, 10114, 48089, 17446, 12931, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "vote", "seal", "##s", "the", "division", "of", "my", "country", ".", "\"" ], "ids": [ 10747, 18926, 37985, 10107, 10105, 13751, 10108, 15127, 12723, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Under", "the", "election", "rules", "citizens", "vote", "for", "a", "three", "-", "man", "presidency", "and", "House", "of", "Representatives", "for", "all", "Bosnia", "-", "Hercegovina", "and", "for", "ass", "##em", "##bli", "##es", "and", "canton", "##al", "seats", "in", "either", "the", "Mo", "##sle", "##m", "-", "C", "##roat", "Federation", "or", "the", "Republika", "Sr", "##bs", "##ka", "." ], "ids": [ 12594, 10105, 13685, 23123, 29812, 18926, 10142, 169, 11003, 118, 10817, 97059, 10111, 11545, 10108, 37774, 10142, 10435, 29634, 118, 28664, 10111, 10142, 13935, 10451, 48850, 10171, 10111, 20035, 10415, 26893, 10106, 16106, 10105, 34987, 42176, 10147, 118, 140, 64825, 18975, 10345, 10105, 20747, 26064, 19528, 10371, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 5, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "On", "Sunday", "voters", "in", "Hungary", "also", "cast", "ballot", "##s", "for", "municipal", "council", "##s", "but", "these", "will", "be", "in", "##vali", "##date", "##d", "following", "the", "can", "##cella", "##tion", "of", "local", "elections", "by", "the", "OS", "##CE", "on", "Tuesday", "." ], "ids": [ 10576, 19731, 55450, 10106, 24601, 10379, 18922, 93339, 10107, 10142, 14935, 23503, 10107, 10473, 11762, 11337, 10347, 10106, 22263, 81921, 10162, 11901, 10105, 10944, 88749, 10822, 10108, 11436, 22054, 10155, 10105, 18398, 43161, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Hus", "##ein", "Mi", "##cije", "##vic", ",", "who", "also", "signed", "the", "letter", ",", "alleged", "that", "elderly", "voters", "were", "directed", "who", "to", "vote", "for", "by", "Hungarian", "translator", "##s", "who", "stood", "in", "the", "poll", "##ing", "boot", "##h", "to", "help", "them", "." ], "ids": [ 109022, 17892, 19803, 13303, 48175, 117, 10479, 10379, 14775, 10105, 19310, 117, 48164, 10189, 106226, 55450, 10309, 15446, 10479, 10114, 18926, 10142, 10155, 24364, 93852, 10107, 10479, 39320, 10106, 10105, 70156, 10230, 63815, 10237, 10114, 15217, 11345, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Pro", "##bab", "##ly", "100", "refugees", "were", "shown", "where", "to", "put", "their", "cross", ",", "\"", "he", "said", "." ], "ids": [ 107, 14021, 51382, 10454, 10407, 71797, 10309, 19989, 10940, 10114, 14499, 10455, 19630, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Seven", "##ty", "eight", "-", "year", "-", "old", "Man", "##dol", "##ina", "Ze", "##lic", ",", "a", "Bosnia", "##n", "C", "##roat", "who", "has", "spent", "the", "last", "five", "years", "in", "Nagy", "##ata", "##d", ",", "told", "Reuters", "she", "had", "cast", "her", "ballot", "because", "she", "'", "d", "been", "told", "to", "by", "the", "camp", "authorities", "but", "had", "no", "idea", "who", "she", "voted", "for", "." ], "ids": [ 21077, 11195, 16222, 118, 10924, 118, 12898, 11343, 47077, 11067, 15536, 25303, 117, 169, 29634, 10115, 140, 64825, 10479, 10393, 18571, 10105, 12469, 12403, 10855, 10106, 26551, 11952, 10162, 117, 21937, 46617, 10833, 10374, 18922, 10485, 93339, 12373, 10833, 112, 172, 10590, 21937, 10114, 10155, 10105, 16700, 28308, 10473, 10374, 10192, 14932, 10479, 10833, 34584, 10142, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "At", "first", "the", "organiser", "##s", "would", "n", "'", "t", "let", "anyone", "help", "me", "but", "when", "they", "saw", "I", "did", "n", "'", "t", "understand", "a", "young", "translator", "ring", "##ed", "the", "names", "I", "had", "to", "mark", ",", "\"", "she", "said", ".", "\"" ], "ids": [ 107, 11699, 10422, 10105, 93446, 10107, 10894, 182, 112, 188, 13595, 51747, 15217, 10911, 10473, 10841, 10689, 17112, 146, 12172, 182, 112, 188, 49151, 169, 14739, 93852, 21550, 10336, 10105, 17978, 146, 10374, 10114, 29221, 117, 107, 10833, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "do", "n", "'", "t", "know", "who", "I", "voted", "for", ".", "\"" ], "ids": [ 146, 10149, 182, 112, 188, 21852, 10479, 146, 34584, 10142, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Maria", "S", "##za", "##bo", "of", "the", "Hungarian", "office", "organi", "##sing", "the", "elections", "on", "behalf", "of", "the", "OS", "##CE", "told", "Reuters", "on", "Wednesday", "her", "office", "was", "studying", "the", "letter", "but", "said", "they", "had", "followed", "OS", "##CE", "instructions", "very", "care", "##fully", "." ], "ids": [ 11066, 156, 10637, 11790, 10108, 10105, 24364, 14301, 91969, 16357, 10105, 22054, 10135, 50683, 10108, 10105, 18398, 43161, 21937, 46617, 10135, 57611, 10485, 14301, 10134, 47308, 10105, 19310, 10473, 12415, 10689, 10374, 15689, 18398, 43161, 68026, 12558, 11131, 42920, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "en", "##vel", "##opes", ",", "each", "with", "the", "five", "different", "voting", "sl", "##ips", ",", "were", "seal", "##ed", "until", "voting", "and", "had", "written", "instructions", "on", "how", "to", "vote", ",", "\"", "she", "said", ".", "\"" ], "ids": [ 107, 10117, 10110, 13128, 89556, 117, 11948, 10169, 10105, 12403, 12902, 48814, 38523, 77593, 117, 10309, 37985, 10336, 11444, 48814, 10111, 10374, 13398, 68026, 10135, 14796, 10114, 18926, 117, 107, 10833, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "of", "course", "those", "who", "could", "not", "read", "had", "to", "be", "shown", ".", "\"" ], "ids": [ 16976, 10108, 15348, 12676, 10479, 12174, 10472, 24944, 10374, 10114, 10347, 19989, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Estonia", "presidential", "race", "next", "round", "on", "Sept", "20", "." ], "ids": [ 31475, 36476, 14025, 13451, 13569, 10135, 51768, 10197, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TA", "##LL", "##IN", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 91075, 82834, 27128, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Estonia", "will", "hold", "the", "next", "round", "of", "an", "in", "##con", "##clu", "##sive", "state", "presidential", "race", "on", "September", "20", ",", "parliamentary", "officers", "of", "the", "Baltic", "state", "ruled", "on", "Wednesday", "." ], "ids": [ 31475, 11337, 18500, 10105, 13451, 13569, 10108, 10151, 10106, 23486, 78225, 37413, 11388, 36476, 14025, 10135, 10596, 10197, 117, 50485, 23579, 10108, 10105, 49590, 11388, 34920, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "comes", "after", "three", "votes", "in", "the", "101", "-", "strong", "parliament", "on", "Monday", "and", "Tuesday", "failed", "to", "give", "either", "incumbent", "Lennart", "Mer", "##i", "or", "rival", "candidate", "Arnold", "R", "##uut", "##el", "the", "necessary", "68", "votes", "for", "a", "clear", "mandate", "." ], "ids": [ 10747, 21405, 10662, 11003, 24659, 10106, 10105, 14123, 118, 18093, 40519, 10135, 40714, 10111, 70245, 20775, 10114, 18090, 16106, 63122, 102034, 10734, 10116, 10345, 24792, 22102, 17733, 155, 61645, 10570, 10105, 27039, 12370, 24659, 10142, 169, 24866, 106424, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "outcome", "was", "a", "re", "##bu", "##ff", "for", "Mer", "##i", ",", "failing", "three", "times", "to", "win", "backing", "in", "his", "bid", "for", "a", "second", "term", "as", "head", "of", "state", "of", "the", "former", "Soviet", "republic", "." ], "ids": [ 10117, 89097, 10134, 169, 11639, 12177, 13820, 10142, 10734, 10116, 117, 72103, 11003, 13465, 10114, 14125, 31962, 10106, 10226, 50385, 10142, 169, 11132, 13719, 10146, 13578, 10108, 11388, 10108, 10105, 11775, 15277, 108499, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Parliament", "'", "s", "press", "officer", "told", "Reuters", "that", "Speaker", "Too", "##mas", "Sa", "##vi", "will", "con", "##vene", "an", "electoral", "college", "involving", "101", "MP", "##s", "and", "and", "273", "local", "government", "representatives", "on", "September", "20", "." ], "ids": [ 19173, 112, 187, 21040, 19288, 21937, 46617, 10189, 64844, 27775, 12922, 12404, 11310, 11337, 10173, 61190, 10151, 29125, 16083, 40368, 14123, 27211, 10107, 10111, 10111, 28414, 11436, 12047, 49959, 10135, 10596, 10197, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "Mer", "##i", ",", "67", ",", "and", "R", "##uut", "##el", ",", "68", "will", "automatically", "be", "listed", "as", "candidates", "but", "the", "election", "will", "also", "be", "open", "to", "new", "nominations", "with", "the", "backing", "of", "any", "21", "members", "of", "the", "college", "." ], "ids": [ 20973, 10734, 10116, 117, 12316, 117, 10111, 155, 61645, 10570, 117, 12370, 11337, 64585, 10347, 17585, 10146, 33439, 10473, 10105, 13685, 11337, 10379, 10347, 14087, 10114, 10751, 66408, 10169, 10105, 31962, 10108, 11178, 10296, 12464, 10108, 10105, 16083, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "winner", "has", "to", "secure", "a", "majority", "from", "the", "college", "within", "two", "rounds", "of", "voting", "otherwise", "the", "election", "will", "go", "back", "before", "the", "parliament", "." ], "ids": [ 10117, 20826, 10393, 10114, 45853, 169, 19471, 10188, 10105, 16083, 12381, 10551, 44759, 10108, 48814, 39712, 10105, 13685, 11337, 11783, 12014, 11360, 10105, 40519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Le", "##bed", "likely", "to", "fail", "on", "Che", "##chny", "##a", "-", "Polish", "minister", "." ], "ids": [ 10281, 33627, 22497, 10114, 84891, 10135, 44131, 95063, 10113, 118, 19870, 16930, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 1, 5, 5, 9, 2, 9, 9 ] }, { "tokens": [ "W", "##AR", "##SA", "##W", "1996", "-", "08", "-", "28" ], "ids": [ 160, 52188, 27138, 13034, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russian", "security", "chief", "Aleksander", "Le", "##bed", "faces", "an", "almost", "impossible", "task", "in", "Che", "##chny", "##a", "and", "is", "likely", "to", "be", "side", "##lined", ",", "Polish", "Foreign", "Minister", "Darius", "##z", "Rosa", "##ti", "was", "reported", "as", "saying", "on", "Wednesday", "." ], "ids": [ 13463, 21849, 19421, 30960, 10281, 33627, 48343, 10151, 17122, 38199, 37758, 10106, 44131, 95063, 10113, 10111, 10124, 22497, 10114, 10347, 12250, 75066, 117, 19870, 20277, 14355, 76384, 10305, 16670, 10325, 10134, 15943, 10146, 22807, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "According", "to", "best", "-", "selling", "daily", "Gazeta", "W", "##y", "##bor", "##cza", ",", "Rosa", "##ti", "told", "the", "Polish", "parliament", "'", "s", "foreign", "affairs", "committee", "on", "Tuesday", "that", "the", "fact", "Le", "##bed", "had", "been", "charged", "with", "reso", "##lv", "##ing", "the", "conflict", "in", "Che", "##chny", "##a", "showed", "he", "would", "be", "marginal", "##ised", "." ], "ids": [ 14156, 10114, 12504, 118, 30870, 27636, 88343, 160, 10157, 16368, 25135, 117, 16670, 10325, 21937, 10105, 19870, 40519, 112, 187, 20796, 43417, 27634, 10135, 70245, 10189, 10105, 18638, 10281, 33627, 10374, 10590, 38253, 10169, 86286, 56963, 10230, 10105, 24620, 10106, 44131, 95063, 10113, 27463, 10261, 10894, 10347, 92379, 20666, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "almost", "impossible", "to", "gain", "success", "in", "this", ",", "\"", "it", "quoted", "Rosa", "##ti", "as", "saying", "during", "a", "committee", "debate", "." ], "ids": [ 107, 10377, 10124, 17122, 38199, 10114, 25881, 17001, 10106, 10531, 117, 107, 10271, 70676, 16670, 10325, 10146, 22807, 10939, 169, 27634, 29632, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Le", "##bed", "has", "no", "diplomatic", "experience", "." ], "ids": [ 107, 10281, 33627, 10393, 10192, 64838, 20627, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ye", "##lts", "##in", "sent", "him", "there", "to", "com", "##pro", "##mise", "him", "." ], "ids": [ 20567, 72847, 10245, 14541, 10957, 11155, 10114, 10212, 73099, 19738, 10957, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "ta", "##ctical", "mano", "##euvre", "also", "shows", "that", "in", "the", "ruling", "circle", "there", "is", "no", "unity", "of", "action", ",", "\"", "he", "said", "." ], "ids": [ 10747, 11057, 100563, 19271, 108658, 10379, 15573, 10189, 10106, 10105, 50788, 54309, 11155, 10124, 10192, 99506, 10108, 14204, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Le", "##bed", ",", "who", "has", "arranged", "a", "military", "tr", "##uce", "with", "separat", "##ist", "rebels", "in", "the", "southern", "Russia", "region", ",", "was", "in", "Moscow", "this", "week", "seeking", "support", "for", "a", "deal", "on", "Che", "##chny", "##a", "'", "s", "political", "status", "." ], "ids": [ 10281, 33627, 117, 10479, 10393, 39591, 169, 14041, 32221, 24075, 10169, 81806, 11293, 57545, 10106, 10105, 17156, 14664, 12220, 117, 10134, 10106, 18744, 10531, 16118, 51285, 13145, 10142, 169, 19918, 10135, 44131, 95063, 10113, 112, 187, 13736, 14042, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Russian", "President", "Boris", "Ye", "##lts", "##in", "has", "seemed", "un", "##wil", "##ling", "to", "meet", "his", "en", "##voy", "and", "went", "on", "holiday", "on", "Monday", "." ], "ids": [ 16976, 13463, 12811, 21463, 20567, 72847, 10245, 10393, 64676, 10119, 70185, 11945, 10114, 23267, 10226, 10110, 81843, 10111, 13446, 10135, 71806, 10135, 40714, 119 ], "entity": [ "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gazeta", "W", "##y", "##bor", "##cza", "quoted", "Rosa", "##ti", "as", "saying", "Ye", "##lts", "##in", "was", "very", "ill", "and", "effectively", "on", "leave", ",", "but", "for", "now", "retained", "control", "in", "Russia", "although", "matters", "were", "passing", "into", "the", "hands", "of", "his", "close", "coll", "##abo", "##rators", "." ], "ids": [ 88343, 160, 10157, 16368, 25135, 70676, 16670, 10325, 10146, 22807, 20567, 72847, 10245, 10134, 12558, 32941, 10111, 46767, 10135, 21964, 117, 10473, 10142, 11858, 39886, 12608, 10106, 14664, 14779, 50807, 10309, 33389, 10708, 10105, 27925, 10108, 10226, 16065, 28552, 90276, 94721, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 4, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rosa", "##ti", "said", "Russia", "'", "s", "July", "poll", "##s", ",", "in", "which", "Ye", "##lts", "##in", "won", "re", "-", "election", ",", "showed", "democracy", "had", "passed", "an", "important", "test", "and", "the", "Russian", "people", "had", "chose", "##d", "the", "path", "of", "further", "reforms", "." ], "ids": [ 16670, 10325, 12415, 14664, 112, 187, 11112, 70156, 10107, 117, 10106, 10319, 20567, 72847, 10245, 11367, 11639, 118, 13685, 117, 27463, 67519, 10374, 20006, 10151, 12452, 15839, 10111, 10105, 13463, 11426, 10374, 25720, 10162, 10105, 37013, 10108, 14586, 71856, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "he", "said", "a", "power", "struggle", "in", "Russia", "'", "s", "ruling", "circles", "could", "not", "be", "ruled", "out", ",", "which", "could", "harm", "further", "reforms", "." ], "ids": [ 16976, 10261, 12415, 169, 13183, 48919, 10106, 14664, 112, 187, 50788, 99818, 12174, 10472, 10347, 34920, 10950, 117, 10319, 12174, 105999, 14586, 71856, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "expressed", "concern", "over", "problems", "in", "the", "Russian", "economy", ",", "saying", "this", "could", "lead", "to", "social", "un", "##rest", ",", "the", "daily", "reported", "." ], "ids": [ 10357, 31685, 43607, 10491, 20390, 10106, 10105, 13463, 27570, 117, 22807, 10531, 12174, 14107, 10114, 12142, 10119, 34189, 117, 10105, 27636, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Moscow", "'", "s", "foreign", "policy", ",", "Rosa", "##ti", "said", "it", "had", "changed", "its", "stan", "##ce", "on", "NATO", "'", "s", "east", "##ward", "expansion", "and", "was", "preparing", "itself", "for", "Poland", "'", "s", "in", "##evi", "##table", "entry", "into", "the", "Western", "alliance", "." ], "ids": [ 10576, 18744, 112, 187, 20796, 14368, 117, 16670, 10325, 12415, 10271, 10374, 17695, 10474, 45244, 10419, 10135, 21662, 112, 187, 13827, 16988, 24837, 10111, 10134, 90798, 17587, 10142, 17879, 112, 187, 10106, 44082, 30434, 14722, 10708, 10105, 13163, 36758, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "He", "also", "reportedly", "criticised", "Russian", "Foreign", "Minister", "Ye", "##v", "##gen", "##y", "Prima", "##kov", ",", "saying", "his", "style", "of", "work", "res", "##emble", "##d", "that", "of", "the", "Soviet", "-", "era", "1970s", "and", "1980s", "." ], "ids": [ 10357, 10379, 53934, 91588, 13463, 20277, 14355, 20567, 10477, 11280, 10157, 20328, 16433, 117, 22807, 10226, 13351, 10108, 11424, 39429, 91259, 10162, 10189, 10108, 10105, 15277, 118, 10411, 21844, 10111, 21215, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Romania", "state", "budget", "soa", "##rs", "in", "June", "." ], "ids": [ 13927, 11388, 25293, 56108, 10943, 10106, 11120, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UC", "##HA", "##RE", "##ST", "1996", "-", "08", "-", "28" ], "ids": [ 139, 93089, 58132, 66014, 32995, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Romania", "'", "s", "state", "budget", "deficit", "jump", "##ed", "sharp", "##ly", "in", "June", "to", "1", ",", "242", ".", "9", "billion", "lei", "for", "the", "January", "-", "June", "period", "from", "596", ".", "5", "billion", "lei", "in", "January", "-", "May", ",", "official", "data", "showed", "on", "Wednesday", "." ], "ids": [ 13927, 112, 187, 11388, 25293, 107383, 54941, 10336, 77348, 10454, 10106, 11120, 10114, 122, 117, 27297, 119, 130, 25848, 15339, 10142, 10105, 11238, 118, 11120, 13127, 10188, 52966, 119, 126, 25848, 15339, 10106, 11238, 118, 10725, 117, 14731, 11165, 27463, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Six", "-", "month", "ex", "##pend", "##itur", "##es", "stood", "at", "9", ".", "50", "tri", "##llion", "lei", ",", "up", "from", "7", ".", "56", "tri", "##llion", "lei", "at", "end", "-", "May", ",", "with", "education", "and", "health", "spending", "accounting", "for", "31", ".", "6", "percent", "of", "state", "ex", "##penses", "and", "economic", "sub", "##sid", "##ies", "and", "support", "taking", "some", "26", "percent", "." ], "ids": [ 20615, 118, 14064, 11419, 63592, 96065, 10171, 39320, 10160, 130, 119, 10462, 15633, 67102, 15339, 117, 10741, 10188, 128, 119, 11628, 15633, 67102, 15339, 10160, 11572, 118, 10725, 117, 10169, 14943, 10111, 17004, 51163, 106010, 10142, 10413, 119, 127, 22362, 10108, 11388, 11419, 57025, 10111, 13925, 13987, 34396, 11624, 10111, 13145, 18084, 11152, 10314, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "January", "-", "June", "revenue", "##s", "went", "up", "to", "8", ".", "26", "tri", "##llion", "lei", "from", "6", ".", "96", "tri", "##llion", "lei", "in", "the", "first", "five", "months", "this", "year", "." ], "ids": [ 11238, 118, 11120, 51557, 10107, 13446, 10741, 10114, 129, 119, 10314, 15633, 67102, 15339, 10188, 127, 119, 12308, 15633, 67102, 15339, 10106, 10105, 10422, 12403, 15555, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Romania", "'", "s", "government", "is", "expected", "to", "rev", "##ise", "the", "1996", "budget", "on", "Wednesday", "to", "bring", "it", "into", "line", "with", "higher", "inflation", ",", "new", "wa", "##ge", "and", "pension", "index", "##ations", "and", "costs", "of", "energy", "import", "##s", "that", "have", "pushed", "up", "the", "state", "deficit", "." ], "ids": [ 13927, 112, 187, 12047, 10124, 25973, 10114, 86095, 13041, 10105, 10389, 25293, 10135, 57611, 10114, 26092, 10271, 10708, 12117, 10169, 17981, 105888, 117, 10751, 11471, 10525, 10111, 70838, 19776, 24965, 10111, 34495, 10108, 18603, 67622, 10107, 10189, 10529, 70157, 10741, 10105, 11388, 107383, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Under", "the", "revised", "version", "state", "spending", "is", "expected", "to", "rise", "by", "some", "566", "billion", "lei", "." ], "ids": [ 12594, 10105, 41226, 11674, 11388, 51163, 10124, 25973, 10114, 28710, 10155, 11152, 57239, 25848, 15339, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "new", "deficit", "for", "##eca", "##st", "has", "been", "issued", "so", "far", "." ], "ids": [ 10657, 10751, 107383, 10142, 33588, 10562, 10393, 10590, 21694, 10380, 13301, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "July", "the", "government", "gave", "a", "6", ".", "0", "-", "percent", "wa", "##ge", "and", "pension", "index", "##ation", "to", "cover", "energy", ",", "fuel", "and", "br", "##ead", "price", "increases", ",", "which", "quick", "##ened", "inflation", "to", "7", ".", "5", "percent", "last", "month", "." ], "ids": [ 10167, 11112, 10105, 12047, 15362, 169, 127, 119, 121, 118, 22362, 11471, 10525, 10111, 70838, 19776, 11809, 10114, 16068, 18603, 117, 30550, 10111, 33989, 30297, 30839, 53306, 117, 10319, 69609, 27867, 105888, 10114, 128, 119, 126, 22362, 12469, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "original", "state", "budget", ",", "approved", "in", "March", ",", "revenue", "##s", "were", "en", "##visa", "##ged", "at", "around", "16", ".", "98", "tri", "##llion", "lei", "and", "ex", "##pend", "##itur", "##es", "20", ".", "17", "tri", "##llion", "lei", "for", "1996", "." ], "ids": [ 10167, 10105, 11364, 11388, 25293, 117, 29855, 10106, 11144, 117, 51557, 10107, 10309, 10110, 48367, 18832, 10160, 12166, 10250, 119, 12327, 15633, 67102, 15339, 10111, 11419, 63592, 96065, 10171, 10197, 119, 10273, 15633, 67102, 15339, 10142, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "state", "budget", "deficit", "was", "originally", "for", "##eca", "##st", "to", "be", "3", ".", "19", "tri", "##llion", "lei", "for", "the", "whole", "year", "." ], "ids": [ 10117, 11388, 25293, 107383, 10134, 15556, 10142, 33588, 10562, 10114, 10347, 124, 119, 10270, 15633, 67102, 15339, 10142, 10105, 21047, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Wednesday", ",", "the", "le", "##u", "'", "s", "official", "rate", "was", "3", ",", "161", "to", "the", "dollar", "." ], "ids": [ 10576, 57611, 117, 10105, 10141, 10138, 112, 187, 14731, 18344, 10134, 124, 117, 21163, 10114, 10105, 34807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Bucharest", "News", "##room", "40", "-", "1", "312", "##02", "##64" ], "ids": [ 118, 118, 100824, 12219, 25525, 10533, 118, 122, 25104, 90426, 51658 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Costa", "Rica", "says", "Dutch", "pair", "ki", "##dna", "##pped", "by", "Nicaragua", "##ns", "." ], "ids": [ 13902, 20834, 22153, 17693, 27643, 10879, 35630, 44357, 10155, 32337, 10891, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 1, 5, 9, 2, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "SA", "##N", "J", "##OS", "##E", ",", "Costa", "Rica", "1996", "-", "08", "-", "28" ], "ids": [ 21318, 11537, 147, 21793, 11259, 117, 13902, 20834, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Costa", "Rica", "##n", "government", "said", "on", "Wednesday", "that", "a", "Dutch", "couple", "ab", "##duct", "##ed", "over", "the", "weekend", "from", "a", "tree", "farm", "in", "northern", "Costa", "Rica", "was", "ki", "##dna", "##pped", "by", "former", "Nicaragua", "##n", "guerrilla", "##s", "." ], "ids": [ 10117, 13902, 20834, 10115, 12047, 12415, 10135, 57611, 10189, 169, 17693, 20969, 11357, 54489, 10336, 10491, 10105, 43440, 10188, 169, 23194, 30568, 10106, 17335, 13902, 20834, 10134, 10879, 35630, 44357, 10155, 11775, 32337, 10115, 106552, 10107, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "\"", "Even", "though", "it", "'", "s", "an", "act", "of", "common", "del", "##in", "##quen", "##cy", ",", "the", "case", "could", "take", "a", "difficult", "turn", "because", "former", "Nicaragua", "##n", "guerrilla", "##s", "are", "involved", ",", "\"", "Security", "Minister", "Bernardo", "Arc", "##e", "told", "reporter", "##s", "." ], "ids": [ 107, 28140, 15102, 10271, 112, 187, 10151, 19833, 10108, 14624, 10127, 10245, 73632, 11710, 117, 10105, 13474, 12174, 13574, 169, 25232, 18923, 12373, 11775, 32337, 10115, 106552, 10107, 10301, 16247, 117, 107, 20924, 14355, 27764, 36433, 10112, 21937, 41408, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Earl", "##ier", "this", "year", ",", "a", "German", "tourist", "and", "a", "Swiss", "tour", "guide", "were", "ki", "##dna", "##pped", "from", "the", "same", "general", "area", "in", "northern", "Costa", "Rica", "near", "the", "Nicaragua", "##n", "border", "." ], "ids": [ 18877, 11709, 10531, 10924, 117, 169, 12026, 61431, 10111, 169, 22984, 12842, 25083, 10309, 10879, 35630, 44357, 10188, 10105, 11561, 11389, 11168, 10106, 17335, 13902, 20834, 12883, 10105, 32337, 10115, 20949, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "They", "were", "held", "for", "71", "days", "before", "relatives", "paid", "a", "ran", "##som", "to", "free", "them", "." ], "ids": [ 11696, 10309, 11991, 10142, 12513, 13990, 11360, 51893, 25938, 169, 17044, 32081, 10114, 13961, 11345, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "Nicaragua", "##n", "former", "guerrilla", "##s", "have", "been", "arrested", "in", "the", "case", "." ], "ids": [ 13214, 32337, 10115, 11775, 106552, 10107, 10529, 10590, 29479, 10106, 10105, 13474, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Because", "of", "the", "apparent", "threat", "to", "foreign", "##ers", "in", "Costa", "Rica", "near", "the", "Nicaragua", "##n", "border", ",", "Arc", "##e", "said", "the", "government", "has", "advised", "many", "to", "take", "additional", "security", "measures", "on", "their", "own", "." ], "ids": [ 24153, 10108, 10105, 51200, 41256, 10114, 20796, 10901, 10106, 13902, 20834, 12883, 10105, 32337, 10115, 20949, 117, 36433, 10112, 12415, 10105, 12047, 10393, 94780, 11299, 10114, 13574, 18568, 21849, 38606, 10135, 10455, 12542, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 2, 6, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hurt", "##e", "Sie", "##rd", "Z", "##yl", "##stra", "and", "his", "wife", ",", "Jets", "##i", "Hendrik", "##a", "Co", "##ers", ",", "both", "50", "years", "old", ",", "were", "seized", "late", "on", "Saturday", "or", "early", "on", "Sunday", "from", "a", "tea", "##k", "tree", "plantation", "they", "manage", "by", "at", "least", "two", "heavily", "armed", "men", "who", "took", "the", "two", "off", "in", "their", "own", "car", ",", "leaving", "behind", "a", "ran", "##som", "note", "demand", "##ing", "$", "1", ".", "5", "million", "." ], "ids": [ 83912, 10112, 11583, 12023, 163, 27652, 19975, 10111, 10226, 14384, 117, 59891, 10116, 29090, 10113, 13098, 10901, 117, 11408, 10462, 10855, 12898, 117, 10309, 80176, 13002, 10135, 24848, 10345, 11732, 10135, 19731, 10188, 169, 57675, 10174, 23194, 103170, 10689, 59251, 10155, 10160, 16298, 10551, 33556, 34174, 10588, 10479, 12149, 10105, 10551, 11898, 10106, 10455, 12542, 13000, 117, 21005, 17155, 169, 17044, 32081, 19864, 34394, 10230, 109, 122, 119, 126, 12473, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "plantation", "is", "owned", "by", "Dutch", "citizen", "E", "##be", "Hui", "##zing", "##a", ",", "who", "has", "since", "arrived", "in", "Costa", "Rica", "to", "deal", "with", "the", "matter", "." ], "ids": [ 10117, 103170, 10124, 17012, 10155, 17693, 64735, 142, 11044, 77845, 19308, 10113, 117, 10479, 10393, 11764, 22584, 10106, 13902, 20834, 10114, 19918, 10169, 10105, 27904, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Go", "##v", "'", "t", "do", "##d", "##ging", "extra", "##dition", ",", "Colombia", "##n", "official", "says", "." ], "ids": [ 14439, 10477, 112, 188, 10149, 10162, 13808, 19868, 34540, 117, 15223, 10115, 14731, 22153, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "B", "##O", "##GO", "##TA", ",", "Colombia", "1996", "-", "08", "-", "28" ], "ids": [ 139, 11403, 83821, 24951, 117, 15223, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "top", "judicial", "official", "and", "critic", "of", "President", "Ernesto", "Sam", "##per", "accused", "the", "government", "of", "ind", "##iff", "##eren", "##ce", "on", "Wednesday", "over", "efforts", "to", "lift", "Colombia", "'", "s", "five", "-", "year", "-", "old", "ban", "on", "extra", "##dition", "." ], "ids": [ 138, 12364, 41809, 14731, 10111, 39727, 10108, 12811, 32249, 14268, 12713, 37303, 10105, 12047, 10108, 30386, 31025, 13653, 10419, 10135, 57611, 10491, 22116, 10114, 63376, 15223, 112, 187, 12403, 118, 10924, 118, 12898, 11915, 10135, 19868, 34540, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "would", "seem", "that", "the", "subject", "of", "extra", "##dition", "is", "un", "##worthy", "of", "an", "opinion", "from", "the", "government", ",", "\"", "Deputy", "Pro", "##se", "##cutor", "-", "General", "Adolfo", "Salamanca", "said", "." ], "ids": [ 107, 10377, 10894, 57047, 10189, 10105, 20036, 10108, 19868, 34540, 10124, 10119, 102786, 10108, 10151, 32282, 10188, 10105, 12047, 117, 107, 32389, 14021, 10341, 98957, 118, 11220, 42904, 33465, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 1, 9, 9 ] }, { "tokens": [ "Constitutional", "reforms", "were", "proposed", "on", "Tuesday", "by", "two", "senator", "##s", ",", "one", "of", "them", "a", "member", "of", "Sam", "##per", "'", "s", "own", "Liberal", "Party", ",", "aimed", "at", "lift", "##ing", "the", "ban", "on", "extra", "##dition", "introduced", "in", "1991", "." ], "ids": [ 86816, 71856, 10309, 21622, 10135, 70245, 10155, 10551, 40954, 10107, 117, 10464, 10108, 11345, 169, 12008, 10108, 14268, 12713, 112, 187, 12542, 22285, 12529, 117, 53004, 10160, 63376, 10230, 10105, 11915, 10135, 19868, 34540, 17037, 10106, 10442, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "Ambassador", "My", "##les", "Fr", "##eche", "##tte", "app", "##lau", "##ded", "the", "move", ",", "saying", "it", "could", "pro", "##mpt", "the", "Clinton", "administration", "to", "remove", "Colombia", "from", "a", "list", "of", "out", "##cast", "nations", "that", "have", "failed", "to", "co", "##oper", "##ate", "in", "U", ".", "S", ".", "counter", "##nar", "##cot", "##ics", "efforts", "." ], "ids": [ 158, 119, 156, 119, 55060, 11590, 11268, 33884, 53137, 12131, 72894, 35166, 21597, 10105, 18577, 117, 22807, 10271, 12174, 11284, 109361, 10105, 24139, 17941, 10114, 51600, 15223, 10188, 169, 13416, 10108, 10950, 31419, 30683, 10189, 10529, 20775, 10114, 11170, 56361, 12436, 10106, 158, 119, 156, 119, 46298, 14582, 41746, 16981, 22116, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sam", "##per", "-", "-", "who", "weather", "##ed", "a", "year", "-", "old", "crisis", "stem", "##ming", "from", "charges", "he", "finance", "##d", "his", "1994", "election", "campaign", "with", "drug", "money", "-", "-", "appeared", "less", "than", "ent", "##hus", "##ias", "##tic", ",", "however", "." ], "ids": [ 14268, 12713, 118, 118, 10479, 35660, 10336, 169, 10924, 118, 12898, 22859, 37649, 16405, 10188, 31128, 10261, 48053, 10162, 10226, 10444, 13685, 17323, 10169, 20998, 17920, 118, 118, 14565, 15306, 11084, 61047, 15471, 15465, 13275, 117, 13800, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Extra", "##dition", "is", "not", "on", "the", "government", "'", "s", "legislative", "agenda", ",", "\"", "he", "told", "reporter", "##s", "on", "Tuesday", "." ], "ids": [ 107, 50821, 34540, 10124, 10472, 10135, 10105, 12047, 112, 187, 53374, 70231, 117, 107, 10261, 21937, 41408, 10107, 10135, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "added", "that", "he", "did", "not", "oppose", "the", "idea", "of", "opening", "a", "public", "debate", "over", "the", "issue", "." ], "ids": [ 10357, 16288, 10189, 10261, 12172, 10472, 53037, 10105, 14932, 10108, 17975, 169, 11683, 29632, 10491, 10105, 15557, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "he", "fell", "far", "short", "of", "end", "##ors", "##ing", "the", "idea", "of", "putting", "Colombia", "##n", "drug", "lord", "##s", "onto", "U", ".", "S", ".", "-", "bound", "flights", "to", "serve", "st", "##iff", "penal", "##ities", "in", "American", "prison", "##s", "." ], "ids": [ 16976, 10261, 25194, 13301, 13716, 10108, 11572, 16379, 10230, 10105, 14932, 10108, 71028, 15223, 10115, 20998, 50674, 10107, 31095, 158, 119, 156, 119, 118, 46538, 55650, 10114, 19430, 28780, 31025, 69270, 17285, 10106, 10536, 20538, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Salamanca", ",", "who", "spoke", "at", "a", "meeting", "on", "ki", "##dna", "##pping", "in", "Colombia", ",", "has", "said", "in", "the", "past", "that", "there", "was", "ample", "evidence", "to", "prove", "that", "Sam", "##per", "'", "s", "campaign", "received", "millions", "of", "dollars", "in", "contributions", "from", "the", "country", "'", "s", "top", "drug", "lord", "##s", "." ], "ids": [ 33465, 117, 10479, 50005, 10160, 169, 19822, 10135, 10879, 35630, 53570, 10106, 15223, 117, 10393, 12415, 10106, 10105, 17781, 10189, 11155, 10134, 106775, 18713, 10114, 35905, 10189, 14268, 12713, 112, 187, 17323, 12296, 18123, 10108, 27953, 10106, 28715, 10188, 10105, 12723, 112, 187, 12364, 20998, 50674, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Qua", "##ke", "sh", "##ake", "##s", "Costa", "Rica", "during", "Has", "##him", "##oto", "visit", "." ], "ids": [ 56618, 10550, 48201, 26389, 10107, 13902, 20834, 10939, 45896, 31362, 19235, 27541, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "SA", "##N", "J", "##OS", "##E", ",", "Costa", "Rica", "1996", "-", "08", "-", "28" ], "ids": [ 21318, 11537, 147, 21793, 11259, 117, 13902, 20834, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "moderate", "earthquake", "measuring", "5", ".", "0", "on", "the", "Richter", "scale", "sh", "##ook", "Costa", "Rica", "on", "Wednesday", "during", "a", "visit", "by", "Japanese", "Prime", "Minister", "Ryu", "##taro", "Has", "##him", "##oto", ",", "but", "there", "were", "no", "reports", "of", "casualties", "or", "damage", ",", "officials", "said", "." ], "ids": [ 138, 62483, 63406, 92267, 126, 119, 121, 10135, 10105, 26888, 19707, 48201, 46921, 13902, 20834, 10135, 57611, 10939, 169, 27541, 10155, 13847, 19924, 14355, 97479, 64618, 45896, 31362, 19235, 117, 10473, 11155, 10309, 10192, 26610, 10108, 69297, 10345, 26115, 117, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "qua", "##ke", "struck", "at", "11", ".", "16", "a", ".", "m", ".", "(", "1716", "GMT", ")", "and", "was", "centre", "##d", "10", "miles", "(", "16", "km", ")", "south", "of", "the", "port", "of", "Que", "##pos", ",", "which", "is", "90", "miles", "(", "140", "km", ")", "south", "of", "the", "capital", "San", "Jose", ",", "the", "Costa", "Rica", "##n", "Vol", "##cani", "##c", "and", "Seis", "##mol", "##ogi", "##cial", "Observatory", "said", "." ], "ids": [ 10117, 14517, 10550, 45622, 10160, 10193, 119, 10250, 169, 119, 181, 119, 113, 40257, 20362, 114, 10111, 10134, 12672, 10162, 10150, 14148, 113, 10250, 10204, 114, 13144, 10108, 10105, 16874, 10108, 27158, 22815, 117, 10319, 10124, 10919, 14148, 113, 13958, 10204, 114, 13144, 10108, 10105, 12185, 10469, 23029, 117, 10105, 13902, 20834, 10115, 12546, 108944, 10350, 10111, 93807, 52814, 28240, 32939, 41495, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "The", "qua", "##ke", "was", "felt", "for", "about", "seven", "seconds", "in", "most", "of", "the", "country", "but", "preliminary", "reports", "said", "no", "one", "was", "hur", "##t", ",", "it", "added", "." ], "ids": [ 10117, 14517, 10550, 10134, 24666, 10142, 10978, 15767, 34290, 10106, 10992, 10108, 10105, 12723, 10473, 68097, 26610, 12415, 10192, 10464, 10134, 52824, 10123, 117, 10271, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "qua", "##ke", "took", "place", "a", "few", "minutes", "before", "the", "end", "of", "a", "wel", "##coming", "ceremony", "at", "Juan", "Santa", "##mari", "##a", "airport", "for", "Has", "##him", "##oto", ",", "who", "was", "starting", "a", "three", "-", "hour", "visit", "as", "part", "of", "a", "Latin", "American", "tour", "." ], "ids": [ 10117, 14517, 10550, 12149, 11192, 169, 13824, 15304, 11360, 10105, 11572, 10108, 169, 16829, 38701, 34713, 10160, 11686, 11154, 65899, 10113, 28460, 10142, 45896, 31362, 19235, 117, 10479, 10134, 21868, 169, 11003, 118, 24730, 27541, 10146, 10668, 10108, 169, 14617, 10536, 12842, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Has", "##him", "##oto", ",", "who", "arrived", "at", "11", "a", ".", "m", ".", "(", "1700", "GMT", ")", ",", "showed", "no", "sign", "of", "having", "felt", "the", "qua", "##ke", ",", "witnesses", "said", "." ], "ids": [ 45896, 31362, 19235, 117, 10479, 22584, 10160, 10193, 169, 119, 181, 119, 113, 17322, 20362, 114, 117, 27463, 10192, 26794, 10108, 13677, 24666, 10105, 14517, 10550, 117, 109898, 12415, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Barr", "##ier", "removed", "to", "Brazil", "CV", "##RD", "sell", "-", "off", "." ], "ids": [ 79283, 11709, 23898, 10114, 16765, 27642, 84444, 36300, 118, 11898, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##AS", "##IL", "##IA", "1996", "-", "08", "-", "28" ], "ids": [ 49351, 38025, 38850, 35976, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Brazilian", "Senate", "Wednesday", "agreed", "to", "she", "##lve", "a", "bill", "linking", "the", "privat", "##ization", "of", "mining", "con", "##glo", "##mera", "##te", "Vale", "do", "Rio", "Doc", "##e", "to", "congressional", "approval", ",", "officials", "said", "." ], "ids": [ 10117, 32818, 22294, 57611, 25577, 10114, 10833, 49992, 169, 34497, 109784, 10105, 51085, 19980, 10108, 32802, 10173, 77646, 35545, 10216, 32286, 10149, 12109, 50653, 10112, 10114, 94137, 48531, 117, 27730, 12415, 119 ], "entity": [ "O", "B-MISC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Official", "##s", "said", "the", "Senate", "vote", "removed", "all", "existing", "legislative", "hur", "##dles", "in", "the", "way", "of", "CV", "##RD", "'", "s", "sell", "-", "off", "." ], "ids": [ 17678, 10107, 12415, 10105, 22294, 18926, 23898, 10435, 26636, 53374, 52824, 92503, 10106, 10105, 13170, 10108, 27642, 84444, 112, 187, 36300, 118, 11898, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "motion", "was", "put", "forward", "by", "Sen", "." ], "ids": [ 10117, 30107, 10134, 14499, 23307, 10155, 18082, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Jose", "Eduardo", "Du", "##tra", ",", "who", "had", "drawn", "up", "the", "bill", "." ], "ids": [ 23029, 19131, 14925, 13207, 117, 10479, 10374, 34788, 10741, 10105, 34497, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Senate", "vote", "also", "ann", "##ulle", "##d", "a", "substitute", "version", "of", "Du", "##tra", "'", "s", "bill", "which", "had", "sought", "to", "dedicat", "##e", "revenue", "from", "Vale", "'", "s", "privat", "##ization", "to", "regional", "infrastructure", "projects", "." ], "ids": [ 10117, 22294, 18926, 10379, 28481, 97740, 10162, 169, 58808, 11674, 10108, 14925, 13207, 112, 187, 34497, 10319, 10374, 32570, 10114, 98718, 10112, 51557, 10188, 32286, 112, 187, 51085, 19980, 10114, 16454, 44284, 22846, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "William", "Sc", "##hom", "##berg", ",", "Brasil", "##ia", "news", "##room", "55", "-", "61", "-", "223", "##0", "##35", "##8" ], "ids": [ 118, 118, 10694, 55260, 71784, 11348, 117, 12264, 10280, 14424, 25525, 11358, 118, 12314, 118, 24415, 10929, 76897, 11396 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Arthur", "Yates", "year", "net", "A", "$", "6", ".", "1", "mln", "." ], "ids": [ 56898, 39469, 118, 13134, 83165, 10924, 11988, 138, 109, 127, 119, 122, 35198, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "29" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "to", "June", "30" ], "ids": [ 13567, 10114, 11120, 10244 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "(", "million", "A", "$", "unless", "stated", ")" ], "ids": [ 113, 12473, 138, 109, 60015, 17067, 114 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Opera", "##ting", "profit", "9", ".", "75", "vs", "5", ".", "79" ], "ids": [ 16836, 12141, 25081, 130, 119, 11417, 14987, 126, 119, 12791 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "profit", "6", ".", "08", "vs", "3", ".", "98" ], "ids": [ 32577, 25081, 127, 119, 11052, 14987, 124, 119, 12327 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Final", "divide", "##nd", "(", "cents", ")", "4", ".", "0", "vs", "4", ".", "0" ], "ids": [ 14924, 41430, 11534, 113, 63487, 114, 125, 119, 121, 14987, 125, 119, 121 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "divide", "##nd", "(", "cents", ")", "6", ".", "0", "vs", "6", ".", "0" ], "ids": [ 25220, 41430, 11534, 113, 63487, 114, 127, 119, 121, 14987, 127, 119, 121 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", ":", "Arthur", "Yates", "and", "Co", "lt", "##d", "is", "a", "garden", "products", "group", "." ], "ids": [ 49307, 29833, 131, 13134, 83165, 10111, 13098, 43900, 10162, 10124, 169, 35651, 20895, 11795, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sales", "148", ".", "29", "vs", "133", ".", "82" ], "ids": [ 48514, 19506, 119, 10386, 14987, 18665, 119, 12180 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Other", "income", "1", ".", "90", "vs", "2", ".", "07" ], "ids": [ 14490, 18245, 122, 119, 10919, 14987, 123, 119, 10878 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##hr", "(", "cents", ")", "8", ".", "63", "vs", "7", ".", "23" ], "ids": [ 156, 16757, 113, 63487, 114, 129, 119, 12256, 14987, 128, 119, 10328 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Di", "##vide", "##nd", "is", "100", "percent", "fra", "##nke", "##d" ], "ids": [ 12944, 41638, 11534, 10124, 10407, 22362, 10628, 53770, 10162 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pay", "date", "Nov", "25" ], "ids": [ 88031, 13664, 36779, 10258 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Reg", "date", "Nov", "11" ], "ids": [ 107990, 13664, 36779, 10193 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Tax", "3", ".", "67", "vs", "1", ".", "82" ], "ids": [ 81839, 124, 119, 12316, 14987, 122, 119, 12180 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Interest", "2", ".", "78", "vs", "2", ".", "69" ], "ids": [ 88492, 123, 119, 12492, 14987, 123, 119, 12573 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "De", "##pre", "##ciation", "3", ".", "25", "vs", "2", ".", "79" ], "ids": [ 10190, 30619, 94958, 124, 119, 10258, 14987, 123, 119, 12791 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "news", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 14424, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brit", "##on", "held", "in", "Thailand", "over", "4", ".", "4", "kg", "hero", "##in", "find", "." ], "ids": [ 68447, 10263, 11991, 10106, 19621, 10491, 125, 119, 125, 11895, 51670, 10245, 17860, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##NG", "##KO", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 39999, 34065, 57277, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thai", "airport", "police", "arrested", "a", "British", "bar", "##tender", "for", "allegedly", "attempting", "to", "board", "a", "flight", "for", "Amsterdam", "with", "nearly", "4", ".", "4", "kg", "(", "9", ".", "68", "lb", ")", "of", "hero", "##in", "in", "his", "lu", "##gga", "##ge", ",", "police", "said", "on", "Wednesday", "." ], "ids": [ 26207, 28460, 15034, 29479, 169, 11160, 18121, 106350, 10142, 78210, 63494, 10114, 17936, 169, 23578, 10142, 14017, 10169, 21377, 125, 119, 125, 11895, 113, 130, 119, 12370, 23989, 114, 10108, 51670, 10245, 10106, 10226, 14657, 38541, 10525, 117, 15034, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "James", "Lee", "Williams", ",", "28", ",", "was", "stopped", "at", "a", "Bangkok", "airport", "departure", "lo", "##unge", "on", "Monday", "after", "officials", "found", "the", "drug", "in", "a", "bag", "that", "Williams", "planned", "to", "carry", "onto", "the", "plane", "." ], "ids": [ 18051, 12415, 10900, 12006, 12494, 117, 10348, 117, 10134, 40949, 10160, 169, 34793, 28460, 51598, 10406, 37948, 10135, 40714, 10662, 27730, 11823, 10105, 20998, 10106, 169, 56332, 10189, 12494, 24292, 10114, 31626, 31095, 10105, 35007, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Williams", "'", "hometown", "was", "not", "immediately", "available", "." ], "ids": [ 12494, 112, 86669, 10134, 10472, 24029, 14579, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "maximum", "sentence", "for", "hero", "##in", "traffic", "##king", "is", "the", "death", "penalty", ",", "although", "it", "is", "normally", "com", "##mut", "##ed", "to", "life", "imprisonment", "." ], "ids": [ 10117, 22393, 49219, 10142, 51670, 10245, 26482, 15629, 10124, 10105, 12557, 40924, 117, 14779, 10271, 10124, 48252, 10212, 50164, 10336, 10114, 12103, 91044, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PL", "##O", "Council", "calls", "for", "halt", "to", "contacts", "with", "Israel", "." ], "ids": [ 71341, 11403, 12821, 31886, 10142, 59334, 10114, 75091, 10169, 12991, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "RAM", "##AL", "##LA", "##H", ",", "West", "Bank", "1996", "-", "08", "-", "28" ], "ids": [ 39604, 32002, 44376, 12396, 117, 11164, 13533, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Palestinian", "Legislative", "Council", "on", "Wednesday", "called", "for", "a", "halt", "to", "contacts", "with", "Israel", ",", "just", "hours", "after", "President", "Ya", "##sser", "Ara", "##fat", "said", "the", "Jewish", "state", "had", "effectively", "declared", "war", "on", "the", "Palestinian", "##s", "by", "pur", "##su", "##ing", "its", "hard", "##line", "policies", "." ], "ids": [ 10117, 56119, 32681, 12821, 10135, 57611, 11552, 10142, 169, 59334, 10114, 75091, 10169, 12991, 117, 12820, 19573, 10662, 12811, 25148, 33519, 54789, 25616, 12415, 10105, 17119, 11388, 10374, 46767, 25019, 10338, 10135, 10105, 56119, 10107, 10155, 32385, 12892, 10230, 10474, 19118, 12953, 38572, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "resolution", "released", "by", "the", "council", "called", "for", "\"", "halt", "##ing", "contacts", "with", "the", "Israeli", "side", "and", "leaving", "the", "mechanism", "to", "carry", "out", "this", "to", "Palestinian", "President", "Ya", "##sser", "Ara", "##fat", "\"", "." ], "ids": [ 138, 40017, 11539, 10155, 10105, 23503, 11552, 10142, 107, 59334, 10230, 75091, 10169, 10105, 28446, 12250, 10111, 21005, 10105, 50706, 10114, 31626, 10950, 10531, 10114, 56119, 12811, 25148, 33519, 54789, 25616, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "The", "council", "was", "meeting", "in", "Rama", "##llah", "to", "discuss", "Israel", "'", "s", "new", "policy", "of", "Jewish", "settlement", "expansion", "and", "its", "un", "##com", "##pro", "##mising", "line", "on", "Jerusalem", "since", "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", "took", "office", "in", "June", "." ], "ids": [ 10117, 23503, 10134, 19822, 10106, 42746, 98134, 10114, 71695, 12991, 112, 187, 10751, 14368, 10108, 17119, 23931, 24837, 10111, 10474, 10119, 22530, 73099, 81654, 12117, 10135, 20599, 11764, 19924, 14355, 16810, 32577, 36027, 13723, 12149, 14301, 10106, 11120, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Council", "resolution", "##s", "are", "not", "necessarily", "binding", "." ], "ids": [ 12821, 40017, 10107, 10301, 10472, 82080, 42249, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ara", "##fat", "had", "earlier", "bl", "##aste", "##d", "Israel", "saying", "its", "policies", "amount", "##ed", "to", "a", "declaration", "of", "war", "against", "the", "Palestinian", "people", "." ], "ids": [ 54789, 25616, 10374, 18905, 21484, 25096, 10162, 12991, 22807, 10474, 38572, 24074, 10336, 10114, 169, 105108, 10108, 10338, 11327, 10105, 56119, 11426, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "He", "also", "called", "for", "the", "first", "general", "strike", "in", "two", "years", "in", "the", "West", "Bank", "and", "Gaza", "on", "Thursday", "." ], "ids": [ 10357, 10379, 11552, 10142, 10105, 10422, 11389, 37456, 10106, 10551, 10855, 10106, 10105, 11164, 13533, 10111, 42434, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9 ] }, { "tokens": [ "\"", "What", "happened", "concerning", "continuous", "violation", "##s", "and", "crimes", "from", "this", "new", "Israeli", "leadership", "means", "they", "are", "de", "##cla", "##ring", "a", "state", "of", "war", "against", "the", "Palestinian", "people", ",", "\"", "Ara", "##fat", "told", "the", "council", "." ], "ids": [ 107, 12489, 44936, 53047, 51035, 88993, 10107, 10111, 36951, 10188, 10531, 10751, 28446, 25121, 17574, 10689, 10301, 10104, 60582, 13135, 169, 11388, 10108, 10338, 11327, 10105, 56119, 11426, 117, 107, 54789, 25616, 21937, 10105, 23503, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Council", "speaker", "Ahmed", "Kore", "##i", "said", "the", "decision", "was", "part", "of", "a", "comprehensive", "plan", "to", "con", "##front", "Israeli", "settlement", "policy", ",", "land", "con", "##fis", "##cation", "and", "what", "he", "terme", "##d", "other", "violation", "##s", "of", "the", "Israeli", "-", "PL", "##O", "peace", "deals", "." ], "ids": [ 12821, 57738, 25530, 100573, 10116, 12415, 10105, 19231, 10134, 10668, 10108, 169, 55586, 13065, 10114, 10173, 31044, 28446, 23931, 14368, 117, 11773, 10173, 65702, 26287, 10111, 12976, 10261, 15830, 10162, 10684, 88993, 10107, 10108, 10105, 28446, 118, 71341, 11403, 28101, 78037, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Iraqi", "Kur", "##d", "group", "says", "agrees", "new", "cea", "##sef", "##ire", "." ], "ids": [ 57806, 61912, 10162, 11795, 22153, 96765, 10751, 25578, 107749, 11627, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##KA", "##RA", "1996", "-", "08", "-", "28" ], "ids": [ 50972, 67813, 29990, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Iraqi", "Kur", "##dish", "group", "on", "Wednesday", "said", "it", "had", "agreed", "a", "new", "U", ".", "S", ".", "-", "broke", "##red", "cea", "##sef", "##ire", "with", "a", "rival", "faction", "after", "a", "previous", "accord", "was", "sh", "##atte", "##red", "by", "spor", "##adi", "##c", "fighting", "between", "the", "groups", "in", "recent", "days", "." ], "ids": [ 10313, 57806, 61912, 67522, 11795, 10135, 57611, 12415, 10271, 10374, 25577, 169, 10751, 158, 119, 156, 119, 118, 30500, 15711, 25578, 107749, 11627, 10169, 169, 24792, 84395, 10662, 169, 16741, 35233, 10134, 48201, 43961, 15711, 10155, 40458, 18974, 10350, 27535, 10948, 10105, 15647, 10106, 19037, 13990, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Patriot", "##ic", "Union", "of", "Kurdistan", "(", "P", "##U", "##K", ")", "leadership", "de", "##cla", "##res", "its", "end", "##orse", "##ment", "for", "a", "cea", "##sef", "##ire", "arrangement", "with", "the", "K", "##DP", "(", "Kurdistan", "Democratic", "Party", ")", "to", "take", "effect", "as", "of", "8", ":", "00", "a", ".", "m", ".", "on", "August", "28", ",", "\"", "the", "P", "##U", "##K", "said", "in", "a", "statement", "." ], "ids": [ 107, 10117, 107222, 11130, 11457, 10108, 86246, 113, 153, 12022, 11733, 114, 25121, 10104, 60582, 11234, 10474, 11572, 91235, 10426, 10142, 169, 25578, 107749, 11627, 40258, 10169, 10105, 148, 54714, 113, 86246, 19281, 12529, 114, 10114, 13574, 18514, 10146, 10108, 129, 131, 11025, 169, 119, 181, 119, 10135, 10735, 10348, 117, 107, 10105, 153, 12022, 11733, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "P", "##U", "##K", "said", "the", "cea", "##sef", "##ire", "was", "agreed", "after", "talks", "between", "U", ".", "S", ".", "Assistant", "Secretary", "for", "Near", "East", "Affairs", "Robert", "Pel", "##let", "##reau", "and", "P", "##U", "##K", "leader", "Ja", "##lal", "Tala", "##bani", "." ], "ids": [ 10117, 153, 12022, 11733, 12415, 10105, 25578, 107749, 11627, 10134, 25577, 10662, 56672, 10948, 158, 119, 156, 119, 32287, 19382, 10142, 16140, 11830, 20891, 10820, 75056, 12630, 50496, 10111, 153, 12022, 11733, 15014, 28248, 29267, 110135, 107081, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 1, 5, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "The", "K", "##DP", ",", "led", "by", "Mass", "##oud", "Bar", "##zani", ",", "had", "said", "a", "previous", "cea", "##sef", "##ire", "nego", "##tia", "##ted", "by", "Pel", "##let", "##reau", "last", "Friday", "was", "broken", "by", "the", "P", "##U", "##K", "." ], "ids": [ 10117, 148, 54714, 117, 12857, 10155, 28957, 50555, 20698, 58319, 117, 10374, 12415, 169, 16741, 25578, 107749, 11627, 21134, 16180, 11912, 10155, 75056, 12630, 50496, 12469, 30767, 10134, 36197, 10155, 10105, 153, 12022, 11733, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Tala", "##bani", "has", "agreed", "to", "take", "part", "in", "talks", "in", "London", "on", "reaching", "a", "comprehensive", "settlement", "for", "the", "P", "##U", "##K", "-", "K", "##DP", "conflict", ",", "the", "P", "##U", "##K", "statement", "said", "." ], "ids": [ 110135, 107081, 10393, 25577, 10114, 13574, 10668, 10106, 56672, 10106, 10829, 10135, 34186, 169, 55586, 23931, 10142, 10105, 153, 12022, 11733, 118, 148, 54714, 24620, 117, 10105, 153, 12022, 11733, 33311, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "It", "said", "the", "K", "##DP", "was", "responsible", "for", "breaking", "the", "previous", "cea", "##sef", "##ire", "by", "ref", "##using", "to", "end", "##orse", "it", "publicly", "." ], "ids": [ 10377, 12415, 10105, 148, 54714, 10134, 21586, 10142, 47105, 10105, 16741, 25578, 107749, 11627, 10155, 48056, 95179, 10114, 11572, 91235, 10271, 53577, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kur", "##d", "group", "says", "Iraqi", "troops", "mass", "##ing", "near", "north", "." ], "ids": [ 61912, 10162, 11795, 22153, 57806, 20836, 22038, 10230, 12883, 12756, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AN", "##KA", "##RA", "1996", "-", "08", "-", "28" ], "ids": [ 50972, 67813, 29990, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Iraqi", "Kur", "##dish", "group", "on", "Wednesday", "said", "Iraq", "was", "mass", "##ing", "troops", "near", "Kur", "##dish", "regions", "in", "the", "north", ",", "where", "a", "U", ".", "S", ".", "-", "led", "allied", "air", "force", "protect", "##s", "the", "local", "population", "against", "attacks", "from", "Baghdad", "." ], "ids": [ 10313, 57806, 61912, 67522, 11795, 10135, 57611, 12415, 21455, 10134, 22038, 10230, 20836, 12883, 61912, 67522, 21721, 10106, 10105, 12756, 117, 10940, 169, 158, 119, 156, 119, 118, 12857, 91649, 12566, 15031, 32949, 10107, 10105, 11436, 11077, 11327, 26483, 10188, 73055, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "The", "Iraqi", "regime", "has", "started", "threat", "##ening", "the", "Kur", "##dish", "population", "by", "mass", "##ing", "troops", "in", "preparation", "to", "attack", "Kur", "##dish", "towns", "and", "population", "centres", ",", "\"", "the", "Patriot", "##ic", "Union", "of", "Kurdistan", "(", "P", "##U", "##K", ")", "said", "in", "a", "statement", "." ], "ids": [ 107, 10117, 57806, 24807, 10393, 13457, 41256, 24428, 10105, 61912, 67522, 11077, 10155, 22038, 10230, 20836, 10106, 59386, 10114, 16342, 61912, 67522, 26656, 10111, 11077, 35208, 117, 107, 10105, 107222, 11130, 11457, 10108, 86246, 113, 153, 12022, 11733, 114, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "P", "##U", "##K", "said", "it", "had", "received", "confirmed", "reports", "that", "Iraqi", "troops", ",", "supported", "by", "tanks", ",", "artillery", "and", "arm", "##oured", "vehicles", ",", "have", "already", "pen", "##et", "##rated", "some", "Kur", "##dish", "areas", "." ], "ids": [ 10117, 153, 12022, 11733, 12415, 10271, 10374, 12296, 27347, 26610, 10189, 57806, 20836, 117, 19992, 10155, 46731, 117, 46524, 10111, 31251, 73499, 27237, 117, 10529, 19034, 66558, 10308, 32199, 11152, 61912, 67522, 14544, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "It", "said", "the", "military", "presence", "reflects", "cooperation", "between", "President", "Saddam", "Hussein", "and", "the", "P", "##U", "##K", "'", "s", "rival", ",", "the", "Kurdistan", "Democratic", "Party", "(", "K", "##DP", ")", "." ], "ids": [ 10377, 12415, 10105, 14041, 25599, 102374, 56547, 10948, 12811, 85431, 49053, 10111, 10105, 153, 12022, 11733, 112, 187, 24792, 117, 10105, 86246, 19281, 12529, 113, 148, 54714, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9 ] }, { "tokens": [ "The", "P", "##U", "##K", "statement", "follows", "K", "##DP", "ass", "##ertion", "##s", "that", "the", "P", "##U", "##K", "is", "receiving", "military", "support", "from", "Iran", "." ], "ids": [ 10117, 153, 12022, 11733, 33311, 23698, 148, 54714, 13935, 107373, 10107, 10189, 10105, 153, 12022, 11733, 10124, 31391, 14041, 13145, 10188, 12901, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Host", "##ilities", "between", "the", "two", "war", "##ring", "Iraqi", "Kur", "##dish", "faction", "##s", "have", "continued", "in", "the", "last", "few", "days", "despite", "a", "U", ".", "S", ".", "-", "broke", "##red", "cea", "##sef", "##ire", "last", "Friday", "." ], "ids": [ 64121, 83133, 10948, 10105, 10551, 10338, 13135, 57806, 61912, 67522, 84395, 10107, 10529, 14278, 10106, 10105, 12469, 13824, 13990, 22087, 169, 158, 119, 156, 119, 118, 30500, 15711, 25578, 107749, 11627, 12469, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "P", "##U", "##K", "called", "on", "the", "United", "Nations", "and", "allied", "forces", "to", "halt", "the", "Iraqi", "ag", "##gression", "." ], "ids": [ 10117, 153, 12022, 11733, 11552, 10135, 10105, 10609, 15145, 10111, 91649, 13729, 10114, 59334, 10105, 57806, 16942, 106105, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", ",", "French", "and", "British", "aircraft", "have", "safe", "##guard", "##ed", "the", "Iraqi", "Kur", "##dish", "population", "against", "ag", "##gression", "from", "Baghdad", "since", "shortly", "after", "the", "Gulf", "War", "in", "1991", "." ], "ids": [ 158, 119, 156, 119, 117, 11894, 10111, 11160, 16167, 10529, 43966, 80928, 10336, 10105, 57806, 61912, 67522, 11077, 11327, 16942, 106105, 10188, 73055, 11764, 31555, 10662, 10105, 28239, 11277, 10106, 10442, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 2, 9, 2, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "The", "allied", "force", ",", "known", "as", "Operation", "Pro", "##vide", "Com", "##fort", ",", "is", "based", "in", "southern", "Turkey", "." ], "ids": [ 10117, 91649, 15031, 117, 11053, 10146, 21188, 14021, 41638, 16680, 23044, 117, 10124, 11610, 10106, 17156, 22519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Iraq", "says", "hija", "##cker", "##s", "were", "not", "diplomat", "##s", "." ], "ids": [ 21455, 22153, 26429, 19153, 10107, 10309, 10472, 45652, 10107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##G", "##HD", "##AD", "1996", "-", "08", "-", "28" ], "ids": [ 39999, 11447, 99997, 55538, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraq", "on", "Wednesday", "said", "the", "hija", "##cker", "##s", "of", "a", "Sudan", "##ese", "airline", "##r", "were", "not", "Iraqi", "diplomat", "##s", "and", "added", "that", "\"", "noble", "Iraqi", "##s", "\"", "would", "never", "conte", "##mp", "##late", "such", "an", "action", "." ], "ids": [ 21455, 10135, 57611, 12415, 10105, 26429, 19153, 10107, 10108, 169, 28407, 13565, 67878, 10129, 10309, 10472, 57806, 45652, 10107, 10111, 16288, 10189, 107, 32777, 57806, 10107, 107, 10894, 14794, 26777, 18573, 23953, 11049, 10151, 14204, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "official", "Iraqi", "News", "Agency", "(", "IN", "##A", ")", "quoted", "Iraq", "'", "s", "ambassador", "in", "K", "##hart", "##oum", "as", "saying", "that", "Iraq", "'", "s", "em", "##bas", "##sy", "in", "the", "Sudan", "##ese", "capital", "had", "nothing", "to", "do", "with", "the", "Monday", "night", "hija", "##cking", "." ], "ids": [ 10117, 14731, 57806, 12219, 21887, 113, 36351, 10738, 114, 70676, 21455, 112, 187, 74853, 10106, 148, 34567, 88314, 10146, 22807, 10189, 21455, 112, 187, 10266, 21322, 16105, 10106, 10105, 28407, 13565, 12185, 10374, 33338, 10114, 10149, 10169, 10105, 40714, 16903, 26429, 72453, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraq", "'", "s", "ambassador", "in", "K", "##hart", "##oum", "den", "##oun", "##ced", "the", "hija", "##cking", "and", "described", "it", "as", "a", "terrorist", "act", "which", "had", "nothing", "to", "do", "\"", "with", "the", "moral", "##s", "and", "values", "of", "noble", "Iraqi", "##s", ",", "\"", "IN", "##A", "said", "." ], "ids": [ 21455, 112, 187, 74853, 10106, 148, 34567, 88314, 10140, 43971, 38039, 10105, 26429, 72453, 10111, 13010, 10271, 10146, 169, 76482, 19833, 10319, 10374, 33338, 10114, 10149, 107, 10169, 10105, 23680, 10107, 10111, 31313, 10108, 32777, 57806, 10107, 117, 107, 36351, 10738, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Ambassador", "Abdul", "##sama", "##d", "Ham", "##eed", "Ali", "told", "IN", "##A", "there", "was", "only", "one", "diplomat", "among", "the", "199", "passengers", "and", "crew", "on", "the", "Sudan", "Airways", "Airbus", "." ], "ids": [ 55060, 23642, 62009, 10162, 39135, 40154, 13518, 21937, 36351, 10738, 11155, 10134, 10893, 10464, 45652, 13328, 10105, 23366, 37008, 10111, 24032, 10135, 10105, 28407, 29791, 35540, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "B-MISC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 2, 9 ] }, { "tokens": [ "\"", "He", "was", "not", "involved", ".", ".", "." ], "ids": [ 107, 10357, 10134, 10472, 16247, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "on", "the", "contra", "##ry", "he", "was", "har", "##asse", "##d", "by", "the", "elements", "which", "carried", "out", "the", "hija", "##cking", ",", "\"", "he", "said", "." ], "ids": [ 10135, 10105, 11473, 10908, 10261, 10134, 10453, 77923, 10162, 10155, 10105, 17464, 10319, 21086, 10950, 10105, 26429, 72453, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##A", "did", "not", "say", "the", "hija", "##cker", "##s", "were", "Iraqi", "##s", "." ], "ids": [ 36351, 10738, 12172, 10472, 23763, 10105, 26429, 19153, 10107, 10309, 57806, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "The", "hija", "##ck", "started", "when", "the", "flight", "left", "K", "##hart", "##oum", "for", "Amman", "on", "Monday", "night", "." ], "ids": [ 10117, 26429, 11263, 13457, 10841, 10105, 23578, 12153, 148, 34567, 88314, 10142, 107098, 10135, 40714, 16903, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "hija", "##cker", "##s", "told", "the", "crew", "they", "had", "gr", "##ena", "##des", "and", "other", "ex", "##plosive", "##s", "and", "threatened", "to", "blow", "up", "the", "plane", "if", "they", "were", "not", "taken", "to", "London", "." ], "ids": [ 10117, 26429, 19153, 10107, 21937, 10105, 24032, 10689, 10374, 30518, 13032, 10920, 10111, 10684, 11419, 83655, 10107, 10111, 44593, 10114, 106194, 10741, 10105, 35007, 12277, 10689, 10309, 10472, 15109, 10114, 10829, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "airline", "##r", "ref", "##uelle", "##d", "at", "La", "##rna", "##ca", ",", "Cyprus", "and", "landed", "at", "London", "'", "s", "Stan", "##sted", "airport", "in", "the", "early", "hours", "of", "Tuesday", "." ], "ids": [ 10117, 67878, 10129, 48056, 36252, 10162, 10160, 10159, 13471, 10425, 117, 45639, 10111, 58961, 10160, 10829, 112, 187, 26637, 36018, 28460, 10106, 10105, 11732, 19573, 10108, 70245, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Seven", "Iraqi", "suspected", "hija", "##cker", "##s", "surrendered", "and", "British", "police", "said", "they", "had", "apparently", "asked", "for", "political", "as", "##ylum", "." ], "ids": [ 21077, 57806, 80337, 26429, 19153, 10107, 104330, 10111, 11160, 15034, 12415, 10689, 10374, 47731, 22151, 10142, 13736, 10146, 54716, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Several", "had", "brought", "their", "families", "along", ",", "including", "children", "." ], "ids": [ 28604, 10374, 17327, 10455, 15300, 12400, 117, 11198, 12694, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dol", "##e", "bl", "##ast", "##s", "Clinton", "for", "ig", "##nor", "##ing", "teen", "drug", "use", "." ], "ids": [ 100035, 10112, 21484, 15171, 10107, 24139, 10142, 23602, 36064, 10230, 33003, 20998, 11760, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Judith", "Cross", "##on" ], "ids": [ 35043, 15666, 10263 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "V", "##EN", "##T", "##UR", "##A", ",", "Cali", "##f", ".", "1996", "-", "08", "-", "28" ], "ids": [ 159, 50655, 11090, 98348, 10738, 117, 65458, 10575, 119, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Republican", "presidential", "candidate", "Bob", "Dol", "##e", "Wednesday", "accused", "the", "Clinton", "administration", "of", "ig", "##nor", "##ing", "drug", "use", "among", "teen", "##ager", "##s", "and", "said", "if", "elected", "he", "would", "use", "the", "National", "Guard", "to", "stop", "drugs", "from", "entering", "the", "United", "States", "." ], "ids": [ 21776, 36476, 22102, 13583, 100035, 10112, 57611, 37303, 10105, 24139, 17941, 10108, 23602, 36064, 10230, 20998, 11760, 13328, 33003, 37247, 10107, 10111, 12415, 12277, 14254, 10261, 10894, 11760, 10105, 10655, 28739, 10114, 20517, 40421, 10188, 44824, 10105, 10609, 10859, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "He", "'", "ll", "probably", "mention", "his", "war", "on", "drugs", ",", "which", "he", "'", "s", "going", "to", "start", "like", "everything", "else", "-", "-", "next", "year", "." ], "ids": [ 107, 10357, 112, 22469, 23282, 33507, 10226, 10338, 10135, 40421, 117, 10319, 10261, 112, 187, 19090, 10114, 15148, 11850, 42536, 40843, 118, 118, 13451, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "too", "late", ",", "Mr", ".", "President", ",", "\"", "Dol", "##e", "told", "an", "outdoor", "crowd", "of", "several", "hundred", "at", "a", "private", "religious", "school", "." ], "ids": [ 10377, 112, 187, 16683, 13002, 117, 12916, 119, 12811, 117, 107, 100035, 10112, 21937, 10151, 60180, 50059, 10108, 11736, 34242, 10160, 169, 14591, 19366, 11393, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "also", "commented", "briefly", "on", "published", "reports", "that", "the", "administration", "was", "planning", "to", "anno", "##unce", "a", "plan", "to", "lower", "capital", "gains", "taxes", "for", "home", "sales", ".", "\"" ], "ids": [ 10357, 10379, 56385, 36327, 10135, 12304, 26610, 10189, 10105, 17941, 10134, 30240, 10114, 11671, 93050, 169, 13065, 10114, 18165, 12185, 92193, 49870, 10142, 11816, 23857, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Welcome", "to", "the", "club", "." ], "ids": [ 39728, 10114, 10105, 11111, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "'", "ve", "had", "it", "out", "there", "for", "weeks", "and", "weeks", "and", "weeks", ",", "\"", "Dol", "##e", "said", "." ], "ids": [ 12865, 112, 10323, 10374, 10271, 10950, 11155, 10142, 20750, 10111, 20750, 10111, 20750, 117, 107, 100035, 10112, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Dol", "##e", "said", "former", "first", "lady", "Nancy", "Reagan", "was", "lau", "##ghed", "at", "with", "her", "\"", "just", "say", "no", "\"", "anti", "-", "drug", "message", ".", "\"" ], "ids": [ 100035, 10112, 12415, 11775, 10422, 61082, 20073, 41984, 10134, 27207, 75395, 10160, 10169, 10485, 107, 12820, 23763, 10192, 107, 14249, 118, 20998, 30514, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "it", "worked", ",", "\"", "Dol", "##e", "said", "." ], "ids": [ 16976, 10271, 13858, 117, 107, 100035, 10112, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Meanwhile", ",", "in", "Los", "Angeles", ",", "Dol", "##e", "'", "s", "running", "mate", ",", "Jack", "Kemp", ",", "campaign", "##ed", "aggressive", "##ly", "for", "the", "black", "vote", "in", "an", "area", "that", "was", "the", "flash", "##point", "of", "the", "1992", "Los", "Angeles", "rio", "##ts", "." ], "ids": [ 43309, 117, 10106, 10630, 12233, 117, 100035, 10112, 112, 187, 18020, 43465, 117, 12342, 87499, 117, 17323, 10336, 75388, 10454, 10142, 10105, 15045, 18926, 10106, 10151, 11168, 10189, 10134, 10105, 59946, 45676, 10108, 10105, 10450, 10630, 12233, 27244, 10806, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Kemp", "told", "a", "crowd", "of", "about", "300", "African", "Americans", "in", "south", "central", "Los", "Angeles", ",", "\"", "Keep", "your", "eyes", "open", ",", "keep", "your", "ear", "##s", "open", ",", "keep", "your", "heart", "open", "." ], "ids": [ 87499, 21937, 169, 50059, 10108, 10978, 11093, 13839, 25069, 10106, 13144, 12397, 10630, 12233, 117, 107, 42384, 20442, 38144, 14087, 117, 23819, 20442, 104700, 10107, 14087, 117, 23819, 20442, 21736, 14087, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "want", "to", "tell", "you", "with", "all", "my", "heart", "that", "we", "want", "to", "win", "your", "vote", ".", "\"" ], "ids": [ 146, 21528, 10114, 41549, 13028, 10169, 10435, 15127, 21736, 10189, 11951, 21528, 10114, 14125, 20442, 18926, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Dol", "##e", "'", "s", "address", "to", "a", "group", "that", "was", "largely", "white", ",", "the", "presidential", "nominee", "like", "##ned", "the", "stream", "of", "illegal", "drugs", "into", "the", "United", "States", "to", "missiles", "aimed", "at", "American", "children", "and", "promised", "to", "app", "##oint", "federal", "judges", "who", "would", "be", "tou", "##gh", "on", "illegal", "drug", "use", "." ], "ids": [ 10167, 100035, 10112, 112, 187, 32198, 10114, 169, 11795, 10189, 10134, 25340, 15263, 117, 10105, 36476, 81878, 11850, 17021, 10105, 41878, 10108, 39806, 40421, 10708, 10105, 10609, 10859, 10114, 65725, 53004, 10160, 10536, 12694, 10111, 77137, 10114, 72894, 94453, 16293, 56181, 10479, 10894, 10347, 52586, 15774, 10135, 39806, 20998, 11760, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "'", "re", "aim", "##ing", "millions", "and", "millions", "of", "missiles", "right", "at", "these", "young", "people", ",", "whether", "it", "'", "s", "a", "need", "##le", ",", "whether", "it", "'", "s", "a", "ci", "##gare", "##tte", ",", "whatever", "the", "delivery", "system", "is", "-", "-", "it", "'", "s", "pois", "##on", "and", "it", "'", "s", "got", "to", "stop", "in", "America", ".", "\"" ], "ids": [ 107, 11696, 112, 11639, 56048, 10230, 18123, 10111, 18123, 10108, 65725, 13448, 10160, 11762, 14739, 11426, 117, 21883, 10271, 112, 187, 169, 17367, 10284, 117, 21883, 10271, 112, 187, 169, 11322, 30671, 12131, 117, 104429, 10105, 55626, 11787, 10124, 118, 118, 10271, 112, 187, 20487, 10263, 10111, 10271, 112, 187, 19556, 10114, 20517, 10106, 11440, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "he", "said", "." ], "ids": [ 10261, 12415, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Dol", "##e", "said", "70", "percent", "of", "the", "co", "##ca", "##ine", "that", "entered", "the", "United", "States", "and", "40", "percent", "of", "the", "mari", "##juana", "came", "from", "Mexico", ".", "\"" ], "ids": [ 100035, 10112, 12415, 10923, 22362, 10108, 10105, 11170, 10425, 11088, 10189, 19226, 10105, 10609, 10859, 10111, 10533, 22362, 10108, 10105, 24538, 69454, 13383, 10188, 10490, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "We", "'", "ve", "got", "an", "international", "problem", "and", "I", "'", "m", "prepared", "to", "use", "our", "military", "might", "." ], "ids": [ 12865, 112, 10323, 19556, 10151, 12533, 18077, 10111, 146, 112, 181, 39837, 10114, 11760, 17446, 14041, 20970, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "want", "to", "stop", "drugs", "at", "the", "border", ",", "\"", "he", "said", "." ], "ids": [ 12865, 21528, 10114, 20517, 40421, 10160, 10105, 20949, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dol", "##e", "'", "s", "re", "##marks", "prompted", "questions", "about", "whether", "he", "was", "seeking", "a", "ban", "on", "ci", "##gare", "##ttes", ".", "\"" ], "ids": [ 100035, 10112, 112, 187, 11639, 64711, 93003, 26686, 10978, 21883, 10261, 10134, 51285, 169, 11915, 10135, 11322, 30671, 23863, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "did", "n", "'", "t", "say", "anything", "about", "ci", "##gare", "##ttes", "." ], "ids": [ 146, 12172, 182, 112, 188, 23763, 42819, 10978, 11322, 30671, 23863, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "was", "talking", "about", "drugs", "." ], "ids": [ 146, 10134, 78254, 10978, 40421, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "said", "you", "should", "n", "'", "t", "smoke", "either", "." ], "ids": [ 146, 12415, 13028, 14819, 182, 112, 188, 100332, 16106, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "'", "s", "all", "I", "said", ",", "\"", "he", "rep", "##lied", "as", "he", "was", "sh", "##aki", "##ng", "hands", "with", "well", "-", "wish", "##ers", "." ], "ids": [ 13646, 112, 187, 10435, 146, 12415, 117, 107, 10261, 76456, 65254, 10146, 10261, 10134, 48201, 22471, 10376, 27925, 10169, 11206, 118, 66069, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "asked", "specifically", "if", "he", "was", "suggesting", "a", "ban", "on", "ci", "##gare", "##ttes", ",", "Dol", "##e", "rep", "##lied", ":", "\"", "Oh", "no", "." ], "ids": [ 12242, 22151, 33228, 12277, 10261, 10134, 85404, 169, 11915, 10135, 11322, 30671, 23863, 117, 100035, 10112, 76456, 65254, 131, 107, 22800, 10192, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Come", "on", ",", "you", "know", "better", "than", "that", ".", "\"" ], "ids": [ 16336, 10135, 117, 13028, 21852, 18322, 11084, 10189, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dol", "##e", "campaign", "aide", "##s", "said", "the", "candidate", "was", "telling", "young", "people", "not", "to", "smoke", "." ], "ids": [ 100035, 10112, 17323, 23135, 10107, 12415, 10105, 22102, 10134, 61758, 14739, 11426, 10472, 10114, 100332, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dol", "##e", "also", "said", "he", "opposed", "California", "Pro", "##position", "215", "which", ",", "if", "approved", "by", "voters", ",", "would", "allow", "the", "cult", "##ivation", "of", "mari", "##juana", "plants", "for", "medicina", "##l", "uses", "." ], "ids": [ 100035, 10112, 10379, 12415, 10261, 30488, 11621, 14021, 33487, 22050, 10319, 117, 12277, 29855, 10155, 55450, 117, 10894, 21992, 10105, 58212, 88341, 10108, 24538, 69454, 21422, 10142, 30566, 10161, 19873, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dol", "##e", "said", "the", "initiative", "would", "allow", "mari", "##juana", "to", "be", "used", "for", "anything", "from", "a", "head", "##ache", "to", "an", "ing", "##row", "##n", "toen", "##ail", "." ], "ids": [ 100035, 10112, 12415, 10105, 34960, 10894, 21992, 24538, 69454, 10114, 10347, 11031, 10142, 42819, 10188, 169, 13578, 41944, 10114, 10151, 11600, 21454, 10115, 19000, 35240, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "an", "effort", "to", "paint", "the", "drug", "issue", "in", "non", "-", "political", "terms", ",", "Dol", "##e", "said", "three", "times", "during", "his", "20", "-", "minute", "address", "that", "illegal", "drug", "use", "was", "neither", "a", "Democratic", "nor", "a", "Republican", "issue", "but", "one", "that", "involves", "all", "people", "." ], "ids": [ 10167, 10151, 24912, 10114, 72700, 10105, 20998, 15557, 10106, 10446, 118, 13736, 18873, 117, 100035, 10112, 12415, 11003, 13465, 10939, 10226, 10197, 118, 21760, 32198, 10189, 39806, 20998, 11760, 10134, 51148, 169, 19281, 31515, 169, 21776, 15557, 10473, 10464, 10189, 53963, 10435, 11426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "anti", "-", "drug", "message", "is", "a", "theme", "Dol", "##e", "feels", "has", "strong", "voter", "appeal", "." ], "ids": [ 10117, 14249, 118, 20998, 30514, 10124, 169, 26648, 100035, 10112, 84992, 10393, 18093, 101309, 44861, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Sunday", "near", "Chicago", "he", "accused", "President", "Bill", "Clinton", "of", "\"", "raising", "the", "white", "flag", "\"", "in", "the", "war", "on", "drugs", "." ], "ids": [ 10576, 19731, 12883, 12317, 10261, 37303, 12811, 13160, 24139, 10108, 107, 59252, 10105, 15263, 31773, 107, 10106, 10105, 10338, 10135, 40421, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "recent", "survey", "showed", "that", "illegal", "drug", "use", "among", "12", "-", "17", "year", "-", "old", "##s", "had", "double", "##d", "in", "the", "past", "four", "years", "." ], "ids": [ 138, 19037, 35035, 27463, 10189, 39806, 20998, 11760, 13328, 10186, 118, 10273, 10924, 118, 12898, 10107, 10374, 15790, 10162, 10106, 10105, 17781, 11598, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dol", "##e", "was", "fl", "##anke", "##d", "by", "several", "California", "Republican", "politicians", "including", "Go", "##v", "." ], "ids": [ 100035, 10112, 10134, 58768, 62428, 10162, 10155, 11736, 11621, 21776, 75284, 11198, 14439, 10477, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 1, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pete", "Wilson", ",", "who", "said", "local", "and", "state", "governments", "cannot", "fight", "illegal", "drugs", "alone", "." ], "ids": [ 23107, 13083, 117, 10479, 12415, 11436, 10111, 11388, 52052, 25259, 20780, 39806, 40421, 24087, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "need", "all", "the", "help", "we", "can", "get", "." ], "ids": [ 107, 12865, 17367, 10435, 10105, 15217, 11951, 10944, 15329, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "need", "to", "get", "the", "kind", "of", "help", "we", "used", "to", "get", "when", "Ronald", "Reagan", "and", "George", "Bush", "were", "in", "the", "White", "House", ",", "\"", "Wilson", "said", "." ], "ids": [ 12865, 17367, 10114, 15329, 10105, 22282, 10108, 15217, 11951, 11031, 10114, 15329, 10841, 21474, 41984, 10111, 10955, 21145, 10309, 10106, 10105, 12136, 11545, 117, 107, 13083, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 9, 9, 1, 5, 9, 9, 4, 9, 9 ] }, { "tokens": [ "BA", "##LA", "##NC", "##E", "-", "Water", "Dis", "##t", "1", "Johnson", "C", "##ty", ",", "Kan", "." ], "ids": [ 39999, 44376, 100230, 11259, 118, 17702, 101270, 10123, 122, 13241, 140, 11195, 117, 57528, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6, 6, 1, 5, 5, 9, 1, 9 ] }, { "tokens": [ ",", "at", "$", "11", "mln", "." ], "ids": [ 117, 10160, 109, 10193, 35198, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AT", "##ER", "DI", "##ST", "##RI", "##CT", "1", "OF", "J", "##OH", "##NS", "##ON", "CO", "." ], "ids": [ 160, 32071, 24093, 110014, 32995, 46876, 91995, 122, 23240, 147, 55859, 69196, 30118, 32992, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ ",", "KS" ], "ids": [ 117, 61080 ], "entity": [ "O", "B-LOC" ], "entity_ids": [ 9, 1 ] }, { "tokens": [ "RE", ":", "$", "45", ",", "020", ",", "000" ], "ids": [ 71033, 131, 109, 10827, 117, 71906, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AT", "##ER", "RE", "##VE", "##N", "##UE", "B", "##ON", "##DS" ], "ids": [ 160, 32071, 24093, 71033, 68560, 11537, 62674, 139, 30118, 33953 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "$", "22", ",", "040", ",", "000", "SE", "##R", "." ], "ids": [ 109, 10306, 117, 82738, 117, 10259, 23056, 11273, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1996", "##A" ], "ids": [ 10389, 10738 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "$", "22", ",", "980", ",", "000", "RF", "##D", "##G", ",", "SE", "##R", "." ], "ids": [ 109, 10306, 117, 46263, 117, 10259, 72148, 11490, 11447, 117, 23056, 11273, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1996", "##B" ], "ids": [ 10389, 11274 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "MO", "##OD", "##Y", "'", "S", ":", "Aa", "S", "&", "P", ":", "AA", "+" ], "ids": [ 102059, 77836, 14703, 112, 156, 131, 80131, 156, 111, 153, 131, 30369, 116 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "Del", "##iver", "##y", "Date", ":", "09", "/", "05", "/", "1996", "(", "F", "##IR", "##M", ")" ], "ids": [ 15973, 37884, 10157, 29897, 131, 11035, 120, 10831, 120, 10389, 113, 143, 73522, 11517, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "06", "/", "01", "12", "/", "01" ], "ids": [ 10719, 120, 10669, 10186, 120, 10669 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MA", "##T", "##UR", "##IT", "##Y", "SE", "##R", "A", "SE", "##R", "B", "SE", "##R", "A", "SE", "##R", "B" ], "ids": [ 27277, 11090, 98348, 37611, 14703, 23056, 11273, 138, 23056, 11273, 139, 23056, 11273, 138, 23056, 11273, 139 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1998", "665", "##M", "840", "##M", "570", "##M" ], "ids": [ 10363, 61269, 11517, 42935, 11517, 31545, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2000", "-", "-", "605", "##M" ], "ids": [ 10180, 118, 118, 48141, 11517 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "2001", "-", "70", "##M", "-" ], "ids": [ 10272, 118, 10923, 11517, 118 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "2002", "-", "895", "##M", "600", "##M" ], "ids": [ 10276, 118, 67323, 11517, 11796, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2003", "705", "##M", "-", "795", "##M" ], "ids": [ 10295, 52979, 11517, 118, 71882, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2004", "655", "##M", "90", "##M", "965", "##M" ], "ids": [ 10264, 55639, 11517, 10919, 11517, 55925, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2009", "65", "##M", "-", "-" ], "ids": [ 10195, 10843, 11517, 118, 118 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "2010", "60", "##M", "-", "100", "##M" ], "ids": [ 10175, 10709, 11517, 118, 10407, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2011", "30", "##M", "-", "90", "##M" ], "ids": [ 10158, 10244, 11517, 118, 10919, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2012", "20", "##M", "-", "35", "##M" ], "ids": [ 10185, 10197, 11517, 118, 10803, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##TA", "##L", ":", "11", ",", "450" ], "ids": [ 58573, 24951, 11369, 131, 10193, 117, 16718 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", ".", "G", ".", "Edwards", "&", "Sons", ",", "Inc", "." ], "ids": [ 138, 119, 144, 119, 17263, 111, 17747, 117, 13604, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "-", "-", "U", ".", "S", ".", "Municipal", "Des", "##k", ",", "212", "-", "859", "-", "1650" ], "ids": [ 118, 118, 158, 119, 156, 119, 18069, 13810, 10174, 117, 22023, 118, 80786, 118, 29117 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CM", "##E", "lu", "##mber", "future", "##s", "close", "lower", "on", "profit", "taking", "." ], "ids": [ 42741, 11259, 14657, 33567, 16711, 10107, 16065, 18165, 10135, 25081, 18084, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Prof", "##it", "taking", "continued", "to", "wei", "##gh", "on", "CM", "##E", "lu", "##mber", "future", "##s", "but", "prices", "ended", "only", "slightly", "lower", "as", "strong", "cash", "markets", "under", "##pin", "##ned", "future", "##s", ",", "trade", "##rs", "said", "." ], "ids": [ 24864, 10486, 18084, 14278, 10114, 86981, 15774, 10135, 42741, 11259, 14657, 33567, 16711, 10107, 10473, 57476, 18428, 10893, 31603, 18165, 10146, 18093, 52828, 42893, 10571, 17298, 17021, 16711, 10107, 117, 18908, 10943, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "same", "pattern", "of", "the", "past", "few", "days", "pers", "##isted", "with", "future", "##s", "de", "##clin", "##ing", "early", "on", "the", "profit", "taking", "before", "firm", "##ing", "late", "." ], "ids": [ 10117, 11561, 36265, 10108, 10105, 17781, 13824, 13990, 108839, 85442, 10169, 16711, 10107, 10104, 86257, 10230, 11732, 10135, 10105, 25081, 18084, 11360, 23410, 10230, 13002, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "cash", "-", "related", "buy", "##ing", "late", "from", "people", "who", "want", "to", "take", "delivery", "of", "the", "September", "contract", ",", "they", "said", "." ], "ids": [ 11723, 10134, 52828, 118, 16382, 47715, 10230, 13002, 10188, 11426, 10479, 21528, 10114, 13574, 55626, 10108, 10105, 10596, 16108, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cash", "sources", "noted", "that", "although", "the", "cash", "market", "is", "generally", "quiet", ",", "prices", "remain", "firm", "on", "demand", "for", "pro", "##mpt", "delivery", "wood", ",", "they", "added", "." ], "ids": [ 41286, 19023, 18575, 10189, 14779, 10105, 52828, 17313, 10124, 18081, 104951, 117, 57476, 25430, 23410, 10135, 34394, 10142, 11284, 109361, 55626, 33837, 117, 10689, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Random", "Len", "##gth", "##s", "quoted", "cash", "sp", "##ruce", "at", "$", "419", "per", "t", "##b", "##f", ",", "up", "$", "5", "from", "last", "Friday", "and", "$", "7", "over", "the", "last", "mid", "##week", "quo", "##te", "." ], "ids": [ 44648, 97413, 81764, 10107, 70676, 52828, 32650, 59532, 10160, 109, 42369, 10178, 188, 10457, 10575, 117, 10741, 109, 126, 10188, 12469, 30767, 10111, 109, 128, 10491, 10105, 12469, 15607, 84805, 48718, 10216, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Red", "##uce", "##d", "concern", "over", "Hurricane", "Edouard", "prompted", "some", "of", "the", "early", "profit", "taking", "." ], "ids": [ 11641, 24075, 10162, 43607, 10491, 44871, 74362, 93003, 11152, 10108, 10105, 11732, 25081, 18084, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##pectations", "the", "storm", "would", "turn", "more", "to", "the", "north", "partly", "ea", "##sed", "concerns", ",", "they", "said", "." ], "ids": [ 27746, 96815, 10105, 31642, 10894, 18923, 10798, 10114, 10105, 12756, 50686, 22257, 16219, 42663, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lu", "##mber", "closed", "$", "2", ".", "20", "to", "$", "0", ".", "20", "per", "t", "##b", "##f", "lower", "with", "September", "off", "$", "0", ".", "70", "at", "$", "413", ".", "20", "and", "November", "off", "most", "at", "$", "369", ".", "00", "per", "t", "##b", "##f", "." ], "ids": [ 23859, 33567, 18440, 109, 123, 119, 10197, 10114, 109, 121, 119, 10197, 10178, 188, 10457, 10575, 18165, 10169, 10596, 11898, 109, 121, 119, 10923, 10160, 109, 39245, 119, 10197, 10111, 10819, 11898, 10992, 10160, 109, 31577, 119, 11025, 10178, 188, 10457, 10575, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Jerry", "Bi", "##es", "##z", "##k", "312", "-", "408", "-", "872", "##5" ], "ids": [ 118, 118, 17686, 31156, 10171, 10305, 10174, 25104, 118, 36899, 118, 77107, 11166 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##H", "##EA", "##T", "-", "-", "Rain", "##s", "bo", "##ost", "U", ".", "S", ".", "HR", "##W", "plant", "##ing", "pro", "##spects", "." ], "ids": [ 160, 12396, 36789, 11090, 118, 118, 23292, 10107, 20506, 18239, 158, 119, 156, 119, 47114, 13034, 16430, 10230, 11284, 105335, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Greg", "Frost" ], "ids": [ 22438, 34077 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", ",", "Mo", "." ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 117, 34987, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "1996", "-", "08", "-", "28" ], "ids": [ 10389, 118, 11052, 118, 10348 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Above", "-", "normal", "summer", "rainfall", "in", "the", "U", ".", "S", ".", "High", "Plains", "has", "produced", "near", "-", "ideal", "conditions", "for", "plant", "##ing", "the", "1997", "hard", "red", "winter", "wheat", "crop", ",", "anal", "##yst", "##s", "said", "Wednesday", "." ], "ids": [ 70081, 118, 16626, 17995, 91549, 10106, 10105, 158, 119, 156, 119, 11956, 58908, 10393, 13433, 12883, 118, 29580, 17315, 10142, 16430, 10230, 10105, 10391, 19118, 10680, 25977, 109653, 99402, 117, 106615, 62769, 10107, 12415, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "From", "central", "Texas", "north", "to", "Kansas", ",", "rain", "##s", "throughout", "July", "and", "August", "have", "relieve", "##d", "most", "of", "the", "dro", "##ught", "conditions", "that", "pla", "##gue", "##d", "the", "region", "earlier", "this", "year", "." ], "ids": [ 12222, 12397, 12466, 12756, 10114, 16735, 117, 50939, 10107, 15916, 11112, 10111, 10735, 10529, 85440, 10162, 10992, 10108, 10105, 33741, 53206, 17315, 10189, 71393, 16381, 10162, 10105, 12220, 18905, 10531, 10924, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Our", "mois", "##ture", "situation", "is", "excellent", ",", "especially", "for", "fall", "plant", "##ing", "of", "winter", "wheat", ",", "\"", "said", "Kim", "Anderson", ",", "extension", "wheat", "marketing", "e", "##cono", "##mist", "at", "Oklahoma", "State", "University", "." ], "ids": [ 107, 18465, 17083, 16023, 18586, 10124, 50337, 117, 17491, 10142, 18042, 16430, 10230, 10108, 25977, 109653, 117, 107, 12415, 13539, 15007, 117, 23019, 109653, 29465, 173, 27447, 24987, 10160, 19585, 11104, 10404, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "iron", "##y", "of", "the", "above", "-", "average", "summer", "rainfall", "was", "not", "lost", "on", "High", "Plains", "wheat", "producers", ",", "who", "only", "three", "months", "ago", "were", "caught", "in", "a", "dro", "##ught", "so", "severe", "that", "old", "-", "timer", "##s", "like", "##ned", "conditions", "to", "the", "\"", "Dust", "Bowl", "\"", "days", "of", "the", "1930s", "." ], "ids": [ 10117, 32374, 10157, 10108, 10105, 16038, 118, 13551, 17995, 91549, 10134, 10472, 14172, 10135, 11956, 58908, 109653, 46511, 117, 10479, 10893, 11003, 15555, 36390, 10309, 39797, 10106, 169, 33741, 53206, 10380, 34844, 10189, 12898, 118, 81709, 10107, 11850, 17021, 17315, 10114, 10105, 107, 63116, 23010, 107, 13990, 10108, 10105, 35010, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "def", "##inite", "##ly", "a", "turn", "##abo", "##ut", "from", "this", "past", "year", ",", "but", "you", "know", "last", "year", "we", "had", "pretty", "good", "mois", "##ture", "about", "this", "time", "of", "year", ",", "and", "then", "about", "October", "1", "it", "quit", ",", "\"", "said", "Mark", "Hodges", ",", "executive", "director", "of", "the", "Oklahoma", "W", "##hea", "##t", "Commission", ".", "\"" ], "ids": [ 107, 10377, 112, 187, 100745, 100240, 10454, 169, 18923, 90276, 11159, 10188, 10531, 17781, 10924, 117, 10473, 13028, 21852, 12469, 10924, 11951, 10374, 108361, 15198, 17083, 16023, 10978, 10531, 10635, 10108, 10924, 117, 10111, 11059, 10978, 11212, 122, 10271, 101237, 117, 107, 12415, 11997, 107570, 117, 22676, 12461, 10108, 10105, 19585, 160, 45546, 10123, 14941, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9 ] }, { "tokens": [ "Hope", "##fully", "that", "'", "s", "not", "going", "to", "happen", "this", "year", ".", "\"" ], "ids": [ 22091, 42920, 10189, 112, 187, 10472, 19090, 10114, 84630, 10531, 10924, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "According", "to", "figures", "released", "by", "the", "Oklahoma", "Cl", "##ima", "##tol", "##ogical", "Survey", ",", "an", "average", "of", "20", ".", "19", "inches", "fell", "across", "the", "state", "between", "March", "1", "and", "August", "26", ",", "1996", "." ], "ids": [ 14156, 10114, 21068, 11539, 10155, 10105, 19585, 101989, 12443, 48530, 77720, 17341, 117, 10151, 13551, 10108, 10197, 119, 10270, 42211, 25194, 15130, 10105, 11388, 10948, 11144, 122, 10111, 10735, 10314, 117, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "'", "s", "about", "1", "/", "2", "inch", "above", "the", "average", "for", "the", "same", "time", "period", ",", "according", "to", "Howard", "Johnson", ",", "associate", "state", "climat", "##ologist", "at", "the", "University", "of", "Oklahoma", "." ], "ids": [ 13646, 112, 187, 10978, 122, 120, 123, 34397, 16038, 10105, 13551, 10142, 10105, 11561, 10635, 13127, 117, 18071, 10114, 15084, 13241, 117, 46175, 11388, 60733, 51940, 10160, 10105, 10404, 10108, 19585, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "He", "noted", "that", "the", "majority", "of", "that", "20", ".", "19", "inches", "had", "fallen", "since", "July", "." ], "ids": [ 10357, 18575, 10189, 10105, 19471, 10108, 10189, 10197, 119, 10270, 42211, 10374, 40055, 11764, 11112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "an", "example", "of", "just", "how", "dry", "it", "was", ",", "data", "showed", "that", "between", "October", "1", ",", "1995", "and", "March", "1", ",", "1996", ",", "the", "state", "received", "an", "average", "of", "only", "4", ".", "6", "inches", "of", "rainfall", "." ], "ids": [ 10882, 10151, 14351, 10108, 12820, 14796, 36796, 10271, 10134, 117, 11165, 27463, 10189, 10948, 11212, 122, 117, 10436, 10111, 11144, 122, 117, 10389, 117, 10105, 11388, 12296, 10151, 13551, 10108, 10893, 125, 119, 127, 42211, 10108, 91549, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "northern", "Texas", ",", "the", "current", "rainfall", "situation", "was", "similar", "to", "most", "of", "Oklahoma", ",", "said", "Rodney", "Mo", "##sier", ",", "executive", "assistant", "for", "the", "Texas", "W", "##hea", "##t", "Producer", "##s", "." ], "ids": [ 10167, 17335, 12466, 117, 10105, 14978, 91549, 18586, 10134, 13213, 10114, 10992, 10108, 19585, 117, 12415, 53784, 34987, 59719, 117, 22676, 20999, 10142, 10105, 12466, 160, 45546, 10123, 46020, 10107, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "\"", "Up", "here", "in", "the", "Texas", "Pan", "##hand", "##le", ",", "we", "'", "ve", "had", "some", "extremely", "bene", "##ficial", "rain", "##s", "that", "came", "through", "within", "the", "last", "several", "days", "and", "are", "really", "setting", "us", "up", "for", "ideal", "conditions", "for", "plant", "##ing", "wheat", ",", "\"", "Mo", "##sier", "said", "." ], "ids": [ 107, 13656, 19353, 10106, 10105, 12466, 18661, 41137, 10284, 117, 11951, 112, 10323, 10374, 11152, 38136, 41847, 69229, 50939, 10107, 10189, 13383, 11222, 12381, 10105, 12469, 11736, 13990, 10111, 10301, 30181, 29421, 19626, 10741, 10142, 29580, 17315, 10142, 16430, 10230, 109653, 117, 107, 34987, 59719, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "But", "he", "war", "##ned", "that", "the", "situation", "was", "not", "as", "ideal", "in", "central", "and", "southern", "Texas", ",", "where", "mos", "##itur", "##e", "levels", "were", "still", "short", "despite", "the", "rain", "##s", "brought", "by", "Hurricane", "Dolly", "last", "week", "." ], "ids": [ 16976, 10261, 10338, 17021, 10189, 10105, 18586, 10134, 10472, 10146, 29580, 10106, 12397, 10111, 17156, 12466, 117, 10940, 94389, 96065, 10112, 21559, 10309, 12647, 13716, 22087, 10105, 50939, 10107, 17327, 10155, 44871, 69562, 12469, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "In", "Kansas", ",", "typically", "the", "number", "one", "U", ".", "S", ".", "hard", "red", "winter", "wheat", "producer", ",", "top", "##so", "##il", "mois", "##ture", "levels", "were", "rated", "mostly", "ad", "##e", "##quate", "during", "the", "week", "ended", "Sunday", ",", "according", "to", "the", "state", "'", "s", "agricultural", "statistics", "service", "." ], "ids": [ 10167, 16735, 117, 24622, 10105, 11487, 10464, 158, 119, 156, 119, 19118, 10680, 25977, 109653, 16607, 117, 12364, 11669, 11030, 17083, 16023, 21559, 10309, 48069, 19774, 10840, 10112, 64207, 10939, 10105, 16118, 18428, 19731, 117, 18071, 10114, 10105, 11388, 112, 187, 35365, 36730, 11989, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "its", "weekly", "report", "released", "Monday", ",", "the", "service", "said", "Kansas", "top", "##so", "##il", "mois", "##ture", "was", "rated", "eight", "percent", "sur", "##plus", ",", "77", "percent", "ad", "##e", "##quate", "and", "15", "percent", "short", "to", "very", "short", "." ], "ids": [ 10167, 10474, 33159, 17553, 11539, 40714, 117, 10105, 11989, 12415, 16735, 12364, 11669, 11030, 17083, 16023, 10134, 48069, 16222, 22362, 10326, 70413, 117, 12527, 22362, 10840, 10112, 64207, 10111, 10208, 22362, 13716, 10114, 12558, 13716, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oklahoma", "'", "s", "Agricultural", "Statistics", "Service", "showed", "similar", "conditions", ",", "rating", "top", "##so", "##il", "mois", "##ture", "levels", "as", "seven", "percent", "sur", "##plus", ",", "81", "percent", "ad", "##e", "##quate", "and", "12", "percent", "short", "to", "very", "short", "." ], "ids": [ 19585, 112, 187, 43393, 18499, 13489, 27463, 13213, 17315, 117, 31035, 12364, 11669, 11030, 17083, 16023, 21559, 10146, 15767, 22362, 10326, 70413, 117, 12324, 22362, 10840, 10112, 64207, 10111, 10186, 22362, 13716, 10114, 12558, 13716, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Data", "on", "top", "##so", "##il", "mois", "##ture", "ratings", "were", "not", "released", "by", "the", "Texas", "Agricultural", "Statistics", "Service", "." ], "ids": [ 12159, 10135, 12364, 11669, 11030, 17083, 16023, 55778, 10309, 10472, 11539, 10155, 10105, 12466, 43393, 18499, 13489, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "-", "-", "Greg", "Frost", ",", "816", "561", "-", "867", "##1" ], "ids": [ 118, 118, 22438, 34077, 117, 60750, 51746, 118, 68389, 10759 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "Union", "National", "Bank", "of", "Fl", "##a", ".", "settle", "##s", "suit", "." ], "ids": [ 12128, 11457, 10655, 13533, 10108, 29981, 10113, 119, 90424, 10107, 26315, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "JA", "##C", "##KS", "##ON", "##VI", "##LL", "##E", ",", "Fl", "##a", ".", "1996", "-", "08", "-", "28" ], "ids": [ 53399, 10858, 62828, 30118, 90939, 82834, 11259, 117, 29981, 10113, 119, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "Union", "National", "Bank", "of", "Florida", "said", "on", "Wednesday", "it", "agreed", "to", "settle", "a", "class", "action", "law", "suit", "involving", "its", "coll", "##ater", "##al", "protection", "insurance", "(", "CP", "##I", ")", "program", "." ], "ids": [ 12128, 11457, 10655, 13533, 10108, 13668, 12415, 10135, 57611, 10271, 25577, 10114, 90424, 169, 13596, 14204, 13255, 26315, 40368, 10474, 28552, 38524, 10415, 20344, 49756, 113, 40070, 11281, 114, 12483, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "To", "provide", "for", "the", "settlements", ",", "First", "Union", "has", "established", "a", "common", "fund", "of", "$", "4", ".", "7", "million", "for", "cash", "ref", "##unds", "and", "$", "19", ".", "4", "million", "in", "credit", "ref", "##unds", "for", "outstanding", "CP", "##I", "balance", "##s", "." ], "ids": [ 11469, 16871, 10142, 10105, 55959, 117, 12128, 11457, 10393, 13245, 169, 14624, 31771, 10108, 109, 125, 119, 128, 12473, 10142, 52828, 48056, 105361, 10111, 109, 10270, 119, 125, 12473, 10106, 37021, 48056, 105361, 10142, 53933, 40070, 11281, 40162, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "The", "bank", "is", "a", "division", "of", "First", "Union", "Corp", "." ], "ids": [ 10117, 19423, 10124, 169, 13751, 10108, 12128, 11457, 44687, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "bank", "said", "most", "of", "the", "charges", "resulted", "from", "loan", "portfolio", "##s", "from", "banks", "and", "th", "##rif", "##ts", "that", "were", "acquired", "in", "the", "1980s", "." ], "ids": [ 10117, 19423, 12415, 10992, 10108, 10105, 31128, 26633, 10188, 33390, 101816, 10107, 10188, 41375, 10111, 77586, 52070, 10806, 10189, 10309, 21011, 10106, 10105, 21215, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "Union", "said", "it", "has", "discontinued", "CP", "##I", "as", "an", "element", "of", "its", "motor", "vehicle", "or", "boat", "instal", "##lmen", "##t", "loan", "contracts", "." ], "ids": [ 12128, 11457, 12415, 10271, 10393, 71086, 40070, 11281, 10146, 10151, 19527, 10108, 10474, 15257, 27404, 10345, 30418, 50562, 104632, 10123, 33390, 69690, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "part", "of", "the", "settlement", "agreement", ",", "customers", "who", "had", "CP", "##I", "placed", "on", "loans", "from", "January", "1", ",", "1986", "to", "September", "31", ",", "1996", ",", "will", "receive", "cash", "or", "credit", "ref", "##unds", ",", "the", "bank", "said", "." ], "ids": [ 10882, 10668, 10108, 10105, 23931, 25432, 117, 49260, 10479, 10374, 40070, 11281, 16906, 10135, 106416, 10188, 11238, 122, 117, 10578, 10114, 10596, 10413, 117, 10389, 117, 11337, 26286, 52828, 10345, 37021, 48056, 105361, 117, 10105, 19423, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cash", "ref", "##unds", "will", "go", "to", "those", "who", "paid", "their", "loans", "to", "First", "Union", "while", "credit", "ref", "##unds", "will", "go", "to", "those", "who", "have", "existing", "loan", "balance", "##s", ",", "the", "bank", "said", "." ], "ids": [ 41286, 48056, 105361, 11337, 11783, 10114, 12676, 10479, 25938, 10455, 106416, 10114, 12128, 11457, 11371, 37021, 48056, 105361, 11337, 11783, 10114, 12676, 10479, 10529, 26636, 33390, 40162, 10107, 117, 10105, 19423, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Am", "##oco", "says", "in", "talks", "over", "Yemen", "oil", "acre", "##age", "." ], "ids": [ 11500, 58165, 22153, 10106, 56672, 10491, 25126, 21073, 54290, 12276, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Am", "##oco", "Corp", "officials", "said", "the", "company", "is", "in", "talks", "over", "c", "##rude", "oil", "production", "sharing", "in", "Yemen", ",", "but", "declined", "to", "comment", "on", "a", "published", "report", "Am", "##oco", "had", "reached", "preliminary", "agreement", "on", "a", "block", "in", "the", "Sha", "##b", "##wa", "area", "." ], "ids": [ 11500, 58165, 44687, 27730, 12415, 10105, 12100, 10124, 10106, 56672, 10491, 171, 97417, 21073, 12116, 57535, 10106, 25126, 117, 10473, 44948, 10114, 49641, 10135, 169, 12304, 17553, 11500, 58165, 10374, 17087, 68097, 25432, 10135, 169, 27242, 10106, 10105, 106583, 10457, 11037, 11168, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "\"", "We", "'", "ve", "been", "asked", "(", "by", "Yemen", ")", "not", "to", "comment", "(", "on", "the", "talks", ")", ",", "\"", "said", "Am", "##oco", "spoke", "##sman", "Dan", "Die", "##tsch", ".", "\"" ], "ids": [ 107, 12865, 112, 10323, 10590, 22151, 113, 10155, 25126, 114, 10472, 10114, 49641, 113, 10135, 10105, 56672, 114, 117, 107, 12415, 11500, 58165, 50005, 24305, 14261, 10236, 41290, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "We", "can", "neither", "con", "##fir", "##m", "nor", "den", "##y", "that", "report", ",", "\"", "he", "said", "." ], "ids": [ 12865, 10944, 51148, 10173, 61644, 10147, 31515, 10140, 10157, 10189, 17553, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "According", "to", "Middle", "East", "Economic", "Survey", "(", "ME", "##ES", ")", ",", "Yemen", "and", "Am", "##oco", "signed", "a", "\"", "me", "##mora", "##ndum", "of", "understanding", "\"", "for", "a", "production", "-", "sharing", "agreement", "in", "Sha", "##b", "##wa", "Block", "No", "." ], "ids": [ 14156, 10114, 15441, 11830, 19080, 17341, 113, 47430, 25054, 114, 117, 25126, 10111, 11500, 58165, 14775, 169, 107, 10911, 79374, 52831, 10108, 37149, 107, 10142, 169, 12116, 118, 57535, 25432, 10106, 106583, 10457, 11037, 28910, 10657, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6, 6, 6, 9, 2, 6, 9, 9, 1, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "S", "-", "1", "in", "the", "former", "South", "Yemen", ",", "which", "united", "with", "North", "Yemen", "in", "1990", "." ], "ids": [ 156, 118, 122, 10106, 10105, 11775, 11056, 25126, 117, 10319, 89284, 10169, 11225, 25126, 10106, 10420, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "According", "to", "another", "Am", "##oco", "official", ",", "the", "company", "is", "not", "ex", "##ploring", "now", "for", "oil", "any", "##where", "in", "Yemen", "." ], "ids": [ 14156, 10114, 12864, 11500, 58165, 14731, 117, 10105, 12100, 10124, 10472, 11419, 79893, 11858, 10142, 21073, 11178, 30935, 10106, 25126, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "officials", "said", "Am", "##oco", "was", "def", "##er", "##ring", "to", "the", "Yemen", "##i", "Ministry", "of", "Petroleum", "and", "Mineral", "##s", "for", "any", "specific", "comments", "on", "the", "Am", "##oco", "-", "Yemen", "talks", "." ], "ids": [ 10117, 27730, 12415, 11500, 58165, 10134, 100745, 10165, 13135, 10114, 10105, 25126, 10116, 19170, 10108, 89589, 10111, 69042, 10107, 10142, 11178, 19182, 61565, 10135, 10105, 11500, 58165, 118, 25126, 56672, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 2, 6, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "The", "former", "Soviet", "Union", "was", "dis", "##placed", "as", "contract", "##or", "of", "the", "potentially", "rich", "Sha", "##b", "##wa", "oil", "##fields", "once", "it", "collapsed", "in", "December", "1991", ",", "according", "to", "the", "International", "Petroleum", "Encyclopedia", "." ], "ids": [ 10117, 11775, 15277, 11457, 10134, 27920, 93570, 10146, 16108, 10667, 10108, 10105, 80916, 33250, 106583, 10457, 11037, 21073, 92381, 14907, 10271, 93621, 10106, 11288, 10442, 117, 18071, 10114, 10105, 10771, 89589, 11430, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "-", "-", "Oliver", "Ludwig", ",", "New", "York", "Energy", "Des", "##k", "+", "1", "212", "859", "1633" ], "ids": [ 118, 118, 16875, 14116, 117, 10287, 10482, 21058, 13810, 10174, 116, 122, 22023, 80786, 13804 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Burundi", "defend", "##s", "military", "regime", "to", "hostile", "UN", "." ], "ids": [ 57824, 60041, 10107, 14041, 24807, 10114, 84962, 26578, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "Evelyn", "Leopold" ], "ids": [ 51057, 22532 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "UN", "##IT", "##ED", "NA", "##TION", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 26578, 37611, 33809, 56586, 98207, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Burundi", "'", "s", "ambassador", "on", "Wednesday", "las", "##hed", "out", "at", "economic", "san", "##ctions", "imposed", "by", "African", "states", "and", "said", "any", "thought", "of", "an", "arms", "embargo", "would", "be", "a", "wind", "##fall", "for", "guerrilla", "##s", "fighting", "his", "army", "-", "run", "government", "." ], "ids": [ 57824, 112, 187, 74853, 10135, 57611, 10285, 16081, 10950, 10160, 13925, 14608, 42068, 83358, 10155, 13839, 16316, 10111, 12415, 11178, 18957, 10108, 10151, 28150, 14668, 10894, 10347, 169, 31346, 16220, 10142, 106552, 10107, 27535, 10226, 17977, 118, 14095, 12047, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "length", "##y", "debate", "on", "Burundi", "before", "the", "U", ".", "N", ".", "Security", "Council", ",", "Ambassador", "N", "##san", "##ze", "Terence", "said", "the", "new", "military", "government", "took", "over", "to", "stabil", "##ise", "the", "country", "and", "wanted", "negotiations", "under", "former", "Tanzania", "##n", "President", "Julius", "Ny", "##rere", "." ], "ids": [ 10167, 169, 17283, 10157, 29632, 10135, 57824, 11360, 10105, 158, 119, 151, 119, 20924, 12821, 117, 55060, 151, 14434, 10870, 65544, 12415, 10105, 10751, 14041, 12047, 12149, 10491, 10114, 71338, 13041, 10105, 12723, 10111, 22591, 61946, 10571, 11775, 22580, 10115, 12811, 18703, 11459, 57844, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Near", "##ly", "every", "African", "member", "who", "spoke", ",", "as", "well", "as", "most", "Security", "Council", "members", ",", "however", ",", "were", "uns", "##ym", "##pat", "##het", "##ic", "towards", "the", "government", "of", "President", "Pierre", "Buy", "##oya", ",", "an", "army", "major", "put", "in", "power", "in", "a", "July", "coup", "by", "the", "Tu", "##tsi", "-", "run", "military", ",", "which", "is", "lock", "##ed", "in", "a", "guerrilla", "war", "with", "the", "majority", "Hut", "##us", "." ], "ids": [ 16140, 10454, 14234, 13839, 12008, 10479, 50005, 117, 10146, 11206, 10146, 10992, 20924, 12821, 12464, 117, 13800, 117, 10309, 15826, 16889, 18115, 13358, 11130, 18095, 10105, 12047, 10108, 12811, 11609, 109211, 51814, 117, 10151, 17977, 11922, 14499, 10106, 13183, 10106, 169, 11112, 26854, 10155, 10105, 20108, 27856, 118, 14095, 14041, 117, 10319, 10124, 79601, 10336, 10106, 169, 106552, 10338, 10169, 10105, 19471, 104185, 10251, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "\"", "These", "(", "African", ")", "brothers", "should", "have", "been", "the", "first", "to", "bind", "the", "wound", "##s", "of", "Burundi", ",", "\"", "Terence", "said", "of", "the", "economic", "embargo", ".", "\"" ], "ids": [ 107, 13252, 113, 13839, 114, 28764, 14819, 10529, 10590, 10105, 10422, 10114, 55154, 10105, 109205, 10107, 10108, 57824, 117, 107, 65544, 12415, 10108, 10105, 13925, 14668, 119, 107 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Qui", "##te", "the", "contra", "##ry", ",", "Burundi", "has", "seen", "economic", "war", "declared", "against", "it", "by", "fellow", "African", "people", ".", ".", ".", "a", "gra", "##tuito", "##us", "im", "##mol", "##ation", "of", "the", "people", "of", "Burundi", ".", "\"" ], "ids": [ 35921, 10216, 10105, 11473, 10908, 117, 57824, 10393, 15652, 13925, 10338, 25019, 11327, 10271, 10155, 24619, 13839, 11426, 119, 119, 119, 169, 63706, 65162, 10251, 10211, 52814, 11809, 10108, 10105, 11426, 10108, 57824, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "He", "said", "his", "government", "had", "just", "asked", "U", ".", "N", ".", "human", "rights", "monitor", "##s", "to", "increase", "their", "numbers", "in", "Burundi", "in", "an", "effort", "\"", "to", "put", "an", "end", "to", "this", "vi", "##cious", "circle", "of", "violence", ".", "\"" ], "ids": [ 10357, 12415, 10226, 12047, 10374, 12820, 22151, 158, 119, 151, 119, 14179, 16691, 60774, 10107, 10114, 20299, 10455, 20953, 10106, 57824, 10106, 10151, 24912, 107, 10114, 14499, 10151, 11572, 10114, 10531, 13956, 45376, 54309, 10108, 26342, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "150", ",", "000", "people", "have", "been", "killed", "in", "violence", "between", "the", "minority", "Tu", "##tsi", "##s", "and", "the", "majority", "Hut", "##us", "since", "1993", "." ], "ids": [ 15946, 11084, 11766, 117, 10259, 11426, 10529, 10590, 15875, 10106, 26342, 10948, 10105, 54147, 20108, 27856, 10107, 10111, 10105, 19471, 104185, 10251, 11764, 10463, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "Botswana", "'", "s", "en", "##voy", ",", "Mot", "##hus", "##i", "N", "##kg", "##owe", ",", "said", "coups", "should", "be", "relegated", "\"", "to", "the", "dum", "##p", "he", "##ap", "of", "history", "\"", "as", "there", "could", "be", "no", "just", "##ification", "for", "the", "over", "##th", "##row", "of", "a", "legi", "##timate", "government", "." ], "ids": [ 41424, 112, 187, 10110, 81843, 117, 97736, 15471, 10116, 151, 47407, 14260, 117, 12415, 69693, 14819, 10347, 62212, 107, 10114, 10105, 54892, 10410, 10261, 16070, 10108, 11486, 107, 10146, 11155, 12174, 10347, 10192, 12820, 29748, 10142, 10105, 10491, 11143, 21454, 10108, 169, 78198, 80021, 12047, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chile", "has", "proposed", "a", "resolution", ",", "still", "under", "discussion", ",", "that", "would", "impose", "an", "immediate", "arms", "embargo", "on", "Burundi", "and", "call", "for", "negotiations", "." ], "ids": [ 13218, 10393, 21622, 169, 40017, 117, 12647, 10571, 41640, 117, 10189, 10894, 48833, 10151, 46938, 28150, 14668, 10135, 57824, 10111, 20575, 10142, 61946, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "draft", "suggests", "further", "san", "##ctions", "against", "those", "who", "im", "##ped", "##e", "a", "political", "solution", "." ], "ids": [ 10117, 28447, 40132, 14586, 14608, 42068, 11327, 12676, 10479, 10211, 16898, 10112, 169, 13736, 28502, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Among", "the", "council", "'", "s", "five", "permanent", "members", ",", "Russia", "and", "the", "United", "States", "appeared", "to", "support", "most", "elements", "of", "the", "Chilean", "proposal", ",", "while", "Britain", ",", "France", "and", "China", "were", "ca", "##uti", "##ous", "." ], "ids": [ 24470, 10105, 23503, 112, 187, 12403, 21295, 12464, 117, 14664, 10111, 10105, 10609, 10859, 14565, 10114, 13145, 10992, 17464, 10108, 10105, 87067, 43542, 117, 11371, 16032, 117, 10688, 10111, 11593, 10309, 11135, 19065, 13499, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 1, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Terence", ",", "a", "Tu", "##tsi", ",", "said", "any", "arms", "embargo", "would", "leave", "the", "army", "unable", "to", "defend", "itself", "against", "Hut", "##u", "guerrilla", "##s", "and", "leave", "the", "population", "exposed", "to", "\"", "armed", "terror", "##its", "##ts", ".", "\"" ], "ids": [ 65544, 117, 169, 20108, 27856, 117, 12415, 11178, 28150, 14668, 10894, 21964, 10105, 17977, 30553, 10114, 60041, 17587, 11327, 104185, 10138, 106552, 10107, 10111, 21964, 10105, 11077, 53305, 10114, 107, 34174, 43143, 15508, 10806, 119, 107 ], "entity": [ "B-PER", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Chilean", "Ambassador", "Juan", "Som", "##avia", "said", ":", "\"", "Every", "weapon", "that", "reached", "Burundi", "is", "a", "weapon", "aimed", "mainly", "at", "killing", "an", "una", "##rmed", "civilian", "." ], "ids": [ 16976, 87067, 55060, 11686, 19441, 42365, 12415, 131, 107, 30929, 54157, 10189, 17087, 57824, 10124, 169, 54157, 53004, 20827, 10160, 34248, 10151, 10153, 98119, 53653, 119 ], "entity": [ "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "must", "not", "send", "a", "signal", "different", "from", "the", "African", "leaders", "themselves", "." ], "ids": [ 12865, 14982, 10472, 45567, 169, 25495, 12902, 10188, 10105, 13839, 24155, 20182, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Ina", "##ction", "is", "becoming", "the", "worst", "possible", "course", "of", "action", ".", "\"" ], "ids": [ 89647, 17530, 10124, 19881, 10105, 62006, 14128, 15348, 10108, 14204, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Burundi", "'", "s", "parliament", "has", "been", "suspended", "and", "political", "parties", "are", "banned", "but", "Terence", "told", "reporter", "##s", "Buy", "##oya", "would", "re", "##con", "##vene", "a", "new", "type", "of", "national", "assembly", "in", "October", "." ], "ids": [ 57824, 112, 187, 40519, 10393, 10590, 49799, 10111, 13736, 18708, 10301, 58587, 10473, 65544, 21937, 41408, 10107, 109211, 51814, 10894, 11639, 23486, 61190, 169, 10751, 12807, 10108, 11844, 38946, 10106, 11212, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "United", "States", "said", "the", "coup", "leaders", "had", "taken", "no", "steps", "to", "restore", "democracy", "and", "ind", "##is", "##cri", "##minat", "##e", "killing", "##s", "continued", "." ], "ids": [ 10117, 10609, 10859, 12415, 10105, 26854, 24155, 10374, 15109, 10192, 50879, 10114, 76873, 67519, 10111, 30386, 10291, 99590, 104130, 10112, 34248, 10107, 14278, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ambassador", "Karl", "Inde", "##rf", "##urt", "##h", "said", "the", "new", "government", "should", "have", "\"", "un", "##con", "##dition", "##al", "\"", "negotiations", "with", "all", "parties", "inside", "and", "outside", "of", "the", "country", "." ], "ids": [ 55060, 11862, 43376, 22260, 30546, 10237, 12415, 10105, 10751, 12047, 14819, 10529, 107, 10119, 23486, 34540, 10415, 107, 61946, 10169, 10435, 18708, 22978, 10111, 17555, 10108, 10105, 12723, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "Washington", "strongly", "supported", "the", "economic", "san", "##ctions", "imposed", "already", "and", "if", "these", "did", "not", "work", "the", "council", "would", "consider", "\"", "an", "arms", "embargo", "or", "targeted", "san", "##ctions", "against", "faction", "leaders", ".", "\"" ], "ids": [ 10357, 12415, 11586, 44125, 19992, 10105, 13925, 14608, 42068, 83358, 19034, 10111, 12277, 11762, 12172, 10472, 11424, 10105, 23503, 10894, 44856, 107, 10151, 28150, 14668, 10345, 79837, 14608, 42068, 11327, 84395, 24155, 119, 107 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "he", "said", "the", "international", "community", "had", "to", "be", "prepared", "for", "the", "worst", "and", "avoid", "a", "rep", "##lay", "of", "the", "horror", "##s", "in", "neighbouring", "Rwanda", ",", "where", "widespread", "gen", "##ocide", "broke", "out", "against", "the", "Tu", "##tsi", "##s", "two", "years", "ago", "." ], "ids": [ 16976, 10261, 12415, 10105, 12533, 13354, 10374, 10114, 10347, 39837, 10142, 10105, 62006, 10111, 33253, 169, 76456, 21768, 10108, 10105, 39108, 10107, 10106, 79475, 57557, 117, 10940, 48675, 15331, 98808, 30500, 10950, 11327, 10105, 20108, 27856, 10107, 10551, 10855, 36390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "He", "again", "said", "the", "United", "Nations", "should", "draw", "up", "cont", "##ingen", "##cy", "plans", "for", "a", "rapid", "human", "##itarian", "intervention", "." ], "ids": [ 10357, 13123, 12415, 10105, 10609, 15145, 14819, 25974, 10741, 60146, 13563, 11710, 18195, 10142, 169, 39782, 14179, 63378, 40152, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "arrest", "Rwanda", "##n", "on", "gen", "##ocide", "sus", "##pic", "##ion", "." ], "ids": [ 22984, 45165, 57557, 10115, 10135, 15331, 98808, 10846, 34891, 11046, 119 ], "entity": [ "B-MISC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##RN", "##E", "1996", "-", "08", "-", "28" ], "ids": [ 46291, 90412, 11259, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "authorities", "said", "on", "Wednesday", "they", "had", "arrested", "a", "former", "Rwanda", "##n", "mayor", ",", "now", "living", "in", "Switzerland", ",", "on", "sus", "##pic", "##ion", "of", "viola", "##ting", "human", "rights", "during", "the", "gen", "##ocide", "in", "his", "country", "in", "1994", "." ], "ids": [ 22984, 28308, 12415, 10135, 57611, 10689, 10374, 29479, 169, 11775, 57557, 10115, 12747, 117, 11858, 14625, 10106, 26002, 117, 10135, 10846, 34891, 11046, 10108, 49698, 12141, 14179, 16691, 10939, 10105, 15331, 98808, 10106, 10226, 12723, 10106, 10444, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Defence", "Ministry", "said", "in", "a", "statement", "that", "investigations", "were", "still", "in", "the", "preliminary", "stage", "but", "it", "was", "co", "##oper", "##ating", "closely", "with", "police", "in", "the", "cantons", "of", "Geneva", "and", "Freiburg", "." ], "ids": [ 10117, 31621, 19170, 12415, 10106, 169, 33311, 10189, 87748, 10309, 12647, 10106, 10105, 68097, 15365, 10473, 10271, 10134, 11170, 56361, 33121, 34331, 10169, 15034, 10106, 10105, 58564, 10108, 47244, 10111, 29283, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "It", "did", "not", "identify", "the", "man", "." ], "ids": [ 10377, 12172, 10472, 51361, 10105, 10817, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OP", "##TION", "##S", "-", "-", "E", "##O", "##E", "options", "volumes", "-", "close", "." ], "ids": [ 55355, 98207, 10731, 118, 118, 142, 11403, 11259, 53121, 25079, 118, 16065, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "28" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1605", "GMT" ], "ids": [ 39708, 20362 ], "entity": [ "O", "B-MISC" ], "entity_ids": [ 9, 2 ] }, { "tokens": [ "CA", "##LL", "##S", "P", "##UT", "##S", "PC", "##T", "OF", "TO", "##TA", "##L" ], "ids": [ 24707, 82834, 10731, 153, 65729, 10731, 16355, 11090, 23240, 58573, 24951, 11369 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##TA", "##L", "VOLUME", "-", "-", "83", ",", "008", "60", ",", "131", "22", ",", "877", "-", "-" ], "ids": [ 58573, 24951, 11369, 40617, 118, 118, 12408, 117, 54307, 10709, 117, 18372, 10306, 117, 70960, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##EA", "##T", "##UR", "##ES", "-", "AE", "##X", "IN", "##DE", "##X", "7", ",", "391", "5", ",", "658", "15", ".", "72" ], "ids": [ 143, 36789, 11090, 98348, 25054, 118, 35060, 12674, 36351, 60675, 12674, 128, 117, 40366, 126, 117, 66841, 10208, 119, 12120 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "AH", "##OL", "##D", "7", ",", "190", "1", ",", "123", "10", ".", "01" ], "ids": [ 118, 71613, 39272, 11490, 128, 117, 16664, 122, 117, 16968, 10150, 119, 10669 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "B", "##OL", "##S", "##W", "##ESS", "##AN", "##EN", "4", ",", "420", "705", "6", ".", "17" ], "ids": [ 118, 139, 39272, 10731, 13034, 76505, 41275, 50655, 125, 117, 24253, 52979, 127, 119, 10273 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "AB", "##N", "AM", "##RO", "3", ",", "003", "1", ",", "940", "5", ".", "95" ], "ids": [ 118, 21644, 11537, 24339, 35066, 124, 117, 26861, 122, 117, 53762, 126, 119, 11978 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "IN", "##G", "3", ",", "853", "673", "5", ".", "45" ], "ids": [ 118, 36351, 11447, 124, 117, 73149, 65213, 126, 119, 10827 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "V", "##N", "##U", "3", ",", "060", "843", "4", ".", "70" ], "ids": [ 118, 159, 11537, 12022, 124, 117, 84350, 61483, 125, 119, 10923 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Amsterdam", "news", "##des", "##k", "+", "31", "20", "504", "5000", "(", "Fax", "020", "-", "504", "-", "504", "##0", ")" ], "ids": [ 118, 118, 14017, 14424, 10920, 10174, 116, 10413, 10197, 43098, 17436, 113, 64530, 71906, 118, 43098, 118, 43098, 10929, 114 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "tax", "office", "su", "##cks", "in", "money", "." ], "ids": [ 11894, 25468, 14301, 10198, 18676, 10106, 17920, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Workers", "fi", "##xin", "##g", "the", "ceiling", "of", "a", "tax", "office", "in", "Paris", "found", "a", "dozen", "seven", "-", "year", "-", "old", "che", "##ques", "for", "a", "total", "of", "six", "million", "francs", "(", "$", "1", ".", "2", "million", ")", "in", "a", "venti", "##lation", "pipe", ",", "the", "weekly", "Le", "Can", "##ard", "En", "##cha", "##ine", "said", "on", "Wednesday", "." ], "ids": [ 52896, 14045, 76750, 10240, 10105, 87076, 10108, 169, 25468, 14301, 10106, 10728, 11823, 169, 84956, 15767, 118, 10924, 118, 12898, 10262, 12633, 10142, 169, 11339, 10108, 12449, 12473, 49303, 113, 109, 122, 119, 123, 12473, 114, 10106, 169, 68711, 19718, 82153, 117, 10105, 33159, 10281, 14820, 13167, 10243, 12964, 11088, 12415, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Finance", "Ministry", "official", "explained", "that", "the", "che", "##ques", "for", "corporate", "tax", "payments", "had", "been", "su", "##cked", "into", "the", "venti", "##lation", "system", ",", "the", "weekly", "reported", "." ], "ids": [ 138, 38533, 19170, 14731, 44191, 10189, 10105, 10262, 12633, 10142, 46666, 25468, 99417, 10374, 10590, 10198, 72333, 10708, 10105, 68711, 19718, 11787, 117, 10105, 33159, 15943, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "companies", "had", "been", "contacte", "##d", "at", "the", "time", "and", "had", "not", "been", "fine", "##d", "for", "failing", "to", "pay", ",", "the", "official", "said", "." ], "ids": [ 10117, 18866, 10374, 10590, 87471, 10162, 10160, 10105, 10635, 10111, 10374, 10472, 10590, 13435, 10162, 10142, 72103, 10114, 16868, 117, 10105, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "bond", "market", "closing", "report", "." ], "ids": [ 22984, 55185, 17313, 57409, 17553, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Z", "##UR", "##IC", "##H", "1996", "-", "08", "-", "28" ], "ids": [ 163, 98348, 30889, 12396, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "bonds", "ended", "mostly", "higher", "in", "generally", "quiet", "activity", ",", "with", "the", "September", "con", "##fe", "##dera", "##te", "bond", "future", "##s", "contract", "holding", "just", "above", "113", ".", "00", "." ], "ids": [ 22984, 93163, 18428, 19774, 17981, 10106, 18081, 104951, 22205, 117, 10169, 10105, 10596, 10173, 14601, 24053, 10216, 55185, 16711, 10107, 16108, 29008, 12820, 16038, 16990, 119, 11025, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Today", "was", "very", "quiet", "after", "a", "lot", "of", "activity", "on", "Tuesday", ",", "\"", "said", "one", "Swiss", "bond", "future", "##s", "trade", "##r", "." ], "ids": [ 107, 17160, 10134, 12558, 104951, 10662, 169, 19826, 10108, 22205, 10135, 70245, 117, 107, 12415, 10464, 22984, 55185, 16711, 10107, 18908, 10129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "the", "market", "began", "strong", ",", "gave", "up", "some", "gains", "at", "mid", "##day", "and", "then", "was", "able", "to", "recover", "back", "at", "the", "close", ",", "but", "all", "on", "light", "volume", "." ], "ids": [ 10357, 12415, 10105, 17313, 11941, 18093, 117, 15362, 10741, 11152, 92193, 10160, 15607, 24558, 10111, 11059, 10134, 16197, 10114, 94962, 12014, 10160, 10105, 16065, 117, 10473, 10435, 10135, 15765, 15901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "primary", "market", ",", "Ek", "##sport", "##fina", "##ns", "and", "Sue", "##dw", "##est", "L", "##B", "launched", "issues", "for", "100", "million", "and", "300", "million", "Swiss", "francs", ",", "respectively", "." ], "ids": [ 10167, 10105, 17627, 17313, 117, 35769, 36565, 54949, 10891, 10111, 41706, 96407, 13051, 149, 11274, 18850, 17850, 10142, 10407, 12473, 10111, 11093, 12473, 22984, 49303, 117, 25179, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "Ek", "##sport", "##fina", "##ns", "'", "seven", "-", "year", "issue", "was", "quoted", "at", "a", "yield", "of", "3", ".", "98", "percent", ",", "and", "Sue", "##dw", "##est", "L", "##B", "'", "s", "five", "-", "year", "issue", "was", "quoted", "at", "3", ".", "60", "percent", "." ], "ids": [ 35769, 36565, 54949, 10891, 112, 15767, 118, 10924, 15557, 10134, 70676, 10160, 169, 95757, 10108, 124, 119, 12327, 22362, 117, 10111, 41706, 96407, 13051, 149, 11274, 112, 187, 12403, 118, 10924, 15557, 10134, 70676, 10160, 124, 119, 10709, 22362, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swiss", "money", "market", "rates", "remained", "lower", "at", "around", "1", ".", "75", "percent", "offered", "." ], "ids": [ 22984, 17920, 17313, 38200, 15980, 18165, 10160, 12166, 122, 119, 11417, 22362, 20841, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "to", "fundamental", "##s", ",", "e", "##cono", "##mist", "##s", "at", "Credit", "Suisse", "said", "they", "ex", "##pect", "the", "country", "'", "s", "gross", "domestic", "product", "to", "be", "flat", "to", "negative", "in", "1996", ",", "and", "to", "grow", "only", "0", ".", "6", "percent", "in", "1997", "." ], "ids": [ 10882, 10114, 27971, 10107, 117, 173, 27447, 24987, 10107, 10160, 75181, 24239, 12415, 10689, 11419, 51511, 10105, 12723, 112, 187, 92746, 31084, 21535, 10114, 10347, 31307, 10114, 25785, 10106, 10389, 117, 10111, 10114, 42254, 10893, 121, 119, 127, 22362, 10106, 10391, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Swiss", "government", "also", "said", "Wednesday", "it", "had", "made", "progress", "in", "cutting", "Switzerland", "'", "s", "projecte", "##d", "spending", "for", "1997", "." ], "ids": [ 10117, 22984, 12047, 10379, 12415, 57611, 10271, 10374, 11019, 40316, 10106, 63039, 26002, 112, 187, 52452, 10162, 51163, 10142, 10391, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Switzerland", "reports", "July", "consumer", "prices", "later", "this", "week", "." ], "ids": [ 26002, 26610, 11112, 64580, 57476, 10873, 10531, 16118, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cl", "##osing", "prices", "as", "follows", ":" ], "ids": [ 101989, 90739, 57476, 10146, 23698, 131 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sept", "con", "##f", "bond", "up", "12", "at", "113", ".", "02", "." ], "ids": [ 51768, 10173, 10575, 55185, 10741, 10186, 10160, 16990, 119, 10983, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sept", "com", "##i", "medium", "-", "term", "bond", "up", "three", "at", "109", ".", "45", "." ], "ids": [ 51768, 10212, 10116, 29843, 118, 13719, 55185, 10741, 11003, 10160, 16296, 119, 10827, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sept", "Euro", "Swiss", "francs", "up", "three", "at", "97", ".", "82", "." ], "ids": [ 51768, 17526, 22984, 49303, 10741, 11003, 10160, 12328, 119, 12180, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Cash", ":" ], "ids": [ 118, 118, 41286, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "1", "/", "2", "Apr", "2006", "bond", "101", ".", "80", "/", "90", "yield", "4", ".", "252", "p", "##ct" ], "ids": [ 125, 118, 122, 120, 123, 81464, 10214, 55185, 14123, 119, 10832, 120, 10919, 95757, 125, 119, 21581, 184, 14526 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Zurich", "Editorial", ",", "+", "41", "1", "631", "734", "##0" ], "ids": [ 118, 118, 55885, 21507, 117, 116, 11349, 122, 47700, 76734, 10929 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anti", "-", "B", "##hut", "##to", "rally", "draws", "about", "8", ",", "000", "in", "Karachi", "." ], "ids": [ 26267, 118, 139, 46296, 10340, 58575, 77517, 10978, 129, 117, 10259, 10106, 82344, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "KA", "##RA", "##CH", "##I", ",", "Pakistan", "1996", "-", "08", "-", "28" ], "ids": [ 85314, 29990, 86448, 11281, 117, 15437, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "About", "8", ",", "000", "protest", "##ers", "marche", "##d", "through", "Karachi", "on", "Wednesday", "demand", "##ing", "the", "removal", "of", "Pakistani", "Prime", "Minister", "Ben", "##azi", "##r", "B", "##hut", "##to", ",", "witnesses", "said", "." ], "ids": [ 16260, 129, 117, 10259, 36627, 10901, 56229, 10162, 11222, 82344, 10135, 57611, 34394, 10230, 10105, 65342, 10108, 66797, 19924, 14355, 13304, 28059, 10129, 139, 46296, 10340, 117, 109898, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "From", "here", "we", "will", "march", "to", "Islam", "##abad", "and", "by", "God", "we", "will", "not", "let", "Ben", "##azi", "##r", "and", "(", "B", "##hut", "##to", "'", "s", "husband", "As", "##if", "Ali", ")", "Za", "##rda", "##ri", "escape", "justice", ",", "\"", "Na", "##wa", "##z", "Sharif", ",", "leader", "of", "the", "main", "opposition", "Pakistan", "Muslim", "League", "told", "a", "rally", "organised", "by", "a", "16", "-", "party", "alliance", "." ], "ids": [ 107, 12222, 19353, 11951, 11337, 78466, 10114, 14727, 45407, 10111, 10155, 14015, 11951, 11337, 10472, 13595, 13304, 28059, 10129, 10111, 113, 139, 46296, 10340, 112, 187, 19634, 10882, 13918, 13518, 114, 14074, 21285, 10401, 30220, 25791, 117, 107, 10685, 11037, 10305, 94724, 117, 15014, 10108, 10105, 12126, 21227, 15437, 20428, 11074, 21937, 169, 58575, 54200, 10155, 169, 10250, 118, 14039, 36758, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 4, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sharif", "accused", "B", "##hut", "##to", "of", "corruption", "and", "ne", "##pot", "##ism", ",", "charges", "she", "has", "denied", "in", "the", "past", "." ], "ids": [ 94724, 37303, 139, 46296, 10340, 10108, 50410, 10111, 10554, 37604, 13397, 117, 31128, 10833, 10393, 47467, 10106, 10105, 17781, 119 ], "entity": [ "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Witness", "##es", "said", "protest", "##ers", "carrying", "colour", "##ful", "party", "flag", "##s", "walk", "##ed", "for", "several", "miles", ",", "chant", "##ing", "anti", "-", "government", "slogan", "##s", "." ], "ids": [ 103594, 10171, 12415, 36627, 10901, 39157, 43361, 14446, 14039, 31773, 10107, 33734, 10336, 10142, 11736, 14148, 117, 36489, 10230, 14249, 118, 12047, 68732, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "event", "was", "part", "of", "an", "opposition", "campaign", "launched", "on", "August", "14", ",", "Pakistan", "'", "s", "independence", "day", "." ], "ids": [ 10117, 14416, 10134, 10668, 10108, 10151, 21227, 17323, 18850, 10135, 10735, 10247, 117, 15437, 112, 187, 31412, 11940, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sharif", "said", "similar", "ra", "##lli", "##es", "would", "be", "held", "in", "the", "Bal", "##och", "##istan", "provincial", "capital", "Que", "##tta", "and", "the", "Punjab", "provincial", "capital", "Lahore", "before", "an", "opposition", "march", "on", "the", "capital", "Islam", "##abad", "." ], "ids": [ 94724, 12415, 13213, 11859, 14088, 10171, 10894, 10347, 11991, 10106, 10105, 93352, 16908, 35631, 24900, 12185, 27158, 12201, 10111, 10105, 40638, 24900, 12185, 76624, 11360, 10151, 21227, 78466, 10135, 10105, 12185, 14727, 45407, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 5, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "I", "promise", "the", "people", "of", "Karachi", "that", "those", "responsible", "for", "the", "extra", "-", "judicial", "killing", "of", "inn", "##ocent", "youth", "##s", "would", "not", "be", "sp", "##ared", ",", "\"", "Sharif", "said", "." ], "ids": [ 107, 146, 73871, 10105, 11426, 10108, 82344, 10189, 12676, 21586, 10142, 10105, 19868, 118, 41809, 34248, 10108, 15203, 103528, 24215, 10107, 10894, 10472, 10347, 32650, 104931, 117, 107, 94724, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "Karachi", "'", "s", "ethnic", "Mo", "##ha", "##jir", "National", "Movement", "(", "M", "##Q", "##M", ")", "accuse", "##s", "the", "government", "of", "killing", "many", "of", "its", "militants", "in", "cold", "blood", "." ], "ids": [ 82344, 112, 187, 34216, 34987, 10921, 81657, 10655, 28516, 113, 150, 19282, 11517, 114, 93413, 10107, 10105, 12047, 10108, 34248, 11299, 10108, 10474, 73829, 10106, 41626, 24911, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "has", "denied", "the", "charge", "and", "bl", "##ames", "the", "M", "##Q", "##M", "for", "much", "of", "the", "violence", "that", "killed", "2", ",", "000", "people", "in", "the", "city", "last", "year", "." ], "ids": [ 10117, 12047, 10393, 47467, 10105, 18163, 10111, 21484, 55497, 10105, 150, 19282, 11517, 10142, 13172, 10108, 10105, 26342, 10189, 15875, 123, 117, 10259, 11426, 10106, 10105, 11584, 12469, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Political", "observer", "##s", "said", "the", "turn", "-", "out", "was", "disa", "##ppo", "##inti", "##ng", "for", "a", "city", "of", "about", "12", "million", "people", ",", "possibly", "indicating", "that", "the", "M", "##Q", "##M", ",", "although", "a", "member", "of", "the", "opposition", "alliance", ",", "had", "not", "mobil", "##ised", "its", "supporters", "for", "the", "event", "." ], "ids": [ 18907, 79368, 10107, 12415, 10105, 18923, 118, 10950, 10134, 36474, 45565, 49886, 10376, 10142, 169, 11584, 10108, 10978, 10186, 12473, 11426, 117, 33370, 71346, 10189, 10105, 150, 19282, 11517, 117, 14779, 169, 12008, 10108, 10105, 21227, 36758, 117, 10374, 10472, 50420, 20666, 10474, 42957, 10142, 10105, 14416, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tur", "##bul", "##ent", "southern", "port", "has", "been", "cal", "##mer", "this", "year", ",", "but", "police", "say", "more", "than", "300", "people", "have", "died", "in", "political", "un", "##rest", "." ], "ids": [ 10117, 32461, 50400, 11405, 17156, 16874, 10393, 10590, 25923, 12371, 10531, 10924, 117, 10473, 15034, 23763, 10798, 11084, 11093, 11426, 10529, 12482, 10106, 13736, 10119, 34189, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "M", "##Q", "##M", "speaks", "for", "Urdu", "-", "speaking", "Mo", "##sle", "##ms", "who", "mig", "##rated", "from", "India", "at", "Partit", "##ion", "in", "1947", "and", "their", "descendants", "." ], "ids": [ 10117, 150, 19282, 11517, 92678, 10142, 67283, 118, 33740, 34987, 42176, 12387, 10479, 34478, 32199, 10188, 11098, 10160, 40222, 11046, 10106, 11113, 10111, 10455, 48325, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sharif", ",", "a", "former", "prime", "minister", ",", "is", "the", "main", "political", "rival", "of", "B", "##hut", "##to", ",", "who", "defeated", "him", "in", "the", "October", "1993", "election", "." ], "ids": [ 94724, 117, 169, 11775, 19287, 16930, 117, 10124, 10105, 12126, 13736, 24792, 10108, 139, 46296, 10340, 117, 10479, 18058, 10957, 10106, 10105, 11212, 10463, 13685, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "only", "the", "removal", "of", "the", "government", "and", "an", "early", "election", "could", "save", "Pakistan", "from", "disaster", ".", "\"" ], "ids": [ 10357, 12415, 10893, 10105, 65342, 10108, 10105, 12047, 10111, 10151, 11732, 13685, 12174, 32635, 15437, 10188, 63913, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "We", "will", "dis", "##lod", "##ge", "the", "B", "##hut", "##to", "government", "." ], "ids": [ 12865, 11337, 27920, 51861, 10525, 10105, 139, 46296, 10340, 12047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "It", "is", "a", "holy", "war", "for", "us", ",", "\"", "he", "said", "." ], "ids": [ 10377, 10124, 169, 95652, 10338, 10142, 19626, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##hut", "##to", "has", "vo", "##wed", "to", "complete", "her", "five", "-", "year", "term", "." ], "ids": [ 139, 46296, 10340, 10393, 12556, 48854, 10114, 17876, 10485, 12403, 118, 10924, 13719, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "ACC", "Apr", "-", "Jul", "'", "96", "sales", ",", "output", "up", "." ], "ids": [ 11098, 106857, 81464, 118, 65855, 112, 12308, 23857, 117, 37131, 10741, 119 ], "entity": [ "B-LOC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OM", "##BA", "##Y", "1996", "-", "08", "-", "28" ], "ids": [ 139, 37079, 35999, 14703, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "'", "s", "leading", "ce", "##ment", "firm", "Associated", "Ce", "##ment", "Companies", "(", "ACC", ")", "said", "on", "Wednesday", "its", "ce", "##ment", "sales", "rose", "to", "3", ".", "1", "million", "tonnes", "in", "April", "-", "July", "1996", "from", "2", ".", "93", "million", "a", "year", "ago", "." ], "ids": [ 11098, 112, 187, 16018, 10794, 10426, 23410, 39781, 13338, 10426, 84364, 113, 106857, 114, 12415, 10135, 57611, 10474, 10794, 10426, 23857, 29467, 10114, 124, 119, 122, 12473, 39435, 10106, 10780, 118, 11112, 10389, 10188, 123, 119, 12479, 12473, 169, 10924, 36390, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ACC", "Chairman", "Nan", "##i", "Pal", "##kh", "##ival", "##a", "told", "share", "##holders", "at", "the", "firm", "'", "s", "annual", "meeting", "ce", "##ment", "output", "rose", "to", "3", ".", "14", "million", "tonnes", "in", "the", "first", "quarter", "of", "1996", "/", "97", "(", "April", "-", "March", ")", ",", "from", "3", ".", "01", "million", "a", "year", "ago", "." ], "ids": [ 106857, 28635, 44286, 10116, 78722, 48502, 92895, 10113, 21937, 23867, 75111, 10160, 10105, 23410, 112, 187, 19246, 19822, 10794, 10426, 37131, 29467, 10114, 124, 119, 10247, 12473, 39435, 10106, 10105, 10422, 28330, 10108, 10389, 120, 12328, 113, 10780, 118, 11144, 114, 117, 10188, 124, 119, 10669, 12473, 169, 10924, 36390, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pal", "##kh", "##ival", "##a", "said", "ACC", "had", "secured", "government", "approval", "to", "take", "over", "a", "sick", "ce", "##ment", "firm", "with", "a", "gr", "##ind", "##ing", "capacity", "of", "275", ",", "000", "tonnes", "per", "year", ".", "\"" ], "ids": [ 78722, 48502, 92895, 10113, 12415, 106857, 10374, 57202, 12047, 48531, 10114, 13574, 10491, 169, 101003, 10794, 10426, 23410, 10169, 169, 30518, 32524, 10230, 23095, 10108, 23896, 117, 10259, 39435, 10178, 10924, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "will", "take", "it", "over", "early", "next", "month", ",", "\"", "he", "said", "." ], "ids": [ 12865, 11337, 13574, 10271, 10491, 11732, 13451, 14064, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Talking", "about", "the", "ce", "##ment", "industry", "in", "general", ",", "Pal", "##kh", "##ival", "##a", "said", "Indian", "production", "rose", "by", "about", "10", "percent", "in", "1995", "/", "96", "." ], "ids": [ 71432, 10978, 10105, 10794, 10426, 17425, 10106, 11389, 117, 78722, 48502, 92895, 10113, 12415, 12544, 12116, 29467, 10155, 10978, 10150, 22362, 10106, 10436, 120, 12308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "industry", "saw", "capacity", "expansion", "of", "about", "13", "percent", "over", "1994", "/", "95", "from", "77", ".", "79", "million", "tonnes", "to", "87", ".", "45", "million", "tonnes", ",", "\"", "Pal", "##kh", "##ival", "##a", "told", "share", "##holders", "." ], "ids": [ 107, 10117, 17425, 17112, 23095, 24837, 10108, 10978, 10249, 22362, 10491, 10444, 120, 11978, 10188, 12527, 119, 12791, 12473, 39435, 10114, 12581, 119, 10827, 12473, 39435, 117, 107, 78722, 48502, 92895, 10113, 21937, 23867, 75111, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "Indian", "ce", "##ment", "export", "##s", "dropped", "about", "eight", "percent", "from", "the", "previous", "year", "because", "of", "st", "##iff", "international", "competition", "and", "ina", "##de", "##quate", "in", "##fra", "##stru", "##ctural", "facilities", "." ], "ids": [ 10357, 12415, 12544, 10794, 10426, 59220, 10107, 30241, 10978, 16222, 22362, 10188, 10105, 16741, 10924, 12373, 10108, 28780, 31025, 12533, 16622, 10111, 22944, 10253, 64207, 10106, 31162, 42461, 60076, 24302, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ACC", "'", "s", "own", "export", "performance", "was", "marginal", "##ly", "better", "than", "in", "1994", "/", "95", "on", "account", "of", "a", "36", "percent", "rise", "in", "export", "##s", "to", "Nepal", "and", "the", "opening", "of", "a", "new", "market", "-", "Sri", "Lanka", ",", "he", "said", "." ], "ids": [ 106857, 112, 187, 12542, 59220, 14432, 10134, 92379, 10454, 18322, 11084, 10106, 10444, 120, 11978, 10135, 23200, 10108, 169, 11055, 22362, 28710, 10106, 59220, 10107, 10114, 22276, 10111, 10105, 17975, 10108, 169, 10751, 17313, 118, 16098, 20828, 117, 10261, 12415, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Despite", "power", "short", "##ages", ",", "ACC", "achieved", "a", "sat", "##is", "##fa", "##ctory", "growth", "in", "production", "during", "the", "year", "with", "the", "help", "of", "its", "power", "plants", "." ], "ids": [ 21230, 13183, 13716, 24115, 117, 106857, 28294, 169, 20694, 10291, 13369, 79181, 14609, 10106, 12116, 10939, 10105, 10924, 10169, 10105, 15217, 10108, 10474, 13183, 21422, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ACC", "sold", "9", ".", "4", "million", "tonnes", "in", "1995", "/", "96", ",", "retain", "##ing", "its", "top", "position", "in", "the", "Indian", "ce", "##ment", "industry", ",", "Pal", "##kh", "##ival", "##a", "said", "." ], "ids": [ 106857, 15337, 130, 119, 125, 12473, 39435, 10106, 10436, 120, 12308, 117, 76863, 10230, 10474, 12364, 12956, 10106, 10105, 12544, 10794, 10426, 17425, 117, 78722, 48502, 92895, 10113, 12415, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9 ] }, { "tokens": [ "-", "-", "Bombay", "news", "##room", "+", "91", "-", "22", "-", "265", "9000" ], "ids": [ 118, 118, 39961, 14424, 25525, 116, 12519, 118, 10306, 118, 25521, 56911 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgium", "bank", "san", "##ctions", "$", "6", ".", "5", "mln", "loan", "to", "India", "W", "##SR", "##L", "." ], "ids": [ 26519, 19423, 14608, 42068, 109, 127, 119, 126, 35198, 33390, 10114, 11098, 160, 52238, 11369, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 3, 7, 7, 9 ] }, { "tokens": [ "B", "##OM", "##BA", "##Y", "1996", "-", "08", "-", "28" ], "ids": [ 139, 37079, 35999, 14703, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Belgium", "'", "s", "Kr", "##edi", "##et", "##bank", "has", "approved", "a", "$", "6", ".", "5", "million", "loan", "to", "India", "'", "s", "We", "##ls", "##pun", "Stahl", "R", "##ohr", "##en", "Ltd", "(", "W", "##SR", "##L", ")", "to", "part", "-", "finance", "its", "sub", "##mer", "##ged", "arc", "wel", "##ded", "pipe", "##s", "plant", ",", "the", "Indian", "company", "said", "in", "a", "statement", "on", "Wednesday", "." ], "ids": [ 26519, 112, 187, 17640, 32212, 10308, 20583, 10393, 29855, 169, 109, 127, 119, 126, 12473, 33390, 10114, 11098, 112, 187, 12865, 11747, 19554, 64499, 155, 97062, 10136, 15129, 113, 160, 52238, 11369, 114, 10114, 10668, 118, 48053, 10474, 13987, 12371, 18832, 27068, 16829, 21597, 82153, 10107, 16430, 117, 10105, 12544, 12100, 12415, 10106, 169, 33311, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "loan", "is", "at", "L", "##IB", "##OR", "plus", "one", "percent", ",", "it", "said", "." ], "ids": [ 10117, 33390, 10124, 10160, 149, 72918, 42622, 10563, 10464, 22362, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "loan", ",", "mat", "##uring", "in", "six", "years", ",", "is", "gu", "##aran", "##teed", "by", "Indus", "##ind", "Bank", "for", "$", "3", ".", "5", "million", "and", "by", "U", "##TI", "Bank", "for", "$", "3", "million", ",", "it", "said", "." ], "ids": [ 10117, 33390, 117, 17255, 31653, 10106, 12449, 10855, 117, 10124, 75980, 24367, 100308, 10155, 89095, 32524, 13533, 10142, 109, 124, 119, 126, 12473, 10111, 10155, 158, 72286, 13533, 10142, 109, 124, 12473, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "W", "##SR", "##L", "plant", ",", "located", "in", "the", "western", "Indian", "state", "of", "Gujarat", ",", "will", "have", "a", "capacity", "to", "manufacture", "175", ",", "000", "tonnes", "per", "annum", "of", "longitud", "##inal", "pipe", "##s", "and", "25", ",", "000", "tonnes", "per", "annum", "of", "spiral", "wel", "##ded", "pipe", "##s", ",", "the", "statement", "said", "." ], "ids": [ 10117, 160, 52238, 11369, 16430, 117, 11954, 10106, 10105, 16672, 12544, 11388, 10108, 63025, 117, 11337, 10529, 169, 23095, 10114, 72022, 18101, 117, 10259, 39435, 10178, 53093, 10108, 23230, 37476, 82153, 10107, 10111, 10258, 117, 10259, 39435, 10178, 53093, 10108, 85496, 16829, 21597, 82153, 10107, 117, 10105, 33311, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "longitud", "##inal", "pipe", "##s", "plant", "is", "expected", "to", "be", "complete", "by", "the", "second", "quarter", "of", "September", "1997", "and", "the", "saw", "arc", "wel", "##ded", "pipe", "##s", "plant", "by", "September", "1996", ",", "it", "said", "." ], "ids": [ 10117, 23230, 37476, 82153, 10107, 16430, 10124, 25973, 10114, 10347, 17876, 10155, 10105, 11132, 28330, 10108, 10596, 10391, 10111, 10105, 17112, 27068, 16829, 21597, 82153, 10107, 16430, 10155, 10596, 10389, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##SR", "##L", "is", "part", "of", "the", "We", "##ls", "##pun", "group", "which", "has", "a", "presence", "in", "the", "cotton", "ya", "##rn", ",", "ter", "##ry", "to", "##wels", "and", "pol", "##yes", "##ter", "ya", "##rn", "industry", ",", "the", "statement", "said", "." ], "ids": [ 160, 52238, 11369, 10124, 10668, 10108, 10105, 12865, 11747, 19554, 11795, 10319, 10393, 169, 25599, 10106, 10105, 77946, 10549, 13061, 117, 12718, 10908, 10114, 67103, 10111, 16304, 28290, 10877, 10549, 13061, 17425, 117, 10105, 33311, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Bombay", "news", "##room", "+", "91", "-", "22", "-", "265", "9000" ], "ids": [ 118, 118, 39961, 14424, 25525, 116, 12519, 118, 10306, 118, 25521, 56911 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "fish", "##erm", "##en", "say", "forced", "to", "carry", "Tamil", "refugees", "." ], "ids": [ 11098, 26228, 91724, 10136, 23763, 20054, 10114, 31626, 22489, 71797, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "P", ".", "V", ".", "Krishna", "##moor", "##thy" ], "ids": [ 153, 119, 159, 119, 45299, 81031, 54047 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8 ] }, { "tokens": [ "RAM", "##ES", "##WA", "##RA", "##M", ",", "India", "1996", "-", "08", "-", "28" ], "ids": [ 39604, 25054, 42196, 29990, 11517, 117, 11098, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indian", "fish", "##erm", "##en", "said", "on", "Wednesday", "they", "had", "been", "forced", "at", "gun", "##point", "to", "ferry", "refugees", "fl", "##ee", "##ing", "the", "ethnic", "war", "in", "Sri", "Lanka", "to", "India", ",", "as", "a", "protest", "strike", "by", "more", "than", "30", ",", "000", "fish", "##erm", "##en", "entered", "its", "ninth", "day", "." ], "ids": [ 12544, 26228, 91724, 10136, 12415, 10135, 57611, 10689, 10374, 10590, 20054, 10160, 23103, 45676, 10114, 69607, 71797, 58768, 13321, 10230, 10105, 34216, 10338, 10106, 16098, 20828, 10114, 11098, 117, 10146, 169, 36627, 37456, 10155, 10798, 11084, 10244, 117, 10259, 26228, 91724, 10136, 19226, 10474, 54905, 11940, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "is", "little", "we", "can", "do", "when", "at", "mid", "-", "sea", "." ], "ids": [ 107, 11723, 10124, 16745, 11951, 10944, 10149, 10841, 10160, 15607, 118, 14931, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "L", "##T", "##TE", "(", "Liberation", "Tigers", "of", "Tamil", "E", "##ela", "##m", ")", "ac", "##cos", "##ts", "us", "and", ",", "at", "the", "point", "of", "a", "gun", ",", "forces", "us", "to", "take", "refugees", ",", "\"", "said", "senior", "fish", "##erm", "##en", "leader", "P", ".", "Ar", "##ulan", "##anda", "##m", "." ], "ids": [ 10117, 149, 11090, 29833, 113, 54766, 38640, 10108, 22489, 142, 15108, 10147, 114, 13621, 15023, 10806, 19626, 10111, 117, 10160, 10105, 12331, 10108, 169, 23103, 117, 13729, 19626, 10114, 13574, 71797, 117, 107, 12415, 17843, 26228, 91724, 10136, 15014, 153, 119, 18484, 43531, 41971, 10147, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Some", "850", "refugees", "have", "landed", "in", "recent", "weeks", "at", "the", "port", "of", "Ram", "##es", "##wara", "##m", "in", "the", "southern", "Indian", "state", "of", "Tamil", "Nadu", ",", "home", "to", "50", "million", "Tamil", "-", "speaking", "people", ",", "port", "officials", "say", "." ], "ids": [ 13885, 24934, 71797, 10529, 58961, 10106, 19037, 20750, 10160, 10105, 16874, 10108, 42932, 10171, 50545, 10147, 10106, 10105, 17156, 12544, 11388, 10108, 22489, 43528, 117, 11816, 10114, 10462, 12473, 22489, 118, 33740, 11426, 117, 16874, 27730, 23763, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 2, 9, 9, 1, 5, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ram", "##es", "##wara", "##m", "is", "15", "km", "(", "10", "miles", ")", "off", "the", "coast", "of", "Sri", "Lanka", "." ], "ids": [ 42932, 10171, 50545, 10147, 10124, 10208, 10204, 113, 10150, 14148, 114, 11898, 10105, 22216, 10108, 16098, 20828, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "State", "chief", "minister", "M", ".", "Kar", "##unan", "##idh", "##i", "has", "publicly", "wel", "##come", "##d", "the", "refugees", ",", "who", "are", "fl", "##ee", "##ing", "the", "13", "-", "year", "war", "between", "Tamil", "separat", "##ists", "and", "government", "troops", "that", "Colombo", "says", "has", "cost", "50", ",", "000", "lives", "." ], "ids": [ 11104, 19421, 16930, 150, 119, 90233, 35701, 51141, 10116, 10393, 53577, 16829, 61643, 10162, 10105, 71797, 117, 10479, 10301, 58768, 13321, 10230, 10105, 10249, 118, 10924, 10338, 10948, 22489, 81806, 18206, 10111, 12047, 20836, 10189, 40367, 22153, 10393, 18849, 10462, 117, 10259, 21418, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "in", "##f", "##lux", "has", "tri", "##ggere", "##d", "fear", "##s", "of", "a", "repeat", "of", "the", "1980s", "when", "some", "200", ",", "000", "refugees", "landed", "in", "Tamil", "Nadu", "." ], "ids": [ 16976, 10105, 10106, 10575, 72896, 10393, 15633, 79581, 10162, 44929, 10107, 10108, 169, 107832, 10108, 10105, 21215, 10841, 11152, 10777, 117, 10259, 71797, 58961, 10106, 22489, 43528, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Intelligence", "off", "##ical", "##s", "said", "more", "than", "5", ",", "000", "Tamil", "##s", "were", "waiting", "on", "the", "western", "coast", "of", "Sri", "Lanka", "to", "cross", "into", "India", "." ], "ids": [ 28854, 11898, 17616, 10107, 12415, 10798, 11084, 126, 117, 10259, 22489, 10107, 10309, 62052, 10135, 10105, 16672, 22216, 10108, 16098, 20828, 10114, 19630, 10708, 11098, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "Indian", "government", "has", "war", "##ned", "its", "fish", "##erm", "##en", "that", "their", "boats", "would", "be", "im", "##pou", "##nded", "if", "they", "were", "caught", "ferry", "##ing", "refugees", "." ], "ids": [ 10117, 12544, 12047, 10393, 10338, 17021, 10474, 26228, 91724, 10136, 10189, 10455, 46760, 10894, 10347, 10211, 73535, 53556, 12277, 10689, 10309, 39797, 69607, 10230, 71797, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fish", "##erm", "##en", "went", "on", "strike", "last", "week", "to", "protest", "the", "government", "'", "s", "can", "##cella", "##tion", "of", "three", "tra", "##wl", "##ers", "'", "fishing", "license", "##s", "after", "the", "boats", "were", "caught", "carrying", "Tamil", "refugees", "." ], "ids": [ 10117, 26228, 91724, 10136, 13446, 10135, 37456, 12469, 16118, 10114, 36627, 10105, 12047, 112, 187, 10944, 88749, 10822, 10108, 11003, 11264, 37676, 10901, 112, 43768, 47679, 10107, 10662, 10105, 46760, 10309, 39797, 39157, 22489, 71797, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "All", "Fisher", "##men", "'", "s", "Association", "secretary", "N", ".", "J", ".", "Bose", "said", "the", "strike", "would", "continue", "inde", "##finite", "##ly", "and", "the", "fish", "##erm", "##en", "would", "block", "road", "and", "rail", "traffic", "if", "their", "demands", "were", "not", "met", "." ], "ids": [ 11101, 24907, 11418, 112, 187, 11751, 37664, 151, 119, 147, 119, 92612, 12415, 10105, 37456, 10894, 17734, 100991, 89618, 10454, 10111, 10105, 26228, 91724, 10136, 10894, 27242, 15485, 10111, 29547, 26482, 12277, 10455, 64886, 10309, 10472, 10428, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Until", "the", "government", "releases", "our", "boats", "from", "naval", "custody", "and", "Sri", "Lanka", "##n", "naval", "custody", ",", "and", "gives", "us", "ass", "##urance", "(", "it", "will", "not", "rev", "##oke", "licence", "##s", "of", "boats", "ferry", "##ing", "refugees", ")", ",", "we", "will", "not", "call", "off", "our", "strike", ",", "\"", "Bose", "said", "." ], "ids": [ 107, 41956, 10105, 12047, 45906, 17446, 46760, 10188, 25922, 103772, 10111, 16098, 20828, 10115, 25922, 103772, 117, 10111, 24952, 19626, 13935, 41078, 113, 10271, 11337, 10472, 86095, 37861, 45241, 10107, 10108, 46760, 69607, 10230, 71797, 114, 117, 11951, 11337, 10472, 20575, 11898, 17446, 37456, 117, 107, 92612, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "L", "##T", "##TE", "spoke", "##smen", "could", "not", "immediately", "be", "reached", "for", "comment", ",", "but", "Sri", "Lanka", "##n", "fish", "##erm", "##en", "denied", "that", "Indians", "were", "being", "co", "##er", "##ced", "into", "carrying", "refugees", "across", "the", "Pal", "##k", "Strait", "." ], "ids": [ 149, 11090, 29833, 50005, 60785, 12174, 10472, 24029, 10347, 17087, 10142, 49641, 117, 10473, 16098, 20828, 10115, 26228, 91724, 10136, 47467, 10189, 33032, 10309, 11223, 11170, 10165, 38039, 10708, 39157, 71797, 15130, 10105, 78722, 10174, 74916, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "\"", "Indian", "fish", "##erm", "##en", "come", "right", "up", "to", "Pe", "##sala", "##i", "to", "fish", ",", "and", "when", "refugees", "request", "them", "to", "ferry", "them", "across", ",", "they", "read", "##ily", "ob", "##lige", "." ], "ids": [ 107, 12544, 26228, 91724, 10136, 10678, 13448, 10741, 10114, 29005, 104655, 10116, 10114, 26228, 117, 10111, 10841, 71797, 37449, 11345, 10114, 69607, 11345, 15130, 117, 10689, 24944, 32464, 17339, 14425, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Only", "some", "take", "money", ",", "\"", "Sri", "Lanka", "##n", "boat", "##man", "Chin", "##natha", "##mbi", "said", "." ], "ids": [ 18740, 11152, 13574, 17920, 117, 107, 16098, 20828, 10115, 30418, 10589, 51529, 94372, 59208, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Ar", "##ulan", "##anda", "##m", "denied", "the", "fish", "##erm", "##en", "charged", "the", "refugees", "for", "passage", "to", "India", "and", "said", "it", "was", "un", "##fair", "to", "penal", "##ise", "them", "for", "the", "refugees", "'", "arrival", "." ], "ids": [ 18484, 43531, 41971, 10147, 47467, 10105, 26228, 91724, 10136, 38253, 10105, 71797, 10142, 22718, 10114, 11098, 10111, 12415, 10271, 10134, 10119, 82198, 10114, 69270, 13041, 11345, 10142, 10105, 71797, 112, 40285, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "not", "gone", "to", "sea", "since", "August", "19", ",", "but", "refugees", "are", "arriving", "daily", "never", "##theless", "." ], "ids": [ 107, 12865, 10529, 10472, 45041, 10114, 14931, 11764, 10735, 10270, 117, 10473, 71797, 10301, 65200, 27636, 14794, 60251, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "How", "could", "we", "alone", "be", "held", "responsible", "for", "the", "in", "##f", "##lux", "?", "\"" ], "ids": [ 14962, 12174, 11951, 24087, 10347, 11991, 21586, 10142, 10105, 10106, 10575, 72896, 136, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "he", "said", "." ], "ids": [ 10261, 12415, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "An", "Indian", "Fisheries", "Department", "official", "said", "the", "government", "planned", "to", "ur", "##ge", "fish", "##erm", "##en", "not", "to", "cross", "the", "international", "boundary", "between", "India", "and", "Sri", "Lanka", ",", "but", "admitted", "this", "would", "be", "hard", "to", "en", "##force", "because", "of", "Sri", "Lanka", "'", "s", "po", "##m", "##fre", "##t", "-", "rich", "waters", "." ], "ids": [ 10313, 12544, 43660, 12933, 14731, 12415, 10105, 12047, 24292, 10114, 10399, 10525, 26228, 91724, 10136, 10472, 10114, 19630, 10105, 12533, 42584, 10948, 11098, 10111, 16098, 20828, 117, 10473, 40345, 10531, 10894, 10347, 19118, 10114, 10110, 39910, 12373, 10108, 16098, 20828, 112, 187, 10514, 10147, 37135, 10123, 118, 33250, 42646, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indian", "cotton", "trade", "shut", "for", "local", "festival", "." ], "ids": [ 12544, 77946, 18908, 70323, 10142, 11436, 15242, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OM", "##BA", "##Y", "1996", "-", "08", "-", "28" ], "ids": [ 139, 37079, 35999, 14703, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "'", "s", "cotton", "trade", "was", "shut", "on", "Wednesday", "for", "a", "local", "religious", "festival", ",", "deal", "##ers", "said", "." ], "ids": [ 11098, 112, 187, 77946, 18908, 10134, 70323, 10135, 57611, 10142, 169, 11436, 19366, 15242, 117, 19918, 10901, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trading", "will", "res", "##ume", "on", "Thursday", "." ], "ids": [ 110260, 11337, 39429, 20467, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Tuesday", ",", "cotton", "prices", "fell", "on", "profit", "-", "taking", "prompted", "by", "increased", "offering", "##s", "from", "state", "agencies", "." ], "ids": [ 10576, 70245, 117, 77946, 57476, 25194, 10135, 25081, 118, 18084, 93003, 10155, 19299, 42281, 10107, 10188, 11388, 49198, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Export", "deals", "remained", "thin", "and", "hard", "##ly", "a", "few", "thousand", "bal", "##es", "were", "traded", "at", "the", "rate", "of", "57", ".", "50", "/", "60", "cents", "per", "pound", ",", "\"", "one", "broke", "##r", "said", "." ], "ids": [ 107, 108268, 78037, 15980, 61470, 10111, 19118, 10454, 169, 13824, 46634, 20873, 10171, 10309, 52696, 10160, 10105, 18344, 10108, 11817, 119, 10462, 120, 10709, 63487, 10178, 99233, 117, 107, 10464, 30500, 10129, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Bombay", "Com", "##mo", "##diti", "##es", "+", "91", "-", "22", "-", "265", "9000" ], "ids": [ 118, 118, 39961, 16680, 11033, 63203, 10171, 116, 12519, 118, 10306, 118, 25521, 56911 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VW", "sees", "group", "net", "profit", "do", "##ub", "##ling", "in", "Q", "##3", "." ], "ids": [ 108027, 41369, 11795, 11988, 25081, 10149, 20664, 11945, 10106, 154, 10884, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DR", "##ES", "##DE", "##N", ",", "Germany", "1996", "-", "08", "-", "28" ], "ids": [ 45457, 25054, 60675, 11537, 117, 12775, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "car", "##maker", "Volkswagen", "AG", "said", "on", "Wednesday", "that", "it", "expected", "group", "net", "profit", "to", "double", "in", "the", "third", "quarter", "." ], "ids": [ 12026, 13000, 32295, 37787, 17935, 12415, 10135, 57611, 10189, 10271, 25973, 11795, 11988, 25081, 10114, 15790, 10106, 10105, 12628, 28330, 119 ], "entity": [ "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "been", "seeking", "to", "double", "our", "profits", "(", "during", "the", "period", ")", "and", "we", "are", "con", "##fi", "##dent", "of", "doing", "so", ",", "\"", "VW", "chief", "financial", "officer", "Bruno", "Adel", "##t", "told", "a", "brief", "##ing", "as", "part", "of", "the", "formal", "introduction", "of", "the", "new", "VW", "Pass", "##at", "sedan", "." ], "ids": [ 107, 12865, 10529, 10590, 51285, 10114, 15790, 17446, 100106, 113, 10939, 10105, 13127, 114, 10111, 11951, 10301, 10173, 14403, 21029, 10108, 30918, 10380, 117, 107, 108027, 19421, 20570, 19288, 16663, 80444, 10123, 21937, 169, 29040, 10230, 10146, 10668, 10108, 10105, 23129, 23890, 10108, 10105, 10751, 108027, 30598, 10526, 17091, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "Adel", "##t", "did", "not", "give", "a", "concrete", "for", "##eca", "##st", "." ], "ids": [ 80444, 10123, 12172, 10472, 18090, 169, 41651, 10142, 33588, 10562, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VW", "had", "a", "1995", "third", "quarter", "group", "net", "profit", "of", "72", "million", "marks", "." ], "ids": [ 108027, 10374, 169, 10436, 12628, 28330, 11795, 11988, 25081, 10108, 12120, 12473, 55112, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "group", "reported", "a", "1996", "first", "-", "half", "group", "net", "profit", "of", "282", "million", "marks", "." ], "ids": [ 10117, 11795, 15943, 169, 10389, 10422, 118, 13877, 11795, 11988, 25081, 10108, 28805, 12473, 55112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "John", "Gil", "##ardi", ",", "Frankfurt", "News", "##room", ",", "+", "49", "69", "756", "##52", "##5" ], "ids": [ 118, 118, 10421, 26463, 96666, 117, 15226, 12219, 25525, 117, 116, 11580, 12573, 65821, 92161, 11166 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##TI", "##AD", "##IS", "EV", "##ER", "##T", "H", "##EA", "##DS", "TO", "AL", "##E", "##X", "##AN", "##D", "##RO", "##UP", "##OL", "##IS", "T", "##HI", "##S", "W", "##EE", "##K", "##EN", "##D", "." ], "ids": [ 75416, 11369, 72286, 55538, 19088, 109821, 24093, 11090, 145, 36789, 33953, 58573, 47271, 11259, 12674, 41275, 11490, 35066, 57487, 39272, 19088, 157, 108880, 10731, 160, 95825, 11733, 50655, 11490, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Conservative", "New", "Democracy", "(", "N", "##D", ")", "party", "leader", "Mil", "##tia", "##dis", "Ever", "##t", "will", "be", "hitting", "the", "campaign", "trail", "and", "head", "to", "Alexa", "##ndro", "##up", "##olis", "this", "weekend", "to", "speak", "to", "the", "city", "'", "s", "business", "##men", "on", "Sunday", "morning", ",", "N", "##D", "said", "." ], "ids": [ 37910, 10287, 45762, 113, 151, 11490, 114, 14039, 15014, 75311, 16180, 17442, 42055, 10123, 11337, 10347, 88998, 10105, 17323, 56559, 10111, 13578, 10114, 94720, 78908, 14590, 35097, 10531, 43440, 10114, 41541, 10114, 10105, 11584, 112, 187, 14155, 11418, 10135, 19731, 28757, 117, 151, 11490, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "Ever", "##t", "will", "de", "##part", "for", "Alexa", "##ndro", "##up", "##olis", "on", "Saturday", "afternoon", "." ], "ids": [ 42055, 10123, 11337, 10104, 48433, 10142, 94720, 78908, 14590, 35097, 10135, 24848, 73213, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Prime", "Minister", "Costa", "##s", "Sim", "##itis", "criticized", "Ever", "##t", "today", "for", "un", "##lea", "##shing", "a", "seven", "-", "point", "economic", "package", "that", "offers", "tax", "relief", "to", "merchants", "and", "other", "professionals", ",", "higher", "pension", "##s", "to", "farmers", "and", "support", "for", "small", "business", "." ], "ids": [ 19924, 14355, 13902, 10107, 103695, 36967, 42318, 42055, 10123, 18745, 10142, 10119, 25277, 74062, 169, 15767, 118, 12331, 13925, 62432, 10189, 23818, 25468, 31276, 10114, 108624, 10111, 10684, 53755, 117, 17981, 70838, 10107, 10114, 55543, 10111, 13145, 10142, 12474, 14155, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "finance", "ministry", "estimated", "the", "cost", "of", "N", "##D", "'", "s", "economic", "measures", "to", "over", "600", "billion", "dra", "##ch", "##mas", "but", "N", "##D", "officials", "put", "the", "figure", "much", "lower", "to", "about", "300", "billion", "dra", "##ch", "##mas", "." ], "ids": [ 10117, 48053, 65338, 25267, 10105, 18849, 10108, 151, 11490, 112, 187, 13925, 38606, 10114, 10491, 11796, 25848, 68507, 10269, 12922, 10473, 151, 11490, 27730, 14499, 10105, 17527, 13172, 18165, 10114, 10978, 11093, 25848, 68507, 10269, 12922, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sim", "##itis", "bl", "##amed", "N", "##D", "for", "the", "low", "ab", "##sorption", "rate", "of", "EU", "funds", "and", "said", "the", "socialist", "##s", "will", "increase", "farmers", "'", "pension", "##s", ",", "combat", "tax", "eva", "##sion", "and", "ac", "##cel", "##erate", "GDP", "growth", "rates", "to", "4", ".", "0", "percent", "in", "a", "few", "years", "." ], "ids": [ 103695, 36967, 21484, 83865, 151, 11490, 10142, 10105, 15626, 11357, 99457, 18344, 10108, 17751, 32067, 10111, 12415, 10105, 79456, 10107, 11337, 20299, 55543, 112, 70838, 10107, 117, 18159, 25468, 103730, 17467, 10111, 13621, 32942, 64474, 47832, 14609, 38200, 10114, 125, 119, 121, 22362, 10106, 169, 13824, 10855, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fast", "##er", "economic", "growth", "is", "a", "major", "component", "of", "N", "##D", "'", "s", "economic", "programme", "and", "Ever", "##t", "has", "repeatedly", "bl", "##amed", "the", "socialist", "##s", "for", "the", "slow", "economic", "growth", "." ], "ids": [ 28191, 10165, 13925, 14609, 10124, 169, 11922, 38483, 10108, 151, 11490, 112, 187, 13925, 19611, 10111, 42055, 10123, 10393, 77998, 21484, 83865, 10105, 79456, 10107, 10142, 10105, 41573, 13925, 14609, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Dimitri", "##s", "Ko", "##nto", "##gian", "##nis", ",", "Athens", "News", "##room", "+", "301", "331", "##18", "##12", "-", "4" ], "ids": [ 118, 118, 73589, 10107, 30186, 15088, 38531, 12597, 117, 33765, 12219, 25525, 116, 26224, 30690, 45987, 24747, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dow", "push", "##es", "London", "stock", "##s", "to", "new", "record", "." ], "ids": [ 106035, 68052, 10171, 10829, 20511, 10107, 10114, 10751, 12410, 119 ], "entity": [ "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peter", "Griffiths" ], "ids": [ 10979, 69625 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "firm", "start", "on", "Wall", "Street", "helped", "push", "leading", "London", "shares", "to", "a", "new", "record", "high", "on", "Wednesday", "and", "German", "stock", "##s", "closed", "floor", "trading", "up", "but", "the", "Paris", "bou", "##rse", "sl", "##ip", "##ped", "sharp", "##ly", ",", "hit", "by", "a", "weak", "##ening", "franc", "and", "fear", "##s", "of", "industrial", "un", "##rest", "." ], "ids": [ 138, 23410, 15148, 10135, 19523, 11962, 20890, 68052, 16018, 10829, 45751, 10114, 169, 10751, 12410, 11846, 10135, 57611, 10111, 12026, 20511, 10107, 18440, 23861, 46663, 10741, 10473, 10105, 10728, 94335, 16239, 38523, 17437, 16898, 77348, 10454, 117, 14946, 10155, 169, 61285, 24428, 63184, 10111, 44929, 10107, 10108, 18138, 10119, 34189, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "the", "foreign", "exchange", "markets", ",", "a", "survey", "indicating", "weak", "##er", "than", "expected", "Japanese", "business", "sentiment", "bo", "##oste", "##d", "the", "dollar", "in", "early", "trading", "but", "it", "failed", "to", "build", "on", "its", "gains", "against", "the", "ye", "##n", "and", "sl", "##ip", "##ped", "lower", "against", "the", "mark", "in", "quiet", "afternoon", "trade", "." ], "ids": [ 10576, 10105, 20796, 27714, 42893, 117, 169, 35035, 71346, 61285, 10165, 11084, 25973, 13847, 14155, 70762, 20506, 45722, 10162, 10105, 34807, 10106, 11732, 46663, 10473, 10271, 20775, 10114, 23332, 10135, 10474, 92193, 11327, 10105, 11023, 10115, 10111, 38523, 17437, 16898, 18165, 11327, 10105, 29221, 10106, 104951, 73213, 18908, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "shares", ",", "bo", "##oste", "##d", "by", "Wall", "Street", ",", "added", "to", "early", "gains", "with", "the", "blue", "chip", "F", "##TS", "##E", "100", "index", "hitting", "a", "new", "peak", "of", "392", "##1", ".", "8", "before", "drop", "##ping", "back", "slightly", "." ], "ids": [ 10829, 45751, 117, 20506, 45722, 10162, 10155, 19523, 11962, 117, 16288, 10114, 11732, 92193, 10169, 10105, 23254, 64008, 143, 36545, 11259, 10407, 19776, 88998, 169, 10751, 34200, 10108, 37956, 10759, 119, 129, 11360, 36365, 15398, 12014, 31603, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "focus", "was", "British", "Airways", ",", "which", "re", "##bound", "##ed", "after", "fear", "##s", "fa", "##ded", "that", "the", "can", "##cella", "##tion", "of", "\"", "open", "ski", "##es", "\"", "talks", "between", "the", "U", ".", "S", ".", "Transportation", "Department", "and", "the", "British", "government", "may", "je", "##opa", "##rdi", "##se", "its", "tie", "-", "up", "with", "American", "Airlines", "." ], "ids": [ 11340, 23195, 10134, 11160, 29791, 117, 10319, 11639, 47755, 10336, 10662, 44929, 10107, 12211, 21597, 10189, 10105, 10944, 88749, 10822, 10108, 107, 14087, 40122, 10171, 107, 56672, 10948, 10105, 158, 119, 156, 119, 44063, 12933, 10111, 10105, 11160, 12047, 11387, 10144, 49482, 18177, 10341, 10474, 27916, 118, 10741, 10169, 10536, 17768, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "The", "conclusion", "of", "an", "open", "ski", "##es", "agreement", "had", "been", "made", "a", "pre", "##re", "##quis", "##ite", "of", "the", "proposed", "link", "-", "up", "by", "the", "U", ".", "S", "." ], "ids": [ 10117, 47775, 10108, 10151, 14087, 40122, 10171, 25432, 10374, 10590, 11019, 169, 12229, 10246, 53499, 12704, 10108, 10105, 21622, 26192, 118, 10741, 10155, 10105, 158, 119, 156, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Better", "-", "than", "-", "expected", "British", "trade", "figures", "had", "little", "impact", "on", "e", "##qui", "##ties", "." ], "ids": [ 34961, 118, 11084, 118, 25973, 11160, 18908, 21068, 10374, 16745, 21316, 10135, 173, 39639, 14197, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "non", "-", "EU", "July", "trade", "deficit", "total", "##led", "506", "million", "ster", "##ling", "(", "$", "788", "million", ")", "while", "June", "'", "s", "world", "deficit", "was", "1", ".", "12", "billion", "pounds", "." ], "ids": [ 10117, 10446, 118, 17751, 11112, 18908, 107383, 11339, 16376, 44288, 12473, 78342, 11945, 113, 109, 70314, 12473, 114, 11371, 11120, 112, 187, 11356, 107383, 10134, 122, 119, 10186, 25848, 61982, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Forecasts", "were", "for", "deficit", "##s", "of", "900", "million", "ster", "##ling", "and", "1", ".", "4", "billion", "ster", "##ling", "." ], "ids": [ 79411, 10309, 10142, 107383, 10107, 10108, 13545, 12473, 78342, 11945, 10111, 122, 119, 125, 25848, 78342, 11945, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "shares", "shed", "some", "gains", "on", "profit", "-", "taking", "but", "none", "##theless", "ended", "the", "floor", "session", "higher", "bu", "##oy", "##ed", "by", "demand", "for", "chemical", "stock", "##s", "and", "a", "stable", "dollar", "." ], "ids": [ 12026, 45751, 106942, 11152, 92193, 10135, 25081, 118, 18084, 10473, 46638, 60251, 18428, 10105, 23861, 30066, 17981, 11499, 20712, 10336, 10155, 34394, 10142, 29677, 20511, 10107, 10111, 169, 38430, 34807, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "30", "-", "share", "DA", "##X", "index", "closed", "at", "2", ",", "563", ".", "16", "points", ",", "up", "4", ".", "32", "." ], "ids": [ 10117, 10244, 118, 23867, 47855, 12674, 19776, 18440, 10160, 123, 117, 50724, 119, 10250, 12789, 117, 10741, 125, 119, 10842, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "However", ",", "French", "stock", "##s", "extended", "opening", "losses", "to", "more", "than", "one", "percent", "in", "morning", "trading", ",", "falling", "through", "the", "2000", "point", "resistance", "level", "on", "the", "main", "CA", "##C", "-", "40", "index", "." ], "ids": [ 12209, 117, 11894, 20511, 10107, 21777, 17975, 45353, 10114, 10798, 11084, 10464, 22362, 10106, 28757, 46663, 117, 54756, 11222, 10105, 10180, 12331, 33823, 13277, 10135, 10105, 12126, 24707, 10858, 118, 10533, 19776, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "bl", "##amed", "a", "weak", "##ening", "franc", "and", "wo", "##rries", "about", "the", "1997", "budget", "and", "possible", "autumn", "strikes" ], "ids": [ 54521, 10901, 21484, 83865, 169, 61285, 24428, 63184, 10111, 12796, 107788, 10978, 10105, 10391, 25293, 10111, 14128, 82240, 86206 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Louis", "Via", "##nnet", ",", "leader", "of", "France", "'", "s", "Communist", "-", "led", "CG", "##T", "union", ",", "criticised", "government", "plans", "for", "spending", "cuts", "in", "the", "1997", "budget", "on", "Wednesday", "and", "war", "##ned", "of", "labour", "un", "##rest", "as", "France", "gets", "back", "to", "work", "after", "the", "holiday", "##s", "." ], "ids": [ 11334, 21280, 94698, 117, 15014, 10108, 10688, 112, 187, 33065, 118, 12857, 74065, 11090, 20763, 117, 91588, 12047, 18195, 10142, 51163, 73311, 10106, 10105, 10391, 25293, 10135, 57611, 10111, 10338, 17021, 10108, 40763, 10119, 34189, 10146, 10688, 30811, 12014, 10114, 11424, 10662, 10105, 71806, 10107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 1, 9, 9, 2, 6, 6, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Later", "in", "the", "day", ",", "helped", "by", "the", "firme", "##r", "Wall", "Street", "opening", ",", "Paris", "climb", "##ed", "back", "to", "the", "2000", "level", "but", "still", "remained", "well", "into", "negative", "territory", "." ], "ids": [ 16397, 10106, 10105, 11940, 117, 20890, 10155, 10105, 33563, 10129, 19523, 11962, 17975, 117, 10728, 93274, 10336, 12014, 10114, 10105, 10180, 13277, 10473, 12647, 15980, 11206, 10708, 25785, 24399, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "foreign", "exchange", "the", "dollar", "was", "trading", "at", "around", "108", ".", "40", "ye", "##n", "in", "the", "European", "afternoon", ",", "up", "from", "its", "European", "close", "on", "Tuesday", "of", "107", ".", "55", "but", "off", "the", "day", "'", "s", "high", "##s", "." ], "ids": [ 10167, 20796, 27714, 10105, 34807, 10134, 46663, 10160, 12166, 15845, 119, 10533, 11023, 10115, 10106, 10105, 11914, 73213, 117, 10741, 10188, 10474, 11914, 16065, 10135, 70245, 10108, 15844, 119, 11358, 10473, 11898, 10105, 11940, 112, 187, 11846, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "had", "been", "bo", "##oste", "##d", "over", "##night", "by", "the", "Bank", "of", "Japan", "'", "s", "quarter", "##ly", "corporate", "survey", ",", "or", "\"", "tank", "##an", "\"", ",", "of", "major", "manufacturers", "-", "-", "an", "important", "gauge", "of", "business", "sentiment", "." ], "ids": [ 10377, 10374, 10590, 20506, 45722, 10162, 10491, 45217, 10155, 10105, 13533, 10108, 11891, 112, 187, 28330, 10454, 46666, 35035, 117, 10345, 107, 28671, 10206, 107, 117, 10108, 11922, 77256, 118, 118, 10151, 12452, 54750, 10108, 14155, 70762, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "une", "##xpected", "##ly", "weak", "figures", "convinced", "markets", "that", "Japanese", "interest", "rates", "would", "stay", "at", "rock", "-", "bottom", "levels", "-", "-", "weak", "##ening", "the", "ye", "##n", "." ], "ids": [ 10117, 10231, 101239, 10454, 61285, 21068, 71869, 42893, 10189, 13847, 17644, 38200, 10894, 29597, 10160, 12249, 118, 34787, 21559, 118, 118, 61285, 24428, 10105, 11023, 10115, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Japanese", "disco", "##unt", "rate", "is", "currently", "at", "a", "record", "low", "of", "0", ".", "5", "percent", "." ], "ids": [ 10117, 13847, 14884, 20631, 18344, 10124, 15313, 10160, 169, 12410, 15626, 10108, 121, 119, 126, 22362, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "B", "##O", "##J", "sought", "to", "put", "the", "best", "face", "on", "the", "data", "which", "def", "##ied", "e", "##cono", "##mist", "##s", "'", "prediction", "##s", "of", "improving", "sentiment", "and", "was", "the", "first", "decline", "in", "business", "sentiment", "in", "a", "year", "." ], "ids": [ 10117, 139, 11403, 15417, 32570, 10114, 14499, 10105, 12504, 13295, 10135, 10105, 11165, 10319, 100745, 24140, 173, 27447, 24987, 10107, 112, 78089, 10107, 10108, 79719, 70762, 10111, 10134, 10105, 10422, 46695, 10106, 14155, 70762, 10106, 169, 10924, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "B", "##O", "##J", "spoke", "##sman", "said", "\"", "the", "doors", "to", "the", "recovery", "have", "not", "been", "shut", ".", ".", "." ], "ids": [ 138, 139, 11403, 15417, 50005, 24305, 12415, 107, 10105, 56390, 10114, 10105, 61958, 10529, 10472, 10590, 70323, 119, 119, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "the", "recovery", "is", "still", "continuing", ".", "\"" ], "ids": [ 10105, 61958, 10124, 12647, 47635, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "re", "##marks", "gave", "the", "ye", "##n", "some", "back", "##bone", "and", "the", "dollar", "failed", "to", "progress", "further", "." ], "ids": [ 13252, 11639, 64711, 15362, 10105, 11023, 10115, 11152, 12014, 66666, 10111, 10105, 34807, 20775, 10114, 40316, 14586, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "dollar", "'", "s", "gains", "were", "less", "than", "sp", "##ecta", "##cular", ",", "suggesting", "that", "while", "it", "'", "s", "likely", "to", "benefit", "from", "revised", "Japanese", "rate", "ex", "##pectations", ",", "a", "break", "##out", "from", "the", "established", "trading", "range", "does", "n", "'", "t", "appear", "likely", ",", "\"", "said", "currency", "e", "##cono", "##mist", "Klaus", "Ba", "##ader", "." ], "ids": [ 107, 10117, 34807, 112, 187, 92193, 10309, 15306, 11084, 32650, 78125, 24236, 117, 85404, 10189, 11371, 10271, 112, 187, 22497, 10114, 43074, 10188, 41226, 13847, 18344, 11419, 96815, 117, 169, 24194, 17514, 10188, 10105, 13245, 46663, 15601, 15107, 182, 112, 188, 22641, 22497, 117, 107, 12415, 83759, 173, 27447, 24987, 21350, 21333, 78687, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Deal", "##ers", "said", "shares", "were", "also", "affected", "by", "a", "sl", "##ip", "##page", "in", "bond", "prices", "due", "to", "lower", "than", "expected", "June", "industrial", "production", ",", "showing", "the", "economy", "was", "still", "falt", "##ering", "." ], "ids": [ 54521, 10901, 12415, 45751, 10309, 10379, 36276, 10155, 169, 38523, 17437, 36795, 10106, 55185, 57476, 10850, 10114, 18165, 11084, 25973, 11120, 18138, 12116, 117, 37501, 10105, 27570, 10134, 12647, 100865, 19232, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##UR", "##RE", "##NC", "##IE", "##S", "AT", "1500", "GMT" ], "ids": [ 140, 98348, 66014, 100230, 71655, 10731, 30554, 13922, 20362 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "The", "dollar", "was", "at", "108", ".", "40", "ye", "##n", "and", "1", ".", "476", "##5", "marks", "compared", "with", "Tuesday", "'", "s", "European", "close", "of", "107", ".", "78", "ye", "##n", "and", "1", ".", "477", "##9", "marks" ], "ids": [ 10117, 34807, 10134, 10160, 15845, 119, 10533, 11023, 10115, 10111, 122, 119, 36019, 11166, 55112, 25626, 10169, 70245, 112, 187, 11914, 16065, 10108, 15844, 119, 12492, 11023, 10115, 10111, 122, 119, 46621, 11373, 55112 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##OCK", "MA", "##R", "##K", "##ET", "##S", "AT", "1500", "GMT" ], "ids": [ 53317, 96608, 27277, 11273, 11733, 52338, 10731, 30554, 13922, 20362 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2 ] }, { "tokens": [ "The", "Financial", "Times", "-", "Stock", "Exchange", "index", "of", "100", "leading", "British", "shares", "had", "rise", "##n", "15", "points", "to", "3", ",", "920", ".", "7", "." ], "ids": [ 10117, 30738, 12020, 118, 31916, 32424, 19776, 10108, 10407, 16018, 11160, 45751, 10374, 28710, 10115, 10208, 12789, 10114, 124, 117, 51197, 119, 128, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Paris", ",", "the", "CA", "##C", "-", "40", "share", "index", "dropped", "15", ".", "09", "to", "2", ",", "002", ".", "9", "." ], "ids": [ 10167, 10728, 117, 10105, 24707, 10858, 118, 10533, 23867, 19776, 30241, 10208, 119, 11035, 10114, 123, 117, 26181, 119, 130, 119 ], "entity": [ "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "30", "-", "share", "DA", "##X", "index", "in", "Frankfurt", "closed", "up", "4", ".", "32", "at", "2", ",", "563", ".", "16", "." ], "ids": [ 10117, 10244, 118, 23867, 47855, 12674, 19776, 10106, 15226, 18440, 10741, 125, 119, 10842, 10160, 123, 117, 50724, 119, 10250, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##EC", "##IO", "##US", "ME", "##TA", "##LS" ], "ids": [ 23837, 35826, 37174, 32612, 47430, 24951, 66934 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gold", "fixed", "at", "$", "388", ".", "50", "versus", "Tuesday", "'", "s", "London", "close", "of", "$", "388", ".", "55", "." ], "ids": [ 14363, 37770, 10160, 109, 38317, 119, 10462, 32412, 70245, 112, 187, 10829, 16065, 10108, 109, 38317, 119, 11358, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Silver", "was", "at", "521", ".", "15", "cents", "." ], "ids": [ 19020, 10134, 10160, 21022, 119, 10208, 63487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "$", "1", "=", ".", "642", "##1", "Sterling", ")" ], "ids": [ 113, 109, 122, 134, 119, 49338, 10759, 43914, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AE", "##I", "'", "s", "Spanish", "operation", "wins", "ISO", "900", "##2", "." ], "ids": [ 35060, 11281, 112, 187, 14661, 20080, 27279, 15859, 13545, 10729, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 3, 7, 9, 9, 2, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Air", "Express", "International", "said", "in", "a", "statement", "that", "Spain", "has", "become", "the", "twenty", "-", "second", "country", "in", "its", "network", "to", "achieve", "ISO", "900", "##2", "quality", "ac", "##cre", "##dita", "##tion", "." ], "ids": [ 11704, 17235, 10771, 12415, 10106, 169, 33311, 10189, 16149, 10393, 13461, 10105, 26051, 118, 11132, 12723, 10106, 10474, 17175, 10114, 43250, 15859, 13545, 10729, 21905, 13621, 27794, 26441, 10822, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "added", "Bureau", "Ver", "##itas", "has", "accredited", "AE", "##I", "I", "##ber", "##fre", "##ight", "'", "s", "offices", "at", "Alicante", ",", "Barcelona", ",", "Bilbao", ",", "Madrid", ",", "Se", "##ville", "and", "Valencia", "as", "meeting", "the", "necessary", "standards", "." ], "ids": [ 10377, 16288, 12344, 41357, 18491, 10393, 110238, 35060, 11281, 146, 12212, 37135, 27521, 112, 187, 29918, 10160, 57219, 117, 12113, 117, 33757, 117, 11727, 117, 11045, 12043, 10111, 18900, 10146, 19822, 10105, 27039, 30381, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 1, 9, 1, 9, 1, 9, 1, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Air", "Cargo", "News", "##room", "Tel", "+", "44", "171", "542", "770", "##6", "Fax", "+", "44", "171", "542", "501", "##7" ], "ids": [ 118, 118, 11704, 70766, 12219, 25525, 25369, 116, 11126, 22478, 51620, 48622, 11211, 64530, 116, 11126, 22478, 51620, 34067, 11305 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ara", "##fat", "says", "Israel", "de", "##cla", "##res", "war", "on", "Palestinian", "##s", "." ], "ids": [ 54789, 25616, 22153, 12991, 10104, 60582, 11234, 10338, 10135, 56119, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "W", "##afa", "Am", "##r" ], "ids": [ 160, 90804, 11500, 10129 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "RAM", "##AL", "##LA", "##H", ",", "West", "Bank", "1996", "-", "08", "-", "28" ], "ids": [ 39604, 32002, 44376, 12396, 117, 11164, 13533, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "President", "Ya", "##sser", "Ara", "##fat", "said", "on", "Wednesday", "that", "Israel", "had", "declared", "war", "on", "the", "Palestinian", "##s", "and", "called", "for", "the", "first", "general", "strike", "in", "the", "West", "Bank", "and", "Gaza", "in", "two", "years", "." ], "ids": [ 56119, 12811, 25148, 33519, 54789, 25616, 12415, 10135, 57611, 10189, 12991, 10374, 25019, 10338, 10135, 10105, 56119, 10107, 10111, 11552, 10142, 10105, 10422, 11389, 37456, 10106, 10105, 11164, 13533, 10111, 42434, 10106, 10551, 10855, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "What", "happened", "concerning", "continuous", "violation", "##s", "and", "crimes", "from", "this", "new", "Israeli", "leadership", "means", "they", "are", "de", "##cla", "##ring", "a", "state", "of", "war", "against", "the", "Palestinian", "people", ",", "\"", "Ara", "##fat", "told", "the", "Palestinian", "legislature", "." ], "ids": [ 107, 12489, 44936, 53047, 51035, 88993, 10107, 10111, 36951, 10188, 10531, 10751, 28446, 25121, 17574, 10689, 10301, 10104, 60582, 13135, 169, 11388, 10108, 10338, 11327, 10105, 56119, 11426, 117, 107, 54789, 25616, 21937, 10105, 56119, 62879, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 9, 9, 2, 9, 9 ] }, { "tokens": [ "A", "##ccus", "##ing", "Israeli", "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", "of", "st", "##upi", "##dity", ",", "Ara", "##fat", "launched", "his", "strong", "##est", "attack", "on", "the", "right", "-", "wing", "government", "since", "its", "election", "in", "May", "." ], "ids": [ 138, 92059, 10230, 28446, 19924, 14355, 16810, 32577, 36027, 13723, 10108, 28780, 90695, 100060, 117, 54789, 25616, 18850, 10226, 18093, 13051, 16342, 10135, 10105, 13448, 118, 22571, 12047, 11764, 10474, 13685, 10106, 10725, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tira", "##de", "was", "sp", "##ark", "##ed", "by", "Israel", "'", "s", "announcement", "on", "Tuesday", "of", "plans", "to", "expand", "the", "Jewish", "settlement", "of", "Ki", "##rya", "##t", "Se", "##fer", "and", "its", "demo", "##lis", "##hing", "of", "a", "community", "centre", "in", "Arab", "East", "Jerusalem", "." ], "ids": [ 10117, 102770, 10253, 10134, 32650, 36269, 10336, 10155, 12991, 112, 187, 76557, 10135, 70245, 10108, 18195, 10114, 50188, 10105, 17119, 23931, 10108, 28941, 62219, 10123, 11045, 14854, 10111, 10474, 30776, 12536, 30809, 10108, 169, 13354, 12672, 10106, 17365, 11830, 20599, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "\"", "Israel", "has", "started", "the", "war", "on", "Jerusalem", "." ], "ids": [ 107, 12991, 10393, 13457, 10105, 10338, 10135, 20599, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "They", "are", "idi", "##ots", "to", "have", "started", "the", "Jerusalem", "battle", ",", "\"", "Ara", "##fat", "said", "in", "Arabic", ".", "\"" ], "ids": [ 11696, 10301, 19648, 25588, 10114, 10529, 13457, 10105, 20599, 18758, 117, 107, 54789, 25616, 12415, 10106, 26571, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 4, 8, 9, 9, 2, 9, 9 ] }, { "tokens": [ "There", "will", "be", "no", "Palestinian", "state", "without", "Jerusalem", "." ], "ids": [ 11723, 11337, 10347, 10192, 56119, 11388, 13663, 20599, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 1, 9 ] }, { "tokens": [ "Net", "##anya", "##hu", "should", "know", "he", "is", "st", "##upi", "##d", "to", "have", "started", "this", "battle", ".", "\"" ], "ids": [ 32577, 36027, 13723, 14819, 21852, 10261, 10124, 28780, 90695, 10162, 10114, 10529, 13457, 10531, 18758, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ara", "##fat", "called", "for", "a", "general", "strike", "\"", "for", "Jerusalem", "\"", "on", "Thursday", "in", "all", "of", "the", "West", "Bank", "and", "Gaza", "Strip", "." ], "ids": [ 54789, 25616, 11552, 10142, 169, 11389, 37456, 107, 10142, 20599, 107, 10135, 67067, 10106, 10435, 10108, 10105, 11164, 13533, 10111, 42434, 79527, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9 ] }, { "tokens": [ "There", "has", "not", "been", "a", "joint", "shut", "##down", "there", "since", "May", "1994", "when", "Israeli", "troops", "began", "withdraw", "##ing", "under", "an", "interim", "self", "-", "rule", "agreement", "signed", "in", "1993", "." ], "ids": [ 11723, 10393, 10472, 10590, 169, 25680, 70323, 27160, 11155, 11764, 10725, 10444, 10841, 28446, 20836, 11941, 100987, 10230, 10571, 10151, 63313, 16567, 118, 21983, 25432, 14775, 10106, 10463, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "strike", "will", "have", "little", "effect", "on", "the", "Israeli", "economy", "while", "hur", "##ting", "Palestinian", "merchants", "in", "East", "Jerusalem", "and", "Bethlehem", "who", "cat", "##er", "to", "the", "tourist", "trade", "." ], "ids": [ 10117, 37456, 11337, 10529, 16745, 18514, 10135, 10105, 28446, 27570, 11371, 52824, 12141, 56119, 108624, 10106, 11830, 20599, 10111, 95307, 10479, 41163, 10165, 10114, 10105, 61431, 18908, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "25", ",", "000", "Palestinian", "labour", "##ers", "are", "likely", "to", "stay", "away", "from", "their", "jobs", ",", "mainly", "in", "construction", ",", "in", "Israel", "." ], "ids": [ 13885, 10258, 117, 10259, 56119, 40763, 10901, 10301, 22497, 10114, 29597, 14942, 10188, 10455, 45083, 117, 20827, 10106, 13407, 117, 10106, 12991, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "But", "Palestinian", "##s", ",", "once", "the", "back", "##bone", "of", "the", "building", "industry", ",", "have", "been", "largely", "replaced", "by", "labour", "##ers", "from", "Romania", "and", "China", "." ], "ids": [ 16976, 56119, 10107, 117, 14907, 10105, 12014, 66666, 10108, 10105, 12585, 17425, 117, 10529, 10590, 25340, 16478, 10155, 40763, 10901, 10188, 13927, 10111, 11593, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "\"", "On", "Friday", ",", "all", "Mo", "##sle", "##ms", ",", "including", "Palestinian", "##s", "in", "Israel", ".", ".", "." ], "ids": [ 107, 10576, 30767, 117, 10435, 34987, 42176, 12387, 117, 11198, 56119, 10107, 10106, 12991, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 2, 6, 9, 1, 9, 9, 9 ] }, { "tokens": [ "will", "go", "to", "(", "Jerusalem", "'", "s", ")", "Al", "-", "A", "##q", "##sa", "mosque", "and", "pra", "##y", "." ], "ids": [ 11337, 11783, 10114, 113, 20599, 112, 187, 114, 10883, 118, 138, 11703, 10466, 95493, 10111, 69857, 10157, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jews", "and", "Christians", "who", "do", "not", "pra", "##y", "should", "ac", "##com", "##pan", "##y", "them", "and", "stand", "behind", "them", ",", "\"", "Ara", "##fat", "said", "." ], "ids": [ 26490, 10111, 49090, 10479, 10149, 10472, 69857, 10157, 14819, 13621, 22530, 15119, 10157, 11345, 10111, 14603, 17155, 11345, 117, 107, 54789, 25616, 12415, 119 ], "entity": [ "B-MISC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 2, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Official", "##s", "in", "Net", "##anya", "##hu", "'", "s", "office", "were", "not", "immediately", "available", "for", "comment", "on", "Ara", "##fat", "'", "s", "re", "##marks", "." ], "ids": [ 17678, 10107, 10106, 32577, 36027, 13723, 112, 187, 14301, 10309, 10472, 24029, 14579, 10142, 49641, 10135, 54789, 25616, 112, 187, 11639, 64711, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israeli", "travel", "restrictions", ",", "imposed", "after", "bombing", "##s", "by", "Mo", "##sle", "##m", "militants", "in", "February", "and", "March", ",", "ban", "most", "of", "the", "two", "million", "Arab", "##s", "in", "the", "West", "Bank", "and", "Gaza", "from", "entering", "Jerusalem", "." ], "ids": [ 28446, 23595, 67028, 117, 83358, 10662, 67011, 10107, 10155, 34987, 42176, 10147, 73829, 10106, 11508, 10111, 11144, 117, 11915, 10992, 10108, 10105, 10551, 12473, 17365, 10107, 10106, 10105, 11164, 13533, 10111, 42434, 10188, 44824, 20599, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9, 1, 9, 9, 1, 9 ] }, { "tokens": [ "Net", "##anya", "##hu", ",", "who", "oppose", "##s", "trading", "occupied", "land", "for", "peace", ",", "made", "Jerusalem", "a", "central", "issue", "in", "his", "election", "campaign", ",", "ac", "##cus", "##ing", "Labour", "Prime", "Minister", "Shi", "##mon", "Pere", "##s", "of", "planning", "to", "hand", "control", "of", "the", "Arab", "eastern", "part", "of", "the", "city", "to", "the", "Palestinian", "##s", "." ], "ids": [ 32577, 36027, 13723, 117, 10479, 53037, 10107, 46663, 28634, 11773, 10142, 28101, 117, 11019, 20599, 169, 12397, 15557, 10106, 10226, 13685, 17323, 117, 13621, 14319, 10230, 25606, 19924, 14355, 44795, 16278, 33511, 10107, 10108, 30240, 10114, 15230, 12608, 10108, 10105, 17365, 18677, 10668, 10108, 10105, 11584, 10114, 10105, 56119, 10107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Israel", "captured", "East", "Jerusalem", "in", "the", "1967", "Middle", "East", "war", "and", "claims", "both", "halve", "##s", "of", "the", "city", "as", "its", "capital", "." ], "ids": [ 12991, 25030, 11830, 20599, 10106, 10105, 10800, 15441, 11830, 10338, 10111, 25880, 11408, 51646, 10107, 10108, 10105, 11584, 10146, 10474, 12185, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "PL", "##O", "wants", "East", "Jerusalem", "as", "the", "capital", "of", "a", "future", "Palestinian", "state", "." ], "ids": [ 10117, 71341, 11403, 45769, 11830, 20599, 10146, 10105, 12185, 10108, 169, 16711, 56119, 11388, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "In", "his", "speech", "to", "the", "crowd", "##ed", "legislature", ",", "Ara", "##fat", "signal", "##led", "he", "was", "not", "abandon", "##ing", "diploma", "##cy", "although", "\"", "ala", "##rm", "bells", "are", "ring", "##ing", "\"", "." ], "ids": [ 10167, 10226, 29811, 10114, 10105, 50059, 10336, 62879, 117, 54789, 25616, 25495, 16376, 10261, 10134, 10472, 56566, 10230, 43087, 11710, 14779, 107, 21739, 19341, 86069, 10301, 21550, 10230, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "une", "##xpected", "##ly", "broke", "off", "his", "address", "to", "take", "a", "telephone", "call", "from", "U", ".", "S", ".", "Middle", "East", "en", "##voy", "Dennis", "Ross", ",", "who", "held", "talks", "in", "Paris", "on", "Tuesday", "with", "Israeli", "and", "Egyptian", "officials", "." ], "ids": [ 10357, 10231, 101239, 10454, 30500, 11898, 10226, 32198, 10114, 13574, 169, 69009, 20575, 10188, 158, 119, 156, 119, 15441, 11830, 10110, 81843, 19874, 16690, 117, 10479, 11991, 56672, 10106, 10728, 10135, 70245, 10169, 28446, 10111, 34624, 27730, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 9, 2, 9, 9 ] }, { "tokens": [ "When", "Ara", "##fat", "returned", "to", "the", "podium", ",", "he", "said", "senior", "PL", "##O", "nego", "##tia", "##tor", "Ma", "##hm", "##oud", "Abbas", ",", "better", "known", "as", "Abu", "Ma", "##zen", ",", "and", "Net", "##anya", "##hu", "aide", "Dor", "##e", "Gold", "could", "meet", "on", "Thursday", "." ], "ids": [ 12242, 54789, 25616, 14030, 10114, 10105, 39252, 117, 10261, 12415, 17843, 71341, 11403, 21134, 16180, 11813, 13744, 29389, 50555, 45679, 117, 18322, 11053, 10146, 18332, 13744, 11985, 117, 10111, 32577, 36027, 13723, 23135, 65987, 10112, 14363, 12174, 23267, 10135, 67067, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "quoted", "Ross", "as", "telling", "him", ":", "\"", "The", "important", "thing", "is", "the", "Israeli", "##s", "are", "prepared", "to", "move", ".", "\"" ], "ids": [ 10357, 70676, 16690, 10146, 61758, 10957, 131, 107, 10117, 12452, 40414, 10124, 10105, 28446, 10107, 10301, 39837, 10114, 18577, 119, 107 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ara", "##fat", "said", "he", "rep", "##lied", ":", "\"", "is", "this", "like", "their", "previous", "promise", "##s", "?", "\"" ], "ids": [ 54789, 25616, 12415, 10261, 76456, 65254, 131, 107, 10124, 10531, 11850, 10455, 16741, 73871, 10107, 136, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "No", ",", "they", "have", "good", "intentions", ",", "\"", "Ara", "##fat", "quoted", "Ross", "as", "saying", "." ], "ids": [ 107, 10657, 117, 10689, 10529, 15198, 18151, 117, 107, 54789, 25616, 70676, 16690, 10146, 22807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "##s", "have", "been", "pressi", "##ng", "Israel", "to", "carry", "out", "a", "long", "-", "delayed", "partial", "tro", "##op", "pull", "##out", "from", "the", "flash", "##point", "West", "Bank", "city", "of", "He", "##bron", "agreed", "by", "the", "previous", "Labour", "government", "." ], "ids": [ 56119, 10107, 10529, 10590, 45036, 10376, 12991, 10114, 31626, 10950, 169, 11695, 118, 67058, 39474, 42169, 13362, 80870, 17514, 10188, 10105, 59946, 45676, 11164, 13533, 11584, 10108, 10357, 65038, 25577, 10155, 10105, 16741, 25606, 12047, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "The", "Israeli", "government", "is", "studying", "rede", "##ploy", "##ment", "plans", "submitted", "by", "Defence", "Minister", "Yi", "##tz", "##hak", "Mord", "##echa", "##i", "which", "are", "likely", "to", "demand", "a", "wider", "than", "agreed", "army", "presence", "in", "He", "##bron", "." ], "ids": [ 10117, 28446, 12047, 10124, 47308, 30940, 91823, 10426, 18195, 58544, 10155, 31621, 14355, 40512, 13695, 46704, 74224, 73235, 10116, 10319, 10301, 22497, 10114, 34394, 169, 50514, 11084, 25577, 17977, 25599, 10106, 10357, 65038, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Turkey", "'", "s", "Ci", "##ller", "to", "hold", "talks", "in", "Jordan", "." ], "ids": [ 22519, 112, 187, 51457, 18289, 10114, 18500, 56672, 10106, 16366, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "AN", "##KA", "##RA", "1996", "-", "08", "-", "28" ], "ids": [ 50972, 67813, 29990, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turkish", "Foreign", "Minister", "Tan", "##su", "Ci", "##ller", "will", "visit", "Jordan", "on", "September", "3", "on", "her", "first", "trip", "abroad", "since", "she", "took", "office", "in", "June", ",", "Foreign", "Ministry", "spoke", "##sman", "Omer", "Ak", "##bel", "said", "on", "Wednesday", "." ], "ids": [ 22814, 20277, 14355, 30594, 12892, 51457, 18289, 11337, 27541, 16366, 10135, 10596, 124, 10135, 10485, 10422, 37307, 50901, 11764, 10833, 12149, 14301, 10106, 11120, 117, 20277, 19170, 50005, 24305, 99927, 71275, 13770, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "two", "-", "day", "visit", "will", "take", "place", "at", "the", "invitation", "of", "Jordan", "##ian", "Prime", "Minister", "Abdul", "-", "Karim", "al", "-", "Ka", "##bari", "##ti", ",", "\"", "he", "told", "reporter", "##s", "." ], "ids": [ 107, 10117, 10551, 118, 11940, 27541, 11337, 13574, 11192, 10160, 10105, 77674, 10108, 16366, 11630, 19924, 14355, 23642, 118, 71139, 10164, 118, 25444, 73840, 10325, 117, 107, 10261, 21937, 41408, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "Turkey", "considered", "Jordan", "a", "suitable", "country", "with", "which", "to", "co", "##oper", "##ate", "on", "Middle", "East", "matters", "." ], "ids": [ 10357, 12415, 22519, 14289, 16366, 169, 55668, 12723, 10169, 10319, 10114, 11170, 56361, 12436, 10135, 15441, 11830, 50807, 119 ], "entity": [ "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "Bila", "##teral", "relations", "and", "the", "Middle", "East", "peace", "process", "would", "be", "on", "the", "table", "during", "the", "visit", ",", "Ak", "##bel", "said", "." ], "ids": [ 72755, 98161, 19824, 10111, 10105, 15441, 11830, 28101, 15138, 10894, 10347, 10135, 10105, 21783, 10939, 10105, 27541, 117, 71275, 13770, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Turkish", "Prime", "Minister", "Ne", "##cm", "##etti", "##n", "Er", "##bakan", "visited", "mainly", "Mo", "##sle", "##m", "countries", ",", "including", "Iran", ",", "during", "a", "10", "-", "day", "tour", "earlier", "in", "August", "." ], "ids": [ 22814, 19924, 14355, 19416, 27528, 21985, 10115, 10915, 91850, 30270, 20827, 34987, 42176, 10147, 15911, 117, 11198, 12901, 117, 10939, 169, 10150, 118, 11940, 12842, 18905, 10106, 10735, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 2, 6, 6, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "prime", "minister", "to", "visit", "Turkey", "." ], "ids": [ 11667, 19287, 16930, 10114, 27541, 22519, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "AN", "##KA", "##RA", "1996", "-", "08", "-", "28" ], "ids": [ 50972, 67813, 29990, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "Prime", "Minister", "Romano", "Pro", "##di", "will", "pay", "a", "one", "-", "day", "working", "visit", "to", "Turkey", "on", "September", "3", ",", "the", "Turkish", "Foreign", "Ministry", "said", "on", "Wednesday", "." ], "ids": [ 11667, 19924, 14355, 24845, 14021, 10703, 11337, 16868, 169, 10464, 118, 11940, 14616, 27541, 10114, 22519, 10135, 10596, 124, 117, 10105, 22814, 20277, 19170, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Both", "countries", "'", "governments", "were", "formed", "recently", "." ], "ids": [ 107, 20973, 15911, 112, 52052, 10309, 14629, 23746, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "visit", "will", "create", "a", "direct", "contact", "opportunity", "for", "the", "two", "parties", "to", "express", "their", "views", ",", "\"", "spoke", "##sman", "Omer", "Ak", "##bel", "told", "a", "news", "brief", "##ing", "." ], "ids": [ 10747, 27541, 11337, 18842, 169, 16934, 20637, 34468, 10142, 10105, 10551, 18708, 10114, 47620, 10455, 33396, 117, 107, 50005, 24305, 99927, 71275, 13770, 21937, 169, 14424, 29040, 10230, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Italian", "prime", "minister", ",", "in", "office", "since", "May", "18", ",", "will", "be", "the", "first", "Western", "leader", "to", "meet", "Islam", "##ist", "Prime", "Minister", "Ne", "##cm", "##etti", "##n", "Er", "##bakan", "since", "he", "came", "to", "power", "on", "June", "28", "." ], "ids": [ 10117, 11667, 19287, 16930, 117, 10106, 14301, 11764, 10725, 10218, 117, 11337, 10347, 10105, 10422, 13163, 15014, 10114, 23267, 14727, 11293, 19924, 14355, 19416, 27528, 21985, 10115, 10915, 91850, 11764, 10261, 13383, 10114, 13183, 10135, 11120, 10348, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 2, 6, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "##di", "will", "also", "meet", "President", "Sul", "##ey", "##man", "Demi", "##rel", "and", "Foreign", "Minister", "Tan", "##su", "Ci", "##ller", ",", "Ak", "##bel", "said", "." ], "ids": [ 14021, 10703, 11337, 10379, 23267, 12811, 16049, 13005, 10589, 71326, 19362, 10111, 20277, 14355, 30594, 12892, 51457, 18289, 117, 71275, 13770, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 9, 9 ] }, { "tokens": [ "Turkey", "says", "25", "Kur", "##d", "rebels", "killed", "in", "c", "##lash", "##es", "." ], "ids": [ 22519, 22153, 10258, 61912, 10162, 57545, 15875, 10106, 171, 25297, 10171, 119 ], "entity": [ "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DI", "##Y", "##AR", "##BA", "##KI", "##R", ",", "Turkey", "1996", "-", "08", "-", "28" ], "ids": [ 110014, 14703, 52188, 35999, 59879, 11273, 117, 22519, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turkish", "troops", "killed", "25", "Kur", "##dish", "rebels", "in", "recent", "c", "##lash", "##es", "in", "the", "east", "of", "the", "country", ",", "security", "officials", "said", "on", "Wednesday", "." ], "ids": [ 22814, 20836, 15875, 10258, 61912, 67522, 57545, 10106, 19037, 171, 25297, 10171, 10106, 10105, 13827, 10108, 10105, 12723, 117, 21849, 27730, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "emergency", "rule", "governor", "'", "s", "office", "said", "in", "a", "statement", "that", "10", "rebels", "from", "the", "Kurdistan", "Workers", "Party", "(", "PKK", ")", "were", "killed", "in", "fighting", "in", "Tun", "##celi", "province", "." ], "ids": [ 10117, 44461, 21983, 28795, 112, 187, 14301, 12415, 10106, 169, 33311, 10189, 10150, 57545, 10188, 10105, 86246, 52896, 12529, 113, 105298, 114, 10309, 15875, 10106, 27535, 10106, 77056, 91461, 14342, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9 ] }, { "tokens": [ "Soldiers", "killed", "nine", "more", "PKK", "guerrilla", "##s", "in", "Sir", "##nak", "province", "and", "six", "in", "Ha", "##kka", "##ri", "." ], "ids": [ 83237, 15875, 19964, 10798, 105298, 106552, 10107, 10106, 12852, 12728, 14342, 10111, 12449, 10106, 13740, 20878, 10401, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 1, 5, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "The", "statement", "did", "not", "report", "any", "military", "casualties", "and", "did", "not", "say", "exactly", "when", "the", "c", "##lash", "##es", "took", "place", "." ], "ids": [ 10117, 33311, 12172, 10472, 17553, 11178, 14041, 69297, 10111, 12172, 10472, 23763, 62136, 10841, 10105, 171, 25297, 10171, 12149, 11192, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "20", ",", "000", "people", "have", "been", "killed", "in", "the", "PKK", "'", "s", "fight", "for", "independence", "or", "auto", "##nomy", "in", "southeastern", "Turkey", "." ], "ids": [ 15704, 10197, 117, 10259, 11426, 10529, 10590, 15875, 10106, 10105, 105298, 112, 187, 20780, 10142, 31412, 10345, 18257, 100395, 10106, 78721, 22519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Israel", "'", "s", "Levy", "to", "meet", "Mu", "##bara", "##k", "in", "Egypt", "." ], "ids": [ 12991, 112, 187, 16608, 10114, 23267, 49056, 43221, 10174, 10106, 20440, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 4, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "28" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israeli", "Foreign", "Minister", "David", "Levy", "will", "visit", "Egypt", "this", "Sunday", "for", "talks", "with", "President", "Ho", "##sni", "Mu", "##bara", "##k", ",", "the", "Foreign", "Ministry", "said", "on", "Wednesday", "." ], "ids": [ 28446, 20277, 14355, 10804, 16608, 11337, 27541, 20440, 10531, 19731, 10142, 56672, 10169, 12811, 20220, 67826, 49056, 43221, 10174, 117, 10105, 20277, 19170, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "trip", "will", "be", "Levy", "'", "s", "first", "to", "an", "Arab", "state", "as", "a", "minister", "in", "Prime", "Minister", "Benjamin", "Net", "##anya", "##hu", "'", "s", "government", "." ], "ids": [ 10117, 37307, 11337, 10347, 16608, 112, 187, 10422, 10114, 10151, 17365, 11388, 10146, 169, 16930, 10106, 19924, 14355, 16810, 32577, 36027, 13723, 112, 187, 12047, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "FS", "##A", "qualifie", "##s", "five", "mun", "##i", "bond", "issues", "for", "insurance", "." ], "ids": [ 83276, 10738, 105263, 10107, 12403, 101833, 10116, 55185, 17850, 10142, 49756, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Financial", "Security", "Ass", "##urance", "said", "Wednesday", "it", "qualified", "for", "bond", "insurance", "the", "following", "five", "municipal", "issues", "scheduled", "for", "competitive", "sale", "today", ":" ], "ids": [ 30738, 20924, 77014, 41078, 12415, 57611, 10271, 32244, 10142, 55185, 49756, 10105, 11901, 12403, 14935, 17850, 34081, 10142, 49836, 15488, 18745, 131 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Paris", "School", "District", "No", "7", ",", "Ark", "." ], "ids": [ 118, 118, 10728, 10984, 11958, 10657, 128, 117, 67552, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ ",", "$", "2", ".", "44", "million", "ref", "##und", "##ing", "bonds", "." ], "ids": [ 117, 109, 123, 119, 11126, 12473, 48056, 17242, 10230, 93163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "St", "Ans", "##gar", "Community", "School", "District", ",", "Iowa", ",", "$", "3", ".", "334", "million", "general", "obligation", "school", "bonds", "." ], "ids": [ 118, 118, 10838, 98671, 14415, 18553, 10984, 11958, 117, 18421, 117, 109, 124, 119, 33956, 12473, 11389, 92905, 11393, 93163, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Avalon", "Borough", ",", "N", ".", "J", ".", ",", "$", "11", ".", "4", "million", "GO", "##s", "." ], "ids": [ 118, 118, 95900, 38126, 117, 151, 119, 147, 119, 117, 109, 10193, 119, 125, 12473, 41525, 10107, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sea", "##ford", "Union", "Free", "School", "District", ",", "N", ".", "Y", ".", ",", "$", "5", "million", "school", "bonds", "." ], "ids": [ 118, 118, 14741, 13387, 11457, 16122, 10984, 11958, 117, 151, 119, 162, 119, 117, 109, 126, 12473, 11393, 93163, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Ak", "##ron", ",", "Ohio", ",", "$", "6", ".", "31", "million", "improvement", "bonds", "." ], "ids": [ 118, 118, 71275, 11620, 117, 13608, 117, 109, 127, 119, 10413, 12473, 70010, 93163, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "U", ".", "S", ".", "Municipal", "Des", "##k", ",", "212", "-", "859", "-", "1650" ], "ids": [ 118, 118, 158, 119, 156, 119, 18069, 13810, 10174, 117, 22023, 118, 80786, 118, 29117 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colo", "." ], "ids": [ 75473, 119 ], "entity": [ "B-LOC", "I-LOC" ], "entity_ids": [ 1, 5 ] }, { "tokens": [ "taxa", "##ble", "health", "deal", "rated", "Aa", "##2", "/", "VM", "##IG", "-", "1", "-", "Moody", "'", "s", "." ], "ids": [ 41404, 11203, 17004, 19918, 48069, 80131, 10729, 120, 18618, 89696, 118, 122, 118, 64663, 112, 187, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Moody", "'", "s", "In", "##vestor", "##s", "Service", "-" ], "ids": [ 64663, 112, 187, 10167, 83436, 10107, 13489, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Rat", "##ing", "Anno", "##unce", "##ment", "As", "of", "08", "/", "26", "/", "96", "." ], "ids": [ 29839, 10230, 26473, 93050, 10426, 10882, 10108, 11052, 120, 10314, 120, 12308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Issue", "##r", ":", "Colorado", "Health", "Fa", "##c", "." ], "ids": [ 39115, 10129, 131, 17111, 15931, 44271, 10350, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7 ] }, { "tokens": [ "Au", "##th", "." ], "ids": [ 13209, 11143, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "National" ], "ids": [ 10655 ], "entity": [ "B-ORG" ], "entity_ids": [ 3 ] }, { "tokens": [ "Ben", "##evo", "##lent", "Ass", "##oc", "." ], "ids": [ 13304, 36237, 44991, 77014, 25125, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Colorado", "Christian", "Home" ], "ids": [ 118, 17111, 11757, 13898 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 3, 7, 7 ] }, { "tokens": [ "Pro", "##j", "." ], "ids": [ 14021, 10418, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Series", "1996", "B", "Tax", "##able" ], "ids": [ 13239, 10389, 139, 81839, 13096 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "State", ":", "CO" ], "ids": [ 11104, 131, 32992 ], "entity": [ "O", "O", "B-LOC" ], "entity_ids": [ 9, 9, 1 ] }, { "tokens": [ "Rat", "##ing", ":", "Aa", "##2", "/", "VM", "##IG", "1" ], "ids": [ 29839, 10230, 131, 80131, 10729, 120, 18618, 89696, 122 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sale", "Am", "##oun", "##t", ":", "4", ",", "300", ",", "000" ], "ids": [ 66272, 11500, 43971, 10123, 131, 125, 117, 11093, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##pect", "##ed", "Sale", "Date", ":", "08", "/", "26", "/", "96" ], "ids": [ 27746, 51511, 10336, 66272, 29897, 131, 11052, 120, 10314, 120, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lam", "##m", "will", "not", "end", "##orse", "Pero", "##t", "for", "Reform", "ticket", "-", "CNN", "." ], "ids": [ 44068, 10147, 11337, 10472, 11572, 91235, 21434, 10123, 10142, 42204, 59037, 118, 31117, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 4, 8, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "27" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "Colorado", "Democratic", "Go", "##v", "." ], "ids": [ 42355, 17111, 19281, 14439, 10477, 119 ], "entity": [ "O", "B-LOC", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 1, 2, 9, 9, 9 ] }, { "tokens": [ "Richard", "Lam", "##m", "has", "decided", "not", "to", "end", "##orse", "Ross", "Pero", "##t", "as", "the", "presidential", "candidate", "of", "the", "Reform", "Party", ",", "CNN", "reported", "late", "Tuesday", "." ], "ids": [ 11118, 44068, 10147, 10393, 17270, 10472, 10114, 11572, 91235, 16690, 21434, 10123, 10146, 10105, 36476, 22102, 10108, 10105, 42204, 12529, 117, 31117, 15943, 13002, 70245, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "CNN", "quoted", "aide", "##s", "and", "family", "members", "as", "saying", "Lam", "##m", ",", "who", "competed", "with", "Pero", "##t", "to", "head", "the", "ticket", "for", "Pero", "##t", "'", "s", "party", ",", "had", "told", "them", "he", "would", "def", "##inite", "##ly", "not", "end", "##orse", "Pero", "##t", ",", "but", "they", "did", "not", "know", "whether", "he", "would", "end", "##orse", "another", "candidate", "." ], "ids": [ 31117, 70676, 23135, 10107, 10111, 11365, 12464, 10146, 22807, 44068, 10147, 117, 10479, 21728, 10169, 21434, 10123, 10114, 13578, 10105, 59037, 10142, 21434, 10123, 112, 187, 14039, 117, 10374, 21937, 11345, 10261, 10894, 100745, 100240, 10454, 10472, 11572, 91235, 21434, 10123, 117, 10473, 10689, 12172, 10472, 21852, 21883, 10261, 10894, 11572, 91235, 12864, 22102, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "announcement", "was", "planned", "in", "Chicago", "Wednesday", "." ], "ids": [ 10313, 76557, 10134, 24292, 10106, 12317, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Lam", "##m", ",", "60", ",", "is", "a", "three", "-", "term", "Colorado", "governor", "who", "left", "office", "in", "1987", "and", "vie", "##d", "for", "the", "Reform", "Party", "nomination", "after", "becoming", "dis", "##ill", "##usion", "##ed", "with", "both", "the", "Democratic", "and", "Republican", "parties", "." ], "ids": [ 44068, 10147, 117, 10709, 117, 10124, 169, 11003, 118, 13719, 17111, 28795, 10479, 12153, 14301, 10106, 10581, 10111, 13772, 10162, 10142, 10105, 42204, 12529, 30807, 10662, 19881, 27920, 19503, 41942, 10336, 10169, 11408, 10105, 19281, 10111, 21776, 18708, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 2, 9, 9 ] }, { "tokens": [ "Lam", "##m", "is", "a", "friend", "of", "President", "Clinton", "and", "supported", "him", "in", "the", "1992", "election", "." ], "ids": [ 44068, 10147, 10124, 169, 20104, 10108, 12811, 24139, 10111, 19992, 10957, 10106, 10105, 10450, 13685, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pero", "##t", "won", "his", "party", "'", "s", "official", "nomination", "as", "its", "presidential", "candidate", "in", "a", "secret", "ballot", "earlier", "this", "month", "." ], "ids": [ 21434, 10123, 11367, 10226, 14039, 112, 187, 14731, 30807, 10146, 10474, 36476, 22102, 10106, 169, 23658, 93339, 18905, 10531, 14064, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RE", "##SE", "##AR", "##CH", "AL", "##ER", "##T", "-", "Career", "Horizons", "said", "cut", "." ], "ids": [ 71033, 39039, 52188, 86448, 47271, 24093, 11090, 118, 84209, 106536, 12415, 21610, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Donald", "##son", "Lu", "##f", "##kin", "&", "Jen", "##rette", "cut", "its", "rating", "on", "Career", "Horizons", "Inc", "to", "market", "perform", "from", "out", "##per", "##form", ",", "according", "to", "market", "sources", "." ], "ids": [ 118, 118, 16437, 11599, 23859, 10575, 12130, 111, 95702, 73458, 21610, 10474, 31035, 10135, 84209, 106536, 13604, 10114, 17313, 28840, 10188, 10950, 12713, 19757, 117, 18071, 10114, 17313, 19023, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Further", "details", "were", "not", "immediately", "available", "." ], "ids": [ 118, 118, 43248, 29500, 10309, 10472, 24029, 14579, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "The", "stock", "was", "up", "3", "/", "4", "at", "35", "-", "7", "/", "8", "." ], "ids": [ 118, 118, 10117, 20511, 10134, 10741, 124, 120, 125, 10160, 10803, 118, 128, 120, 129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Northern", "States", "Power", "Co", "sets", "pay", "##out", "." ], "ids": [ 15352, 10859, 12952, 13098, 23597, 16868, 17514, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##AP", "##OL", "##IS", "1996", "-", "08", "-", "28" ], "ids": [ 75416, 11537, 93280, 38423, 39272, 19088, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Quarterly" ], "ids": [ 55268 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Late", "##st", "Prior" ], "ids": [ 25139, 10562, 29376 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Am", "##oun", "##t", "$", "0", ".", "69", "$", "0", ".", "69" ], "ids": [ 11500, 43971, 10123, 109, 121, 119, 12573, 109, 121, 119, 12573 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pay", "Oct", "20" ], "ids": [ 88031, 45442, 10197 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Record", "Oct", "1" ], "ids": [ 18814, 45442, 122 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "-", "-", "Chicago", "news", "##des", "##k", "312", "408", "-", "878", "##7" ], "ids": [ 118, 118, 12317, 14424, 10920, 10174, 25104, 36899, 118, 74002, 11305 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "US", "investors", "mu", "##ll", "appeal", "of", "Lloyd", "'", "s", "decision", "." ], "ids": [ 10808, 83795, 12361, 11231, 44861, 10108, 19345, 112, 187, 19231, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Patricia", "Vo", "##win", "##kel" ], "ids": [ 26751, 59482, 24748, 14510 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "27" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10365 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "investors", "in", "trouble", "##d", "Lloyd", "'", "s", "of", "London", "were", "considering", "late", "on", "Tuesday", "whether", "to", "appeal", "a", "U", ".", "S", ".", "court", "decision", "in", "favour", "of", "Lloyd", "'", "s", "and", "pl", "##ed", "##ged", "to", "continue", "pur", "##su", "##ing", "other", "legal", "actions", "." ], "ids": [ 158, 119, 156, 119, 83795, 10106, 58285, 10162, 19345, 112, 187, 10108, 10829, 10309, 81243, 13002, 10135, 70245, 21883, 10114, 44861, 169, 158, 119, 156, 119, 14866, 19231, 10106, 61264, 10108, 19345, 112, 187, 10111, 20648, 10336, 18832, 10114, 17734, 32385, 12892, 10230, 10684, 17139, 22115, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "U", ".", "S", ".", "appeal", "##s", "court", "on", "Tuesday", "gave", "Lloyd", "'", "s", "a", "rep", "##rie", "##ve", ",", "throwing", "out", "an", "in", "##jun", "##ction", "that", "the", "insurance", "giant", "said", "could", "have", "led", "to", "its", "collapse", "." ], "ids": [ 138, 158, 119, 156, 119, 44861, 10107, 14866, 10135, 70245, 15362, 19345, 112, 187, 169, 76456, 12904, 10612, 117, 110039, 10950, 10151, 10106, 46329, 17530, 10189, 10105, 49756, 49429, 12415, 12174, 10529, 12857, 10114, 10474, 64306, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "lower", "court", "issued", "the", "in", "##jun", "##ction", "on", "Friday", "and", "ordered", "Lloyd", "'", "s", "to", "give", "investors", ",", "known", "as", "Names", ",", "more", "information", "before", "requiring", "them", "to", "decide", "whether", "to", "accept", "a", "settlement", "offer", "as", "part", "of", "a", "re", "##organisation", "plan", "." ], "ids": [ 138, 18165, 14866, 21694, 10105, 10106, 46329, 17530, 10135, 30767, 10111, 23782, 19345, 112, 187, 10114, 18090, 83795, 117, 11053, 10146, 13242, 117, 10798, 12929, 11360, 74063, 11345, 10114, 19068, 21883, 10114, 45218, 169, 23931, 24443, 10146, 10668, 10108, 169, 11639, 67705, 13065, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "My", "prediction", "is", "that", "the", "Names", "will", "appeal", ",", "\"", "said", "Kenneth", "Chi", "##ate", ",", "a", "U", ".", "S", ".", "Name", "and", "a", "chief", "nego", "##tia", "##tor", "for", "the", "American", "Names", "Association", "." ], "ids": [ 107, 11590, 78089, 10124, 10189, 10105, 13242, 11337, 44861, 117, 107, 12415, 22369, 21946, 12436, 117, 169, 158, 119, 156, 119, 15729, 10111, 169, 19421, 21134, 16180, 11813, 10142, 10105, 10536, 13242, 11751, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 1, 5, 5, 5, 2, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "\"", "At", "this", "point", ",", "it", "is", "a", "sufficient", "##ly", "important", "decision", "that", "I", "'", "m", "con", "##fi", "##dent", "that", "they", "will", "appeal", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 11699, 10531, 12331, 117, 10271, 10124, 169, 55269, 10454, 12452, 19231, 10189, 146, 112, 181, 10173, 14403, 21029, 10189, 10689, 11337, 44861, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "to", "say", "that", "they", "def", "##inite", "##ly", "will", "would", "be", "prema", "##ture", "until", "we", "determine", "what", "the", "exact", "basis", "for", "the", "court", "'", "s", "ruling", "is", ".", "\"" ], "ids": [ 16976, 10114, 23763, 10189, 10689, 100745, 100240, 10454, 11337, 10894, 10347, 14438, 16023, 11444, 11951, 37284, 12976, 10105, 45809, 17172, 10142, 10105, 14866, 112, 187, 50788, 10124, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Under", "the", "re", "##organisation", "plan", ",", "Lloyd", "'", "s", "plans", "to", "rein", "##sure", "its", "massive", "li", "##abi", "##liti", "##es", "into", "a", "new", "company", "called", "E", "##quita", "##s", "." ], "ids": [ 12594, 10105, 11639, 67705, 13065, 117, 19345, 112, 187, 18195, 10114, 74720, 47394, 10474, 35394, 11614, 62229, 63453, 10171, 10708, 169, 10751, 12100, 11552, 142, 54810, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "arrangement", "calls", "for", "investors", "to", "make", "additional", "payments", "to", "fund", "E", "##quita", "##s", "but", "also", "provides", "them", "with", "3", ".", "2", "billion", "st", "##g", "in", "compensation", "to", "help", "reduce", "their", "prior", "outstanding", "li", "##abi", "##liti", "##es", "." ], "ids": [ 10117, 40258, 31886, 10142, 83795, 10114, 13086, 18568, 99417, 10114, 31771, 142, 54810, 10107, 10473, 10379, 20245, 11345, 10169, 124, 119, 123, 25848, 28780, 10240, 10106, 71576, 10114, 15217, 29888, 10455, 20972, 53933, 11614, 62229, 63453, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Names", "had", "been", "scheduled", "to", "decide", "whether", "to", "accept", "or", "re", "##ject", "the", "offer", "by", "1100", "GMT", "Wednesday", ",", "but", "Lloyd", "'", "s", "chairman", "David", "Rowland", "said", "on", "Tuesday", "the", "offer", "would", "be", "extended", "." ], "ids": [ 10117, 13242, 10374, 10590, 34081, 10114, 19068, 21883, 10114, 45218, 10345, 11639, 56617, 10105, 24443, 10155, 23396, 20362, 57611, 117, 10473, 19345, 112, 187, 27627, 10804, 74451, 12415, 10135, 70245, 10105, 24443, 10894, 10347, 21777, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 7, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "eight", "U", ".", "S", ".", "states", "have", "still", "some", "form", "of", "lit", "##iga", "##tion", "pen", "##ding", ",", "said", "John", "Head", ",", "spoke", "##sman", "for", "the", "Association", "of", "Lloyd", "'", "s", "State", "Chair", "##men", ",", "a", "group", "representing", "U", ".", "S", ".", "Names", "." ], "ids": [ 11699, 16298, 16222, 158, 119, 156, 119, 16316, 10529, 12647, 11152, 12188, 10108, 27937, 15342, 10822, 66558, 13971, 117, 12415, 10421, 16830, 117, 50005, 24305, 10142, 10105, 11751, 10108, 19345, 112, 187, 11104, 46167, 11418, 117, 169, 11795, 31221, 158, 119, 156, 119, 13242, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 2, 9 ] }, { "tokens": [ "\"", "It", "goes", "without", "saying", "that", "we", "'", "re", "rather", "disa", "##ppo", "##inted", ",", "\"", "Head", "said", "of", "the", "decision", "by", "the", "U", ".", "S", ".", "Court", "of", "Appeals", "for", "the", "Fourth", "Circuit", ",", "sitting", "in", "Baltimore", "." ], "ids": [ 107, 10377, 25441, 13663, 22807, 10189, 11951, 112, 11639, 16863, 36474, 45565, 107583, 117, 107, 16830, 12415, 10108, 10105, 19231, 10155, 10105, 158, 119, 156, 119, 14100, 10108, 108553, 10142, 10105, 38536, 28418, 117, 62151, 10106, 21413, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 3, 7, 9, 9, 9, 1, 9 ] }, { "tokens": [ "But", ",", "he", "said", ",", "\"", "we", "still", "have", "hope", "that", "some", "##body", "is", "going", "to", "see", "our", "point", "of", "view", "in", "this", ".", "\"" ], "ids": [ 16976, 117, 10261, 12415, 117, 107, 11951, 12647, 10529, 50725, 10189, 11152, 38078, 10124, 19090, 10114, 12888, 17446, 12331, 10108, 17904, 10106, 10531, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Colorado", "attorney", "general", "told", "Lloyd", "'", "s", "last", "week", "it", "was", "considering", "a", "new", "legal", "action", "against", "the", "British", "insurance", "market", ",", "based", "on", "allegations", "of", "consumer", "fraud", "." ], "ids": [ 10117, 17111, 54131, 11389, 21937, 19345, 112, 187, 12469, 16118, 10271, 10134, 81243, 169, 10751, 17139, 14204, 11327, 10105, 11160, 49756, 17313, 117, 11610, 10135, 85190, 10108, 64580, 93070, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "noti", "##fied", "them", "of", "our", "concerns", "and", "asked", "them", "to", "give", "us", "a", "response", ",", "\"", "said", "Colorado", "attorney", "general", "Gale", "Norton", "." ], "ids": [ 107, 12865, 10529, 75349, 19907, 11345, 10108, 17446, 42663, 10111, 22151, 11345, 10114, 18090, 19626, 169, 21001, 117, 107, 12415, 17111, 54131, 11389, 61016, 25924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Norton", "said", "she", "was", "concerned", "that", "the", "Lloyd", "'", "s", "agreement", "im", "##mun", "##izes", "it", "from", "future", "lit", "##iga", "##tion", "regarding", "E", "##quita", "##s", "and", "requires", "that", "all", "legal", "actions", "be", "heard", "outside", "of", "Colorado", "." ], "ids": [ 25924, 12415, 10833, 10134, 47451, 10189, 10105, 19345, 112, 187, 25432, 10211, 34326, 59080, 10271, 10188, 16711, 27937, 15342, 10822, 33295, 142, 54810, 10107, 10111, 39575, 10189, 10435, 17139, 22115, 10347, 32240, 17555, 10108, 17111, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "In", "addition", ",", "she", "said", "she", "was", "concerned", "the", "plan", "may", "not", "offer", "investors", "enough", "protection", "from", "additional", ",", "future", "li", "##abi", "##liti", "##es", "." ], "ids": [ 10167, 14763, 117, 10833, 12415, 10833, 10134, 47451, 10105, 13065, 11387, 10472, 24443, 83795, 21408, 20344, 10188, 18568, 117, 16711, 11614, 62229, 63453, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Meanwhile", ",", "an", "appeal", "of", "a", "lawsuit", "filed", "by", "some", "600", "Names", "in", "California", "is", "still", "pen", "##ding", "before", "the", "U", ".", "S", ".", "Court", "of", "Appeals", "for", "the", "Ni", "##nth", "Circuit", ",", "Chi", "##ate", "of", "the", "American", "Names", "Association", "said", "." ], "ids": [ 43309, 117, 10151, 44861, 10108, 169, 83706, 45959, 10155, 11152, 11796, 13242, 10106, 11621, 10124, 12647, 66558, 13971, 11360, 10105, 158, 119, 156, 119, 14100, 10108, 108553, 10142, 10105, 30409, 61762, 28418, 117, 21946, 12436, 10108, 10105, 10536, 13242, 11751, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 4, 8, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "That", "lawsuit", ",", "which", "seeks", "res", "##cision", "and", "resti", "##tuti", "##on", ",", "was", "dismissed", "in", "a", "U", ".", "S", ".", "district", "court", "." ], "ids": [ 13646, 83706, 117, 10319, 92725, 39429, 42485, 10111, 57676, 80513, 10263, 117, 10134, 59379, 10106, 169, 158, 119, 156, 119, 12107, 14866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "That", "case", "\"", "is", "what", "I", "call", "the", "most", "significant", "alternate", "re", "##med", "##y", "for", "us", ",", "\"", "Chi", "##ate", "said", "." ], "ids": [ 13646, 13474, 107, 10124, 12976, 146, 20575, 10105, 10992, 17912, 43382, 11639, 21986, 10157, 10142, 19626, 117, 107, 21946, 12436, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "The", "individual", "Names", ",", "however", ",", "now", "must", "decide", "whether", "to", "accept", "Lloyd", "'", "s", "settlement", "offer", "or", "re", "##ject", "the", "offer", "and", "pursue", "lit", "##iga", "##tion", "." ], "ids": [ 10117, 16080, 13242, 117, 13800, 117, 11858, 14982, 19068, 21883, 10114, 45218, 19345, 112, 187, 23931, 24443, 10345, 11639, 56617, 10105, 24443, 10111, 57016, 27937, 15342, 10822, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chi", "##ate", "said", "he", "has", "advised", "Names", "that", "\"", "they", "must", "make", ",", "individual", "##ly", ",", "a", "risk", "benefit", "analysis", ".", "\"" ], "ids": [ 21946, 12436, 12415, 10261, 10393, 94780, 13242, 10189, 107, 10689, 14982, 13086, 117, 16080, 10454, 117, 169, 24179, 43074, 19129, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Re", "##ject", "##ion", "involved", "for", "##fe", "##iting", "the", "compensation", "offer", "and", "risk", "##ing", "the", "possibility", "of", "o", "##wing", "Lloyd", "'", "s", "two", "to", "three", "times", "more", "than", "Lloyd", "'", "s", "is", "now", "willing", "to", "accept", ",", "he", "said", "." ], "ids": [ 20304, 56617, 11046, 16247, 10142, 14601, 48802, 10105, 71576, 24443, 10111, 24179, 10230, 10105, 53510, 10108, 183, 25649, 19345, 112, 187, 10551, 10114, 11003, 13465, 10798, 11084, 19345, 112, 187, 10124, 11858, 87615, 10114, 45218, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", ",", "in", "re", "##ject", "##ing", "the", "offer", ",", "the", "Names", "would", "retain", "their", "rights", "to", "pursue", "lit", "##iga", "##tion", ",", "he", "said", "." ], "ids": [ 16976, 117, 10106, 11639, 56617, 10230, 10105, 24443, 117, 10105, 13242, 10894, 76863, 10455, 16691, 10114, 57016, 27937, 15342, 10822, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "police", "made", "Nazi", "ge", "##stu", "##res", ",", "officials", "say", "." ], "ids": [ 12026, 15034, 11019, 25831, 46503, 19987, 11234, 117, 27730, 23763, 119 ], "entity": [ "B-MISC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "N", "##UR", "##EM", "##B", "##ER", "##G", ",", "Germany", "1996", "-", "08", "-", "28" ], "ids": [ 151, 98348, 67753, 11274, 24093, 11447, 117, 12775, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "rio", "##t", "police", "made", "Nazi", "ge", "##stu", "##res", "at", "a", "private", "function", "earlier", "this", "month", "and", "may", "face", "dis", "##missa", "##l", "for", "their", "actions", ",", "the", "Bavarian", "Interior", "Ministry", "said", "on", "Wednesday", "." ], "ids": [ 12026, 27244, 10123, 15034, 11019, 25831, 46503, 19987, 11234, 10160, 169, 14591, 19367, 18905, 10531, 14064, 10111, 11387, 13295, 27920, 94397, 10161, 10142, 10455, 22115, 117, 10105, 83553, 33667, 19170, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ministry", "declined", "to", "detail", "ge", "##stu", "##res", "the", "Nuremberg", "-", "based", "police", "##men", "had", "made", "at", "the", "August", "13", "function", "but", "added", "seven", "had", "been", "suspended", "from", "duty", "pen", "##ding", "an", "internal", "in", "##quiry", "." ], "ids": [ 10117, 65338, 44948, 10114, 45485, 46503, 19987, 11234, 10105, 84766, 118, 11610, 15034, 11418, 10374, 11019, 10160, 10105, 10735, 10249, 19367, 10473, 16288, 15767, 10374, 10590, 49799, 10188, 34238, 66558, 13971, 10151, 29868, 10106, 56914, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "spoke", "##sman", "for", "public", "prose", "##cutor", "##s", "in", "the", "southern", "city", ",", "where", "di", "##ctat", "##or", "Adolf", "Hitler", "held", "some", "of", "his", "most", "in", "##fa", "##mous", "Nazi", "party", "ra", "##lli", "##es", "in", "the", "1930s", ",", "said", "there", "were", "no", "plans", "to", "prose", "##cute", "the", "officers", "as", "the", "ge", "##stu", "##res", "had", "not", "been", "made", "in", "public", "." ], "ids": [ 138, 50005, 24305, 10142, 11683, 84145, 98957, 10107, 10106, 10105, 17156, 11584, 117, 10940, 10120, 95400, 10667, 16235, 15637, 11991, 11152, 10108, 10226, 10992, 10106, 13369, 110106, 25831, 14039, 11859, 14088, 10171, 10106, 10105, 35010, 117, 12415, 11155, 10309, 10192, 18195, 10114, 84145, 103411, 10105, 23579, 10146, 10105, 46503, 19987, 11234, 10374, 10472, 10590, 11019, 10106, 11683, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gun", "-", "wie", "##lding", "motori", "##st", "sna", "##pped", "by", "cool", "passenger", "." ], "ids": [ 31328, 118, 10953, 61198, 62424, 10562, 62541, 44357, 10155, 67420, 33155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##R", "##L", "##IN", "1996", "-", "08", "-", "28" ], "ids": [ 46291, 11273, 11369, 27128, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "motori", "##st", "threatened", "a", "fellow", "driver", "with", "a", "starting", "pistol", "as", "he", "over", "##took", "him", "illegal", "##ly", "in", "the", "inside", "lane", "on", "a", "motor", "##way", "near", "Berlin", "and", "was", "photo", "##graphe", "##d", "in", "the", "act", "by", "the", "driver", "'", "s", "wife", ",", "prose", "##cutor", "##s", "said", "on", "Wednesday", "." ], "ids": [ 138, 62424, 10562, 44593, 169, 24619, 25926, 10169, 169, 21868, 91264, 10146, 10261, 10491, 86995, 10957, 39806, 10454, 10106, 10105, 22978, 23636, 10135, 169, 15257, 14132, 12883, 11193, 10111, 10134, 38171, 53118, 10162, 10106, 10105, 19833, 10155, 10105, 25926, 112, 187, 14384, 117, 84145, 98957, 10107, 12415, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "##se", "##cutor", "##s", "in", "the", "city", "of", "Potsdam", "said", "the", "32", "-", "year", "-", "old", "man", "drew", "alongside", "the", "other", "car", "at", "about", "110", "k", "##ph", "(", "70", "mph", ")", "and", "aimed", "his", "pistol", "at", "the", "driver", "." ], "ids": [ 14021, 10341, 98957, 10107, 10106, 10105, 11584, 10108, 42629, 12415, 10105, 10842, 118, 10924, 118, 12898, 10817, 49098, 25117, 10105, 10684, 13000, 10160, 10978, 13057, 179, 28088, 113, 10923, 25992, 114, 10111, 53004, 10226, 91264, 10160, 10105, 25926, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "driver", "'", "s", "wife", "kept", "her", "nerve", ",", "got", "out", "her", "camera", "and", "photo", "##graphe", "##d", "him", "." ], "ids": [ 16976, 10105, 25926, 112, 187, 14384, 26546, 10485, 95252, 117, 19556, 10950, 10485, 26665, 10111, 38171, 53118, 10162, 10957, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "man", "has", "been", "charged", "with", "dangerous", "driving", ",", "co", "##er", "##cion", "and", "threat", "##ening", "behaviour", "." ], "ids": [ 10117, 10817, 10393, 10590, 38253, 10169, 57195, 37897, 117, 11170, 10165, 15204, 10111, 41256, 24428, 68628, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "prose", "##cutor", "##s", "file", "sex", "tourism", "charges", "." ], "ids": [ 12026, 84145, 98957, 10107, 23198, 18549, 60013, 31128, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##R", "##L", "##IN", "1996", "-", "08", "-", "28" ], "ids": [ 46291, 11273, 11369, 27128, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Berlin", "prose", "##cutor", "##s", "said", "on", "Wednesday", "they", "had", "filed", "charges", "against", "two", "German", "men", "for", "sexual", "##ly", "abu", "##sing", "children", "in", "Thailand", "and", "dis", "##tri", "##but", "##ing", "por", "##nog", "##raphic", "films", "and", "pictures", "of", "their", "de", "##grad", "##ing", "acts", "." ], "ids": [ 11193, 84145, 98957, 10107, 12415, 10135, 57611, 10689, 10374, 45959, 31128, 11327, 10551, 12026, 10588, 10142, 19616, 10454, 104735, 16357, 12694, 10106, 19621, 10111, 27920, 21570, 23170, 10230, 10183, 14567, 48532, 14280, 10111, 54156, 10108, 10455, 10104, 34486, 10230, 29253, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "case", "is", "one", "of", "only", "a", "hand", "##ful", "in", "which", "authorities", "have", "managed", "to", "track", "down", "suspect", "##s", "under", "a", "law", "which", "let", "##s", "them", "pursue", "Germans", "who", "com", "##mit", "sex", "offen", "##ces", "abroad", "." ], "ids": [ 10117, 13474, 10124, 10464, 10108, 10893, 169, 15230, 14446, 10106, 10319, 28308, 10529, 22391, 10114, 14310, 12935, 97881, 10107, 10571, 169, 13255, 10319, 13595, 10107, 11345, 57016, 46269, 10479, 10212, 15772, 18549, 84646, 14585, 50901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "pair", ",", "identified", "only", "as", "43", "-", "year", "-", "old", "clerk", "Dieter", "U", "and", "businessman", "Thomas", "S", ",", "33", ",", "are", "alleged", "to", "have", "carried", "out", "acts", "of", "sexual", "inde", "##cen", "##cy", "with", "children", "as", "young", "as", "10", "years", "old", "between", "1994", "and", "1995", "." ], "ids": [ 10117, 27643, 117, 26121, 10893, 10146, 11370, 118, 10924, 118, 12898, 102899, 28896, 158, 10111, 49910, 11096, 156, 117, 11000, 117, 10301, 48164, 10114, 10529, 21086, 10950, 29253, 10108, 19616, 100991, 26204, 11710, 10169, 12694, 10146, 14739, 10146, 10150, 10855, 12898, 10948, 10444, 10111, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Their", "videos", "included", "pictures", "of", "one", "of", "the", "accused", "ty", "##ing", "up", "a", "Thai", "boy", "and", "performing", "acts", "of", "sad", "##istic", "torture", "on", "him", ",", "prose", "##cutor", "##s", "said", "in", "a", "statement", "." ], "ids": [ 17551, 37655, 12742, 54156, 10108, 10464, 10108, 10105, 37303, 26864, 10230, 10741, 169, 26207, 26905, 10111, 29933, 29253, 10108, 81708, 29025, 81954, 10135, 10957, 117, 84145, 98957, 10107, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "another", "scene", ",", "a", "young", "girl", "performed", "oral", "sex", "with", "an", "uni", "##dent", "##ified", "adult", "man", "." ], "ids": [ 10167, 12864, 18167, 117, 169, 14739, 24699, 15282, 36965, 18549, 10169, 10151, 69191, 21029, 31825, 30521, 10817, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "new", "law", "was", "introduced", "with", "much", "fan", "##fare", "in", "1993", "." ], "ids": [ 10117, 10751, 13255, 10134, 17037, 10169, 13172, 10862, 64110, 10106, 10463, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "prose", "##cutor", "##s", "face", "huge", "difficulties", "in", "gathering", "evidence", "and", "bringing", "witnesses", "to", "testi", "##fy", "in", "a", "German", "court", ",", "and", "only", "one", "person", "has", "so", "far", "been", "convicted", "under", "the", "law", "." ], "ids": [ 16976, 84145, 98957, 10107, 13295, 42126, 64557, 10106, 88666, 18713, 10111, 45749, 109898, 10114, 41319, 24203, 10106, 169, 12026, 14866, 117, 10111, 10893, 10464, 15042, 10393, 10380, 13301, 10590, 61487, 10571, 10105, 13255, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##vesti", "##gator", "##s", "are", "pro", "##bing", "several", "other", "cases", "." ], "ids": [ 10167, 63996, 75791, 10107, 10301, 11284, 27300, 11736, 10684, 16480, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Berlin", "prose", "##cutor", "##s", "said", "they", "had", "been", "ale", "##rte", "##d", "to", "the", "two", "men", "by", "customs", "officials", "who", "inter", "##cept", "##ed", "package", "##s", "containing", "por", "##nog", "##raphic", "photographs", "and", "order", "forms", "." ], "ids": [ 10117, 11193, 84145, 98957, 10107, 12415, 10689, 10374, 10590, 11372, 13733, 10162, 10114, 10105, 10551, 10588, 10155, 89907, 27730, 10479, 22021, 97782, 10336, 62432, 10107, 27248, 10183, 14567, 48532, 54194, 10111, 12990, 19639, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "France", "'", "s", "Ju", "##ppe", "on", "official", "visit", "to", "Greece", "Sep", "15", "." ], "ids": [ 10688, 112, 187, 45031, 21092, 10135, 14731, 27541, 10114, 25154, 67281, 10208, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "Premier", "Alain", "Ju", "##ppe", "will", "pay", "an", "official", "visit", "to", "Greece", "on", "September", "15", "to", "celebrate", "150", "years", "of", "the", "French", "Archaeological", "Society", ",", "government", "spoke", "##sman", "Dimitri", "##s", "Rep", "##pas", "said", "on", "Wednesday", "." ], "ids": [ 11894, 14717, 20444, 45031, 21092, 11337, 16868, 10151, 14731, 27541, 10114, 25154, 10135, 10596, 10208, 10114, 72951, 11766, 10855, 10108, 10105, 11894, 70435, 11256, 117, 12047, 50005, 24305, 73589, 10107, 72337, 20084, 12415, 10135, 57611, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Ju", "##ppe", "will", "meet", "Greek", "Prime", "Minister", "Costa", "##s", "Sim", "##itis", "and", "Foreign", "Minister", "Theodor", "##os", "Pan", "##gal", "##os", ",", "Rep", "##pas", "told", "reporter", "##s", "." ], "ids": [ 45031, 21092, 11337, 23267, 15286, 19924, 14355, 13902, 10107, 103695, 36967, 10111, 20277, 14355, 22496, 10310, 18661, 17026, 10310, 117, 72337, 20084, 21937, 41408, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "French", "premier", "'", "s", "visit", "was", "planned", "to", "coincide", "with", "the", "Archaeological", "Society", "'", "s", "celebration", "##s", "." ], "ids": [ 107, 10117, 11894, 11913, 112, 187, 27541, 10134, 24292, 10114, 81860, 10169, 10105, 70435, 11256, 112, 187, 69173, 10107, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Greek", "government", "was", "asked", "for", "an", "official", "meeting", "with", "the", "prime", "minister", "and", "the", "foreign", "minister", "and", "it", "said", "ye", "##s", ",", "\"", "Rep", "##pas", "said", "." ], "ids": [ 10117, 15286, 12047, 10134, 22151, 10142, 10151, 14731, 19822, 10169, 10105, 19287, 16930, 10111, 10105, 20796, 16930, 10111, 10271, 12415, 11023, 10107, 117, 107, 72337, 20084, 12415, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "St", "##or", "##k", "H", "##1", "results", "break", "##down", "per", "sector", "." ], "ids": [ 10838, 10667, 10174, 145, 10759, 17466, 24194, 27160, 10178, 17417, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "28" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "24", "weeks", "1996" ], "ids": [ 12128, 10233, 20750, 10389 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "(", "millions", "of", "gu", "##ild", "##ers", "unless", "otherwise", "stated", ")" ], "ids": [ 113, 18123, 10108, 75980, 65820, 10901, 60015, 39712, 17067, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Industrial", "systems", "and", "components" ], "ids": [ 24319, 16768, 10111, 34378 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "-", "Turn", "##over", "756", "vs", "829" ], "ids": [ 118, 36750, 16666, 65821, 14987, 78012 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Opera", "##ting", "profit", "46", "vs", "48" ], "ids": [ 118, 16836, 12141, 25081, 11528, 14987, 11300 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "New", "orders", "received", "876", "vs", "933" ], "ids": [ 118, 10287, 31303, 12296, 69271, 14987, 79145 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Order", "book", "(", "billion", "##s", ")", "1", ".", "07", "vs", "0", ".", "98" ], "ids": [ 118, 14715, 12748, 113, 25848, 10107, 114, 122, 119, 10878, 14987, 121, 119, 12327 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Industrial", "services" ], "ids": [ 24319, 12639 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "-", "Turn", "##over", "657", "vs", "700" ], "ids": [ 118, 36750, 16666, 69349, 14987, 12367 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Opera", "##ting", "profit", "9", "vs", "3" ], "ids": [ 118, 16836, 12141, 25081, 130, 14987, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "New", "orders", "received", "(", "billion", "##s", ")", "1", ".", "00", "vs", "1", ".", "09" ], "ids": [ 118, 10287, 31303, 12296, 113, 25848, 10107, 114, 122, 119, 11025, 14987, 122, 119, 11035 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Order", "book", "(", "billion", "##s", ")", "2", ".", "37", "vs", "2", ".", "01" ], "ids": [ 118, 14715, 12748, 113, 25848, 10107, 114, 123, 119, 11204, 14987, 123, 119, 10669 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Order", "book", "figures", "refer", "to", "value", "of", "orders", "on", "books", "at", "end", "of", "period", "." ], "ids": [ 49307, 29833, 118, 14715, 12748, 21068, 42803, 10114, 19211, 10108, 31303, 10135, 15174, 10160, 11572, 10108, 13127, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Amsterdam", "news", "##room", "+", "31", "20", "504", "5000", ",", "Fax", "+", "31", "20", "504", "504", "##0" ], "ids": [ 118, 118, 14017, 14424, 25525, 116, 10413, 10197, 43098, 17436, 117, 64530, 116, 10413, 10197, 43098, 43098, 10929 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stephanie", "of", "Monaco", "'", "s", "husband", "sna", "##pped", "ca", "##vor", "##ting", "." ], "ids": [ 44741, 10108, 24661, 112, 187, 19634, 62541, 44357, 11135, 19360, 12141, 119 ], "entity": [ "B-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ROM", "##E", "1996", "-", "08", "-", "28" ], "ids": [ 41068, 11259, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "Italian", "magazines", "published", "pictures", "on", "Wednesday", "of", "Daniel", "Duc", "##rue", "##t", ",", "Princess", "Stephanie", "of", "Monaco", "'", "s", "husband", "and", "former", "body", "##guard", ",", "ca", "##vor", "##ting", "nak", "##ed", "with", "another", "woman", "by", "a", "pool", "##side", "in", "France", "." ], "ids": [ 13214, 11667, 48320, 12304, 54156, 10135, 57611, 10108, 11792, 55613, 76889, 10123, 117, 22292, 44741, 10108, 24661, 112, 187, 19634, 10111, 11775, 14333, 80928, 117, 11135, 19360, 12141, 82035, 10336, 10169, 12864, 18299, 10155, 169, 34183, 18103, 10106, 10688, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 4, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "magazines", ",", "Eva", "Tre", "##mila", "and", "its", "sister", "publication", "Gent", "##e", ",", "printed", "up", "to", "26", "pages", "of", "photos", "of", "the", "woman", "und", "##ress", "##ing", "Duc", "##rue", "##t", ",", "the", "pair", "em", "##bra", "##cing", "on", "a", "sun", "##bed", "and", "finally", "both", "nak", "##ed", "." ], "ids": [ 10117, 48320, 117, 18742, 30932, 35634, 10111, 10474, 19806, 16877, 39454, 10112, 117, 44632, 10741, 10114, 10314, 20255, 10108, 41833, 10108, 10105, 18299, 10130, 30743, 10230, 55613, 76889, 10123, 117, 10105, 27643, 10266, 13581, 19113, 10135, 169, 42230, 33627, 10111, 21256, 11408, 82035, 10336, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Eva", "Tre", "##mila", "said", "other", "even", "more", "ex", "##plicit", "photos", "were", "taken", "but", "it", "did", "not", "print", "them", "." ], "ids": [ 18742, 30932, 35634, 12415, 10684, 13246, 10798, 11419, 70629, 41833, 10309, 15109, 10473, 10271, 12172, 10472, 31210, 11345, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "magazines", "named", "the", "woman", "as", "Fi", "##li", "Ho", "##ute", "##man", ",", "a", "26", "-", "year", "-", "old", "French", "singer", "and", "dancer", "in", "a", "Belgian", "ca", "##baret", "club", "." ], "ids": [ 10117, 48320, 12038, 10105, 18299, 10146, 36448, 10390, 20220, 16808, 10589, 117, 169, 10314, 118, 10924, 118, 12898, 11894, 17956, 10111, 81070, 10106, 169, 36652, 11135, 56751, 11111, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "The", "photographs", ",", "an", "Italian", "exclusive", ",", "raised", "eye", "##bro", "##ws", "in", "the", "tin", "##y", "principali", "##ty", ",", "where", "Stephanie", "'", "s", "father", "Prince", "Rain", "##ier", ",", "had", "long", "disa", "##pp", "##rove", "##d", "of", "his", "daughter", "'", "s", "choice", "of", "husband", "." ], "ids": [ 10117, 54194, 117, 10151, 11667, 50007, 117, 20526, 32684, 20923, 25080, 10106, 10105, 21629, 10157, 27126, 11195, 117, 10940, 44741, 112, 187, 13194, 14185, 23292, 11709, 117, 10374, 11695, 36474, 16587, 75662, 10162, 10108, 10226, 15243, 112, 187, 30865, 10108, 19634, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stephanie", "had", "two", "children", "with", "Duc", "##rue", "##t", "before", "their", "marriage", "in", "July", "last", "year", "." ], "ids": [ 44741, 10374, 10551, 12694, 10169, 55613, 76889, 10123, 11360, 10455, 21288, 10106, 11112, 12469, 10924, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stephanie", ",", "Caroline", "and", "Albert", "are", "the", "children", "of", "Rain", "##ier", "and", "former", "Hollywood", "screen", "god", "##dess", "Grace", "Kelly", ",", "who", "was", "killed", "in", "a", "car", "crash", "in", "1982", "." ], "ids": [ 44741, 117, 21259, 10111, 12422, 10301, 10105, 12694, 10108, 23292, 11709, 10111, 11775, 14642, 29963, 22009, 59257, 21346, 15787, 117, 10479, 10134, 15875, 10106, 169, 13000, 42774, 10106, 10642, 119 ], "entity": [ "B-PER", "O", "B-PER", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 4, 9, 4, 9, 9, 9, 9, 4, 8, 9, 9, 1, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "seen", "the", "photos", "but", "for", "the", "moment", "the", "palace", "has", "no", "comment", ",", "\"", "a", "spoke", "##s", "##woman", "for", "Prince", "Rain", "##ier", "told", "Reuters", "." ], "ids": [ 107, 12865, 10529, 15652, 10105, 41833, 10473, 10142, 10105, 14316, 10105, 52140, 10393, 10192, 49641, 117, 107, 169, 50005, 10107, 79999, 10142, 14185, 23292, 11709, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 9 ] }, { "tokens": [ "The", "magazines", "said", "the", "photographs", "were", "taken", "in", "Cap", "de", "Ville", "##fra", "##nche", ",", "some", "15", "km", "(", "nine", "miles", ")", "from", "Monte", "Carlo", "." ], "ids": [ 10117, 48320, 12415, 10105, 54194, 10309, 15109, 10106, 24069, 10104, 24772, 31162, 49457, 117, 11152, 10208, 10204, 113, 19964, 14148, 114, 10188, 14915, 14437, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Gent", "##e", "said", "Duc", "##rue", "##t", ",", "a", "keen", "racing", "driver", ",", "met", "Ho", "##ute", "##man", "during", "a", "race", "in", "Belgium", "and", "photographer", "##s", "had", "been", "on", "their", "trail", "ever", "since", "." ], "ids": [ 39454, 10112, 12415, 55613, 76889, 10123, 117, 169, 67605, 31008, 25926, 117, 10428, 20220, 16808, 10589, 10939, 169, 14025, 10106, 26519, 10111, 69816, 10107, 10374, 10590, 10135, 10455, 56559, 17038, 11764, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "magazine", "said", "video", "cameras", "had", "also", "been", "used", "to", "film", "the", "couple", "and", "that", "a", "sound", "-", "track", "existed", "." ], "ids": [ 10117, 15438, 12415, 12078, 95498, 10374, 10379, 10590, 11031, 10114, 10458, 10105, 20969, 10111, 10189, 169, 19302, 118, 14310, 45548, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "High", "##lights", "of", "Wednesday", "'", "s", "Commission", "brief", "##ing", "." ], "ids": [ 11956, 56552, 10108, 57611, 112, 187, 14941, 29040, 10230, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "28" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "are", "high", "##lights", "of", "the", "mid", "##day", "brief", "##ing", "by", "the", "European", "Commission", "on", "Wednesday", ":" ], "ids": [ 18317, 10301, 11846, 56552, 10108, 10105, 15607, 24558, 29040, 10230, 10155, 10105, 11914, 14941, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "In", "response", "to", "a", "question", ",", "Commission", "spoke", "##sman", "Jo", "##ao", "Vale", "de", "Almeida", "said", "there", "had", "been", "no", "developments", "regarding", "the", "Commission", "'", "s", "position", "concerning", "the", "dispute", "with", "Germany", "and", "Saxony", "over", "state", "aid", "to", "Volkswagen", "." ], "ids": [ 10167, 21001, 10114, 169, 20210, 117, 14941, 50005, 24305, 20977, 14875, 32286, 10104, 48536, 12415, 11155, 10374, 10590, 10192, 74475, 33295, 10105, 14941, 112, 187, 12956, 53047, 10105, 31310, 10169, 12775, 10111, 86823, 10491, 11388, 19778, 10114, 37787, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "He", "said", "there", "was", "some", "possibility", "of", "further", "talks", "with", "Germany", "before", "the", "next", "Commission", "meeting", "of", "September", "4", "." ], "ids": [ 10357, 12415, 11155, 10134, 11152, 53510, 10108, 14586, 56672, 10169, 12775, 11360, 10105, 13451, 14941, 19822, 10108, 10596, 125, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "The", "Commission", "released", "the", "following", "documents", ":" ], "ids": [ 10117, 14941, 11539, 10105, 11901, 21784, 131 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "IP", "/", "96", "/", "804", ":", "Commission", "app", "##rove", "##s", "acquisition", "of", "Pa", "##o", "de", "A", "##cu", "##car", "by", "Auch", "##an", "." ], "ids": [ 118, 24124, 120, 12308, 120, 67930, 131, 14941, 72894, 75662, 10107, 41714, 10108, 26907, 10133, 10104, 138, 12352, 15983, 10155, 14427, 10206, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "-", "IP", "/", "96", "/", "805", ":", "Commission", "finds", "acquisition", "of", "CA", "##MA", "##T", "by", "AG", "##F", "-", "IA", "##RT", "does", "not", "fall", "under", "the", "merger", "regulation", "." ], "ids": [ 118, 24124, 120, 12308, 120, 63728, 131, 14941, 31478, 41714, 10108, 24707, 30696, 11090, 10155, 17935, 11565, 118, 87769, 46935, 15107, 10472, 18042, 10571, 10105, 53860, 57939, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "IP", "/", "96", "/", "806", ":", "Commission", "clear", "##s", "acquisition", "of", "Austrian", "food", "retail", "chain", "Bill", "##a", "by", "German", "group", "Re", "##we", "-", "Handel", "##sgruppe", "." ], "ids": [ 118, 24124, 120, 12308, 120, 65736, 131, 14941, 24866, 10107, 41714, 10108, 32201, 18301, 52232, 32768, 13160, 10113, 10155, 12026, 11795, 20304, 12577, 118, 41077, 58283, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 9, 2, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "-", "SP", "##EE", "##CH", "/", "96", "/", "202", ":", "Speech", "by", "European", "Commissioner", "Anita", "Grad", "##in", "at", "the", "World", "Congress", "against", "Sexual", "Ex", "##plo", "##itation", "of", "Children", "in", "Stockholm", "." ], "ids": [ 118, 22570, 95825, 86448, 120, 12308, 120, 22171, 131, 78033, 10155, 11914, 24366, 35183, 30030, 10245, 10160, 10105, 10315, 15984, 11327, 67747, 27746, 46128, 41372, 10108, 18267, 10106, 14607, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 1, 9 ] }, { "tokens": [ "-", "Euro", "##stat", "news", "release", "51", "/", "96", ":", "March", "-", "May", "1996", "EU", "industrial", "production", "figures", "." ], "ids": [ 118, 17526, 57413, 14424, 14072, 11524, 120, 12308, 131, 11144, 118, 10725, 10389, 17751, 18138, 12116, 21068, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Spanish", "toma", "##to", "war", "##rior", "##s", "paint", "the", "town", "red", "." ], "ids": [ 14661, 34202, 10340, 10338, 70014, 10107, 72700, 10105, 12221, 10680, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UN", "##OL", ",", "Spain", "1996", "-", "08", "-", "28" ], "ids": [ 139, 69849, 39272, 117, 16149, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rev", "##eller", "##s", "painted", "the", "town", "red", "on", "Wednesday", "as", "the", "1996", "edition", "of", "the", "world", "'", "s", "biggest", "toma", "##to", "fight", "began", "in", "the", "eastern", "Spanish", "village", "of", "Bu", "##nol", "." ], "ids": [ 24774, 35303, 10107, 37992, 10105, 12221, 10680, 10135, 57611, 10146, 10105, 10389, 14372, 10108, 10105, 11356, 112, 187, 36304, 34202, 10340, 20780, 11941, 10106, 10105, 18677, 14661, 11607, 10108, 11916, 36941, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Thousand", "##s", "of", "people", "pel", "##ted", "each", "other", "with", "arm", "##ful", "##s", "of", "ri", "##pe", "toma", "##toe", "##s", "as", "streets", ",", "walls", "and", "windows", "were", "coat", "##ed", "in", "a", "blood", "-", "red", "was", "##h", "." ], "ids": [ 61795, 10107, 10108, 11426, 12493, 11912, 11948, 10684, 10169, 31251, 14446, 10107, 10108, 29956, 11355, 34202, 60995, 10107, 10146, 41969, 117, 32343, 10111, 40115, 10309, 63646, 10336, 10106, 169, 24911, 118, 10680, 10134, 10237, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "single", "fire", "##work", "after", "mid", "##day", "signal", "##led", "the", "start", "of", "the", "fruit", "-", "throwing", "fr", "##enz", "##y", ",", "during", "which", "participants", "hur", "##l", "some", "100", "tonnes", "of", "toma", "##toe", "##s", "truck", "##ed", "in", "for", "the", "occasion", "." ], "ids": [ 138, 11376, 13559, 37382, 10662, 15607, 24558, 25495, 16376, 10105, 15148, 10108, 10105, 31595, 118, 110039, 12127, 29925, 10157, 117, 10939, 10319, 35675, 52824, 10161, 11152, 10407, 39435, 10108, 34202, 60995, 10107, 58907, 10336, 10106, 10142, 10105, 21334, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Local", "historians", "say", "the", "tradition", "began", "in", "1945", "when", "dis", "##gru", "##nt", "##led", "locals", "began", "sp", "##onta", "##neous", "##ly", "to", "bomba", "##rd", "the", "priest", "and", "mayor", "at", "the", "annual", "fiesta", "in", "Bu", "##nol", "(", "pronounced", "Boo", "-", "ne", "##e", "-", "OL", ")", "." ], "ids": [ 22693, 64346, 23763, 10105, 20049, 11941, 10106, 10670, 10841, 27920, 92603, 10368, 16376, 50805, 11941, 32650, 107835, 76330, 10454, 10114, 39889, 12023, 10105, 40981, 10111, 12747, 10160, 10105, 19246, 46319, 10106, 11916, 36941, 113, 74473, 102498, 118, 10554, 10112, 118, 19768, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9 ] }, { "tokens": [ "The", "festival", "'", "s", "fame", "has", "grown", "and", "now", "attract", "##s", "between", "15", ",", "000", "and", "20", ",", "000", "people", ",", "many", "of", "them", "foreign", "##ers", "." ], "ids": [ 10117, 15242, 112, 187, 51930, 10393, 42527, 10111, 11858, 96721, 10107, 10948, 10208, 117, 10259, 10111, 10197, 117, 10259, 11426, 117, 11299, 10108, 11345, 20796, 10901, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "GR", "##EE", "##CE", "-", "AU", "##G", "28", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 58787, 95825, 43161, 118, 29088, 11447, 10348, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "stories", "in", "the", "Greek", "financial", "press", ":" ], "ids": [ 100085, 21158, 10106, 10105, 15286, 20570, 21040, 131 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "IM", "##ER", "##IS", "##IA" ], "ids": [ 97126, 24093, 19088, 35976 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "-", "Pre", "-", "election", "debate", "heat", "##s", "up", "on", "economic", "issues", "as", "conservative", "New", "Democracy", "party", "promise", "##s", "seven", "measures", "in", "##clu", "##din", "##d", "tax", "relief", "for", "farmers", "and", "socialist", "Paso", "##k", "defend", "##s", "progress", "on", "economic", "con", "##ver", "##gence", "with", "the", "EU" ], "ids": [ 118, 118, 35248, 118, 13685, 29632, 33955, 10107, 10741, 10135, 13925, 17850, 10146, 50202, 10287, 45762, 14039, 73871, 10107, 15767, 38606, 10106, 78225, 15612, 10162, 25468, 31276, 10142, 55543, 10111, 79456, 44493, 10174, 60041, 10107, 40316, 10135, 13925, 10173, 12563, 40078, 10169, 10105, 17751 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3 ] }, { "tokens": [ "-", "-", "Finance", "ministry", "s", "##cra", "##mble", "##s", "to", "find", "temporary", "solution", "to", "regulation", "which", "sl", "##aps", "a", "15", "percent", "tax", "rate", "on", "gains", "from", "trading", "of", "bonds", "and", "coup", "##ons", "by", "mutual", "funds" ], "ids": [ 118, 118, 38533, 65338, 187, 40333, 48272, 10107, 10114, 17860, 43270, 28502, 10114, 57939, 10319, 38523, 76591, 169, 10208, 22362, 25468, 18344, 10135, 92193, 10188, 46663, 10108, 93163, 10111, 26854, 13326, 10155, 85412, 32067 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Finance", "ministry", "will", "cut", "12", "-", "month", "T", "-", "bill", "rate", "by", "10", "basis", "points", "to", "12", ".", "70", "percent", "in", "the", "upcoming", "end", "August", "issue" ], "ids": [ 118, 118, 38533, 65338, 11337, 21610, 10186, 118, 14064, 157, 118, 34497, 18344, 10155, 10150, 17172, 12789, 10114, 10186, 119, 10923, 22362, 10106, 10105, 78228, 11572, 10735, 15557 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##IN", "##AN", "##CI", "##AL", "KA", "##TH", "##IM", "##ER", "##IN", "##I" ], "ids": [ 143, 27128, 41275, 89955, 32002, 85314, 109166, 42031, 24093, 27128, 11281 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "-", "Inf", "##low", "##s", "of", "more", "than", "$", "500", "million", "are", "seen", "in", "the", "inter", "##bank", "market", "and", "the", "bou", "##rse", "in", "the", "last", "three", "days", "reflect", "##ing", "confidence", "in", "the", "post", "-", "election", "economic", "policy" ], "ids": [ 118, 118, 74479, 27863, 10107, 10108, 10798, 11084, 109, 10757, 12473, 10301, 15652, 10106, 10105, 22021, 20583, 17313, 10111, 10105, 94335, 16239, 10106, 10105, 12469, 11003, 13990, 67569, 10230, 74187, 10106, 10105, 11841, 118, 13685, 13925, 14368 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Athens", "Metro", "sub", "##way", "project", "hits", "sna", "##gs", "which", "could", "delay", "delivery", "to", "the", "year", "2000", "and", "over", "##sh", "##oot", "the", "original", "budget", "##ed", "cost", "of", "520", "billion", "dra", "##ch", "##mas" ], "ids": [ 118, 118, 33765, 20640, 13987, 14132, 13920, 27922, 62541, 15703, 10319, 12174, 76497, 55626, 10114, 10105, 10924, 10180, 10111, 10491, 13264, 38961, 10105, 11364, 25293, 10336, 18849, 10108, 25676, 25848, 68507, 10269, 12922 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "State", "National", "Bank", "of", "Greece", "will", "start", "real", "auction", "programme", "September", "9", "to", "light", "##en", "up", "on", "its", "real", "estate", "holding", "##s" ], "ids": [ 118, 118, 11104, 10655, 13533, 10108, 25154, 11337, 15148, 13486, 106733, 19611, 10596, 130, 10114, 15765, 10136, 10741, 10135, 10474, 13486, 19027, 29008, 10107 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##ER", "##DO", "##S" ], "ids": [ 148, 24093, 104847, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "-", "New", "Democracy", "leader", "Mil", "##tia", "##dis", "Ever", "##t", "vo", "##ws", "support", "mesures", "for", "farmers", "and", "small", "business", "as", "he", "kick", "##s", "off", "the", "conservative", "party", "'", "s", "campaign" ], "ids": [ 118, 118, 10287, 45762, 15014, 75311, 16180, 17442, 42055, 10123, 12556, 25080, 13145, 42273, 10142, 55543, 10111, 12474, 14155, 10146, 10261, 55321, 10107, 11898, 10105, 50202, 14039, 112, 187, 17323 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "National", "Economy", "Minister", "Yann", "##os", "Papa", "##ndo", "##nio", "##u", "defend", "##s", "\"", "hard", "dra", "##ch", "##ma", "\"", "foreign", "exchange", "policy", ",", "says", "it", "wo", "n", "'", "t", "change" ], "ids": [ 118, 118, 10655, 37493, 14355, 70661, 10310, 17429, 10605, 16369, 10138, 60041, 10107, 107, 19118, 68507, 10269, 10369, 107, 20796, 27714, 14368, 117, 22153, 10271, 12796, 182, 112, 188, 15453 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EX", "##PR", "##ESS" ], "ids": [ 80426, 73386, 76505 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "-", "-", "Message", "of", "unity", "from", "the", "conservative", "New", "Democracy", "party", "as", "former", "prime", "minister", "Constantine", "Mit", "##sot", "##aki", "##s", "and", "Mil", "##tia", "##dis", "Ever", "##t", "sh", "##ake", "hands" ], "ids": [ 118, 118, 71014, 10108, 99506, 10188, 10105, 50202, 10287, 45762, 14039, 10146, 11775, 19287, 16930, 51184, 12699, 102326, 22471, 10107, 10111, 75311, 16180, 17442, 42055, 10123, 48201, 26389, 27925 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "NA", "##F", "##TE", "##M", "##B", "##OR", "##I", "##KI" ], "ids": [ 56586, 11565, 29833, 11517, 11274, 42622, 11281, 59879 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Government", "defend", "##s", "\"", "hard", "dra", "##ch", "##ma", "\"", "policy", ",", "says", "it", "will", "continue", "un", "##chang", "##ed", "after", "the", "elections" ], "ids": [ 118, 118, 14581, 60041, 10107, 107, 19118, 68507, 10269, 10369, 107, 14368, 117, 22153, 10271, 11337, 17734, 10119, 64208, 10336, 10662, 10105, 22054 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Conservative", "opposition", "New", "Democracy", "promise", "##s", "series", "of", "measures", "on", "the", "economy", "30", "days", "after", "the", "elections", "aim", "##ing", "at", "4", ".", "0", "percent", "GDP", "growth", "rate", "annually", "-", "-", "George", "Georgi", "##op", "##oul", "##os", ",", "Athens", "News", "##room", "+", "301", "331", "##18", "##12", "-", "4" ], "ids": [ 118, 118, 37910, 21227, 10287, 45762, 73871, 10107, 11366, 10108, 38606, 10135, 10105, 27570, 10244, 13990, 10662, 10105, 22054, 56048, 10230, 10160, 125, 119, 121, 22362, 47832, 14609, 18344, 45390, 118, 118, 10955, 84854, 13362, 75631, 10310, 117, 33765, 12219, 25525, 116, 26224, 30690, 45987, 24747, 118, 125 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##O", "##E", "##K", "L", "##O", "##OS", "H", "##1", "NET", "PR", "##O", "##F", "##IT", "28", ".", "9", "ML", "##N", "G", "##UI", "##LD", "##ER", "##S", "." ], "ids": [ 145, 11403, 11259, 11733, 149, 11403, 21793, 145, 10759, 41645, 23837, 11403, 11565, 37611, 10348, 119, 130, 75920, 11537, 144, 83259, 62943, 24093, 10731, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "28" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "half", "1996" ], "ids": [ 12128, 13877, 10389 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "(", "in", "millions", "of", "gu", "##ild", "##ers", "unless", "otherwise", "stated", ")" ], "ids": [ 113, 10106, 18123, 10108, 75980, 65820, 10901, 60015, 39712, 17067, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "per", "sh", "##r", "(", "gu", "##ild", "##ers", ")", "4", ".", "38", "vs", "3", ".", "70" ], "ids": [ 32577, 10178, 48201, 10129, 113, 75980, 65820, 10901, 114, 125, 119, 11171, 14987, 124, 119, 10923 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "profit", "28", ".", "9", "vs", "24", ".", "5" ], "ids": [ 32577, 25081, 10348, 119, 130, 14987, 10233, 119, 126 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turn", "##over", "273", ".", "6", "vs", "290", ".", "3" ], "ids": [ 36750, 16666, 28414, 119, 127, 14987, 21138, 119, 124 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Opera", "##ting", "profit", "44", ".", "4", "vs", "40", ".", "7" ], "ids": [ 16836, 12141, 25081, 11126, 119, 125, 14987, 10533, 119, 128 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Note", "-", "Industrial", "gases", "maker", "Ho", "##ek", "Lo", "##os", "N", "##V", "." ], "ids": [ 20231, 118, 24319, 65981, 94038, 20220, 10707, 13069, 10310, 151, 11779, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Interest", "charges", "2", ".", "20", "vs", "5", ".", "05" ], "ids": [ 88492, 31128, 123, 119, 10197, 14987, 126, 119, 10831 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tax", "13", ".", "26", "vs", "11", ".", "16" ], "ids": [ 81839, 10249, 119, 10314, 14987, 10193, 119, 10250 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Amsterdam", "news", "##room", "+", "31", "20", "504", "5000", ",", "Fax", "+", "31", "20", "504", "504", "##0" ], "ids": [ 118, 118, 14017, 14424, 25525, 116, 10413, 10197, 43098, 17436, 117, 64530, 116, 10413, 10197, 43098, 43098, 10929 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Stage", "##coach", "sees", "S", "##web", "##us", "deal", "agreed", "next", "week", "." ], "ids": [ 25171, 84348, 41369, 156, 51943, 10251, 19918, 25577, 13451, 16118, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "British", "bus", "and", "passenger", "rail", "operator", "Stage", "##coach", "Holdings", "Pl", "##c", "said", "on", "Wednesday", "that", "its", "negotiations", "to", "acquire", "Swedish", "long", "distance", "bus", "operator", "S", "##web", "##us", "AB", "were", "set", "to", "lead", "to", "a", "signed", "agreement", "next", "week", "." ], "ids": [ 11160, 19369, 10111, 33155, 29547, 36935, 25171, 84348, 57727, 48932, 10350, 12415, 10135, 57611, 10189, 10474, 61946, 10114, 86753, 21381, 11695, 18527, 19369, 36935, 156, 51943, 10251, 21644, 10309, 11847, 10114, 14107, 10114, 169, 14775, 25432, 13451, 16118, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Four", "weeks", "ago", "Stage", "##coach", "said", "it", "had", "agreed", "the", "deal", "in", "principle", ",", "and", "it", "expected", "to", "pay", "110", "million", "st", "##g", "-", "plus", "for", "the", "firm", ",", "with", "S", "##web", "##us", "'", "current", "owner", ",", "the", "state", "railway", "company", "." ], "ids": [ 16773, 20750, 36390, 25171, 84348, 12415, 10271, 10374, 25577, 10105, 19918, 10106, 48300, 117, 10111, 10271, 25973, 10114, 16868, 13057, 12473, 28780, 10240, 118, 10563, 10142, 10105, 23410, 117, 10169, 156, 51943, 10251, 112, 14978, 24414, 117, 10105, 11388, 18271, 12100, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "directors", "report", "that", "negotiations", "with", "the", "vend", "##ors", "of", "S", "##web", "##us", "AB", "are", "pro", "##ceed", "##ing", "and", "they", "ex", "##pect", "an", "agreement", "(", "condition", "##al", "on", "share", "##holder", "approval", ")", "will", "be", "signed", "next", "week", ",", "\"", "Stage", "##coach", "said", "in", "a", "statement", "." ], "ids": [ 107, 10117, 44416, 17553, 10189, 61946, 10169, 10105, 43445, 16379, 10108, 156, 51943, 10251, 21644, 10301, 11284, 66390, 10230, 10111, 10689, 11419, 51511, 10151, 25432, 113, 24713, 10415, 10135, 23867, 54535, 48531, 114, 11337, 10347, 14775, 13451, 16118, 117, 107, 25171, 84348, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "London", "News", "##room", "+", "44", "171", "542", "771", "##7" ], "ids": [ 118, 118, 10829, 12219, 25525, 116, 11126, 22478, 51620, 65580, 11305 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NZ", "bill", "##s", "gain", "ground", "after", "see", "-", "saw", "session", "." ], "ids": [ 105920, 34497, 10107, 25881, 16912, 10662, 12888, 118, 17112, 30066, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "05", "##15", "GMT" ], "ids": [ 10831, 37462, 20362 ], "entity": [ "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 2 ] }, { "tokens": [ "The", "New", "Zealand", "money", "market", "gained", "slightly", "at", "Wednesday", "'", "s", "close", "after", "what", "deal", "##ers", "described", "as", "a", "see", "-", "saw", "trading", "session", "." ], "ids": [ 10117, 10287, 14451, 17920, 17313, 25222, 31603, 10160, 57611, 112, 187, 16065, 10662, 12976, 19918, 10901, 13010, 10146, 169, 12888, 118, 17112, 46663, 30066, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nine", "##ty", "-", "day", "bank", "bill", "rates", "shed", "five", "points", "to", "9", ".", "93", "percent", "and", "September", "bank", "bill", "future", "##s", "rose", "four", "to", "90", ".", "18", "." ], "ids": [ 30376, 11195, 118, 11940, 19423, 34497, 38200, 106942, 12403, 12789, 10114, 130, 119, 12479, 22362, 10111, 10596, 19423, 34497, 16711, 10107, 29467, 11598, 10114, 10919, 119, 10218, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "However", ",", "bonds", "finished", "largely", "flat", "." ], "ids": [ 12209, 117, 93163, 15972, 25340, 31307, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Our", "bonds", "were", "better", "bid", "initially", "but", "they", "sold", "off", "on", "a", "lack", "of", "demand", ",", "and", "the", "short", "end", "went", "with", "it", "too", "on", "a", "lower", "currency", "." ], "ids": [ 107, 18465, 93163, 10309, 18322, 50385, 20465, 10473, 10689, 15337, 11898, 10135, 169, 23582, 10108, 34394, 117, 10111, 10105, 13716, 11572, 13446, 10169, 10271, 16683, 10135, 169, 18165, 83759, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "were", "big", "buy", "##ers", "at", "the", "base", "of", "where", "the", "market", "sold", "to", ",", "and", "when", "the", "currency", "got", "bought", "back", "on", "talk", "of", "a", "sam", "##urai", "the", "market", "got", "bought", "back", "again", ",", "\"", "a", "deal", "##er", "said", "." ], "ids": [ 107, 11723, 10309, 22185, 47715, 10901, 10160, 10105, 11404, 10108, 10940, 10105, 17313, 15337, 10114, 117, 10111, 10841, 10105, 83759, 19556, 28870, 12014, 10135, 31311, 10108, 169, 21083, 73023, 10105, 17313, 19556, 28870, 12014, 13123, 117, 107, 169, 19918, 10165, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Volume", "##s", "were", "reason", "##able", "in", "the", "money", "market", "but", "thin", "in", "bonds", "." ], "ids": [ 15239, 10107, 10309, 27949, 13096, 10106, 10105, 17920, 17313, 10473, 61470, 10106, 93163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "said", "the", "market", "seemed", "to", "be", "trading", "a", "range", "and", "would", "wait", "for", "more", "political", "poll", "##s", "to", "provide", "direction", "." ], "ids": [ 54521, 10901, 12415, 10105, 17313, 64676, 10114, 10347, 46663, 169, 15601, 10111, 10894, 83279, 10142, 10798, 13736, 70156, 10107, 10114, 16871, 15599, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "were", "con", "##fi", "##dent", "of", "further", "euro", "##ki", "##wi", "issu", "##ance", "but", "said", "the", "tim", "##ing", "was", "less", "of", "a", "certain", "##ty", "." ], "ids": [ 11696, 10309, 10173, 14403, 21029, 10108, 14586, 18536, 10506, 15926, 28815, 16460, 10473, 12415, 10105, 19604, 10230, 10134, 15306, 10108, 169, 16620, 11195, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Wellington", "news", "##room", "(", "64", "4", ")", "473", "474", "##6" ], "ids": [ 118, 118, 28557, 14424, 25525, 113, 11295, 125, 114, 39130, 46989, 11211 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Guinness", "Pe", "##at", "ex", "##pects", "strong", "full", "yr", "." ], "ids": [ 56898, 39469, 118, 49760, 29005, 10526, 11419, 92385, 18093, 13375, 12590, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "28" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "British", "-", "based", "investment", "company", "Guinness", "Pe", "##at", "Group", "Pl", "##c", "(", "GP", "##G", ")", "said", "on", "Wednesday", "it", "expected", "a", "strong", "full", "year", "result", "." ], "ids": [ 11160, 118, 11610, 37933, 12100, 49760, 29005, 10526, 12054, 48932, 10350, 113, 25236, 11447, 114, 12415, 10135, 57611, 10271, 25973, 169, 18093, 13375, 10924, 14493, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "think", "we", "'", "re", "in", "a", "position", "to", "produce", "a", "strong", "result", ",", "however", "a", "lot", "of", "our", "profit", "##ability", "must", "in", "##evi", "##tab", "##ly", "de", "##pend", "on", "a", "number", "of", "(", "company", ")", "results", ",", "\"", "said", "GP", "##G", "director", "Garry", "Weiss", "." ], "ids": [ 107, 12865, 27874, 11951, 112, 11639, 10106, 169, 12956, 10114, 17368, 169, 18093, 14493, 117, 13800, 169, 19826, 10108, 17446, 25081, 35717, 14982, 10106, 44082, 33051, 10454, 10104, 63592, 10135, 169, 11487, 10108, 113, 12100, 114, 17466, 117, 107, 12415, 25236, 11447, 12461, 89374, 40320, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 9 ] }, { "tokens": [ "GP", "##G", "earlier", "said", "its", "net", "profit", "for", "the", "six", "months", "to", "June", "30", "rose", "to", "9", ".", "77", "million", "pounds", "from", "6", ".", "93", "million", "in", "the", "previous", "first", "half", "." ], "ids": [ 25236, 11447, 18905, 12415, 10474, 11988, 25081, 10142, 10105, 12449, 15555, 10114, 11120, 10244, 29467, 10114, 130, 119, 12527, 12473, 61982, 10188, 127, 119, 12479, 12473, 10106, 10105, 16741, 10422, 13877, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "did", "not", "de", "##cla", "##re", "an", "interim", "divide", "##nd", "as", "in", "the", "previous", "year", "." ], "ids": [ 10117, 12100, 12172, 10472, 10104, 60582, 10246, 10151, 63313, 41430, 11534, 10146, 10106, 10105, 16741, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Weiss", "said", "the", "Australian", "share", "market", "had", "been", "somewhat", "negative", "for", "much", "of", "1996", "and", "this", "had", "some", "effect", "on", "the", "company", "'", "s", "first", "half", "results", "." ], "ids": [ 40320, 12415, 10105, 12829, 23867, 17313, 10374, 10590, 43203, 25785, 10142, 13172, 10108, 10389, 10111, 10531, 10374, 11152, 18514, 10135, 10105, 12100, 112, 187, 10422, 13877, 17466, 119 ], "entity": [ "B-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "However", ",", "it", "certainly", "is", "a", "very", "pl", "##eas", "##ing", "result", "for", "the", "first", "six", "months", ",", "\"", "he", "said", "." ], "ids": [ 107, 12209, 117, 10271, 88134, 10124, 169, 12558, 20648, 42658, 10230, 14493, 10142, 10105, 10422, 12449, 15555, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Weiss", "said", "most", "of", "the", "company", "'", "s", "half", "year", "earning", "stemme", "##d", "from", "the", "sale", "of", "its", "50", "percent", "stake", "in", "Phys", "##icia", "##ns", "Insurance", "Co", "of", "Ohio", "." ], "ids": [ 40320, 12415, 10992, 10108, 10105, 12100, 112, 187, 13877, 10924, 56981, 83826, 10162, 10188, 10105, 15488, 10108, 10474, 10462, 22362, 90081, 10106, 53658, 38016, 10891, 61490, 13098, 10108, 13608, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 1, 9 ] }, { "tokens": [ "He", "said", "the", "company", "decided", "to", "sell", "its", "U", ".", "S", ".", "investment", "in", "order", "to", "con", "##sol", "##idat", "##e", "investment", "##s", "closer", "to", "its", "administrative", "base", "." ], "ids": [ 10357, 12415, 10105, 12100, 17270, 10114, 36300, 10474, 158, 119, 156, 119, 37933, 10106, 12990, 10114, 10173, 43115, 90710, 10112, 37933, 10107, 54561, 10114, 10474, 18401, 11404, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GP", "##G", "said", "its", "stake", "##s", "in", "Ty", "##ndal", "##l", "Australia", "Ltd", "and", "Mid", "-", "East", "Mineral", "##s", "Ltd", "both", "contributed", "strongly", "to", "GP", "##G", "'", "s", "first", "half", "earning", "##s", "." ], "ids": [ 25236, 11447, 12415, 10474, 90081, 10107, 10106, 64515, 73098, 10161, 11729, 15129, 10111, 42234, 118, 11830, 69042, 10107, 15129, 11408, 32128, 44125, 10114, 25236, 11447, 112, 187, 10422, 13877, 56981, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Sydney", "News", "##room", "61", "-", "2", "937", "##3", "-", "1800" ], "ids": [ 118, 118, 14470, 12219, 25525, 12314, 118, 123, 74848, 10884, 118, 13648 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "New", "##cre", "##st", "Q", "##4", "net", "profit", "A", "$", "4", ".", "3", "mln", "." ], "ids": [ 56898, 39469, 118, 10287, 27794, 10562, 154, 11011, 11988, 25081, 138, 109, 125, 119, 124, 35198, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##Y", "##D", "##NE", "##Y", "1996", "-", "08", "-", "28" ], "ids": [ 156, 14703, 11490, 93280, 14703, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gold", "mine", "##r", "New", "##cre", "##st", "Mining", "Ltd", "said", "on", "Wednesday", "it", "posted", "a", "A", "$", "4", ".", "3", "million", "profit", "after", "tax", "in", "the", "final", "quarter", "of", "the", "year", "to", "June", "30", ",", "1996", "." ], "ids": [ 14363, 27546, 10129, 10287, 27794, 10562, 79136, 15129, 12415, 10135, 57611, 10271, 51232, 169, 138, 109, 125, 119, 124, 12473, 25081, 10662, 25468, 10106, 10105, 11070, 28330, 10108, 10105, 10924, 10114, 11120, 10244, 117, 10389, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Earl", "##ier", ",", "New", "##cre", "##st", "reported", "a", "drop", "in", "net", "profit", "after", "ab", "##normal", "##s", "to", "A", "$", "20", ".", "81", "million", "for", "the", "year", "from", "A", "$", "42", ".", "4", "million", "the", "previous", "year", "." ], "ids": [ 18877, 11709, 117, 10287, 27794, 10562, 15943, 169, 36365, 10106, 11988, 25081, 10662, 11357, 89304, 10107, 10114, 138, 109, 10197, 119, 12324, 12473, 10142, 10105, 10924, 10188, 138, 109, 11276, 119, 125, 12473, 10105, 16741, 10924, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "New", "##cre", "##st", "said", "earning", "##s", "from", "the", "Tel", "##fer", "and", "Bo", "##ddin", "##gton", "mines", "were", "lower", "than", "the", "previous", "year", "due", "to", "lower", "head", "grades", "at", "the", "mines", ",", "forcing", "gold", "production", "lower", "." ], "ids": [ 10287, 27794, 10562, 12415, 56981, 10107, 10188, 10105, 25369, 14854, 10111, 27622, 51256, 83410, 33601, 10309, 18165, 11084, 10105, 16741, 10924, 10850, 10114, 18165, 13578, 52175, 10160, 10105, 33601, 117, 75098, 18128, 12116, 18165, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Production", "costs", "also", "rose", "eight", "percent", "during", "the", "year", "to", "A", "$", "406", "per", "ou", "##nce", "." ], "ids": [ 20769, 34495, 10379, 29467, 16222, 22362, 10939, 10105, 10924, 10114, 138, 109, 28081, 10178, 10431, 12150, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RT", "##RS", "-", "Queensland", "gun", "##man", "eva", "##des", "police", "in", "bus", "##h", "hun", "##t", "." ], "ids": [ 56898, 39469, 118, 20008, 23103, 10589, 103730, 10920, 15034, 10106, 19369, 10237, 12041, 10123, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##IS", "##BA", "##NE", "1996", "-", "08", "-", "28" ], "ids": [ 49351, 19088, 35999, 93280, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australian", "police", "on", "Wednesday", "continued", "to", "hun", "##t", "a", "gun", "##man", "in", "dense", "bus", "##hla", "##nd", "after", "he", "killed", "his", "wife", "and", "wounded", "three", "other", "people", ",", "warning", "the", "man", "is", "extremely", "dangerous", "and", "may", "take", "a", "host", "##age", "to", "escape", "." ], "ids": [ 12829, 15034, 10135, 57611, 14278, 10114, 12041, 10123, 169, 23103, 10589, 10106, 70020, 19369, 74935, 11534, 10662, 10261, 15875, 10226, 14384, 10111, 39127, 11003, 10684, 11426, 117, 70990, 10105, 10817, 10124, 38136, 57195, 10111, 11387, 13574, 169, 19317, 12276, 10114, 30220, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "shooting", "occur", "##ed", "around", "6", ".", "30", "a", ".", "m", ".", "(", "2030", "GMT", ")", "on", "Tuesday", "at", "Glen", "##wood", ",", "south", "of", "Mary", "##borough", ",", "about", "150", "km", "(", "93", "miles", ")", "north", "of", "Brisbane", "on", "the", "Queensland", "state", "coast", "." ], "ids": [ 10117, 38969, 32728, 10336, 12166, 127, 119, 10244, 169, 119, 181, 119, 113, 76796, 20362, 114, 10135, 70245, 10160, 30729, 14759, 117, 13144, 10108, 12176, 33057, 117, 10978, 11766, 10204, 113, 12479, 14148, 114, 12756, 10108, 29493, 10135, 10105, 20008, 11388, 22216, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Police", "have", "declared", "an", "\"", "emerge", "##nt", "situation", "\"", "in", "the", "area", ",", "giving", "them", "powers", "to", "raid", "houses", ",", "search", "cars", ",", "close", "schools", ",", "qua", "##ranti", "##ne", "the", "area", "and", "eva", "##cua", "##te", "people", "." ], "ids": [ 18051, 10529, 25019, 10151, 107, 99467, 10368, 18586, 107, 10106, 10105, 11168, 117, 24426, 11345, 32043, 10114, 52152, 21174, 117, 22419, 24602, 117, 16065, 16009, 117, 14517, 89106, 10238, 10105, 11168, 10111, 103730, 75545, 10216, 11426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "one", "step", "short", "of", "an", "emergency", "situation", ",", "\"", "a", "police", "spoke", "##sman", "said", "via", "telephone", "from", "a", "command", "post", "in", "the", "bus", "##h", "." ], "ids": [ 107, 10377, 10124, 10464, 31877, 13716, 10108, 10151, 44461, 18586, 117, 107, 169, 15034, 50005, 24305, 12415, 11406, 69009, 10188, 169, 20818, 11841, 10106, 10105, 19369, 10237, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "not", "had", "any", "sight", "##ings", ",", "but", "we", "suspect", "he", "is", "armed", ",", "possibly", "with", "a", ".", "22", "rifle", "and", "/", "or", "a", "self", "-", "loading", "shot", "##gun", "." ], "ids": [ 107, 12865, 10529, 10472, 10374, 11178, 78327, 18800, 117, 10473, 11951, 97881, 10261, 10124, 34174, 117, 33370, 10169, 169, 119, 10306, 59116, 10111, 120, 10345, 169, 16567, 118, 108731, 19508, 32657, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "is", "considered", "extremely", "dangerous", ",", "\"", "he", "said", "." ], "ids": [ 10357, 10124, 14289, 38136, 57195, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "a", "possibility", ",", "not", "a", "probability", ",", "he", "may", "take", "a", "host", "##age", ",", "but", "we", "have", "measures", "in", "place", "if", "that", "is", "the", "case", ".", "\"" ], "ids": [ 107, 10377, 112, 187, 169, 53510, 117, 10472, 169, 74544, 117, 10261, 11387, 13574, 169, 19317, 12276, 117, 10473, 11951, 10529, 38606, 10106, 11192, 12277, 10189, 10124, 10105, 13474, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "William", "Fox", "broke", "into", "his", "wife", "'", "s", "home", "on", "Tuesday", "morning", ",", "shooting", "her", "dead", "and", "wound", "##ing", "his", "16", "-", "year", "-", "old", "son", ",", "his", "son", "'", "s", "girlfriend", "and", "a", "nei", "##gh", "##bour", ",", "police", "said", "." ], "ids": [ 10694, 14880, 30500, 10708, 10226, 14384, 112, 187, 11816, 10135, 70245, 28757, 117, 38969, 10485, 23457, 10111, 109205, 10230, 10226, 10250, 118, 10924, 118, 12898, 10312, 117, 10226, 10312, 112, 187, 77877, 10111, 169, 11888, 15774, 71527, 117, 15034, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "three", "wounded", "are", "in", "a", "sat", "##is", "##fa", "##ctory", "condition", "in", "hospital", "." ], "ids": [ 11101, 11003, 39127, 10301, 10106, 169, 20694, 10291, 13369, 79181, 24713, 10106, 18141, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fox", "initially", "fled", "from", "the", "shooting", "in", "a", "car", ",", "but", "then", "abandoned", "the", "car", "and", "entered", "dense", "bus", "##hla", "##nd", "." ], "ids": [ 14880, 20465, 56598, 10188, 10105, 38969, 10106, 169, 13000, 117, 10473, 11059, 32296, 10105, 13000, 10111, 19226, 70020, 19369, 74935, 11534, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fox", "is", "a", "skill", "##ed", "bus", "##hman", "who", "knows", "the", "area", "very", "well", ",", "police", "said", "." ], "ids": [ 14880, 10124, 169, 76917, 10336, 19369, 49811, 10479, 75354, 10105, 11168, 12558, 11206, 117, 15034, 12415, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "About", "60", "police", ",", "helicopter", "##s", "and", "fixed", "-", "wing", "aircraft", "have", "maintained", "an", "over", "##night", "cor", "##don", "around", "15", "sq", "km", "(", "six", "sq", "miles", ")", "of", "bus", "##h", "near", "Glen", "##wood", "." ], "ids": [ 16260, 10709, 15034, 117, 80634, 10107, 10111, 37770, 118, 22571, 16167, 10529, 32974, 10151, 10491, 45217, 29162, 15081, 12166, 10208, 27164, 10204, 113, 12449, 27164, 14148, 114, 10108, 19369, 10237, 12883, 30729, 14759, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "The", "area", "is", "litt", "##ered", "with", "caves", "and", "police", "believed", "Fox", "has", "a", "hide", "##out", "which", "has", "enabled", "him", "to", "eva", "##de", "capture", "." ], "ids": [ 10117, 11168, 10124, 38301, 45452, 10169, 107900, 10111, 15034, 20718, 14880, 10393, 169, 96935, 17514, 10319, 10393, 74661, 10957, 10114, 103730, 10253, 32083, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Australia", "'", "s", "six", "states", "and", "two", "territories", "are", "involved", "in", "heat", "##ed", "debate", "over", "the", "introduction", "of", "tou", "##gh", "new", "fire", "##arm", "laws", ",", "including", "the", "ban", "##ning", "rapid", "fire", "weapons", ",", "after", "a", "shooting", "massacre", "in", "the", "island", "state", "of", "Tasmania", "." ], "ids": [ 11729, 112, 187, 12449, 16316, 10111, 10551, 46593, 10301, 16247, 10106, 33955, 10336, 29632, 10491, 10105, 23890, 10108, 52586, 15774, 10751, 13559, 76171, 28160, 117, 11198, 10105, 11915, 11269, 39782, 13559, 31881, 117, 10662, 169, 38969, 53810, 10106, 10105, 17354, 11388, 10108, 58411, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "On", "April", "28", ",", "a", "lo", "##ne", "gun", "##man", "went", "on", "a", "shooting", "ra", "##mpa", "##ge", "at", "the", "site", "of", "the", "historic", "Port", "Arthur", "penal", "settlement", ",", "killing", "35", "people", "." ], "ids": [ 10576, 10780, 10348, 117, 169, 10406, 10238, 23103, 10589, 13446, 10135, 169, 38969, 11859, 31285, 10525, 10160, 10105, 11920, 10108, 10105, 23704, 14734, 13134, 69270, 23931, 117, 34248, 10803, 11426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shanghai", "Ek", "Chor", "opens", "new", "motor", "##cy", "##le", "plant", "." ], "ids": [ 24181, 35769, 38955, 70702, 10751, 15257, 11710, 10284, 16430, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SH", "##AN", "##G", "##HA", "##I", "1996", "-", "08", "-", "28" ], "ids": [ 38702, 41275, 11447, 58132, 11281, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shanghai", "-", "Ek", "Chor", "Motor", "##cycle", "Co", ",", "a", "Sino", "-", "Thai", "joint", "venture", ",", "opened", "a", "new", "plant", "to", "produce", "gas", "##oline", "engines", "in", "the", "P", "##udo", "##ng", "New", "Area", "of", "Shanghai", ",", "the", "Xi", "##nh", "##ua", "news", "agency", "reported", "on", "Wednesday", "." ], "ids": [ 24181, 118, 35769, 38955, 19440, 49274, 13098, 117, 169, 105030, 118, 26207, 25680, 48709, 117, 14377, 169, 10751, 16430, 10114, 17368, 16091, 96541, 34073, 10106, 10105, 153, 33498, 10376, 10287, 17815, 10108, 24181, 117, 10105, 59876, 16317, 11908, 14424, 34649, 15943, 10135, 57611, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 1, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "plant", ",", "requiring", "an", "investment", "of", "three", "billion", "ba", "##ht", ",", "has", "a", "floor", "space", "of", "50", ",", "000", "square", "metres", "and", "is", "designed", "to", "produce", "600", ",", "000", "gas", "##oline", "engines", "a", "year", ",", "to", "be", "sold", "in", "China", ",", "South", "America", ",", "the", "Middle", "East", "and", "Africa", ",", "it", "said", "." ], "ids": [ 10117, 16430, 117, 74063, 10151, 37933, 10108, 11003, 25848, 15688, 13599, 117, 10393, 169, 23861, 16199, 10108, 10462, 117, 10259, 15163, 16393, 10111, 10124, 15513, 10114, 17368, 11796, 117, 10259, 16091, 96541, 34073, 169, 10924, 117, 10114, 10347, 15337, 10106, 11593, 117, 11056, 11440, 117, 10105, 15441, 11830, 10111, 12880, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Cap", "##aci", "##ty", "is", "expected", "to", "reach", "one", "million", "engines", "by", "the", "year", "2000", ",", "it", "said", "." ], "ids": [ 24069, 28841, 11195, 10124, 25973, 10114, 24278, 10464, 12473, 34073, 10155, 10105, 10924, 10180, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shanghai", "-", "Ek", "Chor", "is", "jointly", "owned", "by", "the", "Shanghai", "Automobile", "Corporation", "and", "Ek", "Chor", "China", "Motor", "##cycle", "." ], "ids": [ 24181, 118, 35769, 38955, 10124, 94744, 17012, 10155, 10105, 24181, 77973, 14456, 10111, 35769, 38955, 11593, 19440, 49274, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "It", "started", "operations", "in", "January", "1985", "and", "has", "registered", "capital", "of", "1", ".", "56", "billion", "ba", "##ht", ",", "it", "said", "but", "gave", "no", "further", "details", "." ], "ids": [ 10377, 13457, 18356, 10106, 11238, 10583, 10111, 10393, 33712, 12185, 10108, 122, 119, 11628, 25848, 15688, 13599, 117, 10271, 12415, 10473, 15362, 10192, 14586, 29500, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "joint", "venture", "has", "two", "motorcycle", "plants", "making", "Xi", "##ng", "##fu", "motorcycle", "##s", "and", "aims", "to", "be", "China", "'", "s", "biggest", "producer", "by", "the", "year", "2000", ",", "with", "output", "of", "two", "million", "units", "." ], "ids": [ 10117, 25680, 48709, 10393, 10551, 101923, 21422, 14293, 59876, 10376, 20758, 101923, 10107, 10111, 67789, 10114, 10347, 11593, 112, 187, 36304, 16607, 10155, 10105, 10924, 10180, 117, 10169, 37131, 10108, 10551, 12473, 17163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Khmer", "Rouge", "'", "s", "I", "##eng", "Sar", "##y", "con", "##fir", "##ms", "break", "with", "Pol", "Pot", "." ], "ids": [ 66223, 32721, 112, 187, 146, 23923, 64696, 10157, 10173, 61644, 12387, 24194, 10169, 38432, 59128, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "AR", "##AN", "##Y", "##AP", "##RA", "##TH", "##ET", ",", "Thailand", "1996", "-", "08", "-", "28" ], "ids": [ 50884, 41275, 14703, 38423, 29990, 109166, 52338, 117, 19621, 10389, 118, 11052, 118, 10348 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dis", "##siden", "##t", "Khmer", "Rouge", "leader", "I", "##eng", "Sar", "##y", "confirmed", "on", "Wednesday", "that", "he", "had", "broken", "with", "Pol", "Pot", "and", "other", "hard", "##liner", "##s", "of", "the", "guerrilla", "group", "and", "had", "formed", "a", "rival", "movement", "." ], "ids": [ 101270, 42323, 10123, 66223, 32721, 15014, 146, 23923, 64696, 10157, 27347, 10135, 57611, 10189, 10261, 10374, 36197, 10169, 38432, 59128, 10111, 10684, 19118, 103140, 10107, 10108, 10105, 106552, 11795, 10111, 10374, 14629, 169, 24792, 17123, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "##eng", "Sar", "##y", "said", "in", "a", "written", "statement", ",", "the", "first", "since", "his", "split", "with", "Pol", "Pot", "earlier", "this", "month", ",", "that", "the", "new", "movement", "to", "be", "called", "the", "Democratic", "National", "United", "Movement", "(", "D", "##N", "##UM", ")", "would", "seek", "an", "end", "to", "civil", "war", "and", "work", "towards", "re", "##con", "##ciliation", "with", "the", "Cambodia", "##n", "government", "." ], "ids": [ 146, 23923, 64696, 10157, 12415, 10106, 169, 13398, 33311, 117, 10105, 10422, 11764, 10226, 24137, 10169, 38432, 59128, 18905, 10531, 14064, 117, 10189, 10105, 10751, 17123, 10114, 10347, 11552, 10105, 19281, 10655, 10609, 28516, 113, 141, 11537, 72679, 114, 10894, 48394, 10151, 11572, 10114, 14161, 10338, 10111, 11424, 18095, 11639, 23486, 98956, 10169, 10105, 78062, 10115, 12047, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "\"", "I", "would", "like", "to", "info", "##rm", "you", "about", "my", "decision", "to", "break", "away", "from", "Pol", "Pot", ",", "Ta", "Mo", "##k", ",", "Son", "Sen", "'", "s", "di", "##ctat", "##orial", "group", ",", "\"", "he", "said", "in", "a", "copy", "of", "the", "statement", "obtained", "by", "Reuters", "." ], "ids": [ 107, 146, 10894, 11850, 10114, 26978, 19341, 13028, 10978, 15127, 19231, 10114, 24194, 14942, 10188, 38432, 59128, 117, 14248, 34987, 10174, 117, 12395, 18082, 112, 187, 10120, 95400, 79338, 11795, 117, 107, 10261, 12415, 10106, 169, 39740, 10108, 10105, 33311, 27345, 10155, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "\"", "We", "believe", "that", "our", "country", "will", "be", "reduced", "to", "nothing", "if", "the", "Khmer", "people", "continue", "to", "fight", "against", "each", "other", "inde", "##finite", "##ly", ".", ".", ".", "." ], "ids": [ 107, 12865, 30587, 10189, 17446, 12723, 11337, 10347, 25724, 10114, 33338, 12277, 10105, 66223, 11426, 17734, 10114, 20780, 11327, 11948, 10684, 100991, 89618, 10454, 119, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "this", "reason", "we", "decided", "to", "break", "away", "from", "that", "di", "##ctat", "##orial", "group", "and", "found", "a", "movement", "named", "'", "Democratic", "National", "United", "Movement", "'", ",", "\"", "he", "said", "." ], "ids": [ 11399, 10531, 27949, 11951, 17270, 10114, 24194, 14942, 10188, 10189, 10120, 95400, 79338, 11795, 10111, 11823, 169, 17123, 12038, 112, 19281, 10655, 10609, 28516, 112, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "##eng", "Sar", "##y", "was", "sentenced", "to", "death", "in", "absent", "##ia", "for", "his", "role", "in", "the", "mass", "gen", "##ocide", "in", "Cambodia", "during", "the", "Khmer", "Rouge", "rule", "of", "terror", "between", "1975", "-", "1979", "when", "over", "a", "million", "people", "were", "executed", "or", "died", "of", "star", "##vation", ",", "disease", "or", "over", "##work", "in", "mass", "labour", "camps", "." ], "ids": [ 146, 23923, 64696, 10157, 10134, 53365, 10114, 12557, 10106, 73116, 10280, 10142, 10226, 12971, 10106, 10105, 22038, 15331, 98808, 10106, 78062, 10939, 10105, 66223, 32721, 21983, 10108, 43143, 10948, 10665, 118, 10675, 10841, 10491, 169, 12473, 11426, 10309, 45955, 10345, 12482, 10108, 16624, 39784, 117, 21911, 10345, 10491, 37382, 10106, 22038, 40763, 33978, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "French", "-", "educated", ",", "former", "brother", "-", "in", "-", "law", "of", "Pol", "Pot", "was", "foreign", "minister", "in", "the", "Khmer", "Rouge", "government", "that", "ruled", "Cambodia", "and", "was", "seen", "as", "the", "group", "'", "s", "second", "in", "command", "." ], "ids": [ 10117, 11894, 118, 33471, 117, 11775, 15739, 118, 10106, 118, 13255, 10108, 38432, 59128, 10134, 20796, 16930, 10106, 10105, 66223, 32721, 12047, 10189, 34920, 78062, 10111, 10134, 15652, 10146, 10105, 11795, 112, 187, 11132, 10106, 20818, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "dead", "in", "Cambodia", "helicopter", "crash", "." ], "ids": [ 13214, 23457, 10106, 78062, 80634, 42774, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "P", "##H", "##NO", "##M", "PE", "##NH", "1996", "-", "08", "-", "28" ], "ids": [ 153, 12396, 67292, 11517, 80468, 106877, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "people", "were", "killed", "and", "six", "were", "injured", "after", "a", "helicopter", "crashed", "in", "bad", "weather", "in", "northern", "Cambodia", ",", "a", "government", "minister", "said", "on", "Wednesday", "." ], "ids": [ 13214, 11426, 10309, 15875, 10111, 12449, 10309, 36081, 10662, 169, 80634, 91126, 10106, 15838, 35660, 10106, 17335, 78062, 117, 169, 12047, 16930, 12415, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "15", "survivors", "who", "had", "been", "on", "board", "the", "Russian", "-", "made", "MI", "-", "17", "helicopter", "were", "taken", "to", "hospital", "from", "the", "remote", "jungle", "crash", "site", "about", "150", "km", "(", "90", "miles", ")", "north", "of", "Ph", "##nom", "Pen", "##h", ",", "Information", "Minister", "I", "##eng", "Mo", "##ul", "##y", "said", "." ], "ids": [ 10117, 10208, 81690, 10479, 10374, 10590, 10135, 17936, 10105, 13463, 118, 11019, 75416, 118, 10273, 80634, 10309, 15109, 10114, 18141, 10188, 10105, 55808, 104783, 42774, 11920, 10978, 11766, 10204, 113, 10919, 14148, 114, 12756, 10108, 29343, 13294, 52559, 10237, 117, 12145, 14355, 146, 23923, 34987, 10604, 10157, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "The", "cause", "of", "the", "crash", "of", "the", "helicopter", ",", "which", "went", "down", "on", "Sunday", "while", "on", "a", "routine", "res", "##up", "##ply", "flight", "between", "Ph", "##nom", "Pen", "##h", "and", "St", "##ung", "Tre", "##ng", ",", "was", "not", "known", "." ], "ids": [ 10117, 15311, 10108, 10105, 42774, 10108, 10105, 80634, 117, 10319, 13446, 12935, 10135, 19731, 11371, 10135, 169, 94650, 39429, 14590, 59146, 23578, 10948, 29343, 13294, 52559, 10237, 10111, 10838, 10716, 30932, 10376, 117, 10134, 10472, 11053, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "##eng", "Mo", "##ul", "##y", "said", "the", "aircraft", "went", "down", "during", "a", "rain", "storm", "." ], "ids": [ 146, 23923, 34987, 10604, 10157, 12415, 10105, 16167, 13446, 12935, 10939, 169, 50939, 31642, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##F", "'", "s", "Ku", "##bo", "says", "believes", "B", "##O", "##J", "rate", "policy", "un", "##chang", "##ed", "." ], "ids": [ 102059, 11565, 112, 187, 49869, 11790, 22153, 56920, 139, 11403, 15417, 18344, 14368, 10119, 64208, 10336, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 8, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "28" ], "ids": [ 76531, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "'", "s", "Finance", "Minister", "Wat", "##aru", "Ku", "##bo", "told", "a", "news", "conference", "on", "Wednesday", "that", "he", "believes", "that", "the", "Bank", "of", "Japan", "'", "s", "(", "B", "##O", "##J", ")", "interest", "rate", "policy", "which", "is", "gear", "##ed", "towards", "ens", "##uring", "economic", "growth", "has", "not", "changed", "after", "the", "release", "of", "the", "central", "bank", "'", "s", "\"", "tank", "##an", "\"", "survey", "." ], "ids": [ 11891, 112, 187, 38533, 14355, 51082, 41417, 49869, 11790, 21937, 169, 14424, 25029, 10135, 57611, 10189, 10261, 56920, 10189, 10105, 13533, 10108, 11891, 112, 187, 113, 139, 11403, 15417, 114, 17644, 18344, 14368, 10319, 10124, 62559, 10336, 18095, 55683, 31653, 13925, 14609, 10393, 10472, 17695, 10662, 10105, 14072, 10108, 10105, 12397, 19423, 112, 187, 107, 28671, 10206, 107, 35035, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "B", "##O", "##J", "released", "the", "August", "tank", "##an", ",", "its", "quarter", "##ly", "short", "-", "term", "corporate", "survey", ",", "in", "the", "morning", "and", "it", "showed", "business", "out", "##lo", "##ok", "had", "worse", "##ned", "." ], "ids": [ 10117, 139, 11403, 15417, 11539, 10105, 10735, 28671, 10206, 117, 10474, 28330, 10454, 13716, 118, 13719, 46666, 35035, 117, 10106, 10105, 28757, 10111, 10271, 27463, 14155, 10950, 10715, 11140, 10374, 110353, 17021, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "However", ",", "Ku", "##bo", "said", "it", "did", "not", "necessarily", "show", "a", "substantial", "worse", "##ning", "of", "the", "economy", "." ], "ids": [ 12209, 117, 49869, 11790, 12415, 10271, 12172, 10472, 82080, 11897, 169, 50608, 110353, 11269, 10108, 10105, 27570, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "question", "is", "what", "the", "B", "##O", "##J", "is", "going", "to", "do", "with", "its", "interest", "rate", "policy", "." ], "ids": [ 107, 10117, 20210, 10124, 12976, 10105, 139, 11403, 15417, 10124, 19090, 10114, 10149, 10169, 10474, 17644, 18344, 14368, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "B", "##O", "##J", "governor", "has", "made", "it", "clear", "that", "the", "B", "##O", "##J", "'", "s", "policy", "is", "aimed", "at", "ens", "##uring", "basis", "for", "economic", "recovery", "." ], "ids": [ 10117, 139, 11403, 15417, 28795, 10393, 11019, 10271, 24866, 10189, 10105, 139, 11403, 15417, 112, 187, 14368, 10124, 53004, 10160, 55683, 31653, 17172, 10142, 13925, 61958, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "believe", "this", "policy", "has", "not", "changed", ",", "\"", "he", "said", "." ], "ids": [ 146, 30587, 10531, 14368, 10393, 10472, 17695, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ask", "##ed", "if", "a", "supplement", "##ary", "budget", "for", "1996", "/", "97", "was", "needed", "to", "support", "the", "economy", ",", "Ku", "##bo", "said", "the", "tank", "##an", "results", "would", "not", "lead", "to", "any", "immediate", "decision", "on", "the", "need", "for", "an", "extra", "budget", "." ], "ids": [ 93919, 10336, 12277, 169, 106925, 14926, 25293, 10142, 10389, 120, 12328, 10134, 23794, 10114, 13145, 10105, 27570, 117, 49869, 11790, 12415, 10105, 28671, 10206, 17466, 10894, 10472, 14107, 10114, 11178, 46938, 19231, 10135, 10105, 17367, 10142, 10151, 19868, 25293, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "n", "'", "t", "think", "we", "should", "immediately", "draw", "a", "conclusion", "that", "the", "economic", "recovery", "has", "come", "to", "a", "halt", "or", "that", "signs", "of", "a", "economic", "contract", "##ion", "have", "emerged", ",", "\"", "Ku", "##bo", "said", ".", "\"" ], "ids": [ 107, 146, 10149, 182, 112, 188, 27874, 11951, 14819, 24029, 25974, 169, 47775, 10189, 10105, 13925, 61958, 10393, 10678, 10114, 169, 59334, 10345, 10189, 45033, 10108, 169, 13925, 16108, 11046, 10529, 50658, 117, 107, 49869, 11790, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "The", "economy", "is", "not", "recover", "##ing", "smooth", "##ly", "or", "at", "a", "fast", "pace", ".", "\"" ], "ids": [ 10117, 27570, 10124, 10472, 94962, 10230, 67601, 10454, 10345, 10160, 169, 15040, 32547, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ku", "##bo", "said", "he", "would", "make", "a", "decision", "on", "the", "need", "for", "a", "supplement", "##ary", "budget", "after", "an", "announcement", "in", "mid", "-", "September", "of", "Japan", "'", "s", "gross", "domestic", "product", "for", "the", "April", "-", "June", "quarter", "." ], "ids": [ 49869, 11790, 12415, 10261, 10894, 13086, 169, 19231, 10135, 10105, 17367, 10142, 169, 106925, 14926, 25293, 10662, 10151, 76557, 10106, 15607, 118, 10596, 10108, 11891, 112, 187, 92746, 31084, 21535, 10142, 10105, 10780, 118, 11120, 28330, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "would", "like", "to", "see", "how", "the", "economy", "moved", "in", "the", "first", "half", "of", "1996", ",", "\"", "he", "said", "." ], "ids": [ 107, 146, 10894, 11850, 10114, 12888, 14796, 10105, 27570, 13059, 10106, 10105, 10422, 13877, 10108, 10389, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "says", "militant", "Japan", "must", "face", "war", "past", "." ], "ids": [ 11593, 22153, 79006, 11891, 14982, 13295, 10338, 17781, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##I", "##J", "##ING", "1996", "-", "08", "-", "28" ], "ids": [ 46291, 11281, 15417, 50183, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "on", "Wednesday", "called", "on", "Japan", "to", "ac", "##k", "##now", "##ledge", "its", "war", "##time", "past", "and", "put", "a", "stop", "to", "a", "tid", "##e", "of", "res", "##urg", "##ent", "militari", "##sm", "to", "prevent", "similar", "at", "##roc", "##ities", "in", "future", "." ], "ids": [ 11593, 10135, 57611, 11552, 10135, 11891, 10114, 13621, 10174, 69346, 100803, 10474, 10338, 18086, 17781, 10111, 14499, 169, 20517, 10114, 169, 15201, 10112, 10108, 39429, 51932, 11405, 39516, 19534, 10114, 29320, 13213, 10160, 87015, 17285, 10106, 16711, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Some", "Japanese", "are", "still", "un", "##re", "##pent", "##ant", "about", "the", "at", "##roc", "##ities", "committed", "by", "the", "Japanese", "militari", "##sts", "during", "the", "war", ",", "\"", "said", "a", "commentary", "in", "the", "official", "China", "Daily", "." ], "ids": [ 107, 13885, 13847, 10301, 12647, 10119, 10246, 55939, 11236, 10978, 10105, 10160, 87015, 17285, 38184, 10155, 10105, 13847, 39516, 28036, 10939, 10105, 10338, 117, 107, 12415, 169, 62438, 10106, 10105, 14731, 11593, 17252, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "\"", "If", "they", "are", "still", "unde", "##cide", "##d", "whether", "the", "war", "Japan", "launched", "was", "aggressive", "in", "nature", ",", "it", "will", "be", "difficult", "to", "tell", "whether", "they", "will", "do", "the", "same", "again", ",", "\"", "the", "newspaper", "said", "." ], "ids": [ 107, 14535, 10689, 10301, 12647, 23650, 65074, 10162, 21883, 10105, 10338, 11891, 18850, 10134, 75388, 10106, 16613, 117, 10271, 11337, 10347, 25232, 10114, 41549, 21883, 10689, 11337, 10149, 10105, 11561, 13123, 117, 107, 10105, 22047, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "raised", "ind", "##ign", "##ant", "protests", "after", "several", "Japanese", "cabinet", "ministers", "visited", "a", "sh", "##rine", "dedicated", "to", "their", "country", "'", "s", "war", "dead", "on", "August", "15", ",", "the", "51", "##st", "anniversary", "of", "Japan", "'", "s", "World", "War", "Two", "surrender", "." ], "ids": [ 11593, 20526, 30386, 58445, 11236, 60931, 10662, 11736, 13847, 33801, 66281, 30270, 169, 48201, 28728, 23361, 10114, 10455, 12723, 112, 187, 10338, 23457, 10135, 10735, 10208, 117, 10105, 11524, 10562, 37157, 10108, 11891, 112, 187, 10315, 11277, 13214, 75614, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 6, 9, 9 ] }, { "tokens": [ "\"", "Nu", "##mero", "##us", "Japanese", "politicians", "have", "tried", "to", "white", "##was", "##h", "their", "country", "'", "s", "war", "at", "##roc", "##ities", "in", "recent", "years", ",", "\"", "the", "commentary", "said", "." ], "ids": [ 107, 28336, 93817, 10251, 13847, 75284, 10529, 27156, 10114, 15263, 64785, 10237, 10455, 12723, 112, 187, 10338, 10160, 87015, 17285, 10106, 19037, 10855, 117, 107, 10105, 62438, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "estimates", "35", "million", "Chinese", "were", "killed", "or", "wounded", "by", "in", "##vad", "##ing", "Japanese", "troops", "from", "1931", "to", "1945", "." ], "ids": [ 11593, 45870, 10803, 12473, 13299, 10309, 15875, 10345, 39127, 10155, 10106, 16678, 10230, 13847, 20836, 10188, 11383, 10114, 10670, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Japanese", "have", "never", "gen", "##uine", "##ly", "apo", "##logi", "##sed", "for", "their", "war", "##time", "crimes", ",", "\"", "the", "commentary", "said", "." ], "ids": [ 107, 10117, 13847, 10529, 14794, 15331, 63251, 10454, 34768, 25504, 16219, 10142, 10455, 10338, 18086, 36951, 117, 107, 10105, 62438, 12415, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japanese", "Prime", "Minister", "Ryu", "##taro", "Has", "##him", "##oto", "marked", "the", "August", "15", "anniversary", "by", "express", "##ing", "\"", "re", "##mor", "##se", "\"", "for", "foreign", "victims", "of", "Japan", "'", "s", "World", "War", "Two", "at", "##roc", "##ities", "." ], "ids": [ 13847, 19924, 14355, 97479, 64618, 45896, 31362, 19235, 26981, 10105, 10735, 10208, 37157, 10155, 47620, 10230, 107, 11639, 35269, 10341, 107, 10142, 20796, 41205, 10108, 11891, 112, 187, 10315, 11277, 13214, 10160, 87015, 17285, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "coalition", "party", "leader", "plans", "to", "res", "##ign", "." ], "ids": [ 11891, 41028, 14039, 15014, 18195, 10114, 39429, 58445, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "28" ], "ids": [ 76531, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "leader", "of", "a", "junior", "partner", "in", "Japan", "'", "s", "three", "-", "party", "ruling", "coalition", "plans", "to", "res", "##ign", "to", "quell", "a", "political", "rebellion", ",", "party", "officials", "said", "on", "Wednesday", "." ], "ids": [ 10117, 15014, 10108, 169, 21854, 22825, 10106, 11891, 112, 187, 11003, 118, 14039, 50788, 41028, 18195, 10114, 39429, 58445, 10114, 44183, 169, 13736, 75746, 117, 14039, 27730, 12415, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "officials", "said", "New", "Party", "Sa", "##ki", "##ga", "##ke", "President", "Masa", "##yoshi", "Take", "##mura", ",", "finance", "minister", "until", "the", "beginning", "of", "this", "year", ",", "promised", "his", "resignation", "in", "a", "meeting", "with", "the", "politician", "who", "set", "off", "the", "rebellion", "in", "the", "smallest", "coalition", "member", "." ], "ids": [ 10117, 27730, 12415, 10287, 12529, 12404, 10506, 10483, 10550, 12811, 64807, 52908, 21200, 50866, 117, 48053, 16930, 11444, 10105, 17967, 10108, 10531, 10924, 117, 77137, 10226, 66129, 10106, 169, 19822, 10169, 10105, 20354, 10479, 11847, 11898, 10105, 75746, 10106, 10105, 109457, 41028, 12008, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "the", "date", "of", "Take", "##mura", "'", "s", "resignation", "would", "be", "determined", "by", "party", "officials", "." ], "ids": [ 11696, 12415, 10105, 13664, 10108, 21200, 50866, 112, 187, 66129, 10894, 10347, 30706, 10155, 14039, 27730, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Sa", "##ki", "##ga", "##ke", "row", "has", "caused", "ji", "##tter", "##s", "in", "its", "coalition", "partners", ",", "Prime", "Minister", "Ryu", "##taro", "Has", "##him", "##oto", "'", "s", "Liberal", "Democratic", "Party", "(", "L", "##DP", ")", ",", "the", "biggest", "group", "##ing", ",", "and", "the", "Social", "Democratic", "Party", "." ], "ids": [ 10117, 12404, 10506, 10483, 10550, 45006, 10393, 19513, 18028, 18413, 10107, 10106, 10474, 41028, 48125, 117, 19924, 14355, 97479, 64618, 45896, 31362, 19235, 112, 187, 22285, 19281, 12529, 113, 149, 54714, 114, 117, 10105, 36304, 11795, 10230, 117, 10111, 10105, 12824, 19281, 12529, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "But", "anal", "##yst", "##s", "said", "the", "row", "was", "not", "expected", "to", "immediately", "desta", "##bilis", "##e", "the", "government", "as", "even", "if", "Sa", "##ki", "##ga", "##ke", "split", "##s", "apart", "it", "has", "so", "few", "seats", "a", "loss", "of", "support", "would", "not", "lead", "to", "a", "general", "election", "." ], "ids": [ 16976, 106615, 62769, 10107, 12415, 10105, 45006, 10134, 10472, 25973, 10114, 24029, 25358, 48411, 10112, 10105, 12047, 10146, 13246, 12277, 12404, 10506, 10483, 10550, 24137, 10107, 43084, 10271, 10393, 10380, 13824, 26893, 169, 18576, 10108, 13145, 10894, 10472, 14107, 10114, 169, 11389, 13685, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "dispute", "pit", "##s", "Take", "##mura", ",", "who", "founded", "Sa", "##ki", "##ga", "##ke", "in", "1993", "as", "a", "reform", "-", "oriented", "L", "##DP", "sp", "##lin", "##ter", "group", ",", "against", "party", "official", "Yuki", "##o", "Hat", "##oya", "##ma", ",", "who", "says", "he", "will", "leave", "Sa", "##ki", "##ga", "##ke", "to", "form", "a", "reform", "##ist", "political", "group", "next", "month", "." ], "ids": [ 10117, 31310, 55277, 10107, 21200, 50866, 117, 10479, 14078, 12404, 10506, 10483, 10550, 10106, 10463, 10146, 169, 34800, 118, 58245, 149, 54714, 32650, 13020, 10877, 11795, 117, 11327, 14039, 14731, 84181, 10133, 48024, 51814, 10369, 117, 10479, 22153, 10261, 11337, 21964, 12404, 10506, 10483, 10550, 10114, 12188, 169, 34800, 11293, 13736, 11795, 13451, 14064, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hat", "##oya", "##ma", ",", "the", "49", "-", "year", "-", "old", "grandson", "of", "a", "1950s", "prime", "minister", ",", "on", "Tuesday", "quit", "as", "Sa", "##ki", "##ga", "##ke", "secretary", "general", "and", "has", "publicly", "s", "##nu", "##bbed", "the", "62", "-", "year", "-", "old", "Take", "##mura", ",", "pointed", "##ly", "ruling", "his", "mentor", "out", "as", "a", "possible", "member", "of", "the", "new", "political", "force", "." ], "ids": [ 48024, 51814, 10369, 117, 10105, 11580, 118, 10924, 118, 12898, 60111, 10108, 169, 28359, 19287, 16930, 117, 10135, 70245, 101237, 10146, 12404, 10506, 10483, 10550, 37664, 11389, 10111, 10393, 53577, 187, 11147, 98091, 10105, 12066, 118, 10924, 118, 12898, 21200, 50866, 117, 62288, 10454, 50788, 10226, 57881, 10950, 10146, 169, 14128, 12008, 10108, 10105, 10751, 13736, 15031, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Marathon", "talks", "between", "the", "two", "former", "allies", "on", "Tuesday", "night", "and", "Wednesday", "morning", "failed", "to", "resolve", "the", "dispute", "over", "the", "role", "of", "Take", "##mura", ",", "seen", "by", "Hat", "##oya", "##ma", "back", "##ers", "as", "tai", "##nted", "by", "his", "senior", "role", "in", "the", "L", "##DP", "-", "dominated", "coalition", "." ], "ids": [ 38745, 56672, 10948, 10105, 10551, 11775, 67675, 10135, 70245, 16903, 10111, 57611, 28757, 20775, 10114, 102825, 10105, 31310, 10491, 10105, 12971, 10108, 21200, 50866, 117, 15652, 10155, 48024, 51814, 10369, 12014, 10901, 10146, 12815, 58839, 10155, 10226, 17843, 12971, 10106, 10105, 149, 54714, 118, 49365, 41028, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "The", "presence", "of", "Take", "##mura", ",", "whose", "role", "as", "finance", "minister", "in", "passing", "an", "un", "##pop", "##ular", "plan", "to", "use", "tax", "##pa", "##yer", "funds", "to", "wind", "up", "failed", "housing", "loan", "firms", "ru", "##ined", "his", "reputation", "as", "a", "reform", "##er", ",", "has", "stal", "##led", "Hat", "##oya", "##ma", "'", "s", "efforts", "to", "attract", "to", "his", "new", "group", "def", "##ector", "##s", "from", "the", "opposition", "camp", ",", "anal", "##yst", "##s", "said", "." ], "ids": [ 10117, 25599, 10108, 21200, 50866, 117, 16879, 12971, 10146, 48053, 16930, 10106, 33389, 10151, 10119, 63229, 18062, 13065, 10114, 11760, 25468, 11359, 17750, 32067, 10114, 31346, 10741, 20775, 24116, 33390, 84459, 13483, 28751, 10226, 44214, 10146, 169, 34800, 10165, 117, 10393, 17844, 16376, 48024, 51814, 10369, 112, 187, 22116, 10114, 96721, 10114, 10226, 10751, 11795, 100745, 61545, 10107, 10188, 10105, 21227, 16700, 117, 106615, 62769, 10107, 12415, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Media", "reports", "say", "that", "at", "most", "10", "of", "23", "Sa", "##ki", "##ga", "##ke", "members", ",", "joined", "by", "a", "hand", "##ful", "of", "Social", "Democrats", ",", "will", "follow", "Hat", "##oya", "##ma", "when", "he", "bol", "##ts", "-", "-", "far", "short", "of", "the", "50", "law", "##makers", "needed", "to", "top", "##ple", "Has", "##him", "##oto", "'", "s", "eight", "-", "month", "-", "old", "government", "." ], "ids": [ 13341, 26610, 23763, 10189, 10160, 10992, 10150, 10108, 10328, 12404, 10506, 10483, 10550, 12464, 117, 13914, 10155, 169, 15230, 14446, 10108, 12824, 56282, 117, 11337, 28086, 48024, 51814, 10369, 10841, 10261, 14038, 10806, 118, 118, 13301, 13716, 10108, 10105, 10462, 13255, 65744, 23794, 10114, 12364, 22238, 45896, 31362, 19235, 112, 187, 16222, 118, 14064, 118, 12898, 12047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Has", "##him", "##oto", "-", "-", "who", "returns", "from", "a", "10", "-", "day", "Latin", "American", "tour", "on", "Saturday", "-", "-", "must", "call", "poll", "##s", "by", "mid", "-", "1997", ",", "and", "has", "repeatedly", "said", "he", "would", "not", "call", "an", "early", "general", "election", "." ], "ids": [ 45896, 31362, 19235, 118, 118, 10479, 38302, 10188, 169, 10150, 118, 11940, 14617, 10536, 12842, 10135, 24848, 118, 118, 14982, 20575, 70156, 10107, 10155, 15607, 118, 10391, 117, 10111, 10393, 77998, 12415, 10261, 10894, 10472, 20575, 10151, 11732, 11389, 13685, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "many", "anal", "##yst", "##s", "and", "politicians", "believe", "he", "may", "disso", "##lve", "parliament", "soon", "after", "it", "re", "##con", "##venes", "in", "early", "October", "." ], "ids": [ 16976, 11299, 106615, 62769, 10107, 10111, 75284, 30587, 10261, 11387, 32375, 49992, 40519, 17864, 10662, 10271, 11639, 23486, 106395, 10106, 11732, 11212, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Liu", "Chong", "Hi", "##ng", "interim", "net", "up", "2", ".", "7", "p", "##ct", "." ], "ids": [ 23456, 105442, 20065, 10376, 63313, 11988, 10741, 123, 119, 128, 184, 14526, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "28" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Six", "months", "ended", "June", "30" ], "ids": [ 20615, 15555, 18428, 11120, 10244 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "million", "HK", "$", "unless", "stated", ")" ], "ids": [ 113, 10106, 12473, 33150, 109, 60015, 17067, 114 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "S", "##hr", "(", "H", ".", "K", ".", "cents", ")", "65", ".", "61", "vs", "63", ".", "87" ], "ids": [ 156, 16757, 113, 145, 119, 148, 119, 63487, 114, 10843, 119, 12314, 14987, 12256, 119, 12581 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Di", "##vide", "##nd", "(", "H", ".", "K", ".", "cents", ")", "18", ".", "0", "vs", "18", ".", "0" ], "ids": [ 12944, 41638, 11534, 113, 145, 119, 148, 119, 63487, 114, 10218, 119, 121, 14987, 10218, 119, 121 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ex", "##ception", "##al", "items", "ni", "##l", "vs", "ni", "##l" ], "ids": [ 27746, 41341, 10415, 34109, 10414, 10161, 14987, 10414, 10161 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "249", ".", "53", "vs", "242", ".", "94" ], "ids": [ 32577, 26544, 119, 11756, 14987, 27297, 119, 12749 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Turn", "##over", "119", ".", "49", "vs", "134", ".", "40" ], "ids": [ 36750, 16666, 17963, 119, 11580, 14987, 18546, 119, 10533 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Company", "name", "Liu", "Chong", "Hi", "##ng", "Investment", "Ltd" ], "ids": [ 11739, 11324, 23456, 105442, 20065, 10376, 63254, 15129 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7 ] }, { "tokens": [ "Books", "close", "September", "23", "-", "27" ], "ids": [ 14003, 16065, 10596, 10328, 118, 10365 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Di", "##vide", "##nd", "pay", "##able", "October", "8" ], "ids": [ 12944, 41638, 11534, 16868, 13096, 11212, 129 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Liu", "Chong", "Hi", "##ng", "engage", "##s", "in", "property", "development", "and", "investment", ",", "ware", "##hou", "##sing", ",", "banking", "and", "insurance", "services", "." ], "ids": [ 49307, 29833, 118, 23456, 105442, 20065, 10376, 38391, 10107, 10106, 18381, 13405, 10111, 37933, 117, 88902, 25611, 16357, 117, 75703, 10111, 49756, 12639, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Hong", "Kong", "News", "##room", "(", "852", ")", "284", "##3", "636", "##8" ], "ids": [ 118, 118, 15078, 14577, 12219, 25525, 113, 70072, 114, 29137, 10884, 54105, 11396 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fire", "bomb", "hur", "##led", "at", "U", ".", "S", ".", "consul", "##ate", "in", "Indonesia", "." ], "ids": [ 16011, 41654, 52824, 16376, 10160, 158, 119, 156, 119, 53704, 12436, 10106, 11658, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 1, 9 ] }, { "tokens": [ "JA", "##KA", "##RT", "##A", "1996", "-", "08", "-", "28" ], "ids": [ 53399, 67813, 46935, 10738, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "fire", "bomb", "was", "thrown", "over", "the", "fe", "##nce", "into", "the", "grounds", "of", "the", "U", ".", "S", ".", "Con", "##sula", "##te", "-", "General", "in", "Indonesia", "'", "s", "second", "largest", "city", "of", "Surabaya", "but", "no", "one", "was", "hur", "##t", ",", "a", "mission", "official", "said", "on", "Wednesday", "." ], "ids": [ 138, 13559, 41654, 10134, 88590, 10491, 10105, 34778, 12150, 10708, 10105, 38190, 10108, 10105, 158, 119, 156, 119, 12845, 57170, 10216, 118, 11220, 10106, 11658, 112, 187, 11132, 15363, 11584, 10108, 55805, 10473, 10192, 10464, 10134, 52824, 10123, 117, 169, 17032, 14731, 12415, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Craig", "Strom", "##me", ",", "U", ".", "S", ".", "em", "##bas", "##sy", "spoke", "##sman", "in", "Jakarta", ",", "700", "km", "(", "430", "miles", ")", "west", "of", "Surabaya", ",", "confirmed", "the", "Tuesday", "morning", "attack", "." ], "ids": [ 21703, 66091, 10627, 117, 158, 119, 156, 119, 10266, 21322, 16105, 50005, 24305, 10106, 14164, 117, 12367, 10204, 113, 26262, 14148, 114, 13735, 10108, 55805, 117, 27347, 10105, 70245, 28757, 16342, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Somebody", "threw", "a", "mol", "##otov", "co", "##ckt", "##ail", "over", "the", "fe", "##nce", "and", "it", "went", "into", "the", "parking", "lot", "." ], "ids": [ 107, 76713, 80516, 169, 39520, 106933, 11170, 25028, 35240, 10491, 10105, 34778, 12150, 10111, 10271, 13446, 10708, 10105, 23975, 19826, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "did", "n", "'", "t", "hit", "any", "##body", "or", "anything", ",", "\"", "Strom", "##me", "said", "." ], "ids": [ 10377, 12172, 182, 112, 188, 14946, 11178, 38078, 10345, 42819, 117, 107, 66091, 10627, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "He", "said", "there", "was", "no", "immediate", "explanation", "for", "the", "attack", "or", "any", "information", "on", "those", "responsible", "." ], "ids": [ 10357, 12415, 11155, 10134, 10192, 46938, 88840, 10142, 10105, 16342, 10345, 11178, 12929, 10135, 12676, 21586, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shanghai", "novelist", "murdered", "at", "home", "." ], "ids": [ 24181, 81448, 65861, 10160, 11816, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SH", "##AN", "##G", "##HA", "##I", "1996", "-", "08", "-", "28" ], "ids": [ 38702, 41275, 11447, 58132, 11281, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Shanghai", "novelist", "was", "murdered", "at", "her", "home", "on", "Sunday", ",", "an", "official", "of", "the", "city", "'", "s", "Writers", "Association", "said", "on", "Wednesday", "." ], "ids": [ 138, 24181, 81448, 10134, 65861, 10160, 10485, 11816, 10135, 19731, 117, 10151, 14731, 10108, 10105, 11584, 112, 187, 45574, 11751, 12415, 10135, 57611, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "victim", "was", "Dai", "Ho", "##uy", "##ing", ",", "who", "wrote", "about", "China", "'", "s", "1966", "-", "76", "left", "##ist", "Cultural", "Revolution", "and", "the", "lives", "of", "Chinese", "intellectual", "##s", ",", "the", "official", "said", "." ], "ids": [ 10117, 62585, 10134, 57019, 20220, 53452, 10230, 117, 10479, 13954, 10978, 11593, 112, 187, 10857, 118, 12428, 12153, 11293, 17439, 17166, 10111, 10105, 21418, 10108, 13299, 62941, 10107, 117, 10105, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "killing", "was", "under", "investigation", ",", "she", "said", "." ], "ids": [ 10117, 34248, 10134, 10571, 32719, 117, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "gave", "no", "further", "details", "." ], "ids": [ 11149, 15362, 10192, 14586, 29500, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Born", "in", "1937", "in", "the", "central", "province", "of", "Anh", "##ui", ",", "Dai", "came", "to", "Shanghai", "as", "a", "student", "and", "remained", "in", "the", "city", "as", "a", "pro", "##lifi", "##c", "author", "and", "teacher", "of", "Chinese", "." ], "ids": [ 18021, 10106, 11173, 10106, 10105, 12397, 14342, 10108, 15212, 11990, 117, 57019, 13383, 10114, 24181, 10146, 169, 16470, 10111, 15980, 10106, 10105, 11584, 10146, 169, 11284, 80237, 10350, 17034, 10111, 24996, 10108, 13299, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 4, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "She", "was", "divorced", "and", "lived", "alone", ",", "leaving", "one", "daughter", "who", "received", "university", "education", "in", "Hawaii", "and", "lives", "in", "Chicago", ",", "a", "friend", "said", "." ], "ids": [ 11149, 10134, 81440, 10111, 17603, 24087, 117, 21005, 10464, 15243, 10479, 12296, 19756, 14943, 10106, 21729, 10111, 21418, 10106, 12317, 117, 169, 20104, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dai", "'", "s", "most", "famous", "book", ",", "\"", "Ren", "A", "Ren", "\"", "(", "People", ",", "People", ")", ",", "was", "translated", "into", "German", "and", "English", ",", "he", "said", "." ], "ids": [ 57019, 112, 187, 10992, 18689, 12748, 117, 107, 52712, 138, 52712, 107, 113, 14235, 117, 14235, 114, 117, 10134, 29909, 10708, 12026, 10111, 11616, 117, 10261, 12415, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 2, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##wa", "Kay", "plu", "##nges", "on", "rights", "issue", ",", "earning", "##s", "." ], "ids": [ 145, 11037, 37313, 13651, 83943, 10135, 16691, 15557, 117, 56981, 10107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "28" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "of", "H", "##wa", "Kay", "Thai", "Holdings", "Ltd", "plu", "##nge", "##d", "to", "an", "all", "-", "time", "low", "after", "the", "company", "announced", "a", "rights", "issue", "plan", "and", "also", "reported", "a", "sharp", "fall", "in", "earning", "##s", ",", "broke", "##rs", "said", "." ], "ids": [ 106583, 11234, 10108, 145, 11037, 37313, 26207, 57727, 15129, 13651, 18180, 10162, 10114, 10151, 10435, 118, 10635, 15626, 10662, 10105, 12100, 13854, 169, 16691, 15557, 13065, 10111, 10379, 15943, 169, 77348, 18042, 10106, 56981, 10107, 117, 30500, 10943, 12415, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "stock", "fell", "HK", "$", "0", ".", "23", ",", "or", "30", ".", "26", "percent", ",", "to", "an", "all", "-", "time", "low", "of", "HK", "$", "0", ".", "53", "." ], "ids": [ 10117, 20511, 25194, 33150, 109, 121, 119, 10328, 117, 10345, 10244, 119, 10314, 22362, 117, 10114, 10151, 10435, 118, 10635, 15626, 10108, 33150, 109, 121, 119, 11756, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "In", "##vestor", "##s", "un", "##loaded", "their", "shares", "due", "to", "the", "poor", "earning", "##s", "out", "##lo", "##ok", "following", "a", "sharp", "profit", "decline", "." ], "ids": [ 107, 10167, 83436, 10107, 10119, 101802, 10455, 45751, 10850, 10114, 10105, 23247, 56981, 10107, 10950, 10715, 11140, 11901, 169, 77348, 25081, 46695, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rights", "issue", "also", "prompted", "dil", "##ution", "fear", "##s", ",", "\"", "said", "a", "dealing", "director", "at", "a", "local", "broke", "##rage", "." ], "ids": [ 10117, 16691, 15557, 10379, 93003, 36031, 30861, 44929, 10107, 117, 107, 12415, 169, 73082, 12461, 10160, 169, 11436, 30500, 40696, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "July", "ref", "##ined", "zinc", "import", "##s", "off", "47", ".", "5", "p", "##ct", "yr", "/", "yr", "." ], "ids": [ 11891, 11112, 48056, 28751, 86232, 67622, 10107, 11898, 11413, 119, 126, 184, 14526, 12590, 120, 12590, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "28" ], "ids": [ 76531, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "'", "s", "ref", "##ined", "zinc", "import", "##s", "in", "July", "total", "##led", "3", ",", "684", "tonnes", ",", "off", "47", ".", "5", "percent", "from", "7", ",", "011", "tonnes", "in", "the", "same", "month", "a", "year", "earlier", ",", "according", "to", "Ministry", "of", "Finance", "data", "released", "on", "Wednesday", "." ], "ids": [ 11891, 112, 187, 48056, 28751, 86232, 67622, 10107, 10106, 11112, 11339, 16376, 124, 117, 53608, 39435, 117, 11898, 11413, 119, 126, 22362, 10188, 128, 117, 62384, 39435, 10106, 10105, 11561, 14064, 169, 10924, 18905, 117, 18071, 10114, 19170, 10108, 38533, 11165, 11539, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Figures", "were", "as", "follows", "(", "in", "tonnes", ")", ":" ], "ids": [ 105894, 10309, 10146, 23698, 113, 10106, 39435, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "July", "96", "June", "96", "July", "95" ], "ids": [ 11112, 12308, 11120, 12308, 11112, 11978 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "3", ",", "684", "3", ",", "292", "7", ",", "011" ], "ids": [ 25220, 124, 117, 53608, 124, 117, 29477, 128, 117, 62384 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "su", "##pp", "##liers", ":" ], "ids": [ 14988, 10198, 16587, 79687, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "961", "1", ",", "683", "5", ",", "539" ], "ids": [ 11593, 72488, 122, 117, 64070, 126, 117, 52194 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Re", "##fine", "##d", "zinc", "import", "##s", "in", "the", "first", "seven", "months", "of", "1996", "total", "##led", "115", ",", "941", "tonnes", ",", "up", "38", ".", "4", "percent", "from", "83", ",", "801", "tonnes", "in", "the", "year", "-", "ago", "period", "." ], "ids": [ 20304, 100456, 10162, 86232, 67622, 10107, 10106, 10105, 10422, 15767, 15555, 10108, 10389, 11339, 16376, 15680, 117, 82944, 39435, 117, 10741, 11171, 119, 125, 22362, 10188, 12408, 117, 57175, 39435, 10106, 10105, 10924, 118, 36390, 13127, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Tokyo", "Com", "##mo", "##diti", "##es", "Des", "##k", "(", "813", "343", "##2", "617", "##9", ")" ], "ids": [ 118, 118, 15308, 16680, 11033, 63203, 10171, 13810, 10174, 113, 58790, 32007, 10729, 56159, 11373, 114 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "HK", "newspaper", "editorial", "##s", "-", "Aug", "28", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 33150, 22047, 30202, 10107, 118, 53012, 10348, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "28" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "307", "days", "to", "go", "before", "the", "British", "colony", "rev", "##erts", "to", "China", ",", "the", "Hong", "Kong", "media", "focused", "mainly", "on", "domestic", "issues", "concerning", "alleged", "pressure", "on", "a", "judge", ",", "cross", "straight", "##s", "relations", "and", "the", "democratic", "lo", "##bby", "'", "s", "relationship", "with", "Beijing", "." ], "ids": [ 12613, 26790, 13990, 10114, 11783, 11360, 10105, 11160, 48968, 86095, 64115, 10114, 11593, 117, 10105, 15078, 14577, 12518, 31293, 20827, 10135, 31084, 17850, 53047, 48164, 23460, 10135, 169, 31624, 117, 19630, 31214, 10107, 19824, 10111, 10105, 72209, 10406, 31444, 112, 187, 19808, 10169, 23824, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "Beijing", "-", "funded", "W", "##EN", "W", "##E", "##I", "P", "##O", "said", "Taiwan", "'", "s", "government", "could", "not", "hope", "to", "stem", "the", "island", "'", "s", "economic", "and", "trade", "exchange", "##s", "with", "China", "." ], "ids": [ 10117, 23824, 118, 47845, 160, 50655, 160, 11259, 11281, 153, 11403, 12415, 19449, 112, 187, 12047, 12174, 10472, 50725, 10114, 37649, 10105, 17354, 112, 187, 13925, 10111, 18908, 27714, 10107, 10169, 11593, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 6, 6, 3, 7, 7, 7, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "paper", "said", "that", "using", "administrative", "power", "to", "limit", "economic", "activities", "across", "the", "Taiwan", "str", "##ait", "would", "not", "work", "." ], "ids": [ 10117, 17895, 12415, 10189, 13382, 18401, 13183, 10114, 34316, 13925, 19286, 15130, 10105, 19449, 17791, 14598, 10894, 10472, 11424, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##NG", "PA", "##O", "DA", "##IL", "##Y", "NEWS", "said", "it", "hoped", "Chinese", "officials", "would", "soon", "open", "dialogue", "with", "Hong", "Kong", "'", "s", "Democratic", "Party", "and", "the", "newly", "-", "established", "democracy", "lo", "##bby", ",", "Frontier", ",", "in", "order", "to", "ea", "##se", "an", "##xie", "##ties", "in", "the", "lead", "-", "up", "to", "the", "hand", "##over", "." ], "ids": [ 75416, 34065, 32349, 11403, 47855, 38850, 14703, 109023, 12415, 10271, 84245, 13299, 27730, 10894, 17864, 14087, 51077, 10169, 15078, 14577, 112, 187, 19281, 12529, 10111, 10105, 26574, 118, 13245, 67519, 10406, 31444, 117, 50218, 117, 10106, 12990, 10114, 22257, 10341, 10151, 50536, 14197, 10106, 10105, 14107, 118, 10741, 10114, 10105, 15230, 16666, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "English", "language", "SO", "##UT", "##H", "CH", "##IN", "##A", "MO", "##RN", "##ING", "P", "##OS", "##T", "said", "the", "ju", "##dici", "##ary", "needed", "to", "take", "s", "##wi", "##ft", "and", "de", "##cisive", "action", "in", "in", "##vesti", "##gating", "the", "allegations", "that", "a", "judge", "had", "been", "subject", "##ed", "to", "pressure", "in", "a", "New", "Zealand", "immigration", "case", "involving", "allegations", "of", "fraud", "." ], "ids": [ 10117, 11616, 13702, 71020, 65729, 12396, 39774, 27128, 10738, 102059, 90412, 50183, 153, 21793, 11090, 12415, 10105, 23005, 49534, 14926, 23794, 10114, 13574, 187, 15926, 12961, 10111, 10104, 79533, 14204, 10106, 10106, 63996, 91045, 10105, 85190, 10189, 169, 31624, 10374, 10590, 20036, 10336, 10114, 23460, 10106, 169, 10287, 14451, 55031, 13474, 40368, 85190, 10108, 93070, 119 ], "entity": [ "O", "B-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "independence", "of", "the", "ju", "##dici", "##ary", "and", "the", "rule", "of", "law", "were", "of", "para", "##mou", "##nt", "importance", "to", "Hong", "Kong", "'", "s", "survival", "as", "a", "business", "centre", "." ], "ids": [ 10117, 31412, 10108, 10105, 23005, 49534, 14926, 10111, 10105, 21983, 10108, 13255, 10309, 10108, 10220, 36038, 10368, 21912, 10114, 15078, 14577, 112, 187, 66023, 10146, 169, 14155, 12672, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Chinese", "language", "daily", "H", "##ON", "##G", "KO", "##NG", "EC", "##ON", "##OM", "##IC", "TIME", "##S", "said", "the", "Legal", "Department", "had", "been", "inde", "##cisive", "in", "its", "handling", "of", "the", "judge", "'", "s", "case", "." ], "ids": [ 10117, 13299, 13702, 27636, 145, 30118, 11447, 67422, 34065, 27364, 30118, 37079, 30889, 89275, 10731, 12415, 10105, 43109, 12933, 10374, 10590, 100991, 79533, 10106, 10474, 52703, 10108, 10105, 31624, 112, 187, 13474, 119 ], "entity": [ "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Such", "he", "##sita", "##ncy", "on", "the", "part", "of", "the", "government", "had", "damaged", "public", "confidence", "in", "the", "rule", "of", "law", ",", "the", "paper", "said", "." ], "ids": [ 43958, 10261, 69999, 24166, 10135, 10105, 10668, 10108, 10105, 12047, 10374, 39034, 11683, 74187, 10106, 10105, 21983, 10108, 13255, 117, 10105, 17895, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Hong", "Kong", "news", "##room", "(", "852", ")", "284", "##3", "644", "##1" ], "ids": [ 118, 118, 15078, 14577, 14424, 25525, 113, 70072, 114, 29137, 10884, 63772, 10759 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "Authority", "free", "##s", "rights", "activist", "." ], "ids": [ 56119, 26553, 13961, 10107, 16691, 49024, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GA", "##ZA", "1996", "-", "08", "-", "28" ], "ids": [ 74212, 105512, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "human", "rights", "activist", "said", "on", "Wednesday", "he", "had", "been", "released", "after", "more", "than", "two", "weeks", "in", "det", "##ention", "that", "followed", "his", "call", "for", "an", "in", "##quiry", "into", "the", "death", "of", "a", "Gaza", "man", "inter", "##roga", "##ted", "by", "Palestinian", "police", "." ], "ids": [ 138, 14179, 16691, 49024, 12415, 10135, 57611, 10261, 10374, 10590, 11539, 10662, 10798, 11084, 10551, 20750, 10106, 10349, 90372, 10189, 15689, 10226, 20575, 10142, 10151, 10106, 56914, 10708, 10105, 12557, 10108, 169, 42434, 10817, 22021, 59648, 11912, 10155, 56119, 15034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Mohammad", "Da", "##hman", ",", "director", "of", "the", "Gaza", "-", "based", "Ad", "##dam", "##eer", "Prison", "##ers", "Support", "Association", ",", "said", "he", "was", "free", "##d", "on", "Tuesday", "without", "being", "charged", "." ], "ids": [ 40036, 11818, 49811, 117, 12461, 10108, 10105, 42434, 118, 11610, 25474, 32037, 23869, 52808, 10901, 39007, 11751, 117, 12415, 10261, 10134, 13961, 10162, 10135, 70245, 13663, 11223, 38253, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 2, 6, 6, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "Attorney", "-", "General", "K", "##hale", "##d", "al", "-", "Qi", "##dra", "was", "not", "immediately", "available", "to", "comment", "." ], "ids": [ 56119, 45551, 118, 11220, 148, 39149, 10162, 10164, 118, 88454, 14951, 10134, 10472, 24029, 14579, 10114, 49641, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Qi", "##dra", "had", "said", "Da", "##hman", "was", "arrested", "on", "sus", "##pic", "##ion", "of", "making", "a", "false", "statement", "." ], "ids": [ 88454, 14951, 10374, 12415, 11818, 49811, 10134, 29479, 10135, 10846, 34891, 11046, 10108, 14293, 169, 37155, 33311, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "activist", "was", "det", "##ained", "by", "Palestinian", "intelligence", "service", "agents", "on", "August", "12", "after", "publishing", "a", "statement", "demand", "##ing", "an", "investigation", "into", "the", "death", "of", "a", "Gaza", "man", "who", "had", "been", "questioned", "by", "Palestinian", "authorities", "." ], "ids": [ 10117, 49024, 10134, 10349, 65804, 10155, 56119, 30151, 11989, 32124, 10135, 10735, 10186, 10662, 38880, 169, 33311, 34394, 10230, 10151, 32719, 10708, 10105, 12557, 10108, 169, 42434, 10817, 10479, 10374, 10590, 101173, 10155, 56119, 28308, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "Palestinian", "Authority", "said", "the", "dead", "man", ",", "Na", "##hed", "Dahl", "##an", ",", "had", "committed", "suicide", "." ], "ids": [ 10117, 56119, 26553, 12415, 10105, 23457, 10817, 117, 10685, 16081, 55809, 10206, 117, 10374, 38184, 35656, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Human", "rights", "groups", "had", "protest", "##ed", "about", "Da", "##hman", "'", "s", "arrest", "in", "letters", "to", "Palestinian", "President", "Ya", "##sser", "Ara", "##fat", "and", "to", "Qi", "##dra", "." ], "ids": [ 15426, 16691, 15647, 10374, 36627, 10336, 10978, 11818, 49811, 112, 187, 45165, 10106, 26005, 10114, 56119, 12811, 25148, 33519, 54789, 25616, 10111, 10114, 88454, 14951, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 4, 8, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Spain", "-", "Aug", "28", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 16149, 118, 53012, 10348, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Head", "##lines", "from", "major", "national", "newspapers", "." ], "ids": [ 16830, 31782, 10188, 11922, 11844, 48473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EL", "PA", "##IS" ], "ids": [ 69765, 32349, 19088 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "-", "Work", "groups", "and", "weekend", "arrest", "to", "quell", "juvenil", "##e", "violence", "in", "Basque", "Country" ], "ids": [ 118, 25641, 15647, 10111, 43440, 45165, 10114, 44183, 65511, 10112, 26342, 10106, 74950, 14966 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5 ] }, { "tokens": [ "EL", "M", "##UN", "##DO" ], "ids": [ 69765, 150, 69849, 104847 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Ale", "##ix", "Vidal", "-", "Qua", "##dras", "-", "Catalan", "nationalist", "##s", "are", "demand", "##ing", "my", "def", "##enes", "##tration" ], "ids": [ 118, 59340, 13274, 44928, 118, 56618, 90039, 118, 81164, 99451, 10107, 10301, 34394, 10230, 15127, 100745, 28999, 54525 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DI", "##AR", "##IO", "16" ], "ids": [ 110014, 52188, 37174, 10250 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Catalan", "nationalist", "##s", "say", "the", "1997", "budget", "will", "make", "Spania", "##rds", "s", "##we", "##at" ], "ids": [ 118, 81164, 99451, 10107, 23763, 10105, 10391, 25293, 11337, 13086, 42751, 40725, 187, 12577, 10526 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ABC" ], "ids": [ 16052 ], "entity": [ "B-ORG" ], "entity_ids": [ 3 ] }, { "tokens": [ "-", "Worldwide", "ala", "##rm", "over", "child", "pro", "##stitution" ], "ids": [ 118, 67141, 21739, 19341, 10491, 18048, 11284, 68199 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CO", "DI", "##AS" ], "ids": [ 140, 27128, 82272, 110014, 38025 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Banco", "Santander", "starts", "conquest", "of", "the", "east", "." ], "ids": [ 118, 30067, 41774, 33039, 17841, 10108, 10105, 13827, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EX", "##PA", "##NS", "##ION" ], "ids": [ 80426, 52099, 69196, 52980 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Government", "will", "finish", "pension", "reform", "before", "the", "year", "2000" ], "ids": [ 118, 14581, 11337, 26282, 70838, 34800, 11360, 10105, 10924, 10180 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GA", "##CE", "##TA", "DE", "L", "##OS", "NE", "##GO", "##CI", "##OS" ], "ids": [ 74212, 43161, 24951, 25067, 149, 21793, 86607, 83821, 89955, 21793 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Caja", "de", "Madrid", "sta", "##gna", "##tes", "during", "struggle", "for", "presidency" ], "ids": [ 118, 102693, 10104, 11727, 16527, 21153, 11197, 10939, 48919, 10142, 97059 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "asks", "Bonn", "to", "extra", "##dite", "ex", "-", "president", "Ban", "##isa", "##dr", "." ], "ids": [ 12901, 54031, 21982, 10114, 19868, 59627, 11419, 118, 12931, 21631, 19403, 59464, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "has", "asked", "Germany", "to", "extra", "##dite", "its", "former", "president", "Ab", "##ol", "##has", "##san", "Ban", "##isa", "##dr", "for", "alleged", "hija", "##cking", ",", "an", "Iranian", "em", "##bas", "##sy", "spoke", "##sman", "said", "on", "Wednesday", "." ], "ids": [ 12901, 10393, 22151, 12775, 10114, 19868, 59627, 10474, 11775, 12931, 15595, 11481, 20578, 14434, 21631, 19403, 59464, 10142, 48164, 26429, 72453, 117, 10151, 41768, 10266, 21322, 16105, 50005, 24305, 12415, 10135, 57611, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ban", "##isa", "##dr", "anger", "##ed", "Tehran", "last", "week", "by", "ac", "##cus", "##ing", "top", "Iranian", "leaders", "of", "order", "##ing", "the", "assassination", "of", "Iranian", "Kur", "##dish", "leaders", "in", "a", "Berlin", "restaurant", "in", "1992", "." ], "ids": [ 21631, 19403, 59464, 46464, 10336, 73520, 12469, 16118, 10155, 13621, 14319, 10230, 12364, 41768, 24155, 10108, 12990, 10230, 10105, 94509, 10108, 41768, 61912, 67522, 24155, 10106, 169, 11193, 26234, 10106, 10450, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "He", "made", "the", "allegations", "at", "the", "trial", "of", "an", "Iranian", "and", "four", "Lebanese", "accused", "of", "carrying", "out", "the", "attack", "." ], "ids": [ 10357, 11019, 10105, 85190, 10160, 10105, 23626, 10108, 10151, 41768, 10111, 11598, 101257, 37303, 10108, 39157, 10950, 10105, 16342, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "Iranian", "em", "##bas", "##sy", "spoke", "##sman", "said", "in", "response", "to", "an", "in", "##quiry", "that", "Iran", "had", "formally", "requested", "Ban", "##isa", "##dr", "'", "s", "extra", "##dition", "for", "hija", "##cking", "the", "military", "aircraft", "which", "he", "commande", "##ered", "to", "fl", "##ee", "Iran", "in", "July", "1981", "." ], "ids": [ 10313, 41768, 10266, 21322, 16105, 50005, 24305, 12415, 10106, 21001, 10114, 10151, 10106, 56914, 10189, 12901, 10374, 43082, 59728, 21631, 19403, 59464, 112, 187, 19868, 34540, 10142, 26429, 72453, 10105, 14041, 16167, 10319, 10261, 57867, 45452, 10114, 58768, 13321, 12901, 10106, 11112, 10654, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "submitted", "the", "request", "three", "or", "four", "days", "ago", ",", "\"", "he", "said", "." ], "ids": [ 107, 12865, 58544, 10105, 37449, 11003, 10345, 11598, 13990, 36390, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "authorities", "could", "not", "immediately", "be", "reached", "for", "comment", "." ], "ids": [ 12026, 28308, 12174, 10472, 24029, 10347, 17087, 10142, 49641, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ban", "##isa", "##dr", "lives", "under", "round", "-", "the", "-", "clock", "security", "in", "France", ",", "fear", "##ing", "Tehran", "could", "make", "an", "attempt", "on", "his", "life", "." ], "ids": [ 21631, 19403, 59464, 21418, 10571, 13569, 118, 10105, 118, 52843, 21849, 10106, 10688, 117, 44929, 10230, 73520, 12174, 13086, 10151, 21395, 10135, 10226, 12103, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "is", "due", "back", "in", "Berlin", "on", "September", "5", "to", "continue", "his", "testi", "##mony", ",", "which", "has", "backed", "up", "German", "prose", "##cutor", "##s", "'", "allegations", "that", "Tehran", "ordered", "the", "attack", "on", "the", "exile", "##d", "leaders", "." ], "ids": [ 10357, 10124, 10850, 12014, 10106, 11193, 10135, 10596, 126, 10114, 17734, 10226, 41319, 91481, 117, 10319, 10393, 61010, 10741, 12026, 84145, 98957, 10107, 112, 85190, 10189, 73520, 23782, 10105, 16342, 10135, 10105, 67696, 10162, 24155, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Three", "dis", "##siden", "##ts", "and", "their", "translator", "were", "killed", "in", "the", "gang", "##land", "-", "style", "machine", "##gun", "attack", "." ], "ids": [ 15139, 27920, 42323, 10806, 10111, 10455, 93852, 10309, 15875, 10106, 10105, 16330, 11080, 118, 13351, 21432, 32657, 16342, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "has", "war", "##ned", "Germany", "that", "bila", "##teral", "relations", "could", "su", "##ffer", "if", "it", "pays", "hee", "##d", "to", "the", "testi", "##mony", "of", "Ban", "##isa", "##dr", ",", "an", "architect", "of", "Iran", "'", "s", "Islamic", "revolution", "who", "has", "been", "a", "s", "##wo", "##rn", "enemy", "of", "Tehran", "since", "he", "fell", "from", "favour", "after", "a", "year", "as", "president", "." ], "ids": [ 12901, 10393, 10338, 17021, 12775, 10189, 12517, 98161, 19824, 12174, 10198, 22888, 12277, 10271, 13850, 100415, 10162, 10114, 10105, 41319, 91481, 10108, 21631, 19403, 59464, 117, 10151, 26370, 10108, 12901, 112, 187, 22150, 48336, 10479, 10393, 10590, 169, 187, 16828, 13061, 29410, 10108, 73520, 11764, 10261, 25194, 10188, 61264, 10662, 169, 10924, 10146, 12931, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 1, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NATO", "military", "chief", "##s", "to", "visit", "Iberia", "." ], "ids": [ 21662, 14041, 19421, 10107, 10114, 27541, 86524, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "28" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Top", "military", "officials", "from", "North", "Atlantic", "Treaty", "Organisation", "countries", "will", "tour", "Spain", "and", "Portugal", "next", "month", "for", "their", "annual", "inspection", "of", "alliance", "country", "installations", "and", "forces", "." ], "ids": [ 12685, 14041, 27730, 10188, 11225, 16739, 38031, 22223, 15911, 11337, 12842, 16149, 10111, 12939, 13451, 14064, 10142, 10455, 19246, 99455, 10108, 36758, 12723, 60410, 10111, 13729, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NATO", "said", "in", "a", "statement", "received", "on", "Wednesday", "that", "its", "military", "committee", "would", "visit", "the", "two", "countries", "between", "September", "8", "and", "13", "." ], "ids": [ 21662, 12415, 10106, 169, 33311, 12296, 10135, 57611, 10189, 10474, 14041, 27634, 10894, 27541, 10105, 10551, 15911, 10948, 10596, 129, 10111, 10249, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "committee", "consists", "of", "the", "chief", "##s", "of", "defence", "staff", "of", "each", "alliance", "country", "except", "Iceland", ",", "which", "has", "no", "armed", "forces", "." ], "ids": [ 10117, 27634, 20963, 10108, 10105, 19421, 10107, 10108, 47245, 18927, 10108, 11948, 36758, 12723, 23423, 53588, 117, 10319, 10393, 10192, 34174, 13729, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NATO", "'", "s", "top", "military", "men", "-", "-", "General", "George", "Jo", "##ul", "##wan", ",", "Supreme", "Allied", "Commander", "Europe", ",", "and", "General", "John", "She", "##ehan", ",", "Supreme", "Allied", "Commander", "Atlantic", "-", "-", "will", "also", "attend", "." ], "ids": [ 21662, 112, 187, 12364, 14041, 10588, 118, 118, 11220, 10955, 20977, 10604, 14394, 117, 22872, 42885, 25783, 11767, 117, 10111, 11220, 10421, 11149, 79788, 117, 22872, 42885, 25783, 16739, 118, 118, 11337, 10379, 34465, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "committee", "'", "s", "last", "tour", "was", "in", "September", "1995", "in", "Belgium", ",", "Luxembourg", "and", "the", "Netherlands", "." ], "ids": [ 10117, 27634, 112, 187, 12469, 12842, 10134, 10106, 10596, 10436, 10106, 26519, 117, 23903, 10111, 10105, 22043, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 9 ] }, { "tokens": [ "RE", "##UT", "##ER" ], "ids": [ 71033, 65729, 24093 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "ISS", "says", "agreed", "sale", "of", "U", ".", "S", ".", "unit", "." ], "ids": [ 58915, 22153, 25577, 15488, 10108, 158, 119, 156, 119, 16511, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "CO", "##P", "##EN", "##HA", "##GE", "##N", "1996", "-", "08", "-", "28" ], "ids": [ 32992, 11127, 50655, 58132, 58719, 11537, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Danish", "clean", "##ing", "group", "ISS", "on", "Wednesday", "said", "it", "had", "signed", "a", "letter", "of", "intent", "to", "sell", "its", "trouble", "##d", "U", ".", "S", "unit", "ISS", "Inc", "to", "Canadian", "firm", "Aa", "##xis", "Limited", "." ], "ids": [ 29876, 55911, 10230, 11795, 58915, 10135, 57611, 12415, 10271, 10374, 14775, 169, 19310, 10108, 58692, 10114, 36300, 10474, 58285, 10162, 158, 119, 156, 16511, 58915, 13604, 10114, 14023, 23410, 80131, 53496, 20474, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "B-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 2, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 3, 7, 9, 2, 9, 3, 7, 7, 9 ] }, { "tokens": [ "An", "ISS", "statement", "said", "that", "Aa", "##xis", ",", "with", "year", "-", "end", "1996", "assets", "of", "US", "$", "10", ".", "9", "million", "and", "equity", "of", "$", "10", ".", "5", "million", ",", "would", "be", "listed", "on", "the", "Montreal", "stock", "exchange", ",", "but", "did", "not", "say", "when", "." ], "ids": [ 10313, 58915, 33311, 12415, 10189, 80131, 53496, 117, 10169, 10924, 118, 11572, 10389, 51701, 10108, 10808, 109, 10150, 119, 130, 12473, 10111, 102686, 10108, 109, 10150, 119, 126, 12473, 117, 10894, 10347, 17585, 10135, 10105, 20990, 20511, 27714, 117, 10473, 12172, 10472, 23763, 10841, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "that", "under", "the", "sale", "agreement", ",", "full", "financial", "details", "of", "which", "were", "not", "revealed", ",", "ISS", "would", "acquire", "a", "25", "percent", "stake", "in", "Aa", "##xis", "which", "would", "become", "an", "associated", "company", "within", "the", "ISS", "group", "trading", "under", "the", "ISS", "name", "and", "logo", "." ], "ids": [ 10377, 12415, 10189, 10571, 10105, 15488, 25432, 117, 13375, 20570, 29500, 10108, 10319, 10309, 10472, 23127, 117, 58915, 10894, 86753, 169, 10258, 22362, 90081, 10106, 80131, 53496, 10319, 10894, 13461, 10151, 18107, 12100, 12381, 10105, 58915, 11795, 46663, 10571, 10105, 58915, 11324, 10111, 18655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "ISS", "Inc", "senior", "management", "would", "continue", "to", "run", "the", "business", "under", "the", "new", "owners", ",", "it", "said", "." ], "ids": [ 58915, 13604, 17843, 17150, 10894, 17734, 10114, 14095, 10105, 14155, 10571, 10105, 10751, 38437, 117, 10271, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Danish", "anal", "##yst", "##s", "recently", "estimated", "ISS", "Inc", "'", "s", "sale", "value", "at", "up", "to", "$", "118", "million", "." ], "ids": [ 29876, 106615, 62769, 10107, 23746, 25267, 58915, 13604, 112, 187, 15488, 19211, 10160, 10741, 10114, 109, 17515, 12473, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ISS", "said", "that", "the", "deal", "included", "ISS", "Inc", "operations", "in", "Mexico", "and", "the", "sale", "of", "ISS", "Inc", "interests", "in", "Brazil", "would", "be", "discussed", "." ], "ids": [ 58915, 12415, 10189, 10105, 19918, 12742, 58915, 13604, 18356, 10106, 10490, 10111, 10105, 15488, 10108, 58915, 13604, 36026, 10106, 16765, 10894, 10347, 55424, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "On", "August", "15", ",", "ISS", "published", "first", "half", "1996", "results", "showing", "a", "two", "billion", "crown", "loss", "caused", "by", "fa", "##ls", "##ified", "accounts", "in", "ISS", "Inc", "and", "said", "that", "charges", "and", "provisions", "earlier", "estimated", "at", "$", "100", "million", "would", "have", "to", "be", "increased", "to", "$", "146", "million", "." ], "ids": [ 10576, 10735, 10208, 117, 58915, 12304, 10422, 13877, 10389, 17466, 37501, 169, 10551, 25848, 52990, 18576, 19513, 10155, 12211, 11747, 31825, 44546, 10106, 58915, 13604, 10111, 12415, 10189, 31128, 10111, 67623, 18905, 25267, 10160, 109, 10407, 12473, 10894, 10529, 10114, 10347, 19299, 10114, 109, 19680, 12473, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "also", "wrote", "down", "all", "ISS", "Inc", "good", "##wil", "##l", "and", "Wednesday", "'", "s", "statement", "said", "that", "the", "Aa", "##xis", "purchase", "would", "not", "ne", "##ces", "##sita", "##te", "further", "write", "down", "if", "the", "sale", "were", "completed", "according", "to", "the", "terms", "of", "the", "letter", "of", "intent", "." ], "ids": [ 10377, 10379, 13954, 12935, 10435, 58915, 13604, 15198, 70185, 10161, 10111, 57611, 112, 187, 33311, 12415, 10189, 10105, 80131, 53496, 37891, 10894, 10472, 10554, 14585, 69999, 10216, 14586, 28685, 12935, 12277, 10105, 15488, 10309, 15782, 18071, 10114, 10105, 18873, 10108, 10105, 19310, 10108, 58692, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Steve", "Wei", "##zma", "##n", ",", "Copenhagen", "news", "##room", "+", "45", "339", "##69", "##65", "##0" ], "ids": [ 118, 118, 13308, 37343, 32022, 10115, 117, 45832, 14424, 25525, 116, 10827, 34753, 85147, 74327, 10929 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraq", "bal", "##ks", "at", "U", ".", "N", ".", "staff", "for", "oil", "-", "for", "-", "food", "deal", "." ], "ids": [ 21455, 20873, 11676, 10160, 158, 119, 151, 119, 18927, 10142, 21073, 118, 10142, 118, 18301, 19918, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Evelyn", "Leopold" ], "ids": [ 51057, 22532 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "UN", "##IT", "##ED", "NA", "##TION", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 26578, 37611, 33809, 56586, 98207, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraq", "has", "bal", "##ked", "at", "the", "number", "of", "U", ".", "N", ".", "staff", "needed", "to", "implement", "the", "oil", "-", "for", "-", "food", "deal", ",", "bl", "##aming", "the", "United", "States", "for", "ins", "##isti", "##ng", "on", "string", "##ent", "monitoring", "." ], "ids": [ 21455, 10393, 20873, 30511, 10160, 10105, 11487, 10108, 158, 119, 151, 119, 18927, 23794, 10114, 92292, 10105, 21073, 118, 10142, 118, 18301, 19918, 117, 21484, 48366, 10105, 10609, 10859, 10142, 15498, 23620, 10376, 10135, 33714, 11405, 74265, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "comments", "to", "reporter", "##s", "and", "a", "statement", "on", "Tuesday", ",", "Iraqi", "diplomat", "##s", "said", "the", "cost", "of", "the", "monitor", "##s", "and", "other", "staff", ",", "which", "Baghdad", "has", "to", "finance", ",", "sur", "##passes", "funds", "allocated", "for", "electricity", ",", "water", ",", "se", "##wers", ",", "education", "and", "agriculture", "." ], "ids": [ 10167, 61565, 10114, 41408, 10107, 10111, 169, 33311, 10135, 70245, 117, 57806, 45652, 10107, 12415, 10105, 18849, 10108, 10105, 60774, 10107, 10111, 10684, 18927, 117, 10319, 73055, 10393, 10114, 48053, 117, 10326, 96658, 32067, 99109, 10142, 55955, 117, 12286, 117, 10126, 45868, 117, 14943, 10111, 29309, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "issue", "was", "a", "May", "20", "agreement", "allowing", "Iraq", "to", "sell", "$", "2", "billion", "worth", "of", "oil", "to", "purchase", "badly", "needed", "food", ",", "medicine", "and", "other", "supplies", "to", "ea", "##se", "the", "impact", "of", "san", "##ctions", "in", "force", "since", "its", "troops", "in", "##vaded", "Kuwait", "in", "August", "1990", "." ], "ids": [ 11699, 15557, 10134, 169, 10725, 10197, 25432, 28357, 21455, 10114, 36300, 109, 123, 25848, 43509, 10108, 21073, 10114, 37891, 91810, 23794, 18301, 117, 28219, 10111, 10684, 49963, 10114, 22257, 10341, 10105, 21316, 10108, 14608, 42068, 10106, 15031, 11764, 10474, 20836, 10106, 108868, 44892, 10106, 10735, 10420, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Iraqi", "statement", "said", "the", "United", "States", "was", "\"", "inter", "##feri", "##ng", "and", "pressi", "##ng", "to", "au", "##gment", "the", "number", "of", "international", "staff", "and", "this", "is", "not", "legal", "and", "not", "just", "##ified", ".", "\"" ], "ids": [ 10117, 57806, 33311, 12415, 10105, 10609, 10859, 10134, 107, 22021, 59908, 10376, 10111, 45036, 10376, 10114, 10257, 36282, 10105, 11487, 10108, 12533, 18927, 10111, 10531, 10124, 10472, 17139, 10111, 10472, 12820, 31825, 119, 107 ], "entity": [ "O", "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iraq", "'", "s", "deputy", "ambassador", ",", "Sa", "##eed", "Hasan", ",", "noted", "that", "the", "May", "20", "accord", "said", "that", "the", "number", "of", "personnel", "would", "be", "determined", "by", "the", "United", "Nations", "and", "that", "the", "government", "of", "Iraq", "would", "be", "consul", "##ted", "." ], "ids": [ 21455, 112, 187, 45404, 74853, 117, 12404, 40154, 36578, 117, 18575, 10189, 10105, 10725, 10197, 35233, 12415, 10189, 10105, 11487, 10108, 23889, 10894, 10347, 30706, 10155, 10105, 10609, 15145, 10111, 10189, 10105, 12047, 10108, 21455, 10894, 10347, 53704, 11912, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sa", "##eed", "in", "his", "comments", "did", "not", "threat", "##en", "to", "call", "off", "the", "deal", "and", "the", "U", ".", "N", ".", "officials", "said", "they", "expected", "it", "to", "go", "into", "force", "next", "month", "after", "Secretary", "-", "General", "Bou", "##tros", "Bou", "##tros", "-", "G", "##hali", "reports", "that", "arrangements", "are", "in", "place", "." ], "ids": [ 12404, 40154, 10106, 10226, 61565, 12172, 10472, 41256, 10136, 10114, 20575, 11898, 10105, 19918, 10111, 10105, 158, 119, 151, 119, 27730, 12415, 10689, 25973, 10271, 10114, 11783, 10708, 15031, 13451, 14064, 10662, 19382, 118, 11220, 62583, 34715, 62583, 34715, 118, 144, 63889, 26610, 10189, 56449, 10301, 10106, 11192, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "U", ".", "N", ".", "Department", "of", "Human", "##itarian", "Affairs", "(", "DH", "##A", ")", ",", "which", "has", "to", "coordinate", "the", "distribution", "of", "food", ",", "medicine", "and", "other", "goods", ",", "increased", "the", "number", "of", "monitor", "##s", "earlier", "this", "month", "at", "the", "ins", "##isten", "##ce", "of", "the", "United", "States", "." ], "ids": [ 10117, 158, 119, 151, 119, 12933, 10108, 15426, 63378, 20891, 113, 83164, 10738, 114, 117, 10319, 10393, 10114, 94091, 10105, 18477, 10108, 18301, 117, 28219, 10111, 10684, 36931, 117, 19299, 10105, 11487, 10108, 60774, 10107, 18905, 10531, 14064, 10160, 10105, 15498, 17146, 10419, 10108, 10105, 10609, 10859, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "According", "to", "U", ".", "N", ".", "officials", "and", "diplomat", "##s", ",", "Iraq", "would", "have", "about", "$", "1", ".", "13", "billion", "to", "spend", "for", "food", ",", "medicine", "and", "other", "goods", "after", "mon", "##ies", "for", "a", "rep", "##aration", "##s", "fund", "for", "Gulf", "War", "victims", "and", "costs", "for", "U", ".", "N", ".", "weapons", "inspection", "##s", "were", "de", "##duct", "##ed", "." ], "ids": [ 14156, 10114, 158, 119, 151, 119, 27730, 10111, 45652, 10107, 117, 21455, 10894, 10529, 10978, 109, 122, 119, 10249, 25848, 10114, 63222, 10142, 18301, 117, 28219, 10111, 10684, 36931, 10662, 34372, 11624, 10142, 169, 76456, 104614, 10107, 31771, 10142, 28239, 11277, 41205, 10111, 34495, 10142, 158, 119, 151, 119, 31881, 99455, 10107, 10309, 10104, 54489, 10336, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "cost", "of", "the", "U", ".", "N", ".", "staff", "over", "##see", "##ing", "the", "distribution", "of", "food", "and", "other", "supplies", "was", "estimated", "to", "cost", "$", "31", "million", "." ], "ids": [ 10117, 18849, 10108, 10105, 158, 119, 151, 119, 18927, 10491, 20262, 10230, 10105, 18477, 10108, 18301, 10111, 10684, 49963, 10134, 25267, 10114, 18849, 109, 10413, 12473, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "addition", "another", "$", "12", "million", "was", "antic", "##ipa", "##ted", "to", "cover", "other", "ex", "##penses", ",", "such", "as", "oil", "experts", "and", "administrative", "costs", "." ], "ids": [ 10167, 14763, 12864, 109, 10186, 12473, 10134, 33687, 60287, 11912, 10114, 16068, 10684, 11419, 57025, 117, 11049, 10146, 21073, 47306, 10111, 18401, 34495, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "the", "distribution", "and", "supervision", "of", "human", "##itarian", "supplies", "the", "United", "Nations", "estimated", "it", "needed", "1", ",", "190", "people", ",", "including", "267", "international", "staff", "and", "923", "Iraqi", "support", "staff", "." ], "ids": [ 11399, 10105, 18477, 10111, 83193, 10108, 14179, 63378, 49963, 10105, 10609, 15145, 25267, 10271, 23794, 122, 117, 16664, 11426, 117, 11198, 29729, 12533, 18927, 10111, 75979, 57806, 13145, 18927, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Of", "this", "number", "64", "foreign", "and", "598", "local", "staff", "would", "be", "in", "the", "northern", "Kur", "##dish", "provinces", ",", "no", "longer", "the", "direct", "control", "of", "the", "Baghdad", "government", "." ], "ids": [ 12610, 10531, 11487, 11295, 20796, 10111, 59066, 11436, 18927, 10894, 10347, 10106, 10105, 17335, 61912, 67522, 31209, 117, 10192, 20165, 10105, 16934, 12608, 10108, 10105, 73055, 12047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Another", "203", "international", "staff", "and", "325", "Iraqi", "##s", "would", "run", "the", "programme", "in", "the", "central", "and", "southern", "parts", "of", "the", "country", "." ], "ids": [ 17101, 20235, 12533, 18927, 10111, 25843, 57806, 10107, 10894, 14095, 10105, 19611, 10106, 10105, 12397, 10111, 17156, 15569, 10108, 10105, 12723, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "are", "also", "14", "monitor", "##s", "to", "watch", "oil", "flows", ",", "32", "customs", "experts", "and", "four", "New", "York", "-", "based", "oil", "experts", "or", "over", "##see", "##rs", "to", "app", "##rove", "contracts", "." ], "ids": [ 11723, 10301, 10379, 10247, 60774, 10107, 10114, 34481, 21073, 41271, 117, 10842, 89907, 47306, 10111, 11598, 10287, 10482, 118, 11610, 21073, 47306, 10345, 10491, 20262, 10943, 10114, 72894, 75662, 69690, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ya", "##sus", "##hi", "Ak", "##ashi", ",", "the", "DH", "##A", "under", "##se", "##creta", "##ry", "-", "general", ",", "told", "the", "Security", "Council", "last", "week", "that", "the", "\"", "financial", "requirements", "to", "support", "the", "(", "human", "##itarian", ")", "programme", "represent", "a", "very", "modest", "percent", "##ile", "of", "the", "total", ".", ".", "." ], "ids": [ 25148, 16824, 11924, 71275, 51151, 117, 10105, 83164, 10738, 10571, 10341, 104988, 10908, 118, 11389, 117, 21937, 10105, 20924, 12821, 12469, 16118, 10189, 10105, 107, 20570, 39282, 10114, 13145, 10105, 113, 14179, 63378, 114, 19611, 30382, 169, 12558, 106608, 22362, 12808, 10108, 10105, 11339, 119, 119, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "roughly", "3", "percent", ".", "\"" ], "ids": [ 40540, 124, 22362, 119, 107 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "OF", "##F", "##IC", "##IA", "##L", "J", "##O", "##UR", "##NA", "##L", "CO", "##NT", "##EN", "##TS", "-", "O", "##J", "C", "251", "OF", "AU", "##G", "##US", "##T", "29", ",", "1996", "." ], "ids": [ 23240, 11565, 30889, 35976, 11369, 147, 11403, 98348, 36742, 11369, 32992, 77261, 50655, 36545, 118, 152, 15417, 140, 26123, 23240, 29088, 11447, 32612, 11090, 10386, 117, 10389, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*" ], "ids": [ 115 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "(", "Note", "-", "contents", "are", "displayed", "in", "reverse", "order", "to", "that", "in", "the", "printed", "Journal", ")" ], "ids": [ 113, 20231, 118, 97831, 10301, 52991, 10106, 60971, 12990, 10114, 10189, 10106, 10105, 44632, 11929, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "*" ], "ids": [ 115 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Aircraft", "noise", "and", "emissions", "Economic", "assessment", "of", "proposals", "for", "a", "common", "European", "Union", "position", "for", "CA", "##EP", "4", "Consulta", "##ncy", "services", "Call", "for", "tender", "(", "96", "/", "C", "251", "/", "09", ")" ], "ids": [ 22892, 58638, 10111, 88126, 19080, 62492, 10108, 93646, 10142, 169, 14624, 11914, 11457, 12956, 10142, 24707, 59742, 125, 65456, 24166, 12639, 23553, 10142, 96486, 113, 12308, 120, 140, 26123, 120, 11035, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "##vision", "of", "over", "##land", "transport", "services", "for", "material", "and", "equipment", "for", "European", "Commission", "delegation", "##s", "in", "European", "Third", "Countries", "and", "in", "the", "New", "Independent", "States", "(", "N", "##IS", ")", "Contra", "##ct", "notice", "No", "TR", "##A", "/", "96", "/", "003", "/", "IA", "##E", "-", "3", "-", "Open", "procedure", "(", "96", "/", "C", "251", "/", "08", ")" ], "ids": [ 14021, 62632, 10108, 10491, 11080, 16024, 12639, 10142, 13540, 10111, 24518, 10142, 11914, 14941, 98689, 10107, 10106, 11914, 16788, 78739, 10111, 10106, 10105, 10287, 20199, 10859, 113, 151, 19088, 114, 62046, 14526, 48323, 10657, 80047, 10738, 120, 12308, 120, 26861, 120, 87769, 11259, 118, 124, 118, 11919, 48244, 113, 12308, 120, 140, 26123, 120, 11052, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 2, 6, 6, 9, 9, 9, 2, 6, 6, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Micro", "##fic", "##he", "production", "system", "Open", "procedure", "In", "##vita", "##tion", "to", "tender", "DI", "96", "/", "04", "Micro", "##mation", "(", "96", "/", "C", "251", "/", "07", ")" ], "ids": [ 78857, 35214, 11643, 12116, 11787, 11919, 48244, 10167, 43130, 10822, 10114, 96486, 110014, 12308, 120, 10814, 78857, 41856, 113, 12308, 120, 140, 26123, 120, 10878, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Aircraft", "noise", "and", "emissions", "Gas", "##eo", "##us", "emissions", "from", "aircraft", "in", "the", "atmosphere", "Consulta", "##ncy", "services", "Call", "for", "tender", "(", "96", "/", "C", "251", "/", "06", ")" ], "ids": [ 22892, 58638, 10111, 88126, 34874, 15998, 10251, 88126, 10188, 16167, 10106, 10105, 59043, 65456, 24166, 12639, 23553, 10142, 96486, 113, 12308, 120, 140, 26123, 120, 10719, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ta", "##cis", "-", "support", "framework", "for", "the", "coordination", "and", "development", "of", "the", "Ta", "##cis", "information", "and", "communications", "programme", "Notice", "of", "open", "invitation", "to", "tender", "for", "a", "public", "service", "contract", "(", "96", "/", "C", "251", "/", "05", ")" ], "ids": [ 14248, 18390, 118, 13145, 54387, 10142, 10105, 89371, 10111, 13405, 10108, 10105, 14248, 18390, 12929, 10111, 42919, 19611, 108643, 10108, 14087, 77674, 10114, 96486, 10142, 169, 11683, 11989, 16108, 113, 12308, 120, 140, 26123, 120, 10831, 114 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##UN", "##CI", "##L", "RE", "##G", "##UL", "##AT", "##ION", "(", "EE", "##C", ")", "No", "406", "##4", "/", "89", "(", "96", "/", "C", "251", "/", "04", ")" ], "ids": [ 32992, 69849, 89955, 11369, 71033, 11447, 100673, 32071, 52980, 113, 36502, 10858, 114, 10657, 28081, 11011, 120, 12642, 113, 12308, 120, 140, 26123, 120, 10814, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##IN", "##AN", "##CI", "##AL", "ST", "##AT", "##EM", "##EN", "##TS", "OF", "THE", "EU", "##RO", "##P", "##EA", "##N", "CO", "##AL", "AND", "ST", "##EE", "##L", "COM", "##M", "##UN", "##IT", "##Y", "AT", "31", "DE", "##CE", "##M", "##B", "##ER", "1995", "(", "96", "/", "C", "251", "/", "03", ")" ], "ids": [ 143, 27128, 41275, 89955, 32002, 53317, 32071, 67753, 50655, 36545, 23240, 17443, 17751, 35066, 11127, 36789, 11537, 32992, 32002, 52428, 53317, 95825, 11369, 80645, 11517, 69849, 37611, 14703, 30554, 10413, 25067, 43161, 11517, 11274, 24093, 10436, 113, 12308, 120, 140, 26123, 120, 10907, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ave", "##rage", "prices", "and", "representative", "prices", "for", "table", "wine", "##s", "at", "the", "various", "marketing", "centres", "(", "96", "/", "C", "251", "/", "02", ")" ], "ids": [ 50998, 40696, 57476, 10111, 33786, 57476, 10142, 21783, 43558, 10107, 10160, 10105, 13547, 29465, 35208, 113, 12308, 120, 140, 26123, 120, 10983, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "E", "##cu", "(", "1", ")", "28", "August", "1996", "(", "96", "/", "C", "251", "/", "01", ")", "EN", "##D", "OF", "DO", "##C", "##UM", "##EN", "##T", "." ], "ids": [ 142, 12352, 113, 122, 114, 10348, 10735, 10389, 113, 12308, 120, 140, 26123, 120, 10669, 114, 31278, 11490, 23240, 99843, 10858, 72679, 50655, 11090, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EU", "Commission", "cool", "on", "changing", "be", "##ef", "cu", "##ll", "plan", "." ], "ids": [ 17751, 14941, 67420, 10135, 43068, 10347, 16822, 10854, 11231, 13065, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "29" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "European", "Commission", "said", "on", "Thursday", "it", "would", "study", "scientific", "reports", "saying", "Britain", "'", "s", "ma", "##d", "co", "##w", "epi", "##demi", "##c", "would", "die", "out", "by", "2001", "but", "offered", "little", "pro", "##spect", "the", "findings", "would", "change", "an", "agreed", "sl", "##au", "##ghter", "campaign", "." ], "ids": [ 10117, 11914, 14941, 12415, 10135, 67067, 10271, 10894, 14687, 23301, 26610, 22807, 16032, 112, 187, 10824, 10162, 11170, 10874, 17247, 108986, 10350, 10894, 10128, 10950, 10155, 10272, 10473, 20841, 16745, 11284, 77229, 10105, 79441, 10894, 15453, 10151, 25577, 38523, 11705, 45953, 17323, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Ob", "##vio", "##usly", "we", "are", "interested", "in", "this", "research", "." ], "ids": [ 107, 43019, 18574, 61289, 11951, 10301, 40905, 10106, 10531, 14108, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "will", "ask", "the", "(", "EU", ")", "scientific", "and", "vet", "##erina", "##ry", "committee", "to", "ex", "##amine", "it", ",", "\"", "Commission", "spoke", "##sman", "Gerard", "Kiel", "##y", "told", "Reuters", "." ], "ids": [ 12865, 11337, 63001, 10105, 113, 17751, 114, 23301, 10111, 56975, 90643, 10908, 27634, 10114, 11419, 45980, 10271, 117, 107, 14941, 50005, 24305, 31882, 32329, 10157, 21937, 46617, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 9, 3, 9 ] }, { "tokens": [ "But", "he", "added", "that", "new", "research", "into", "the", "dynamics", "of", "the", "bo", "##vine", "sp", "##ong", "##if", "##or", "##m", "en", "##ce", "##pha", "##lop", "##ath", "##y", "(", "BS", "##E", ")", ",", "a", "fatal", "brain", "-", "was", "##ting", "disease", "suffered", "by", "cattle", ",", "was", "unlikely", "to", "alter", "a", "sl", "##au", "##ghter", "plan", "agreed", "by", "Britain", "and", "its", "14", "EU", "partners", "." ], "ids": [ 16976, 10261, 16288, 10189, 10751, 14108, 10708, 10105, 95674, 10108, 10105, 20506, 30396, 32650, 13891, 13918, 10667, 10147, 10110, 10419, 37590, 101908, 44196, 10157, 113, 43436, 11259, 114, 117, 169, 71126, 34467, 118, 10134, 12141, 21911, 26090, 10155, 56980, 117, 10134, 107914, 10114, 42141, 169, 38523, 11705, 45953, 13065, 25577, 10155, 16032, 10111, 10474, 10247, 17751, 48125, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "\"", "We", "agreed", "that", "following", "detailed", "scientific", "analysis", "using", "a", "method", "##ology", "which", "would", "take", "out", "the", "maximum", "number", "of", "BS", "##E", "cases", "possible", "." ], "ids": [ 107, 12865, 25577, 10189, 11901, 47368, 23301, 19129, 13382, 169, 22414, 18096, 10319, 10894, 13574, 10950, 10105, 22393, 11487, 10108, 43436, 11259, 16480, 14128, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "I", "think", "it", "would", "be", "very", "difficult", "to", "sell", "to", "the", "European", "Commission", "a", "programme", "which", "would", "involve", "the", "elimination", "of", "fewer", "BS", "##E", "cases", ",", "\"", "Kiel", "##y", "said", "." ], "ids": [ 146, 27874, 10271, 10894, 10347, 12558, 25232, 10114, 36300, 10114, 10105, 11914, 14941, 169, 19611, 10319, 10894, 85232, 10105, 86698, 10108, 74139, 43436, 11259, 16480, 117, 107, 32329, 10157, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "We", "will", "look", "at", "our", "approach", "(", "to", "the", "plan", ")", "but", "we", "wo", "n", "'", "t", "get", "involved", "with", "the", "number", "of", "animals", "to", "be", "sl", "##au", "##ghter", "##ed", ",", "\"", "he", "said", "." ], "ids": [ 107, 12865, 11337, 25157, 10160, 17446, 23068, 113, 10114, 10105, 13065, 114, 10473, 11951, 12796, 182, 112, 188, 15329, 16247, 10169, 10105, 11487, 10108, 22528, 10114, 10347, 38523, 11705, 45953, 10336, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "always", "avoid", "##ed", "the", "question", "of", "numbers", "of", "animals", "to", "be", "sl", "##au", "##ghter", "##ed", ",", "that", "'", "s", "not", "the", "issue", "." ], "ids": [ 107, 12865, 10529, 19540, 33253, 10336, 10105, 20210, 10108, 20953, 10108, 22528, 10114, 10347, 38523, 11705, 45953, 10336, 117, 10189, 112, 187, 10472, 10105, 15557, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "issue", "is", "the", "protection", "of", "consumers", "'", "health", "and", "the", "rapid", "era", "##dication", "of", "BS", "##E", ",", "\"", "he", "added", "." ], "ids": [ 10117, 15557, 10124, 10105, 20344, 10108, 97129, 112, 17004, 10111, 10105, 39782, 10411, 93141, 10108, 43436, 11259, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "reaction", "is", "likely", "to", "disa", "##ppo", "##int", "British", "farmers", ",", "who", "seized", "on", "research", "by", "Oxford", "scientists", "in", "the", "scientific", "journal", "Nature", "saying", "it", "would", "be", "hard", "to", "get", "ri", "##d", "of", "the", "disease", "any", "faster", "than", "2001", "without", "killing", "vast", "numbers", "of", "cattle", "." ], "ids": [ 10117, 35723, 10124, 22497, 10114, 36474, 45565, 16261, 11160, 55543, 117, 10479, 80176, 10135, 14108, 10155, 11109, 49871, 10106, 10105, 23301, 19061, 13937, 22807, 10271, 10894, 10347, 19118, 10114, 15329, 29956, 10162, 10108, 10105, 21911, 11178, 66109, 11084, 10272, 13663, 34248, 35472, 20953, 10108, 56980, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "researchers", "predicted", "there", "would", "be", "340", "new", "infection", "##s", "and", "14", ",", "000", "new", "cases", "of", "BS", "##E", "before", "2001", "." ], "ids": [ 10117, 53719, 98075, 11155, 10894, 10347, 22405, 10751, 55223, 10107, 10111, 10247, 117, 10259, 10751, 16480, 10108, 43436, 11259, 11360, 10272, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "British", "farmers", "'", "leader", "called", "on", "Wednesday", "for", "an", "ur", "##gent", "meeting", "with", "ministers", "to", "discuss", "the", "report", "." ], "ids": [ 11160, 55543, 112, 15014, 11552, 10135, 57611, 10142, 10151, 10399, 22500, 19822, 10169, 66281, 10114, 71695, 10105, 17553, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "hope", "the", "government", "will", "now", "make", "it", "clear", "they", "believe", "there", "is", "a", "better", "way", "of", "dealing", "with", "this", "issue", ",", "\"", "National", "Farmer", "##s", "Union", "president", "Sir", "David", "Na", "##ish", "told", "BBC", "radio", "." ], "ids": [ 107, 146, 50725, 10105, 12047, 11337, 11858, 13086, 10271, 24866, 10689, 30587, 11155, 10124, 169, 18322, 13170, 10108, 73082, 10169, 10531, 15557, 117, 107, 10655, 57316, 10107, 11457, 12931, 12852, 10804, 10685, 15529, 21937, 11721, 12429, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 4, 8, 8, 9, 3, 7, 9 ] }, { "tokens": [ "Na", "##ish", "said", "there", "was", "no", "need", "for", "Britain", "to", "carry", "out", "a", "planned", "cu", "##ll", "of", "some", "147", ",", "000", "cattle", "to", "which", "it", "had", "re", "##lu", "##cta", "##ntly", "agreed", "to", "placa", "##te", "its", "European", "partners", "." ], "ids": [ 10685, 15529, 12415, 11155, 10134, 10192, 17367, 10142, 16032, 10114, 31626, 10950, 169, 24292, 10854, 11231, 10108, 11152, 19811, 117, 10259, 56980, 10114, 10319, 10271, 10374, 11639, 11435, 24290, 97456, 25577, 10114, 57474, 10216, 10474, 11914, 48125, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "\"", "The", "new", "evidence", "to", "me", "means", "some", "of", "that", "proposal", "should", "be", "re", "-", "examined", "because", "we", "could", "get", "away", "with", "considerably", "less", "animals", "being", "cu", "##lle", "##d", "if", "in", "fact", "scientists", "throughout", "Europe", "accepted", "this", "evidence", ",", "\"", "Na", "##ish", "said", "." ], "ids": [ 107, 10117, 10751, 18713, 10114, 10911, 17574, 11152, 10108, 10189, 43542, 14819, 10347, 11639, 118, 101657, 12373, 11951, 12174, 15329, 14942, 10169, 91499, 15306, 22528, 11223, 10854, 11270, 10162, 12277, 10106, 18638, 49871, 15916, 11767, 24926, 10531, 18713, 117, 107, 10685, 15529, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "The", "report", "could", "well", "re", "##open", "a", "dama", "##ging", "row", "between", "Britain", "and", "the", "EU", ",", "which", "sl", "##app", "##ed", "a", "worldwide", "ban", "on", "British", "be", "##ef", "after", "the", "government", "said", "there", "could", "be", "a", "link", "between", "BS", "##E", "and", "the", "human", "form", "of", "the", "disease", "." ], "ids": [ 10117, 17553, 12174, 11206, 11639, 47656, 169, 60990, 13808, 45006, 10948, 16032, 10111, 10105, 17751, 117, 10319, 38523, 102295, 10336, 169, 31197, 11915, 10135, 11160, 10347, 16822, 10662, 10105, 12047, 12415, 11155, 12174, 10347, 169, 26192, 10948, 43436, 11259, 10111, 10105, 14179, 12188, 10108, 10105, 21911, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "issue", "fl", "##ared", "in", "in", "March", "when", "government", "scientists", "admitted", "that", "people", "could", "become", "in", "##fected", "with", "Creu", "##tz", "##feldt", "-", "Jakob", "Disease", "(", "CJ", "##D", ")", "from", "eating", "BS", "##E", "-", "in", "##fected", "be", "##ef", "." ], "ids": [ 10117, 15557, 58768, 104931, 10106, 10106, 11144, 10841, 12047, 49871, 40345, 10189, 11426, 12174, 13461, 10106, 108881, 10169, 94008, 13695, 91059, 118, 22110, 53878, 113, 80622, 11490, 114, 10188, 77596, 43436, 11259, 118, 10106, 108881, 10347, 16822, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 2, 6, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "French", "farmers", "set", "up", "block", "##ades", "in", "ma", "##d", "co", "##w", "protest", "." ], "ids": [ 11894, 55543, 11847, 10741, 27242, 16013, 10106, 10824, 10162, 11170, 10874, 36627, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thousand", "##s", "of", "farmers", "threw", "up", "road", "##blo", "##cks", "across", "France", "over", "##night", ",", "stop", "##ping", "and", "check", "##ing", "lor", "##ries", "suspected", "of", "import", "##ing", "meat", "from", "outside", "the", "European", "Union", ",", "French", "radios", "reported", "on", "Thursday", "." ], "ids": [ 61795, 10107, 10108, 55543, 80516, 10741, 15485, 71933, 18676, 15130, 10688, 10491, 45217, 117, 20517, 15398, 10111, 43662, 10230, 21916, 15388, 80337, 10108, 67622, 10230, 64080, 10188, 17555, 10105, 11914, 11457, 117, 11894, 86275, 15943, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Radio", "stations", "said", "around", "15", ",", "000", "farmers", ",", "anger", "##ed", "by", "a", "fall", "in", "be", "##ef", "prices", "following", "the", "ma", "##d", "co", "##w", "disease", "crisis", ",", "staged", "protests", "in", "many", "areas", "and", "block", "##ade", "##d", "several", "main", "roads", "and", "motor", "##ways", "." ], "ids": [ 12083, 18592, 12415, 12166, 10208, 117, 10259, 55543, 117, 46464, 10336, 10155, 169, 18042, 10106, 10347, 16822, 57476, 11901, 10105, 10824, 10162, 11170, 10874, 21911, 22859, 117, 84310, 60931, 10106, 11299, 14544, 10111, 27242, 12930, 10162, 11736, 12126, 36970, 10111, 15257, 36869, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "By", "3", "a", ".", "m", ".", "(", "010", "##0", "GMT", ")", "more", "than", "2", ",", "000", "lor", "##ries", "had", "been", "stopped", "and", "search", "##ed", "." ], "ids": [ 12716, 124, 169, 119, 181, 119, 113, 49470, 10929, 20362, 114, 10798, 11084, 123, 117, 10259, 21916, 15388, 10374, 10590, 40949, 10111, 22419, 10336, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "European", "be", "##ef", "sales", "plu", "##nge", "##d", "after", "Britain", "announced", "the", "discovery", "of", "a", "likely", "link", "between", "bo", "##vine", "sp", "##ong", "##if", "##or", "##m", "en", "##ce", "##pha", "##lop", "##ath", "##y", "(", "BS", "##E", ")", ",", "or", "ma", "##d", "co", "##w", "disease", ",", "and", "its", "fatal", "human", "equivalent", "Creu", "##tz", "##feldt", "-", "Jakob", "Disease", "(", "CJ", "##D", ")", "." ], "ids": [ 11914, 10347, 16822, 23857, 13651, 18180, 10162, 10662, 16032, 13854, 10105, 30419, 10108, 169, 22497, 26192, 10948, 20506, 30396, 32650, 13891, 13918, 10667, 10147, 10110, 10419, 37590, 101908, 44196, 10157, 113, 43436, 11259, 114, 117, 10345, 10824, 10162, 11170, 10874, 21911, 117, 10111, 10474, 71126, 14179, 30647, 94008, 13695, 91059, 118, 22110, 53878, 113, 80622, 11490, 114, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 2, 6, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "BR", "##IT", "##IS", "##H", "MA", "##ST", "##ER", "##S", "SEC", "##ON", "##D", "R", "##O", "##UN", "##D", "SC", "##OR", "##ES", "." ], "ids": [ 41525, 11369, 11565, 118, 49351, 37611, 19088, 12396, 27277, 32995, 24093, 10731, 92031, 30118, 11490, 155, 11403, 69849, 11490, 18137, 42622, 25054, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##RT", "##HA", "##MP", "##TO", "##N", ",", "England", "1996", "-", "08", "-", "29" ], "ids": [ 49307, 46935, 58132, 79936, 60493, 11537, 117, 11701, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "scores", "after" ], "ids": [ 100085, 49931, 10662 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "the", "second", "round", "of", "the", "British", "Masters", "on", "Thursday", "(", "British" ], "ids": [ 10105, 11132, 13569, 10108, 10105, 11160, 20622, 10135, 67067, 113, 11160 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 2 ] }, { "tokens": [ "unless", "stated", ")", ":" ], "ids": [ 60015, 17067, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "140", "Robert", "Allen", "##by", "(", "Australia", ")", "69", "71", ",", "Mark", "R", "##oe", "69", "71" ], "ids": [ 13958, 10820, 15101, 11530, 113, 11729, 114, 12573, 12513, 117, 11997, 155, 20085, 12573, 12513 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "141", "Francisco", "Cea", "(", "Spain", ")", "70", "71", ",", "Gavin", "Lev", "##ens", "##on", "(", "South", "Africa", ")" ], "ids": [ 19578, 11798, 109435, 113, 16149, 114, 10923, 12513, 117, 57112, 51644, 12457, 10263, 113, 11056, 12880, 114 ], "entity": [ "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 5, 9 ] }, { "tokens": [ "66", "75" ], "ids": [ 12215, 11417 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "142", "Daniel", "Cho", "##pra", "(", "Sweden", ")", "74", "68" ], "ids": [ 19893, 11792, 50690, 30631, 113, 20937, 114, 12535, 12370 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "143", "David", "Gil", "##ford", "69", "74" ], "ids": [ 19510, 10804, 26463, 13387, 12573, 12535 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "144", "Peter", "O", "'", "Mall", "##ey", "(", "Australia", ")", "71", "73", ",", "Costa", "##ntino", "Rocca", "(", "Italy", ")" ], "ids": [ 18393, 10979, 152, 112, 48719, 13005, 113, 11729, 114, 12513, 12545, 117, 13902, 44878, 63718, 113, 11619, 114 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "71", "73", ",", "Colin", "Mont", "##gom", "##erie", "68", "76", ",", "David", "Howell", "70", "74", ",", "Mark" ], "ids": [ 12513, 12545, 117, 20766, 19472, 72757, 25433, 12370, 12428, 117, 10804, 83382, 10923, 12535, 117, 11997 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4 ] }, { "tokens": [ "Davis", "71", "73" ], "ids": [ 14281, 12513, 12545 ], "entity": [ "B-PER", "O", "O" ], "entity_ids": [ 4, 9, 9 ] }, { "tokens": [ "145", "Peter", "Mitchell", "74", "71", ",", "Philip", "Walton", "(", "Ireland", ")", "71", "74", ",", "Re", "##tief" ], "ids": [ 17862, 10979, 19906, 12535, 12513, 117, 13324, 56487, 113, 14637, 114, 12513, 12535, 117, 20304, 108386 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "Goose", "##n", "(", "South", "Africa", ")", "71", "74", ",", "Ove", "Se", "##ll", "##berg", "(", "Sweden", ")", "71", "74", "," ], "ids": [ 106354, 10115, 113, 11056, 12880, 114, 12513, 12535, 117, 68710, 11045, 11231, 11348, 113, 20937, 114, 12513, 12535, 117 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Peter", "He", "##d", "##blo", "##m", "(", "Sweden", ")", "70", "75", ",", "Pedro", "Linha", "##rt", "(", "Spain", ")", "72", "73", "," ], "ids": [ 10979, 10357, 10162, 71933, 10147, 113, 20937, 114, 10923, 11417, 117, 12849, 85861, 10976, 113, 16149, 114, 12120, 12545, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Mike", "Clayton", "(", "Australia", ")", "69", "76", ",", "Emanuele", "Canon", "##ica", "(", "Italy", ")" ], "ids": [ 13270, 43687, 113, 11729, 114, 12573, 12428, 117, 64492, 44998, 11043, 113, 11619, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9 ] }, { "tokens": [ "69", "76", ",", "Miguel", "Angel", "Martin", "(", "Spain", ")", "75", "70" ], "ids": [ 12573, 12428, 117, 13905, 17567, 11235, 113, 16149, 114, 11417, 10923 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "146", "Ia", "##in", "P", "##yman", "71", "75", ",", "Eduardo", "Romero", "(", "Argentina", ")", "70", "76", ",", "Ian" ], "ids": [ 19680, 13959, 10245, 153, 66654, 12513, 11417, 117, 19131, 35337, 113, 12853, 114, 10923, 12428, 117, 16582 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 4 ] }, { "tokens": [ "Woo", "##sna", "##m", "70", "76", ",", "Miguel", "Angel", "Jim", "##ene", "##z", "(", "Spain", ")", "74", "72", ",", "K", "##las" ], "ids": [ 84270, 45981, 10147, 10923, 12428, 117, 13905, 17567, 14178, 12061, 10305, 113, 16149, 114, 12535, 12120, 117, 148, 13983 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "Eriksson", "(", "Sweden", ")", "71", "75", ",", "Paul", "Ea", "##les", "75", "71" ], "ids": [ 70145, 113, 20937, 114, 12513, 11417, 117, 10772, 47132, 11268, 11417, 12513 ], "entity": [ "B-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 4, 9, 1, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "147", "Antoine", "Le", "##bou", "##c", "(", "France", ")", "74", "73", ",", "Paul", "Curry", "76", "71", ",", "Andrew" ], "ids": [ 19811, 17926, 10281, 23723, 10350, 113, 10688, 114, 12535, 12545, 117, 10772, 84474, 12428, 12513, 117, 13999 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4 ] }, { "tokens": [ "Colt", "##art", "72", "75", ",", "Paul", "Law", "##rie", "72", "75", ",", "Jose", "Co", "##cere", "##s", "(", "Argentina", ")" ], "ids": [ 69952, 15391, 12120, 11417, 117, 10772, 13216, 12904, 12120, 11417, 117, 23029, 13098, 51159, 10107, 113, 12853, 114 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9 ] }, { "tokens": [ "69", "78", ",", "Raymond", "Russell", "69", "78", ",", "Roger", "Chapman", "71", "76", ",", "Paul" ], "ids": [ 12573, 12492, 117, 17326, 13481, 12573, 12492, 117, 13513, 33069, 12513, 12428, 117, 10772 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 9, 9, 9, 4 ] }, { "tokens": [ "Af", "##f", "##lec", "##k", "74", "73", "." ], "ids": [ 71164, 10575, 42507, 10174, 12535, 12545, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "SO", "##RE", "##NS", "##EN", "W", "##IN", "##S", "F", "##O", "##UR", "##TH", "ST", "##AG", "##E", "OF", "TOUR", "OF", "NET", "##H", "##ER", "##LA", "##ND", "##S", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 71020, 66014, 69196, 50655, 160, 27128, 10731, 143, 11403, 98348, 109166, 53317, 109865, 11259, 23240, 86526, 23240, 41645, 12396, 24093, 44376, 58521, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "DO", "##ET", "##IN", "##CH", "##EM", ",", "Netherlands", "1996", "-", "08", "-", "29" ], "ids": [ 99843, 52338, 27128, 86448, 67753, 117, 22043, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "and", "overall", "standing", "##s", "after", "the", "19", ".", "6", "kilometre", "fourth", "stage", "of", "the", "Tour", "of", "the", "Netherlands", "on", "Thursday", ",", "a", "time", "trial", "starting", "and", "finishing", "in", "Doe", "##tin", "##chem", "." ], "ids": [ 100085, 17466, 10111, 20947, 32173, 10107, 10662, 10105, 10270, 119, 127, 84485, 16918, 15365, 10108, 10105, 11595, 10108, 10105, 22043, 10135, 67067, 117, 169, 10635, 23626, 21868, 10111, 34348, 10106, 71335, 15364, 34884, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "1", ".", "Rolf", "So", "##rens", "##en", "(", "Denmark", ")", "Ra", "##bo", "##bank", "22", "minutes", "40", "seconds" ], "ids": [ 122, 119, 31371, 12882, 74111, 10136, 113, 25854, 114, 38571, 11790, 20583, 10306, 15304, 10533, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Lance", "Armstrong", "(", "U", ".", "S", ".", ")", "Motorola", "1", "second", "behind" ], "ids": [ 123, 119, 45013, 24472, 113, 158, 119, 156, 119, 114, 67289, 122, 11132, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 3, 9, 9, 9 ] }, { "tokens": [ "3", ".", "V", "##ya", "##ches", "##lav", "Ekim", "##ov", "(", "Russia", ")", "Ra", "##bo", "##bank", "29", "seconds", "behind" ], "ids": [ 124, 119, 159, 10679, 16272, 25768, 33421, 11024, 113, 14664, 114, 38571, 11790, 20583, 10386, 34290, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Erik", "De", "##kker", "(", "Netherlands", ")", "Ra", "##bo", "##bank", "43" ], "ids": [ 125, 119, 16925, 10190, 24234, 113, 22043, 114, 38571, 11790, 20583, 11370 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 9 ] }, { "tokens": [ "5", ".", "G", "##iu", "##nl", "##uca", "Gori", "##ni", "(", "Italy", ")", "Aki", "45" ], "ids": [ 126, 119, 144, 11877, 108854, 26540, 99378, 10342, 113, 11619, 114, 93026, 10827 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "6", ".", "Erik", "Br", "##eu", "##kin", "##k", "(", "Netherlands", ")", "Ra", "##bo", "##bank", "48" ], "ids": [ 127, 119, 16925, 38508, 16831, 12130, 10174, 113, 22043, 114, 38571, 11790, 20583, 11300 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 7, 7, 9 ] }, { "tokens": [ "7", ".", "Wilfried", "Pe", "##eter", "##s", "(", "Belgium", ")", "Map", "##ei", "51" ], "ids": [ 128, 119, 107652, 29005, 28647, 10107, 113, 26519, 114, 24847, 11998, 11524 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "8", ".", "Bart", "Vos", "##kamp", "(", "Netherlands", ")", "TV", "##M", "53" ], "ids": [ 129, 119, 33849, 96769, 31665, 113, 22043, 114, 10813, 11517, 11756 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "9", ".", "Michael", "Andersson", "(", "Sweden", ")", "Tel", "##ekom", "54" ], "ids": [ 130, 119, 10631, 36303, 113, 20937, 114, 25369, 84782, 11653 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "10", ".", "Gregory", "Randolph", "(", "USA", ")", "Motorola", "1", "minute", "3", "seconds" ], "ids": [ 10150, 119, 22392, 55078, 113, 11061, 114, 67289, 122, 21760, 124, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "overall", "placing", "##s", "after", "three", "stages", ":" ], "ids": [ 100085, 20947, 66959, 10107, 10662, 11003, 35023, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "So", "##rens", "##en", "11", ".", "20", ":", "33" ], "ids": [ 122, 119, 12882, 74111, 10136, 10193, 119, 10197, 131, 11000 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Armstrong", "3", "seconds", "behind" ], "ids": [ 123, 119, 24472, 124, 34290, 17155 ], "entity": [ "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Ekim", "##ov", "1", "minute", "7", "seconds" ], "ids": [ 124, 119, 33421, 11024, 122, 21760, 128, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Marco", "Lie", "##tti", "(", "Italy", ")", "MG", "-", "Tech", "##nog", "##ym", "1", "minute", "14", "seconds" ], "ids": [ 125, 119, 14160, 39710, 12683, 113, 11619, 114, 38668, 118, 34265, 14567, 16889, 122, 21760, 10247, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "De", "##kker", "1", "minute", "21", "seconds" ], "ids": [ 126, 119, 10190, 24234, 122, 21760, 10296, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Br", "##eu", "##kin", "##k", "1", "minute", "26", "seconds" ], "ids": [ 127, 119, 38508, 16831, 12130, 10174, 122, 21760, 10314, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Maarten", "den", "Ba", "##kker", "(", "Netherlands", ")", "TV", "##M", "1", "minute", "31", "seconds" ], "ids": [ 128, 119, 96619, 10140, 21333, 24234, 113, 22043, 114, 10813, 11517, 122, 21760, 10413, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Vos", "##kamp", "same", "time" ], "ids": [ 129, 119, 96769, 31665, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "9", ".", "Andersson", "1", "minute", "32", "seconds" ], "ids": [ 130, 119, 36303, 122, 21760, 10842, 34290 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Olaf", "Ludwig", "(", "Germany", ")", "Tel", "##ekom", "1", "minute", "44", "seconds" ], "ids": [ 10150, 119, 48382, 14116, 113, 12775, 114, 25369, 84782, 122, 21760, 11126, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "race", "continues", "on", "Friday", "with", "the", "178", "kilometre", "fifth", "-", "stage", "from", "Ze", "##vena", "##ar", "to", "Ve", "##n", "##ray", "." ], "ids": [ 10117, 14025, 25266, 10135, 30767, 10169, 10105, 22475, 84485, 22237, 118, 15365, 10188, 15536, 57227, 10354, 10114, 19561, 10115, 23432, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 5, 5, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "BE", "##AT", "PA", "##KI", "##ST", "##AN", "IN", "F", "##IR", "##ST", "ONE", "-", "DA", "##Y", "##ER", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 46291, 32071, 32349, 59879, 32995, 41275, 36351, 143, 73522, 32995, 57929, 118, 47855, 14703, 24093, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "29" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "beat", "Pakistan", "by", "five", "wickets", "to", "win", "the", "first", "one", "-", "day", "(", "50", "over", "##s", "-", "a", "-", "side", ")", "international", "at", "Old", "Tra", "##fford", "on", "Thursday", "." ], "ids": [ 11701, 27868, 15437, 10155, 12403, 83839, 10114, 14125, 10105, 10422, 10464, 118, 11940, 113, 10462, 10491, 10107, 118, 169, 118, 12250, 114, 12533, 10160, 13773, 21469, 98680, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "Score", "##s", ":", "Pakistan", "225", "-", "5", "innings", "closed", "(", "Sa", "##eed", "Anwar", "57", ")", ",", "England", "226", "-", "5", "in", "46", ".", "4", "over", "##s", "(", "M", ".", "At", "##hert", "##on", "65", ")", "." ], "ids": [ 66875, 10107, 131, 15437, 20843, 118, 126, 48974, 18440, 113, 12404, 40154, 92168, 11817, 114, 117, 11701, 23776, 118, 126, 10106, 11528, 119, 125, 10491, 10107, 113, 150, 119, 11699, 102855, 10263, 10843, 114, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "WORLD", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 67376, 39774, 36535, 11127, 52980, 64091, 30331, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "29" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "at", "the", "world", "track", "c", "##ycling", "championships", "on", "Thursday", ":" ], "ids": [ 33036, 10160, 10105, 11356, 14310, 171, 87497, 47211, 10135, 67067, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Individual", "pursuit", "semifinals", "(", "over", "4", ",", "000", "metres", ")", ":" ], "ids": [ 58191, 93910, 82726, 113, 10491, 125, 117, 10259, 16393, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chris", "Board", "##man", "(", "Britain", ")", "4", ":", "15", ".", "006", "beat", "Alexei", "Marko", "##v", "(", "Russia", ")", "4", ":", "23", ".", "029" ], "ids": [ 13151, 14743, 10589, 113, 16032, 114, 125, 131, 10208, 119, 52076, 27868, 108548, 41337, 10477, 113, 14664, 114, 125, 131, 10328, 119, 97567 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Andrea", "Coll", "##ine", "##lli", "(", "Italy", ")", "4", ":", "16", ".", "141", "beat", "Francis", "Moreau", "(", "France", ")", "4", ":", "19", ".", "665" ], "ids": [ 16101, 65689, 11088, 14088, 113, 11619, 114, 125, 131, 10250, 119, 19578, 27868, 13738, 68232, 113, 10688, 114, 125, 131, 10270, 119, 61269 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Moreau", "takes", "bronze", "medal", "as", "faster", "losing", "semifinali", "##st", "." ], "ids": [ 68232, 19135, 17930, 16531, 10146, 66109, 27817, 71380, 10562, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Final", ":" ], "ids": [ 14924, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Chris", "Board", "##man", "(", "Britain", ")", "4", ":", "11", ".", "114", "(", "world", "record", ")", "beat", "Andrea", "Coll", "##ine", "##lli", "(", "Italy", ")", "4", ":", "20", ".", "341" ], "ids": [ 13151, 14743, 10589, 113, 16032, 114, 125, 131, 10193, 119, 16977, 113, 11356, 12410, 114, 27868, 16101, 65689, 11088, 14088, 113, 11619, 114, 125, 131, 10197, 119, 35957 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Olympic", "sprint", "championship", "(", "three", "-", "man", "teams", ")", ":" ], "ids": [ 17952, 42707, 20755, 113, 11003, 118, 10817, 14404, 114, 131 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Australia", "(", "Dar", "##ryn", "Hill", ",", "Shane", "Kelly", ",", "Gary", "Nei", "##wand", ")", "44", ".", "804" ], "ids": [ 122, 119, 11729, 113, 35368, 64653, 12289, 117, 40429, 15787, 117, 15516, 25822, 31389, 114, 11126, 119, 67930 ], "entity": [ "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "seconds" ], "ids": [ 34290 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "2", ".", "Germany", "(", "Jens", "Fi", "##ed", "##ler", ",", "Michael", "Hub", "##ner", ",", "So", "##ren", "Lau", "##sberg", ")" ], "ids": [ 123, 119, 12775, 113, 30780, 36448, 10336, 10815, 117, 10631, 104451, 11129, 117, 12882, 10969, 73185, 23815, 114 ], "entity": [ "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 1, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "45", ".", "455" ], "ids": [ 10827, 119, 38767 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "3", ".", "France", "(", "Laurent", "Gan", "##e", ",", "Florian", "Rousseau", ",", "Her", "##ve", "Thu", "##et", ")" ], "ids": [ 124, 119, 10688, 113, 19982, 90792, 10112, 117, 48385, 47351, 117, 13229, 10612, 93332, 10308, 114 ], "entity": [ "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 1, 9, 4, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "45", ".", "810" ], "ids": [ 10827, 119, 49357 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "4", ".", "Greece", "(", "Dimitri", "##os", "Georg", "##alis", ",", "Georgi", "##os", "Chi", "##mone", "##tos", ",", "Lam", "##pro", "##s" ], "ids": [ 125, 119, 25154, 113, 73589, 10310, 13994, 33269, 117, 84854, 10310, 21946, 62340, 13318, 117, 44068, 73099, 10107 ], "entity": [ "O", "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 9, 1, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8 ] }, { "tokens": [ "Vas", "##ilo", "##pou", "##los", ")", "46", ".", "538" ], "ids": [ 98242, 21785, 73535, 13788, 114, 11528, 119, 45677 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "world", "sprint", "championship", "quarter", "-", "finals", "(", "best", "of" ], "ids": [ 13536, 112, 187, 11356, 42707, 20755, 28330, 118, 21758, 113, 12504, 10108 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "three", "matches", ")", ":" ], "ids": [ 11003, 18258, 114, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Mag", "##ali", "Fa", "##ure", "(", "France", ")", "beat", "Kat", "##hri", "##n", "Frei", "##tag", "(", "Germany", ")", "two" ], "ids": [ 63672, 13133, 44271, 12101, 113, 10688, 114, 27868, 85467, 53743, 10115, 90928, 24603, 113, 12775, 114, 10551 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "matches", "to", "ni", "##l", "(", "with", "times", "for", "the", "last", "200", "metres", "of", "11", ".", "833" ], "ids": [ 18258, 10114, 10414, 10161, 113, 10169, 13465, 10142, 10105, 12469, 10777, 16393, 10108, 10193, 119, 55242 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "seconds", "and", "12", ".", "033", "seconds", ")" ], "ids": [ 34290, 10111, 10186, 119, 100402, 34290, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fel", "##icia", "Ball", "##anger", "(", "France", ")", "beat", "Ok", "##sana", "G", "##rich", "##ina", "(", "Russia", ")", "2", "-", "0", "," ], "ids": [ 72493, 38016, 19479, 83224, 113, 10688, 114, 27868, 84591, 51308, 144, 27749, 11067, 113, 14664, 114, 123, 118, 121, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "11", ".", "776", "/", "12", ".", "442", ")" ], "ids": [ 113, 10193, 119, 69588, 120, 10186, 119, 38334, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tan", "##ya", "Dub", "##nico", "##ff", "(", "Canada", ")", "beat", "Michelle", "Ferris", "(", "Australia", ")", "2", "-", "0", "," ], "ids": [ 30594, 10679, 51536, 32665, 13820, 113, 11635, 114, 27868, 27062, 101621, 113, 11729, 114, 123, 118, 121, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "12", ".", "211", "/", "12", ".", "208", ")" ], "ids": [ 113, 10186, 119, 22448, 120, 10186, 119, 21881, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anne", "##tt", "Neumann", "(", "Germany", ")", "beat", "Gal", "##ina", "En", "##iou", "##kh", "##ina", "(", "Russia", ")", "2", "-", "0", "," ], "ids": [ 13490, 11527, 43081, 113, 12775, 114, 27868, 66676, 11067, 10243, 95752, 48502, 11067, 113, 14664, 114, 123, 118, 121, 117 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "12", ".", "434", "/", "12", ".", "177", ")", "." ], "ids": [ 113, 10186, 119, 44726, 120, 10186, 119, 21976, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "CR", "##O", "##F", "##T", "RE", "##ST", "##RI", "##CT", "##S", "PA", "##KI", "##ST", "##AN", "TO", "225", "-", "5", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 44912, 11403, 11565, 11090, 71033, 32995, 46876, 91995, 10731, 32349, 59879, 32995, 41275, 58573, 20843, 118, 126, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "29" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ti", "##ght", "bowling", "from", "G", "##lam", "##organ", "off", "-", "spin", "##ner", "Robert", "C", "##roft", "helped", "England", "to", "rest", "##ric", "##t", "Pakistan", "to", "225", "for", "five", "in", "their", "50", "over", "##s", "in", "the", "first", "one", "-", "day", "international", "at", "Old", "Tra", "##fford", "on", "Thursday", "." ], "ids": [ 29033, 20687, 97228, 10188, 144, 21114, 100807, 11898, 118, 30428, 11129, 10820, 140, 101860, 20890, 11701, 10114, 17333, 18570, 10123, 15437, 10114, 20843, 10142, 12403, 10106, 10455, 10462, 10491, 10107, 10106, 10105, 10422, 10464, 118, 11940, 12533, 10160, 13773, 21469, 98680, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "C", "##roft", ",", "who", "was", "one", "of", "the", "few", "English", "##men", "to", "make", "a", "good", "impression", "in", "his", "test", "debut", "at", "The", "Oval", "last", "week", ",", "showed", "great", "control", "as", "he", "first", "drie", "##d", "up", "the", "early", "flow", "of", "Pakistan", "runs", "and", "then", "collected", "the", "wickets", "of", "Aa", "##mir", "So", "##hai", "##l", "and", "Was", "##im", "Ak", "##ram", "in", "a", "spell", "of", "10", "-", "1", "-", "36", "-", "2", "." ], "ids": [ 140, 101860, 117, 10479, 10134, 10464, 10108, 10105, 13824, 11616, 11418, 10114, 13086, 169, 15198, 59513, 10106, 10226, 15839, 13424, 10160, 10117, 98765, 12469, 16118, 117, 27463, 14772, 12608, 10146, 10261, 10422, 16171, 10162, 10741, 10105, 11732, 30676, 10108, 15437, 17913, 10111, 11059, 29611, 10105, 83839, 10108, 80131, 20825, 12882, 37821, 10161, 10111, 22034, 11759, 71275, 13845, 10106, 169, 76738, 10108, 10150, 118, 122, 118, 11055, 118, 123, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "also", "a", "wi", "##cket", "each", "for", "Ronnie", "Iran", "##i", ",", "Allan", "Mu", "##lla", "##lly", "and", "Darren", "Go", "##ugh", "although", "there", "was", "no", "jo", "##y", "for", "Dean", "Head", "##ley", "who", ",", "along", "with", "Lancashire", "bat", "##sman", "Graham", "Lloyd", ",", "was", "making", "his", "international", "debut", "." ], "ids": [ 11723, 10134, 10379, 169, 23040, 28721, 11948, 10142, 39219, 12901, 10116, 117, 18750, 49056, 11083, 17903, 10111, 53337, 14439, 25905, 14779, 11155, 10134, 10192, 12541, 10157, 10142, 18657, 16830, 12105, 10479, 117, 12400, 10169, 48487, 11519, 24305, 16928, 19345, 117, 10134, 14293, 10226, 12533, 13424, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 3, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "After", "Was", "##im", "had", "won", "the", "tos", "##s", "and", "chosen", "to", "bat", "first", ",", "Pakistani", "made", "an", "excellent", "start", "as", "So", "##hai", "##l", "and", "Sa", "##eed", "Anwar", "continued", "their", "good", "form", "with", "an", "opening", "partnership", "of", "82", "." ], "ids": [ 11301, 22034, 11759, 10374, 11367, 10105, 84686, 10107, 10111, 27997, 10114, 11519, 10422, 117, 66797, 11019, 10151, 50337, 15148, 10146, 12882, 37821, 10161, 10111, 12404, 40154, 92168, 14278, 10455, 15198, 12188, 10169, 10151, 17975, 36944, 10108, 12180, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anwar", ",", "who", "struck", "a", "super", "##b", "176", "at", "The", "Oval", ",", "was", "the", "more", "aggressive", "as", "he", "made", "57", "from", "75", "balls", "before", "sky", "##ing", "a", "catch", "off", "Iran", "##i", "to", "Mu", "##lla", "##lly", "at", "long", "-", "on", "." ], "ids": [ 92168, 117, 10479, 45622, 169, 25212, 10457, 21613, 10160, 10117, 98765, 117, 10134, 10105, 10798, 75388, 10146, 10261, 11019, 11817, 10188, 11417, 88301, 11360, 62368, 10230, 169, 61093, 11898, 12901, 10116, 10114, 49056, 11083, 17903, 10160, 11695, 118, 10135, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "So", "##hai", "##l", "and", "I", "##ja", "##z", "Ahmed", "then", "added", "59", "for", "the", "second", "wi", "##cket", "before", "England", "struck", "back", "with", "three", "wickets", "for", "19", "in", "the", "space", "of", "five", "over", "##s", "." ], "ids": [ 12882, 37821, 10161, 10111, 146, 10320, 10305, 25530, 11059, 16288, 11867, 10142, 10105, 11132, 23040, 28721, 11360, 11701, 45622, 12014, 10169, 11003, 83839, 10142, 10270, 10106, 10105, 16199, 10108, 12403, 10491, 10107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", ",", "So", "##hai", "##l", ",", "after", "making", "48", ",", "was", "bowl", "##ed", "by", "C", "##roft", "as", "he", "stepped", "back", "to", "try", "and", "hit", "through", "the", "off", "-", "side", "." ], "ids": [ 12128, 117, 12882, 37821, 10161, 117, 10662, 14293, 11300, 117, 10134, 99380, 10336, 10155, 140, 101860, 10146, 10261, 99116, 12014, 10114, 31638, 10111, 14946, 11222, 10105, 11898, 118, 12250, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Was", "##im", ",", "who", "promoted", "himself", "to", "number", "four", "in", "the", "order", ",", "followed", "for", "six", "when", "C", "##roft", "drift", "##ed", "another", "well", "-", "flight", "##ed", "delivery", "behind", "his", "legs", "." ], "ids": [ 22034, 11759, 117, 10479, 22312, 14764, 10114, 11487, 11598, 10106, 10105, 12990, 117, 15689, 10142, 12449, 10841, 140, 101860, 60246, 10336, 12864, 11206, 118, 23578, 10336, 55626, 17155, 10226, 51863, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Shortly", "after", "I", "##ja", "##z", "was", "also", "back", "in", "the", "pa", "##vili", "##on", "for", "48", "after", "Iran", "##i", "had", "rep", "##aid", "Mu", "##lla", "##lly", "with", "another", "good", "catch", "at", "long", "-", "on", "." ], "ids": [ 50752, 10662, 146, 10320, 10305, 10134, 10379, 12014, 10106, 10105, 10931, 55397, 10263, 10142, 11300, 10662, 12901, 10116, 10374, 76456, 39522, 49056, 11083, 17903, 10169, 12864, 15198, 61093, 10160, 11695, 118, 10135, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Go", "##ugh", "later", "bowl", "##ed", "Moi", "##n", "Khan", "with", "an", "ins", "##wing", "##ing", "yo", "##rker", "but", "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", ",", "37", "not", "out", ",", "and", "Salim", "Malik", "took", "Pakistan", "to", "225", "for", "five", "when", "the", "over", "##s", "ran", "out", "." ], "ids": [ 14439, 25905, 10873, 99380, 10336, 82447, 10115, 16324, 10169, 10151, 15498, 25649, 10230, 13672, 97720, 10473, 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 117, 11204, 10472, 10950, 117, 10111, 98284, 45783, 12149, 15437, 10114, 20843, 10142, 12403, 10841, 10105, 10491, 10107, 17044, 10950, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "V", "PA", "##KI", "##ST", "##AN", "ONE", "-", "DA", "##Y", "SC", "##OR", "##EB", "##O", "##AR", "##D", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 159, 32349, 59879, 32995, 41275, 57929, 118, 47855, 14703, 18137, 42622, 89922, 11403, 52188, 11490, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "29" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##board", "of", "the" ], "ids": [ 66875, 25690, 10108, 10105 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "first", "one", "-", "day", "(", "50", "over", "##s", "-", "a", "-", "side", ")", "match", "between", "England", "and" ], "ids": [ 10422, 10464, 118, 11940, 113, 10462, 10491, 10107, 118, 169, 118, 12250, 114, 12356, 10948, 11701, 10111 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Pakistan", "at", "Old", "Tra", "##fford", "on", "Thursday", ":" ], "ids": [ 15437, 10160, 13773, 21469, 98680, 10135, 67067, 131 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "Pakistan" ], "ids": [ 15437 ], "entity": [ "B-LOC" ], "entity_ids": [ 1 ] }, { "tokens": [ "Sa", "##eed", "Anwar", "c", "Mu", "##lla", "##lly", "b", "Iran", "##i", "57" ], "ids": [ 12404, 40154, 92168, 171, 49056, 11083, 17903, 170, 12901, 10116, 11817 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "Aa", "##mir", "So", "##hai", "##l", "b", "C", "##roft", "48" ], "ids": [ 80131, 20825, 12882, 37821, 10161, 170, 140, 101860, 11300 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "I", "##ja", "##z", "Ahmed", "c", "Iran", "##i", "b", "Mu", "##lla", "##lly", "48" ], "ids": [ 146, 10320, 10305, 25530, 171, 12901, 10116, 170, 49056, 11083, 17903, 11300 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Was", "##im", "Ak", "##ram", "b", "C", "##roft", "6" ], "ids": [ 22034, 11759, 71275, 13845, 170, 140, 101860, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", "not", "out", "37" ], "ids": [ 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 10472, 10950, 11204 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Moi", "##n", "Khan", "b", "Go", "##ugh", "10" ], "ids": [ 82447, 10115, 16324, 170, 14439, 25905, 10150 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 9 ] }, { "tokens": [ "Salim", "Malik", "not", "out", "6" ], "ids": [ 98284, 45783, 10472, 10950, 127 ], "entity": [ "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "b", "-", "2", "lb", "-", "4", "w", "-", "7", ")", "13" ], "ids": [ 50821, 10107, 113, 170, 118, 123, 23989, 118, 125, 191, 118, 128, 114, 10249 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "5", "wickets", ",", "innings", "closed", ")", "225" ], "ids": [ 25220, 113, 10142, 126, 83839, 117, 48974, 18440, 114, 20843 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", ":", "1", "-", "82", "2", "-", "141", "3", "-", "160", "4", "-", "174", "5", "-", "203", "." ], "ids": [ 15750, 131, 122, 118, 12180, 123, 118, 19578, 124, 118, 13849, 125, 118, 22767, 126, 118, 20235, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Did", "Not", "Bat", ":", "Mus", "##hta", "##q", "Ahmed", ",", "W", "##aq", "##ar", "You", "##nis", ",", "Ata", "-", "ur", "-", "Re", "##hman", "," ], "ids": [ 50133, 16040, 62949, 131, 31013, 32493, 11703, 25530, 117, 160, 49277, 10354, 11065, 12597, 117, 68795, 118, 10399, 118, 20304, 49811, 117 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Sa", "##q", "##lain", "Mus", "##hta", "##q", "." ], "ids": [ 12404, 11703, 50280, 31013, 32493, 11703, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Bowling", ":", "Go", "##ugh", "10", "-", "0", "-", "44", "-", "1", ",", "Mu", "##lla", "##lly", "10", "-", "3", "-", "31", "-", "1", ",", "Head", "##ley" ], "ids": [ 100017, 131, 14439, 25905, 10150, 118, 121, 118, 11126, 118, 122, 117, 49056, 11083, 17903, 10150, 118, 124, 118, 10413, 118, 122, 117, 16830, 12105 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8 ] }, { "tokens": [ "10", "-", "0", "-", "52", "-", "0", ",", "Iran", "##i", "10", "-", "0", "-", "56", "-", "1", ",", "C", "##roft", "10", "-", "1", "-", "36", "-", "2", "." ], "ids": [ 10150, 118, 121, 118, 11525, 118, 121, 117, 12901, 10116, 10150, 118, 121, 118, 11628, 118, 122, 117, 140, 101860, 10150, 118, 122, 118, 11055, 118, 123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England" ], "ids": [ 11701 ], "entity": [ "B-LOC" ], "entity_ids": [ 1 ] }, { "tokens": [ "N", ".", "Knight", "c", "Moi", "##n", "Khan", "b", "Was", "##im", "Ak", "##ram", "26" ], "ids": [ 151, 119, 19848, 171, 82447, 10115, 16324, 170, 22034, 11759, 71275, 13845, 10314 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "A", ".", "Stewart", "lb", "##w", "b", "W", "##aq", "##ar", "You", "##nis", "48" ], "ids": [ 138, 119, 17493, 23989, 10874, 170, 160, 49277, 10354, 11065, 12597, 11300 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "M", ".", "At", "##hert", "##on", "b", "Was", "##im", "Ak", "##ram", "65" ], "ids": [ 150, 119, 11699, 102855, 10263, 170, 22034, 11759, 71275, 13845, 10843 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "G", ".", "Thorpe", "st", "Moi", "##n", "Khan", "b", "Aa", "##mir", "So", "##hai", "##l", "23" ], "ids": [ 144, 119, 84855, 28780, 82447, 10115, 16324, 170, 80131, 20825, 12882, 37821, 10161, 10328 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "M", ".", "Maynard", "b", "Was", "##im", "Ak", "##ram", "41" ], "ids": [ 150, 119, 92517, 170, 22034, 11759, 71275, 13845, 11349 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "G", ".", "Lloyd", "not", "out", "2" ], "ids": [ 144, 119, 19345, 10472, 10950, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "R", ".", "Iran", "##i", "not", "out", "6" ], "ids": [ 155, 119, 12901, 10116, 10472, 10950, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Extra", "##s", "(", "lb", "-", "4", "w", "-", "7", "n", "##b", "-", "4", ")", "15" ], "ids": [ 50821, 10107, 113, 23989, 118, 125, 191, 118, 128, 182, 10457, 118, 125, 114, 10208 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "(", "for", "5", "wickets", ",", "46", ".", "4", "over", "##s", ")", "226" ], "ids": [ 25220, 113, 10142, 126, 83839, 117, 11528, 119, 125, 10491, 10107, 114, 23776 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fall", "of", "wickets", ":", "1", "-", "57", "2", "-", "98", "3", "-", "146", "4", "-", "200", "5", "-", "220", "." ], "ids": [ 15750, 10108, 83839, 131, 122, 118, 11817, 123, 118, 12327, 124, 118, 19680, 125, 118, 10777, 126, 118, 15817, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Did", "not", "bat", ":", "R", ".", "C", "##roft", ",", "D", ".", "Go", "##ugh", ",", "D", ".", "Head", "##ley", ",", "A", ".", "Mu", "##lla", "##lly", "." ], "ids": [ 50133, 10472, 11519, 131, 155, 119, 140, 101860, 117, 141, 119, 14439, 25905, 117, 141, 119, 16830, 12105, 117, 138, 119, 49056, 11083, 17903, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "Bowling", ":", "Was", "##im", "Ak", "##ram", "9", ".", "4", "-", "1", "-", "45", "-", "3", ",", "W", "##aq", "##ar", "You", "##nis", "7", "-", "0", "-", "28", "-", "1", "," ], "ids": [ 100017, 131, 22034, 11759, 71275, 13845, 130, 119, 125, 118, 122, 118, 10827, 118, 124, 117, 160, 49277, 10354, 11065, 12597, 128, 118, 121, 118, 10348, 118, 122, 117 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sa", "##q", "##lain", "Mus", "##hta", "##q", "10", "-", "1", "-", "54", "-", "0", ",", "Ata", "-", "ur", "-", "Re", "##hman", "3", "-", "0", "-", "14", "-", "0", ",", "Mus", "##hta", "##q", "Ahmed" ], "ids": [ 12404, 11703, 50280, 31013, 32493, 11703, 10150, 118, 122, 118, 11653, 118, 121, 117, 68795, 118, 10399, 118, 20304, 49811, 124, 118, 121, 118, 10247, 118, 121, 117, 31013, 32493, 11703, 25530 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8 ] }, { "tokens": [ "10", "-", "0", "-", "52", "-", "0", ",", "Aa", "##mir", "So", "##hai", "##l", "7", "-", "1", "-", "29", "-", "1", "." ], "ids": [ 10150, 118, 121, 118, 11525, 118, 121, 117, 80131, 20825, 12882, 37821, 10161, 128, 118, 122, 118, 10386, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", ":", "England", "won", "by", "five", "wickets", "." ], "ids": [ 32070, 16203, 131, 11701, 11367, 10155, 12403, 83839, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "match", ":", "August", "31", ",", "Ed", "##g", "##bas", "##ton", "(", "Birmingham", ")" ], "ids": [ 14181, 12356, 131, 10735, 10413, 117, 13114, 10240, 21322, 11183, 113, 22712, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "Third", ":", "September", "1", ",", "Trent", "Bridge", "(", "Nottingham", ")" ], "ids": [ 16788, 131, 10596, 122, 117, 47528, 17426, 113, 43396, 114 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ "L", "##OM", "##BA", "##RD", "##I", "W", "##IN", "##S", "T", "##HI", "##RD", "ST", "##AG", "##E", "OF", "TOUR", "OF", "NET", "##H", "##ER", "##LA", "##ND", "##S", "." ], "ids": [ 149, 37079, 35999, 84444, 11281, 160, 27128, 10731, 157, 108880, 84444, 53317, 109865, 11259, 23240, 86526, 23240, 41645, 12396, 24093, 44376, 58521, 10731, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "DO", "##ET", "##IN", "##CH", "##EM", ",", "Netherlands", "1996", "-", "08", "-", "29" ], "ids": [ 99843, 52338, 27128, 86448, 67753, 117, 22043, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "results", "and", "overall", "standing", "##s", "after", "the", "122", "kilometre", "third", "stage", "of", "the", "Tour", "of", "the", "Netherlands", "on", "Thursday", "between", "Al", "##mere", "and", "Doe", "##tin", "##chem", "." ], "ids": [ 100085, 17466, 10111, 20947, 32173, 10107, 10662, 10105, 17484, 84485, 12628, 15365, 10108, 10105, 11595, 10108, 10105, 22043, 10135, 67067, 10948, 10883, 32732, 10111, 71335, 15364, 34884, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 1, 5, 9, 1, 5, 5, 9 ] }, { "tokens": [ "1", ".", "Giovanni", "Lombard", "##i", "(", "Italy", ")", "Pol", "##ti", "2", "hours", "35", "minutes" ], "ids": [ 122, 119, 13297, 84808, 10116, 113, 11619, 114, 38432, 10325, 123, 19573, 10803, 15304 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "29", "seconds" ], "ids": [ 10386, 34290 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "2", ".", "Rolf", "So", "##rens", "##en", "(", "Denmark", ")", "Ra", "##bo", "##bank" ], "ids": [ 123, 119, 31371, 12882, 74111, 10136, 113, 25854, 114, 38571, 11790, 20583 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 7 ] }, { "tokens": [ "3", ".", "Lance", "Armstrong", "(", "U", ".", "S", ".", ")", "Motorola" ], "ids": [ 124, 119, 45013, 24472, 113, 158, 119, 156, 119, 114, 67289 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 3 ] }, { "tokens": [ "4", ".", "Maarten", "den", "Ba", "##kker", "(", "Netherlands", ")", "TV", "##M", "all", "same", "time" ], "ids": [ 125, 119, 96619, 10140, 21333, 24234, 113, 22043, 114, 10813, 11517, 10435, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Marco", "Lie", "##tti", "(", "Italy", ")", "MG", "-", "Tech", "##nog", "##ym", "1", "second", "behind" ], "ids": [ 126, 119, 14160, 39710, 12683, 113, 11619, 114, 38668, 118, 34265, 14567, 16889, 122, 11132, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 7, 7, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Hans", "de", "Cl", "##er", "##q", "(", "Belgium", ")", "Palma", "##ns", "27", "seconds" ], "ids": [ 127, 119, 11768, 10104, 101989, 10165, 11703, 113, 26519, 114, 28138, 10891, 10365, 34290 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 7, 9, 9 ] }, { "tokens": [ "7", ".", "Marty", "Je", "##mis", "##on", "(", "U", ".", "S", ".", ")", "U", ".", "S", ".", "Postal" ], "ids": [ 128, 119, 47730, 13796, 15240, 10263, 113, 158, 119, 156, 119, 114, 158, 119, 156, 119, 89208 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 3, 7, 7, 7, 7 ] }, { "tokens": [ "8", ".", "Ser", "##vais", "K", "##na", "##ven", "(", "Netherlands", ")", "TV", "##M" ], "ids": [ 129, 119, 39759, 65882, 148, 10219, 11975, 113, 22043, 114, 10813, 11517 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 7 ] }, { "tokens": [ "9", ".", "Olaf", "Ludwig", "(", "Germany", ")", "Tel", "##ekom", "all", "same", "time" ], "ids": [ 130, 119, 48382, 14116, 113, 12775, 114, 25369, 84782, 10435, 11561, 10635 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Je", "##roen", "B", "##li", "##jle", "##vens", "(", "Netherlands", ")", "TV", "##M", "31" ], "ids": [ 10150, 119, 13796, 77321, 139, 10390, 98969, 54086, 113, 22043, 114, 10813, 11517, 10413 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "Leading", "overall", "placing", "##s", "after", "three", "stages", ":" ], "ids": [ 100085, 20947, 66959, 10107, 10662, 11003, 35023, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "So", "##rens", "##en", "10", ".", "57", ":", "33" ], "ids": [ 122, 119, 12882, 74111, 10136, 10150, 119, 11817, 131, 11000 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Lombard", "##i", "1", "second", "behind" ], "ids": [ 123, 119, 84808, 10116, 122, 11132, 17155 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Armstrong", "2", "seconds" ], "ids": [ 124, 119, 24472, 123, 34290 ], "entity": [ "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9 ] }, { "tokens": [ "4", ".", "Den", "Ba", "##kker", "7" ], "ids": [ 125, 119, 10235, 21333, 24234, 128 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "5", ".", "Lie", "##tti", "8" ], "ids": [ 126, 119, 39710, 12683, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 4, 8, 9 ] }, { "tokens": [ "6", ".", "Federico", "Colonna", "(", "Italy", ")", "Map", "##ei", "27" ], "ids": [ 127, 119, 20809, 78709, 113, 11619, 114, 24847, 11998, 10365 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "7", ".", "Max", "van", "Hee", "##s", "##wijk", "(", "Netherlands", ")", "Motorola", "28" ], "ids": [ 128, 119, 12854, 10145, 107443, 10107, 42727, 113, 22043, 114, 67289, 10348 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 9 ] }, { "tokens": [ "8", ".", "Sven", "Te", "##uten", "##berg", "(", "Germany", ")", "U", ".", "S", ".", "Postal", "31" ], "ids": [ 129, 119, 33559, 21452, 30315, 11348, 113, 12775, 114, 158, 119, 156, 119, 89208, 10413 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "9", ".", "Johan", "Cap", "##iot", "(", "Belgium", ")", "Coll", "##stro", "##p", "32" ], "ids": [ 130, 119, 15706, 24069, 69325, 113, 26519, 114, 65689, 34582, 10410, 10842 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 7, 7, 9 ] }, { "tokens": [ "10", ".", "Jan", "##s", "Ko", "##erts", "(", "Netherlands", ")", "Palma", "##ns", "34" ], "ids": [ 10150, 119, 11806, 10107, 30186, 64115, 113, 22043, 114, 28138, 10891, 11069 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 7, 9 ] }, { "tokens": [ "The", "race", "continues", "on", "Thursday", "afternoon", "with", "a", "19", ".", "6", "fourth", "-", "stage", "Doe", "##tin", "##chem", "-", "Doe", "##tin", "##chem", "time", "trial" ], "ids": [ 10117, 14025, 25266, 10135, 67067, 73213, 10169, 169, 10270, 119, 127, 16918, 118, 15365, 71335, 15364, 34884, 118, 71335, 15364, 34884, 10635, 23626 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##AN", "##D", "V", "PA", "##KI", "##ST", "##AN", "TO", "##SS", "AND", "T", "##EA", "##MS", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 41275, 11490, 159, 32349, 59879, 32995, 41275, 58573, 49248, 52428, 157, 36789, 53355, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "29" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pakistan", "won", "the", "tos", "##s", "and", "elected", "to", "bat", "in", "the", "first", "one", "-", "day", "cricket", "international", "between", "England", "and", "Pakistan", "at", "Old", "Tra", "##fford", "on", "Thursday", "." ], "ids": [ 15437, 11367, 10105, 84686, 10107, 10111, 14254, 10114, 11519, 10106, 10105, 10422, 10464, 118, 11940, 32289, 12533, 10948, 11701, 10111, 15437, 10160, 13773, 21469, 98680, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "Teams", ":" ], "ids": [ 25754, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "England", "-", "Mike", "At", "##hert", "##on", "(", "captain", ")", ",", "Nick", "Knight", ",", "Alec", "Stewart", ",", "Graham", "Thorpe", ",", "Matthew", "Maynard", ",", "Graham", "Lloyd", ",", "Ronnie", "Iran", "##i", ",", "Robert", "C", "##roft", ",", "Darren", "Go", "##ugh", ",", "Dean", "Head", "##ley", ",", "Alan", "Mu", "##lla", "##lly", "." ], "ids": [ 11701, 118, 13270, 11699, 102855, 10263, 113, 28157, 114, 117, 16126, 19848, 117, 61961, 17493, 117, 16928, 84855, 117, 18168, 92517, 117, 16928, 19345, 117, 39219, 12901, 10116, 117, 10820, 140, 101860, 117, 53337, 14439, 25905, 117, 18657, 16830, 12105, 117, 14309, 49056, 11083, 17903, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Pakistan", ":", "Aa", "##mir", "So", "##hai", "##l", ",", "Sa", "##eed", "Anwar", ",", "I", "##ja", "##z", "Ahmed", ",", "In", "##zama", "##m", "-", "ul", "-", "Ha", "##q", ",", "Salim", "Malik", ",", "Was", "##im", "Ak", "##ram", "(", "captain", ")", ",", "Moi", "##n", "Khan", ",", "Mus", "##hta", "##q", "Ahmed", ",", "W", "##aq", "##ar", "You", "##nis", ",", "Ata", "-", "ur", "-", "Re", "##hman", ",", "Sa", "##q", "##lain", "Mus", "##hta", "##q", "." ], "ids": [ 15437, 131, 80131, 20825, 12882, 37821, 10161, 117, 12404, 40154, 92168, 117, 146, 10320, 10305, 25530, 117, 10167, 79786, 10147, 118, 16600, 118, 13740, 11703, 117, 98284, 45783, 117, 22034, 11759, 71275, 13845, 113, 28157, 114, 117, 82447, 10115, 16324, 117, 31013, 32493, 11703, 25530, 117, 160, 49277, 10354, 11065, 12597, 117, 68795, 118, 10399, 118, 20304, 49811, 117, 12404, 11703, 50280, 31013, 32493, 11703, 119 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9, 4, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "CR", "##IC", "##K", "##ET", "-", "EN", "##GL", "##IS", "##H", "CO", "##UN", "##T", "##Y", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "SC", "##OR", "##ES", "." ], "ids": [ 44912, 30889, 11733, 52338, 118, 31278, 104780, 19088, 12396, 32992, 69849, 11090, 14703, 39774, 36535, 11127, 52980, 64091, 30331, 18137, 42622, 25054, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Close", "of", "play", "scores", "in", "English", "county", "championship", "matches", "on", "Thursday", ":" ], "ids": [ 39981, 10108, 12253, 49931, 10106, 11616, 17382, 20755, 18258, 10135, 67067, 131 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tun", "##bridge", "Wells", ":", "Nottingham", "##shire", "40", "-", "3", "v", "Kent" ], "ids": [ 77056, 29273, 25325, 131, 43396, 19684, 10533, 118, 124, 190, 19393 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG" ], "entity_ids": [ 1, 5, 5, 9, 3, 7, 9, 9, 9, 9, 3 ] }, { "tokens": [ "London", "(", "The", "Oval", ")", ":", "Warwick", "##shire", "195", "(", "A", ".", "Giles", "50", ";", "B", ".", "Julian", "4", "-", "66", ",", "C", ".", "Lewis", "4", "-", "45", ")", ",", "Surrey", "82", "-", "0", "." ], "ids": [ 10829, 113, 10117, 98765, 114, 131, 48234, 19684, 21825, 113, 138, 119, 49355, 10462, 132, 139, 119, 23154, 125, 118, 12215, 117, 140, 119, 13759, 125, 118, 10827, 114, 117, 42858, 12180, 118, 121, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 9, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Ho", "##ve", ":", "Sussex", "285", "-", "6", "(", "W", ".", "At", "##he", "##y", "111", ")", "v", "Lancashire" ], "ids": [ 20220, 10612, 131, 38426, 27485, 118, 127, 113, 160, 119, 11699, 11643, 10157, 15821, 114, 190, 48487 ], "entity": [ "B-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG" ], "entity_ids": [ 1, 5, 9, 3, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 3 ] }, { "tokens": [ "Leeds", "(", "Head", "##ing", "##ley", ")", ":", "Yorkshire", "290", "(", "C", ".", "White", "76", ",", "M", ".", "Mo", "##xon", "59", ",", "R", ".", "Blake", "##y", "57", ")", ",", "Essex", "79", "-", "2", "." ], "ids": [ 28654, 113, 16830, 10230, 12105, 114, 131, 27577, 21138, 113, 140, 119, 12136, 12428, 117, 150, 119, 34987, 55251, 11867, 117, 155, 119, 24321, 10157, 11817, 114, 117, 33634, 12791, 118, 123, 119 ], "entity": [ "B-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 1, 5, 5, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Chester", "-", "le", "-", "Street", ":", "G", "##lam", "##organ", "259", "(", "P", ".", "Co", "##tte", "##y", "81", ";", "M", ".", "Sa", "##gger", "##s", "6", "-", "65", ")", "and", "8", "-", "0", ",", "Durham", "114", "(", "S", ".", "Wat", "##kin", "4", "-", "28", ")" ], "ids": [ 32729, 118, 10141, 118, 11962, 131, 144, 21114, 100807, 29559, 113, 153, 119, 13098, 12131, 10157, 12324, 132, 150, 119, 12404, 25749, 10107, 127, 118, 10843, 114, 10111, 129, 118, 121, 117, 37499, 16977, 113, 156, 119, 51082, 12130, 125, 118, 10348, 114 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 3, 7, 7, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Chester", "##field", ":", "Worcester", "##shire", "238", "(", "W", ".", "Weston", "100", "not", "out", ",", "V", ".", "Sol", "##ank", "##i", "58", ";", "A", ".", "Harris", "4", "-", "31", ")", ",", "Derbyshire", "166", "-", "1", "(", "K", ".", "Barnett", "83", "not", "out", ")" ], "ids": [ 32729, 13408, 131, 55518, 19684, 24388, 113, 160, 119, 62676, 10407, 10472, 10950, 117, 159, 119, 19655, 30022, 10116, 11824, 132, 138, 119, 16667, 125, 118, 10413, 114, 117, 87260, 21505, 118, 122, 113, 148, 119, 102674, 12408, 10472, 10950, 114 ], "entity": [ "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Portsmouth", ":", "Middlesex", "199", "and", "226", "-", "1", "(", "J", ".", "Poole", "##y", "106", "not", "out", ",", "M", ".", "Ram", "##pra", "##kas", "##h", "81", "not", "out", ")", ",", "Hampshire", "232", "(", "A", ".", "Fraser", "5", "-", "55", ",", "R", ".", "Fay", "4", "-", "77", ")" ], "ids": [ 46933, 131, 74972, 23366, 10111, 23776, 118, 122, 113, 147, 119, 88995, 10157, 16084, 10472, 10950, 117, 150, 119, 42932, 30631, 16438, 10237, 12324, 10472, 10950, 114, 117, 26036, 23944, 113, 138, 119, 30677, 126, 118, 11358, 117, 155, 119, 84829, 125, 118, 12527, 114 ], "entity": [ "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 3, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Leicester", ":", "Somerset", "83", "(", "D", ".", "Mill", "##ns", "4", "-", "35", ")", ",", "Leicester", "##shire", "202", "-", "5" ], "ids": [ 38789, 131, 35434, 12408, 113, 141, 119, 28639, 10891, 125, 118, 10803, 114, 117, 38789, 19684, 22171, 118, 126 ], "entity": [ "B-LOC", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 1, 9, 3, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Bristol", ":", "Gloucestershire", "183", "(", "J", ".", "Russell", "50", ")", ",", "Northampton", "##shire", "123", "-", "4", "(", "K", ".", "Cu", "##rran", "51", "not", "out", ")", "." ], "ids": [ 24732, 131, 91183, 22505, 113, 147, 119, 13481, 10462, 114, 117, 79445, 19684, 16968, 118, 125, 113, 148, 119, 34387, 89112, 11524, 10472, 10950, 114, 119 ], "entity": [ "B-LOC", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 3, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "R", "##U", "##GB", "##Y", "UN", "##ION", "-", "T", "##EL", "##F", "##ER", "CO", "##NF", "##IR", "##ME", "##D", "FOR", "L", "##ION", "##S", "CO", "##AC", "##HI", "##NG", "R", "##OL", "##E", "." ], "ids": [ 155, 12022, 32469, 14703, 26578, 52980, 118, 157, 68999, 11565, 24093, 32992, 94954, 73522, 42424, 11490, 109544, 149, 52980, 10731, 32992, 30340, 108880, 34065, 155, 39272, 11259, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "30" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Scotland", "'", "s", "Jim", "Tel", "##fer", "was", "officially", "confirmed", "on", "Thursday", "as", "assistant", "coach", "for", "the", "British", "Lions", "tour", "to", "South", "Africa", "next", "year", "." ], "ids": [ 16901, 112, 187, 14178, 25369, 14854, 10134, 23296, 27347, 10135, 67067, 10146, 20999, 15701, 10142, 10105, 11160, 32966, 12842, 10114, 11056, 12880, 13451, 10924, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Tel", "##fer", ",", "who", "has", "put", "on", "hold", "his", "role", "as", "Scotland", "team", "manager", "for", "a", "year", ",", "will", "act", "as", "assistant", "to", "Ian", "M", "##c", "##G", "##ee", "##chan", "." ], "ids": [ 25369, 14854, 117, 10479, 10393, 14499, 10135, 18500, 10226, 12971, 10146, 16901, 11121, 16935, 10142, 169, 10924, 117, 11337, 19833, 10146, 20999, 10114, 16582, 150, 10350, 11447, 13321, 47019, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "The", "pair", "last", "worked", "together", "when", "Scotland", "won", "the", "Five", "Nations", "grand", "sl", "##am", "in", "1990", "." ], "ids": [ 10117, 27643, 12469, 13858, 14229, 10841, 16901, 11367, 10105, 19268, 15145, 13023, 38523, 11008, 10106, 10420, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tour", "party", "will", "be", "announced", "towards", "the", "end", "of", "March", "." ], "ids": [ 10117, 12842, 14039, 11337, 10347, 13854, 18095, 10105, 11572, 10108, 11144, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "CH", "##RI", "##ST", "##IE", "TO", "R", "##UN", "IN", "BE", "##R", "##L", "##IN", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 39774, 46876, 32995, 71655, 58573, 155, 69849, 36351, 46291, 11273, 11369, 27128, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lin", "##ford", "Christie", "has", "confirmed", "he", "will", "run", "in", "a", "\"", "Dream", "Team", "\"", "sprint", "relay", "at", "the", "Berlin", "grand", "prix", "athletics", "meeting", "on", "Friday", "." ], "ids": [ 35207, 13387, 34964, 10393, 27347, 10261, 11337, 14095, 10106, 169, 107, 17316, 12140, 107, 42707, 74973, 10160, 10105, 11193, 13023, 18236, 98600, 19822, 10135, 30767, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "spoke", "##s", "##woman", "for", "Christie", "said", "the", "former", "Olympic", "100", "metres", "champion", "had", "agreed", "to", "captain", "a", "quality", "quart", "##et", "which", "also", "includes", "Canada", "'", "s", "Donovan", "Bailey", ",", "the", "current", "Olympic", "champion", "and", "world", "record", "holder", ",", "and", "Namibia", "##n", "Frankie", "Frederick", "##s", "." ], "ids": [ 138, 50005, 10107, 79999, 10142, 34964, 12415, 10105, 11775, 17952, 10407, 16393, 17689, 10374, 25577, 10114, 28157, 169, 21905, 49461, 10308, 10319, 10379, 15433, 11635, 112, 187, 55072, 29761, 117, 10105, 14978, 17952, 17689, 10111, 11356, 12410, 48938, 117, 10111, 46670, 10115, 51059, 17132, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Christie", "is", "retiring", "from", "international", "competition", "at", "the", "end", "of", "the", "season", ",", "but", "Berlin", "promote", "##r", "Rudi", "Th", "##iel", "has", "pers", "##ua", "##ded", "him", "to", "join", "what", "is", "intended", "to", "be", "a", "special", "tribute", "to", "Jesse", "Owens", ",", "who", "won", "four", "gold", "medals", "60", "years", "ago", "at", "the", "Berlin", "Olympics", "." ], "ids": [ 34964, 10124, 75933, 10188, 12533, 16622, 10160, 10105, 11572, 10108, 10105, 11226, 117, 10473, 11193, 32807, 10129, 74202, 51635, 19428, 10393, 108839, 11908, 21597, 10957, 10114, 23707, 12976, 10124, 24071, 10114, 10347, 169, 14478, 51903, 10114, 27213, 58551, 117, 10479, 11367, 11598, 18128, 48512, 10709, 10855, 36390, 10160, 10105, 11193, 19185, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "B-MISC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 2, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GR", "##O", "##BB", "##EL", "##AA", "##R", "NA", "##ME", "##D", "T", "##EM", "##PO", "##RA", "##R", "##Y", "Z", "##IM", "##BA", "##B", "##W", "##E", "CO", "##AC", "##H", "." ], "ids": [ 71020, 65622, 24093, 118, 58787, 11403, 79281, 68999, 62281, 11273, 56586, 42424, 11490, 157, 67753, 93520, 29990, 11273, 14703, 163, 42031, 35999, 11274, 13034, 11259, 32992, 30340, 12396, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##AR", "##AR", "##E", "1996", "-", "08", "-", "29" ], "ids": [ 145, 52188, 52188, 11259, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "England", "-", "based", "goalkeeper", "Bruce", "G", "##ro", "##bbe", "##laar", "has", "been", "appointed", "temporary", "head", "coach", "of", "the", "Zimbabwe", "national", "soccer", "team", "for", "two", "international", "matches", ",", "the", "Zimbabwe", "Football", "Association", "(", "Z", "##IF", "##A", ")", "said", "on", "Thursday", "." ], "ids": [ 11701, 118, 11610, 84159, 14686, 144, 10567, 28053, 100112, 10393, 10590, 14896, 43270, 13578, 15701, 10108, 10105, 34577, 11844, 41356, 11121, 10142, 10551, 12533, 18258, 117, 10105, 34577, 12499, 11751, 113, 163, 53668, 10738, 114, 12415, 10135, 67067, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Z", "##IF", "##A", "vice", "-", "chairman", "Vincent", "Pam", "##ire", "said", "G", "##ro", "##bbe", "##laar", "would", "take", "charge", "for", "a", "match", "against", "Tanzania", "in", "Hara", "##re", "on", "September", "29", "in", "the", "five", "-", "nation", "Castle", "Cup", "of", "Africa", "tournament", "and", "an", "African", "Nations", "'", "Cup", "first", "round", "qualifier", "against", "Sudan", "in", "K", "##hart", "##oum", "on", "October", "5", "." ], "ids": [ 163, 53668, 10738, 16543, 118, 27627, 16179, 95101, 11627, 12415, 144, 10567, 28053, 100112, 10894, 13574, 18163, 10142, 169, 12356, 11327, 22580, 10106, 46205, 10246, 10135, 10596, 10386, 10106, 10105, 12403, 118, 22274, 17064, 11544, 10108, 12880, 17390, 10111, 10151, 13839, 15145, 112, 11544, 10422, 13569, 96076, 11327, 28407, 10106, 148, 34567, 88314, 10135, 11212, 126, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 4, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 1, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##ro", "##bbe", "##laar", "takes", "over", "until", "a", "permanent", "replacement", "is", "appointed", "for", "Zimbabwe", "'", "s", "previous", "coach", ",", "Switzerland", "'", "s", "Marc", "Du", "##villa", "##rd", "." ], "ids": [ 144, 10567, 28053, 100112, 19135, 10491, 11444, 169, 21295, 41636, 10124, 14896, 10142, 34577, 112, 187, 16741, 15701, 117, 26002, 112, 187, 15254, 14925, 68753, 12023, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "G", "##ro", "##bbe", "##laar", "now", "plays", "for", "English", "second", "division", "leaders", "Plymouth", "Ar", "##gy", "##le", "after", "years", "in", "the", "top", "flight", "with", "Liverpool", "and", "Southampton", "." ], "ids": [ 144, 10567, 28053, 100112, 11858, 17724, 10142, 11616, 11132, 13751, 24155, 40814, 18484, 17113, 10284, 10662, 10855, 10106, 10105, 12364, 23578, 10169, 18376, 10111, 45113, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 2, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 9, 3, 9 ] }, { "tokens": [ "G", "##ro", "##bbe", "##laar", ",", "fellow", "goalkeeper", "Hans", "Se", "##gers", ",", "retired", "striker", "John", "Fa", "##shan", "##u", "and", "Malaysian", "businessman", "Hen", "##g", "Sua", "##n", "Lim", "pl", "##ead", "##ed", "not", "guilty", "in", "May", "to", "charges", "of", "giving", "or", "accept", "##ing", "br", "##ibes", "to", "fi", "##x", "English", "premier", "league", "matches", "." ], "ids": [ 144, 10567, 28053, 100112, 117, 24619, 84159, 11768, 11045, 30787, 117, 18675, 103325, 10421, 44271, 60511, 10138, 10111, 72413, 49910, 86362, 10240, 24157, 10115, 64200, 20648, 30297, 10336, 10472, 56044, 10106, 10725, 10114, 31128, 10108, 24426, 10345, 45218, 10230, 33989, 74844, 10114, 14045, 10686, 11616, 11913, 15616, 18258, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 2, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "They", "are", "due", "to", "stand", "trial", "next", "January", "." ], "ids": [ 11696, 10301, 10850, 10114, 14603, 23626, 13451, 11238, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##S", "##K", "##ET", "##BA", "##LL", "-", "OL", "##Y", "##MP", "##IA", "##KO", "##S", "BE", "##AT", "DIN", "##AM", "##O", "69", "-", "60", "." ], "ids": [ 39999, 10731, 11733, 52338, 35999, 82834, 118, 19768, 14703, 79936, 35976, 57277, 10731, 46291, 32071, 63617, 36535, 11403, 12573, 118, 10709, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "29" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Olympia", "##kos", "of", "Greece", "beat", "Russia", "'", "s", "Dinamo", "69", "-", "60", "(", "half", "##time", "35", "-", "23", ")", "in", "the", "third", "match", "of", "an", "international", "basketball", "tournament", "on", "Thursday", ",", "qualifying", "for", "the", "finals", "." ], "ids": [ 39624, 18845, 10108, 25154, 27868, 14664, 112, 187, 35011, 12573, 118, 10709, 113, 13877, 18086, 10803, 118, 10328, 114, 10106, 10105, 12628, 12356, 10108, 10151, 12533, 22111, 17390, 10135, 67067, 117, 43631, 10142, 10105, 21758, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 1, 9, 1, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Partizan", "and", "Red", "Star", "of", "Yugoslavia", ",", "Alba", "of", "Germany", ",", "and", "Ben", "##etto", "##n", "of", "Italy", "are", "also", "taking", "part", "in", "the", "event", "which", "continues", "until", "Saturday", "." ], "ids": [ 93130, 10111, 11641, 11836, 10108, 38168, 117, 26613, 10108, 12775, 117, 10111, 13304, 24327, 10115, 10108, 11619, 10301, 10379, 18084, 10668, 10106, 10105, 14416, 10319, 25266, 11444, 24848, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O", "B-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 9, 1, 9, 3, 9, 1, 9, 9, 3, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ad", "##d", "results" ], "ids": [ 25474, 10162, 17466 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Partizan", "beat", "Ben", "##etto", "##n", "97", "-", "94", "(", "half", "##time", "39", "-", "32", ")", "." ], "ids": [ 93130, 27868, 13304, 24327, 10115, 12328, 118, 12749, 113, 13877, 18086, 11303, 118, 10842, 114, 119 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Final", "Partizan", "v", "Olympia", "##kos", "." ], "ids": [ 14924, 93130, 190, 39624, 18845, 119 ], "entity": [ "O", "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 9, 3, 7, 9 ] }, { "tokens": [ "S", "##Q", "##U", "##AS", "##H", "-", "H", "##ON", "##G", "KO", "##NG", "OP", "##EN", "SEC", "##ON", "##D", "R", "##O", "##UN", "##D", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 156, 19282, 12022, 38025, 12396, 118, 145, 30118, 11447, 67422, 34065, 55355, 50655, 92031, 30118, 11490, 155, 11403, 69849, 11490, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "29" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "round", "results", "in", "the", "Hong", "Kong", "Open", "on", "Thursday", "(", "pre", "##fix", "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 14181, 13569, 17466, 10106, 10105, 15078, 14577, 11919, 10135, 67067, 113, 12229, 57014, 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "Jan", "##sher", "Khan", "(", "Pakistan", ")", "beat", "Simon", "Fr", "##enz", "(", "Germany", ")", "15", "-", "12", "15", "-", "7", "12", "-", "15", "15", "-", "10" ], "ids": [ 122, 118, 11806, 94001, 16324, 113, 15437, 114, 27868, 12237, 33884, 29925, 113, 12775, 114, 10208, 118, 10186, 10208, 118, 128, 10186, 118, 10208, 10208, 118, 10150 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Cai", "##rns", "(", "England", ")", "beat", "Joseph", "K", "##nei", "##pp", "(", "Australia", ")", "8", "-", "15", "15", "-", "12", "15", "-", "8", "15", "-", "8" ], "ids": [ 11997, 90152, 42481, 113, 11701, 114, 27868, 11379, 148, 34773, 16587, 113, 11729, 114, 129, 118, 10208, 10208, 118, 10186, 10208, 118, 129, 10208, 118, 129 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anthony", "Hill", "(", "Australia", ")", "beat", "Mir", "Zaman", "G", "##ul", "(", "Pakistan", ")", "15", "-", "12", "15", "-", "11", "15", "-", "13" ], "ids": [ 14751, 12289, 113, 11729, 114, 27868, 43209, 71374, 144, 10604, 113, 15437, 114, 10208, 118, 10186, 10208, 118, 10193, 10208, 118, 10249 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dan", "Jens", "##on", "(", "Australia", ")", "beat", "3", "-", "Brett", "Martin", "(", "Australia", ")", "15", "-", "9", "17", "-", "14", "7", "-", "15", "9", "-", "15", "15", "-", "14" ], "ids": [ 14261, 30780, 10263, 113, 11729, 114, 27868, 124, 118, 43719, 11235, 113, 11729, 114, 10208, 118, 130, 10273, 118, 10247, 128, 118, 10208, 130, 118, 10208, 10208, 118, 10247 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "Peter", "Nico", "##l", "(", "Scotland", ")", "beat", "Jon", "##ath", "##on", "Power", "(", "Canada", ")", "15", "-", "10", "15", "-", "9", "15", "-", "9" ], "ids": [ 125, 118, 10979, 44557, 10161, 113, 16901, 114, 27868, 17749, 44196, 10263, 12952, 113, 11635, 114, 10208, 118, 10150, 10208, 118, 130, 10208, 118, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "Chris", "Walker", "(", "England", ")", "beat", "Am", "##r", "Sha", "##bana", "(", "Egypt", ")", "15", "-", "13", "15", "-", "10", "15", "-", "6" ], "ids": [ 128, 118, 13151, 15432, 113, 11701, 114, 27868, 11500, 10129, 106583, 31380, 113, 20440, 114, 10208, 118, 10249, 10208, 118, 10150, 10208, 118, 127 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Derek", "Ryan", "(", "Ireland", ")", "beat", "Paul", "Johnson", "(", "England", ")", "10", "-", "15", "15", "-", "5", "12", "-", "15", "15", "-", "12", "15", "-", "11" ], "ids": [ 30815, 16466, 113, 14637, 114, 27868, 10772, 13241, 113, 11701, 114, 10150, 118, 10208, 10208, 118, 126, 10186, 118, 10208, 10208, 118, 10186, 10208, 118, 10193 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", "-", "Rodney", "E", "##yle", "##s", "(", "Australia", ")", "beat", "Zu", "##bai", "##r", "Ja", "##han", "Khan", "(", "Pakistan", ")", "15", "-", "10", "15", "-", "8", "9", "-", "15", "13", "-", "15", "15", "-", "4", "." ], "ids": [ 123, 118, 53784, 142, 18369, 10107, 113, 11729, 114, 27868, 16229, 47727, 10129, 28248, 11781, 16324, 113, 15437, 114, 10208, 118, 10150, 10208, 118, 129, 130, 118, 10208, 10249, 118, 10208, 10208, 118, 125, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "RE", "##SU", "##L", "##TS", "OF", "SO", "##UT", "##H", "KO", "##RE", "##AN", "PR", "##O", "-", "SO", "##CC", "##ER", "GA", "##ME", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 71033, 88592, 11369, 36545, 23240, 71020, 65729, 12396, 67422, 66014, 41275, 23837, 11403, 118, 71020, 65622, 24093, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "29" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "South", "Korean", "pro", "-", "soccer" ], "ids": [ 33036, 10108, 11056, 20501, 11284, 118, 41356 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "games", "played", "on", "Wednesday", "." ], "ids": [ 13332, 11553, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##nan", "4", "Any", "##ang", "1", "(", "half", "##time", "1", "-", "0", ")" ], "ids": [ 50690, 13470, 125, 47336, 11889, 122, 113, 13877, 18086, 122, 118, 121, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##won", "4", "P", "##usan", "0", "(", "half", "##time", "2", "-", "0", ")" ], "ids": [ 12271, 36816, 125, 153, 29885, 121, 113, 13877, 18086, 123, 118, 121, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "after", "games", "played", "on", "Wednesday", "(", "tab", "##ulate", "under", "-" ], "ids": [ 58592, 10107, 10662, 13332, 11553, 10135, 57611, 113, 100781, 70863, 10571, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "won", ",", "drawn", ",", "lost", ",", "goals", "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 11367, 117, 34788, 117, 14172, 117, 18173, 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "D", "L", "G", "/", "F", "G", "/", "A", "P" ], "ids": [ 160, 141, 149, 144, 120, 143, 144, 120, 138, 153 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##nan", "3", "0", "1", "13", "10", "9" ], "ids": [ 50690, 13470, 124, 121, 122, 10249, 10150, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##uch", "##on", "2", "1", "0", "4", "0", "7" ], "ids": [ 153, 20591, 10263, 123, 122, 121, 125, 121, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Su", "##won", "1", "3", "0", "7", "3", "6" ], "ids": [ 12271, 36816, 122, 124, 121, 128, 124, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Po", "##hang", "1", "1", "1", "8", "8", "4" ], "ids": [ 11255, 30222, 122, 122, 122, 129, 129, 125 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", "##ls", "##an", "1", "0", "1", "6", "6", "3" ], "ids": [ 158, 11747, 10206, 122, 121, 122, 127, 127, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Any", "##ang", "0", "3", "1", "6", "9", "3" ], "ids": [ 47336, 11889, 121, 124, 122, 127, 130, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##nna", "##m", "0", "2", "1", "4", "5", "2" ], "ids": [ 50690, 16441, 10147, 121, 123, 122, 125, 126, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##usan", "0", "2", "1", "3", "7", "2" ], "ids": [ 153, 29885, 121, 123, 122, 124, 128, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cho", "##n", "##buk", "0", "0", "2", "2", "5", "0" ], "ids": [ 50690, 10115, 58074, 121, 121, 123, 123, 126, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "RE", "##SU", "##L", "##TS", "OF", "S", ".", "KO", "##RE", "##AN", "PR", "##O", "-", "BA", "##SE", "##BA", "##LL", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 71033, 88592, 11369, 36545, 23240, 156, 119, 67422, 66014, 41275, 23837, 11403, 118, 39999, 39039, 35999, 82834, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "29" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "South", "Korean" ], "ids": [ 33036, 10108, 11056, 20501 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "pro", "-", "baseball", "games", "played", "on", "Wednesday", "." ], "ids": [ 11284, 118, 22450, 13332, 11553, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LG", "5", "O", "##B", "1" ], "ids": [ 49780, 126, 152, 11274, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "O", "##B", "4", "LG", "3" ], "ids": [ 152, 11274, 125, 49780, 124 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 9 ] }, { "tokens": [ "S", "##sang", "##bang", "##wo", "##ol", "12", "Han", "##w", "##ha", "0" ], "ids": [ 156, 45952, 26337, 16828, 11481, 10186, 10818, 10874, 10921, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Han", "##w", "##ha", "12", "S", "##sang", "##bang", "##wo", "##ol", "5" ], "ids": [ 10818, 10874, 10921, 10186, 156, 45952, 26337, 16828, 11481, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Lotte", "4", "Hyundai", "0" ], "ids": [ 102530, 125, 72344, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Samsung", "7", "Hai", "##tai", "1" ], "ids": [ 37077, 128, 26329, 26812, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 9 ] }, { "tokens": [ "Note", "-", "LG", "and", "O", "##B", ",", "S", "##sang", "##bang", "##wo", "##ol", "and", "Han", "##w", "##ha", "played", "two", "games", "." ], "ids": [ 20231, 118, 49780, 10111, 152, 11274, 117, 156, 45952, 26337, 16828, 11481, 10111, 10818, 10874, 10921, 11553, 10551, 13332, 119 ], "entity": [ "O", "O", "B-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 3, 7, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Standing", "##s", "after", "games", "played", "on", "Wednesday", "(", "tab", "##ulate", "under" ], "ids": [ 58592, 10107, 10662, 13332, 11553, 10135, 57611, 113, 100781, 70863, 10571 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "won", ",", "drawn", ",", "lost", ",", "winning", "percentage", ",", "games", "behind", "first", "place", ")" ], "ids": [ 11367, 117, 34788, 117, 14172, 117, 16542, 46971, 117, 13332, 17155, 10422, 11192, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "D", "L", "PC", "##T", "GB" ], "ids": [ 160, 141, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hai", "##tai", "63", "2", "42", ".", "598", "-" ], "ids": [ 26329, 26812, 12256, 123, 11276, 119, 59066, 118 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##sang", "##bang", "##wo", "##ol", "59", "2", "48", ".", "500", "5" ], "ids": [ 156, 45952, 26337, 16828, 11481, 11867, 123, 11300, 119, 10757, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Han", "##w", "##ha", "57", "1", "49", ".", "537", "6", "1", "/", "2" ], "ids": [ 10818, 10874, 10921, 11817, 122, 11580, 119, 49980, 127, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hyundai", "56", "5", "48", ".", "536", "6", "1", "/", "2" ], "ids": [ 72344, 11628, 126, 11300, 119, 45913, 127, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Samsung", "48", "5", "55", ".", "468", "14" ], "ids": [ 37077, 11300, 126, 11358, 119, 47121, 10247 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lotte", "45", "6", "53", ".", "462", "14", "1", "/", "2" ], "ids": [ 102530, 10827, 127, 11756, 119, 44574, 10247, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LG", "45", "5", "59", ".", "436", "17", "1", "/", "2" ], "ids": [ 49780, 10827, 126, 11867, 119, 43630, 10273, 122, 120, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##B", "42", "6", "61", ".", "413", "20" ], "ids": [ 152, 11274, 11276, 127, 12314, 119, 39245, 10197 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "T", "##H", "##UR", "##SD", "##A", "##Y", "'", "S", "RE", "##SU", "##L", "##TS", "FR", "##OM", "THE", "U", ".", "S", ".", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 157, 12396, 98348, 83452, 10738, 14703, 112, 156, 71033, 88592, 11369, 36545, 64655, 37079, 17443, 158, 119, 156, 119, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "second", "round", "matches", "on", "Thursday", "in", "the", "U", ".", "S", ".", "Open", "Tennis", "Championships", "at", "the", "National", "Tennis", "Centre", "(", "pre", "##fix", "number", "den", "##otes", "seed", "##ing", ")", ":" ], "ids": [ 33036, 10108, 11132, 13569, 18258, 10135, 67067, 10106, 10105, 158, 119, 156, 119, 11919, 27380, 17264, 10160, 10105, 10655, 27380, 12838, 113, 12229, 57014, 11487, 10140, 54989, 49282, 10230, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles" ], "ids": [ 13536, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Anna", "Ko", "##urn", "##iko", "##va", "(", "Russia", ")", "beat", "Natalia", "Bau", "##done", "(", "Italy", ")", "6", "-", "3", "6", "-", "3" ], "ids": [ 12300, 30186, 63158, 18924, 10362, 113, 14664, 114, 27868, 51946, 18727, 99726, 113, 11619, 114, 127, 118, 124, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rita", "Grande", "(", "Italy", ")", "beat", "Tina", "Kr", "##iza", "##n", "(", "Slovenia", ")", "6", "-", "2", "6", "-", "0" ], "ids": [ 25105, 12800, 113, 11619, 114, 27868, 34225, 17640, 24213, 10115, 113, 34583, 114, 127, 118, 123, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Els", "Calle", "##ns", "(", "Belgium", ")", "beat", "Anna", "##bel", "El", "##l", "##wood", "(", "Australia", ")", "6", "-", "4" ], "ids": [ 13075, 57433, 10891, 113, 26519, 114, 27868, 12300, 13770, 10224, 10161, 14759, 113, 11729, 114, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "6", "6", "-", "1" ], "ids": [ 122, 118, 127, 127, 118, 122 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Elena", "Li", "##kh", "##ov", "##tse", "##va", "(", "Russia", ")", "beat", "Lil", "##a", "Ost", "##er", "##loh", "(", "U", ".", "S", ".", ")", "6", "-", "4", "6", "-", "2" ], "ids": [ 22342, 13258, 48502, 11024, 45507, 10362, 113, 14664, 114, 27868, 46242, 10113, 32352, 10165, 75887, 113, 158, 119, 156, 119, 114, 127, 118, 125, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sandra", "Do", "##pfer", "(", "Austria", ")", "beat", "Nan", "##ne", "Dahl", "##man", "(", "Finland", ")", "2", "-", "6", "6", "-", "2" ], "ids": [ 31433, 11791, 69828, 113, 14479, 114, 27868, 44286, 10238, 55809, 10589, 113, 15497, 114, 123, 118, 127, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "3" ], "ids": [ 127, 118, 124 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles" ], "ids": [ 13026, 112, 187, 20527 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "13", "-", "Thomas", "En", "##qvist", "(", "Sweden", ")", "beat", "Guillaume", "Rao", "##ux", "(", "France", ")", "6", "-", "3" ], "ids": [ 10249, 118, 11096, 10243, 47780, 113, 20937, 114, 27868, 20619, 44776, 11855, 113, 10688, 114, 127, 118, 124 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "2", "6", "-", "3" ], "ids": [ 127, 118, 123, 127, 118, 124 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ser", "##gi", "Br", "##ugu", "##era", "(", "Spain", ")", "beat", "Michael", "St", "##ich", "(", "Germany", ")", "6", "-", "3", "6", "-", "2" ], "ids": [ 39759, 11210, 38508, 47630, 12015, 113, 16149, 114, 27868, 10631, 10838, 14401, 113, 12775, 114, 127, 118, 124, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "4" ], "ids": [ 127, 118, 125 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Jakob", "H", "##lase", "##k", "(", "Switzerland", ")", "beat", "Alberto", "Be", "##ras", "##ate", "##gui", "(", "Spain", ")", "7", "-", "6", "(", "7", "-", "5", ")", "7", "-", "6", "(", "9", "-", "7", ")", "6", "-", "0" ], "ids": [ 22110, 145, 77031, 10174, 113, 26002, 114, 27868, 15796, 14321, 12783, 12436, 55818, 113, 16149, 114, 128, 118, 127, 113, 128, 118, 126, 114, 128, 118, 127, 113, 130, 118, 128, 114, 127, 118, 121 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", "-", "St", "##ef", "##fi", "Graf", "(", "Germany", ")", "beat", "Karin", "K", "##sch", "##wen", "##dt", "(", "Austria", ")", "6", "-", "2", "6", "-", "1" ], "ids": [ 122, 118, 10838, 16822, 14403, 20617, 113, 12775, 114, 27868, 41633, 148, 12044, 19584, 14892, 113, 14479, 114, 127, 118, 123, 127, 118, 122 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Na", "##oko", "Ki", "##jim", "##uta", "(", "Japan", ")", "beat", "Alexandra", "Fu", "##sai", "(", "France", ")", "6", "-", "4", "7", "-", "5" ], "ids": [ 10685, 20954, 28941, 60911, 14118, 113, 11891, 114, 27868, 23438, 17056, 32912, 113, 10688, 114, 127, 118, 125, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Natasha", "Z", "##vere", "##va", "(", "Belarus", ")", "beat", "Ai", "Su", "##gi", "##yama", "(", "Japan", ")", "4", "-", "6", "6", "-", "4", "6", "-", "3" ], "ids": [ 79827, 163, 29282, 10362, 113, 55131, 114, 27868, 19672, 12271, 11210, 32529, 113, 11891, 114, 125, 118, 127, 127, 118, 125, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "14", "-", "Barbara", "Paulus", "(", "Austria", ")", "beat", "Elena", "Wagner", "(", "Germany", ")", "7", "-", "5", "7", "-", "6", "(", "7", "-", "5", ")" ], "ids": [ 10247, 118, 16010, 33470, 113, 14479, 114, 27868, 22342, 19821, 113, 12775, 114, 128, 118, 126, 128, 118, 127, 113, 128, 118, 126, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Petra", "Lang", "##rova", "(", "Czech", "Republic", ")", "beat", "Na", "##oko", "Saw", "##amat", "##su", "(", "Japan", ")", "6", "-", "4", "3", "-", "6", "7", "-", "5" ], "ids": [ 27357, 23798, 36657, 113, 22148, 13681, 114, 27868, 10685, 20954, 74666, 49158, 12892, 113, 11891, 114, 127, 118, 125, 124, 118, 127, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "17", "-", "Karin", "##a", "Ha", "##bs", "##udo", "##va", "(", "Slovakia", ")", "beat", "Nathalie", "Dec", "##hy", "(", "France", ")", "6", "-", "4", "6", "-", "2" ], "ids": [ 10273, 118, 41633, 10113, 13740, 19528, 33498, 10362, 113, 43031, 114, 27868, 64682, 46147, 19275, 113, 10688, 114, 127, 118, 125, 127, 118, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", "-", "Jana", "Novo", "##tna", "(", "Czech", "Republic", ")", "beat", "Florencia", "Laba", "##t", "(", "Argentina", ")", "6", "-", "2", "4", "-", "6", "6", "-", "2" ], "ids": [ 128, 118, 18909, 28649, 34247, 113, 22148, 13681, 114, 27868, 80221, 88739, 10123, 113, 12853, 114, 127, 118, 123, 125, 118, 127, 127, 118, 123 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13026, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "Thomas", "Must", "##er", "(", "Austria", ")", "beat", "Dirk", "Die", "##r", "(", "Germany", ")", "6", "-", "3", "6", "-", "2", "6", "-", "4" ], "ids": [ 124, 118, 11096, 54690, 10165, 113, 14479, 114, 27868, 38535, 10236, 10129, 113, 12775, 114, 127, 118, 124, 127, 118, 123, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pablo", "Camp", "##ana", "(", "Ecuador", ")", "beat", "Mark", "Knowles", "(", "Bahamas", ")", "7", "-", "6", "(", "7", "-", "3", ")", "3", "-", "6", "6", "-", "3", "6", "-", "7", "(", "3", "-", "7", ")", "6", "-", "3" ], "ids": [ 17199, 20020, 11631, 113, 20475, 114, 27868, 11997, 69382, 113, 64534, 114, 128, 118, 127, 113, 128, 118, 124, 114, 124, 118, 127, 127, 118, 124, 127, 118, 128, 113, 124, 118, 128, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jason", "St", "##olt", "##enberg", "(", "Australia", ")", "beat", "Kenneth", "Carl", "##sen", "(", "Denmark", ")", "6", "-", "3", "7", "-", "6", "(", "7", "-", "1", ")", "6", "-", "3" ], "ids": [ 16796, 10838, 27667, 24304, 113, 11729, 114, 27868, 22369, 12225, 10917, 113, 25854, 114, 127, 118, 124, 128, 118, 127, 113, 128, 118, 122, 114, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Arnaud", "Bo", "##ets", "##ch", "(", "France", ")", "beat", "Magnus", "Gustaf", "##sson", "(", "Sweden", ")", "7", "-", "6", "(", "8", "-", "6", ")", "6", "-", "3", "6", "-", "1" ], "ids": [ 56856, 27622, 17137, 10269, 113, 10688, 114, 27868, 22940, 36183, 14650, 113, 20937, 114, 128, 118, 127, 113, 129, 118, 127, 114, 127, 118, 124, 127, 118, 122 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ad", "##d", "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 25474, 10162, 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "16", "-", "Martina", "Hi", "##ngi", "##s", "(", "Switzerland", ")", "beat", "Miriam", "Or", "##eman", "##s", "(", "Netherlands", ")", "6", "-", "4", "6", "-", "4" ], "ids": [ 10250, 118, 35012, 20065, 31681, 10107, 113, 26002, 114, 27868, 60176, 19372, 31087, 10107, 113, 22043, 114, 127, 118, 125, 127, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tam", "##i", "W", "##hit", "##linger", "Jones", "(", "U", ".", "S", ".", ")", "beat", "Amy", "Fra", "##zier", "(", "U", ".", "S", ".", ")", "7", "-", "6", "(", "7", "-", "3", ")", "6", "-", "2" ], "ids": [ 27324, 10116, 160, 40762, 51099, 12298, 113, 158, 119, 156, 119, 114, 27868, 23149, 18633, 43815, 113, 158, 119, 156, 119, 114, 128, 118, 127, 113, 128, 118, 124, 114, 127, 118, 123 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Judith", "Wie", "##sne", "##r", "(", "Austria", ")", "beat", "Debbie", "Graham", "(", "U", ".", "S", ".", ")", "6", "-", "2", "7", "-", "5" ], "ids": [ 35043, 23789, 28395, 10129, 113, 14479, 114, 27868, 78808, 16928, 113, 158, 119, 156, 119, 114, 127, 118, 123, 128, 118, 126 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ad", "##d", "Men", "'", "s", "singles", ",", "second", "round" ], "ids": [ 25474, 10162, 13026, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", "-", "Andre", "Aga", "##ssi", "(", "U", ".", "S", ".", ")", "beat", "Lea", "##nder", "Pa", "##es", "(", "India", ")", "3", "-", "6", "6", "-", "4", "6", "-", "1", "6", "-", "0" ], "ids": [ 127, 118, 25188, 103721, 28377, 113, 158, 119, 156, 119, 114, 27868, 46231, 16497, 26907, 10171, 113, 11098, 114, 124, 118, 127, 127, 118, 125, 127, 118, 122, 127, 118, 121 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Javier", "Sanchez", "(", "Spain", ")", "beat", "Jim", "Grab", "##b", "(", "U", ".", "S", ".", ")", "6", "-", "2", "7", "-", "6", "(", "7", "-", "3", ")", "2", "-", "6", "6", "-", "3" ], "ids": [ 22856, 66007, 113, 16149, 114, 27868, 14178, 61020, 10457, 113, 158, 119, 156, 119, 114, 127, 118, 123, 128, 118, 127, 113, 128, 118, 124, 114, 123, 118, 127, 127, 118, 124 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Her", "##nan", "G", "##um", "##y", "(", "Argentina", ")", "beat", "Jared", "Palmer", "(", "U", ".", "S", ".", ")", "6", "-", "7", "(", "5", "-", "7", ")", "6", "-", "3", "7", "-", "6", "(", "7", "-", "4", ")", "0", "-", "6", "7", "-", "6", "(", "7", "-", "1", ")" ], "ids": [ 13229, 13470, 144, 10465, 10157, 113, 12853, 114, 27868, 77741, 26161, 113, 158, 119, 156, 119, 114, 127, 118, 128, 113, 126, 118, 128, 114, 127, 118, 124, 128, 118, 127, 113, 128, 118, 125, 114, 121, 118, 127, 128, 118, 127, 113, 128, 118, 122, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ ":" ], "ids": [ 131 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Women", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13536, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", "-", "Ara", "##nt", "##xa", "Sanchez", "Vic", "##ario", "(", "Spain", ")", "beat", "Nicole", "Are", "##ndt", "(", "U", ".", "S", ".", ")" ], "ids": [ 124, 118, 54789, 10368, 14220, 66007, 39574, 16780, 113, 16149, 114, 27868, 27142, 13491, 33096, 113, 158, 119, 156, 119, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "6", "-", "2", "6", "-", "2" ], "ids": [ 127, 118, 123, 127, 118, 123 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Men", "'", "s", "singles", ",", "second", "round" ], "ids": [ 13026, 112, 187, 20527, 117, 11132, 13569 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "David", "W", "##hea", "##ton", "(", "U", ".", "S", ".", ")", "beat", "Frederic", "Vito", "##ux", "(", "France", ")", "6", "-", "4", "6", "-", "4" ], "ids": [ 10804, 160, 45546, 11183, 113, 158, 119, 156, 119, 114, 27868, 43120, 55209, 11855, 113, 10688, 114, 127, 118, 125, 127, 118, 125 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", "-", "6", "7", "-", "6", "(", "7", "-", "4", ")" ], "ids": [ 125, 118, 127, 128, 118, 127, 113, 128, 118, 125, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jan", "Sie", "##meri", "##nk", "(", "Netherlands", ")", "beat", "Carlos", "Mo", "##ya", "(", "Spain", ")", "7", "-", "6" ], "ids": [ 11806, 11583, 85137, 17761, 113, 22043, 114, 27868, 12050, 34987, 10679, 113, 16149, 114, 128, 118, 127 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "(", "7", "-", "2", ")", "6", "-", "4", "6", "-", "4" ], "ids": [ 113, 128, 118, 123, 114, 127, 118, 125, 127, 118, 125 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "ST", "##AN", "##DI", "##NG", "##S", "AF", "##TER", "W", "##ED", "##NE", "##SD", "##A", "##Y", "'", "S", "GA", "##ME", "##S", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 53317, 41275, 58730, 34065, 10731, 55640, 99552, 160, 33809, 93280, 83452, 10738, 14703, 112, 156, 74212, 42424, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Major", "League", "Baseball" ], "ids": [ 14988, 11074, 27084 ], "entity": [ "B-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6 ] }, { "tokens": [ "standing", "##s", "after", "games", "played", "on", "Wednesday", "(", "tab", "##ulate", "under", "won", "," ], "ids": [ 32173, 10107, 10662, 13332, 11553, 10135, 57611, 113, 100781, 70863, 10571, 11367, 117 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "lost", ",", "winning", "percentage", "and", "games", "behind", ")", ":" ], "ids": [ 14172, 117, 16542, 46971, 10111, 13332, 17155, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ER", "##IC", "##AN", "LE", "##AG", "##UE" ], "ids": [ 24339, 24093, 30889, 41275, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "74", "58", ".", "561", "-" ], "ids": [ 86607, 13034, 162, 42622, 11733, 12535, 11824, 119, 51746, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "70", "62", ".", "530", "4" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 10923, 12066, 119, 31977, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "69", "65", ".", "515", "6" ], "ids": [ 139, 21793, 60493, 11537, 12573, 10843, 119, 41211, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "63", "71", ".", "470", "12" ], "ids": [ 58573, 35066, 77261, 11403, 12256, 12513, 119, 29231, 10186 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##T", "##RO", "##IT", "47", "86", ".", "353", "27", "1", "/", "2" ], "ids": [ 25067, 11090, 35066, 37611, 11413, 12224, 119, 35373, 10365, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "CL", "##E", "##VE", "##LA", "##ND", "80", "53", ".", "602", "-" ], "ids": [ 75151, 11259, 68560, 44376, 58521, 10832, 11756, 119, 50321, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "71", "64", ".", "526", "10" ], "ids": [ 39774, 30889, 109865, 11403, 12513, 11295, 119, 51559, 10150 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "66", "67", ".", "496", "14" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 12215, 12316, 119, 42498, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##L", "##WA", "##U", "##K", "##EE", "64", "70", ".", "478", "16", "1", "/", "2" ], "ids": [ 75416, 11369, 42196, 12022, 11733, 95825, 11295, 10923, 119, 47107, 10250, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "61", "73", ".", "455", "19", "1", "/", "2" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 12314, 12545, 119, 38767, 10270, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "T", "##E", "##X", "##AS", "75", "58", ".", "564", "-" ], "ids": [ 157, 11259, 12674, 38025, 11417, 11824, 119, 61846, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "69", "63", ".", "523", "5", "1", "/", "2" ], "ids": [ 23056, 32071, 11090, 51036, 12573, 12256, 119, 50564, 126, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##A", "##K", "##LA", "##ND", "64", "72", ".", "471", "12", "1", "/", "2" ], "ids": [ 152, 10738, 11733, 44376, 58521, 11295, 12120, 119, 31614, 10186, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##L", "##IF", "##OR", "##NI", "##A", "61", "72", ".", "459", "14" ], "ids": [ 24707, 11369, 53668, 42622, 52898, 10738, 12314, 12120, 119, 45671, 10247 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##H", "##UR", "##SD", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "29", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 157, 12396, 98348, 83452, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10386, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "AT", "DE", "##T", "##RO", "##IT" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 30554, 25067, 11090, 35066, 37611 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "MI", "##N", "##NE", "##S", "##OT", "##A", "AT", "MI", "##L", "##WA", "##U", "##K", "##EE" ], "ids": [ 75416, 11537, 93280, 10731, 62146, 10738, 30554, 75416, 11369, 42196, 12022, 11733, 95825 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "AT", "CA", "##L", "##IF", "##OR", "##NI", "##A" ], "ids": [ 86607, 13034, 162, 42622, 11733, 30554, 24707, 11369, 53668, 42622, 52898, 10738 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##L", "##TI", "##M", "##OR", "##E", "AT", "SE", "##AT", "##T", "##LE" ], "ids": [ 39999, 11369, 72286, 11517, 42622, 11259, 30554, 23056, 32071, 11090, 51036 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "NA", "##TION", "##AL", "LE", "##AG", "##UE" ], "ids": [ 56586, 98207, 32002, 84977, 109865, 62674 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6 ] }, { "tokens": [ "EA", "##ST", "##ER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 38478, 32995, 24093, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "W", "L", "PC", "##T", "GB" ], "ids": [ 160, 149, 16355, 11090, 32258 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "82", "49", ".", "626", "-" ], "ids": [ 30554, 44376, 77261, 10738, 12180, 11580, 119, 55440, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "71", "60", ".", "542", "11" ], "ids": [ 102059, 77261, 66014, 32002, 12513, 10709, 119, 51620, 10193 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "63", "70", ".", "474", "20" ], "ids": [ 83243, 42622, 28895, 10738, 12256, 10923, 119, 46989, 10197 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "59", "74", ".", "444", "24" ], "ids": [ 86607, 13034, 162, 42622, 11733, 11867, 12535, 119, 40984, 10233 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "54", "80", ".", "403", "29", "1", "/", "2" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 11653, 10832, 119, 36151, 10386, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CE", "##NT", "##RA", "##L", "DI", "##VI", "##SI", "##ON" ], "ids": [ 31078, 77261, 29990, 11369, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "72", "62", ".", "537", "-" ], "ids": [ 145, 11403, 32612, 60493, 11537, 12120, 12066, 119, 49980, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "L", "##O", "##UI", "##S", "69", "64", ".", "519", "2", "1", "/", "2" ], "ids": [ 53317, 149, 11403, 83259, 10731, 12573, 11295, 119, 52224, 123, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "65", "67", ".", "492", "6" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 10843, 12316, 119, 44609, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "64", "66", ".", "492", "6" ], "ids": [ 39774, 30889, 109865, 11403, 11295, 12215, 119, 44609, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "56", "76", ".", "424", "15" ], "ids": [ 153, 37611, 36545, 108865, 11273, 11447, 12396, 11628, 12428, 119, 40635, 10208 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##ES", "##TER", "##N", "DI", "##VI", "##SI", "##ON" ], "ids": [ 160, 25054, 99552, 11537, 110014, 90939, 44802, 30118 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "74", "60", ".", "552", "-" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 12535, 10709, 119, 44809, 118 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "71", "61", ".", "538", "2" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 12513, 12314, 119, 45677, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "70", "64", ".", "522", "4" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 10923, 11295, 119, 47305, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "57", "74", ".", "435", "15", "1", "/", "2" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 11817, 12535, 119, 36898, 10208, 122, 120, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##H", "##UR", "##SD", "##A", "##Y", ",", "AU", "##G", "##US", "##T", "29", "##TH", "SC", "##H", "##ED", "##UL", "##E" ], "ids": [ 157, 12396, 98348, 83452, 10738, 14703, 117, 29088, 11447, 32612, 11090, 10386, 109166, 18137, 12396, 33809, 100673, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "DI", "##EG", "##O", "AT", "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 21318, 11537, 110014, 104036, 11403, 30554, 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "AT", "H", "##O", "##US", "##TO", "##N" ], "ids": [ 39774, 30889, 109865, 11403, 30554, 145, 11403, 32612, 60493, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "C", "##IN", "##CI", "##N", "##NA", "##TI", "AT", "CO", "##L", "##OR", "##AD", "##O" ], "ids": [ 140, 27128, 89955, 11537, 36742, 72286, 30554, 32992, 11369, 42622, 55538, 11403 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "AT", "P", "##IT", "##TS", "##BU", "##R", "##G", "##H" ], "ids": [ 30554, 44376, 77261, 10738, 30554, 153, 37611, 36545, 108865, 11273, 11447, 12396 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5, 5, 5 ] }, { "tokens": [ "L", "##OS", "AN", "##GE", "##LE", "##S", "AT", "MO", "##NT", "##RE", "##AL" ], "ids": [ 149, 21793, 50972, 58719, 51036, 10731, 30554, 102059, 77261, 66014, 32002 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 5, 5, 5 ] }, { "tokens": [ "FL", "##OR", "##ID", "##A", "AT", "ST", "L", "##O", "##UI", "##S" ], "ids": [ 83243, 42622, 28895, 10738, 30554, 53317, 149, 11403, 83259, 10731 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 5, 5 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "Y", "##AN", "##K", "##EE", "##S", "BR", "##A", "##W", "##L", "AND", "CO", "##NT", "##IN", "##UE", "TO", "SL", "##ID", "##E", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 162, 41275, 11733, 95825, 10731, 49351, 10738, 13034, 11369, 52428, 32992, 77261, 27128, 62674, 58573, 52671, 28895, 11259, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "1996", "-", "08", "-", "29" ], "ids": [ 23056, 32071, 11090, 51036, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jay", "Bu", "##hner", "hit", "a", "three", "-", "run", "home", "##r", "and", "former", "Yankee", "Terry", "Mu", "##lho", "##lland", "allowed", "one", "run", "over", "seven", "innings", "as", "the", "Seattle", "Marine", "##rs", "completed", "a", "s", "##we", "##ep", "of", "New", "York", "with", "a", "10", "-", "2", "victory", "in", "a", "game", "mar", "##red", "by", "a", "bench", "-", "clear", "##ing", "bra", "##wl", "." ], "ids": [ 18559, 11916, 45930, 14946, 169, 11003, 118, 14095, 11816, 10129, 10111, 11775, 86837, 19902, 49056, 50403, 102474, 18162, 10464, 14095, 10491, 15767, 48974, 10146, 10105, 20902, 12425, 10943, 15782, 169, 187, 12577, 19986, 10108, 10287, 10482, 10169, 169, 10150, 118, 123, 19735, 10106, 169, 11661, 12318, 15711, 10155, 169, 86696, 118, 24866, 10230, 67603, 37676, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Inc", "##lu", "##ding", "the", "last", "three", "games", "of", "last", "October", "'", "s", "Division", "##al", "Play", "##off", "Series", ",", "the", "Marine", "##rs", "have", "beaten", "the", "Yankees", "12", "of", "the", "past", "15", "meetings", "overall", "and", "14", "of", "the", "last", "16", "in", "the", "Kingdom", "##e", "." ], "ids": [ 13604, 11435, 13971, 10105, 12469, 11003, 13332, 10108, 12469, 11212, 112, 187, 11987, 10415, 17712, 20584, 13239, 117, 10105, 12425, 10943, 10529, 74075, 10105, 60799, 10186, 10108, 10105, 17781, 10208, 47307, 20947, 10111, 10247, 10108, 10105, 12469, 10250, 10106, 10105, 14648, 10112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Five", "players", "were", "eje", "##cted", "after", "Yankees", "'", "out", "##field", "##er", "Paul", "O", "'", "Neill", "and", "Seattle", "catch", "##er", "John", "Mar", "##zano", "got", "into", "a", "fight", "after", "O", "'", "Neill", "had", "been", "br", "##ush", "##ed", "back", "." ], "ids": [ 19268, 16021, 10309, 86923, 27756, 10662, 60799, 112, 10950, 13408, 10165, 10772, 152, 112, 38269, 10111, 20902, 61093, 10165, 10421, 15734, 39874, 19556, 10708, 169, 20780, 10662, 152, 112, 38269, 10374, 10590, 33989, 37026, 10336, 12014, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Baltimore", ",", "Don", "Wen", "##gert", "threw", "a", "nine", "-", "hit", "##ter", "for", "his", "first", "shut", "##out", "and", "Jose", "Herrera", "had", "a", "two", "-", "run", "double", "in", "a", "three", "-", "run", "fifth", "inning", "as", "the", "Oakland", "Athletics", "bl", "##anke", "##d", "the", "Baltimore", "Or", "##iol", "##es", "3", "-", "0", "." ], "ids": [ 10167, 21413, 117, 11740, 64786, 57241, 80516, 169, 19964, 118, 14946, 10877, 10142, 10226, 10422, 70323, 17514, 10111, 23029, 39809, 10374, 169, 10551, 118, 14095, 15790, 10106, 169, 11003, 118, 14095, 22237, 110505, 10146, 10105, 38340, 46800, 21484, 62428, 10162, 10105, 21413, 19372, 35493, 10171, 124, 118, 121, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Wen", "##gert", "(", "7", "-", "9", ")", ",", "who", "failed", "to", "record", "a", "shut", "##out", "in", "his", "previous", "86", "starts", "in", "either", "the", "minor", "##s", "or", "majors", ",", "did", "not", "walk", "a", "bat", "##ter", "and", "struck", "out", "three", "for", "Oakland", "." ], "ids": [ 64786, 57241, 113, 128, 118, 130, 114, 117, 10479, 20775, 10114, 12410, 169, 70323, 17514, 10106, 10226, 16741, 12224, 33039, 10106, 16106, 10105, 17746, 10107, 10345, 86611, 117, 12172, 10472, 33734, 169, 11519, 10877, 10111, 45622, 10950, 11003, 10142, 38340, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "In", "Chicago", ",", "James", "Baldwin", "scattered", "five", "hits", "over", "seven", "score", "##less", "innings", "and", "Ray", "Durham", "and", "Oz", "##zie", "G", "##uille", "##n", "had", "RB", "##I", "hits", "in", "the", "second", "inning", "as", "the", "Chicago", "White", "Sox", "bl", "##anke", "##d", "the", "Milwaukee", "Brewer", "##s", "2", "-", "0", "." ], "ids": [ 10167, 12317, 117, 10900, 39185, 95335, 12403, 27922, 10491, 15767, 17704, 14985, 48974, 10111, 13871, 37499, 10111, 51358, 14548, 144, 69376, 10115, 10374, 71201, 11281, 27922, 10106, 10105, 11132, 110505, 10146, 10105, 12317, 12136, 55687, 21484, 62428, 10162, 10105, 36413, 109040, 10107, 123, 118, 121, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 4, 8, 8, 8, 8, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "Baldwin", "(", "10", "-", "4", ")", "struck", "out", "four", "and", "did", "not", "walk", "a", "bat", "##ter", "for", "Chicago", ",", "which", "won", "for", "only", "the", "fourth", "time", "in", "15", "games", "." ], "ids": [ 39185, 113, 10150, 118, 125, 114, 45622, 10950, 11598, 10111, 12172, 10472, 33734, 169, 11519, 10877, 10142, 12317, 117, 10319, 11367, 10142, 10893, 10105, 16918, 10635, 10106, 10208, 13332, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dave", "Nilsson", "had", "three", "hits", "for", "the", "Brewer", "##s", "." ], "ids": [ 16073, 46038, 10374, 11003, 27922, 10142, 10105, 109040, 10107, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "In", "Kansas", "City", ",", "Jose", "Off", "##erman", "'", "s", "single", "with", "two", "out", "in", "the", "12th", "inning", "scored", "Johnny", "Damon", "with", "the", "winning", "run", "and", "lift", "##ed", "the", "Kansas", "City", "Royals", "to", "a", "4", "-", "3", "victory", "over", "the", "Texas", "Rangers", "." ], "ids": [ 10167, 16735, 10773, 117, 23029, 23490, 66744, 112, 187, 11376, 10169, 10551, 10950, 10106, 10105, 34505, 110505, 17233, 15551, 50633, 10169, 10105, 16542, 14095, 10111, 63376, 10336, 10105, 16735, 10773, 97906, 10114, 169, 125, 118, 124, 19735, 10491, 10105, 12466, 23042, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 1, 5, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Rick", "Huis", "##man", "(", "1", "-", "1", ")", "allowed", "one", "hit", "and", "a", "walk", "in", "the", "12th", "to", "post", "his", "first", "major", "-", "league", "win", "." ], "ids": [ 20093, 76997, 10589, 113, 122, 118, 122, 114, 18162, 10464, 14946, 10111, 169, 33734, 10106, 10105, 34505, 10114, 11841, 10226, 10422, 11922, 118, 15616, 14125, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Toronto", ",", "Pat", "Hen", "##tge", "##n", "tos", "##sed", "a", "five", "-", "hit", "##ter", "for", "his", "fifth", "consecutive", "complete", "game", "and", "three", "players", "drove", "in", "two", "runs", "apie", "##ce", "as", "the", "Toronto", "Blue", "Jay", "##s", "defeated", "the", "Minnesota", "Twins", "6", "-", "1", "for", "their", "ninth", "win", "in", "11", "games", "." ], "ids": [ 10167, 15256, 117, 24714, 86362, 26910, 10115, 84686, 16219, 169, 12403, 118, 14946, 10877, 10142, 10226, 22237, 29864, 17876, 11661, 10111, 11003, 16021, 72256, 10106, 10551, 17913, 20456, 10419, 10146, 10105, 15256, 12972, 18559, 10107, 18058, 10105, 16306, 68084, 127, 118, 122, 10142, 10455, 54905, 14125, 10106, 10193, 13332, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hen", "##tge", "##n", "(", "17", "-", "7", ")", "surrendered", "just", "three", "doubles", "and", "a", "pair", "of", "singles", "in", "tos", "##sing", "his", "major", "-", "league", "leading", "ninth", "complete", "game", "." ], "ids": [ 86362, 26910, 10115, 113, 10273, 118, 128, 114, 104330, 12820, 11003, 46255, 10111, 169, 27643, 10108, 20527, 10106, 84686, 16357, 10226, 11922, 118, 15616, 16018, 54905, 17876, 11661, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "walk", "##ed", "three", "and", "struck", "out", "three", "in", "winning", "for", "the", "10th", "time", "in", "his", "last", "11", "decisions", "." ], "ids": [ 10357, 33734, 10336, 11003, 10111, 45622, 10950, 11003, 10106, 16542, 10142, 10105, 31004, 10635, 10106, 10226, 12469, 10193, 48126, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Detroit", ",", "Or", "##el", "Her", "##shi", "##ser", "recorded", "his", "fourth", "straight", "win", "and", "Albert", "Belle", "sna", "##pped", "a", "sixth", "-", "inning", "tie", "with", "a", "grand", "sl", "##am", "as", "the", "Cleveland", "Indians", "completed", "a", "season", "s", "##we", "##ep", "of", "the", "Detroit", "Tigers", "with", "a", "9", "-", "3", "victory", "." ], "ids": [ 10167, 19727, 117, 19372, 10570, 13229, 16119, 12754, 14227, 10226, 16918, 31214, 14125, 10111, 12422, 26602, 62541, 44357, 169, 28913, 118, 110505, 27916, 10169, 169, 13023, 38523, 11008, 10146, 10105, 21342, 33032, 15782, 169, 11226, 187, 12577, 19986, 10108, 10105, 19727, 38640, 10169, 169, 130, 118, 124, 19735, 119 ], "entity": [ "O", "B-LOC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Her", "##shi", "##ser", "(", "14", "-", "7", ")", ",", "who", "allowed", "three", "runs", ",", "eight", "hits", "and", "one", "walk", "with", "five", "strike", "##outs", "over", "seven", "innings", ",", "improved", "to", "4", "-", "0", "in", "his", "last", "six", "starts", ",", "including", "a", "pair", "of", "wins", "over", "Detroit", "in", "the", "last", "11", "days", "." ], "ids": [ 13229, 16119, 12754, 113, 10247, 118, 128, 114, 117, 10479, 18162, 11003, 17913, 117, 16222, 27922, 10111, 10464, 33734, 10169, 12403, 37456, 72199, 10491, 15767, 48974, 117, 34605, 10114, 125, 118, 121, 10106, 10226, 12469, 12449, 33039, 117, 11198, 169, 27643, 10108, 27279, 10491, 19727, 10106, 10105, 12469, 10193, 13990, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "California", "," ], "ids": [ 11699, 11621, 117 ], "entity": [ "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9 ] }, { "tokens": [ "In", "Seattle", "," ], "ids": [ 10167, 20902, 117 ], "entity": [ "O", "B-LOC", "O" ], "entity_ids": [ 9, 1, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "MA", "##J", "##OR", "LE", "##AG", "##UE", "RE", "##SU", "##L", "##TS", "W", "##ED", "##NE", "##SD", "##A", "##Y", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 27277, 15417, 42622, 84977, 109865, 62674, 71033, 88592, 11369, 36545, 160, 33809, 93280, 83452, 10738, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "Major", "League" ], "ids": [ 33036, 10108, 14988, 11074 ], "entity": [ "O", "O", "B-MISC", "I-MISC" ], "entity_ids": [ 9, 9, 2, 6 ] }, { "tokens": [ "Baseball", "games", "played", "on", "Wednesday", "(", "home", "team", "in", "CA", "##PS", ")", ":" ], "ids": [ 27084, 13332, 11553, 10135, 57611, 113, 11816, 11121, 10106, 24707, 46983, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "National", "League" ], "ids": [ 10655, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "CO", "##L", "##OR", "##AD", "##O", "10", "Cincinnati", "9" ], "ids": [ 32992, 11369, 42622, 55538, 11403, 10150, 31257, 130 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "MO", "##NT", "##RE", "##AL", "6", "Los", "Angeles", "5" ], "ids": [ 102059, 77261, 66014, 32002, 127, 10630, 12233, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Atlanta", "9", "P", "##IT", "##TS", "##BU", "##R", "##G", "##H", "4" ], "ids": [ 19600, 130, 153, 37611, 36545, 108865, 11273, 11447, 12396, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "San", "Diego", "3", "NE", "##W", "Y", "##OR", "##K", "2", "(", "10", "innings", ")" ], "ids": [ 10469, 14665, 124, 86607, 13034, 162, 42622, 11733, 123, 113, 10150, 48974, 114 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##O", "##US", "##TO", "##N", "5", "Chicago", "4", "(", "11", "innings", ")" ], "ids": [ 145, 11403, 32612, 60493, 11537, 126, 12317, 125, 113, 10193, 48974, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Florida", "3", "ST", "L", "##O", "##UI", "##S", "2", "(", "10", "innings", ")" ], "ids": [ 13668, 124, 53317, 149, 11403, 83259, 10731, 123, 113, 10150, 48974, 114 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SA", "##N", "FR", "##AN", "##CI", "##SC", "##O", "7", "Philadelphia", "6" ], "ids": [ 21318, 11537, 64655, 41275, 89955, 36175, 11403, 128, 15979, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "American", "League" ], "ids": [ 10536, 11074 ], "entity": [ "B-MISC", "I-MISC" ], "entity_ids": [ 2, 6 ] }, { "tokens": [ "Cleveland", "9", "DE", "##T", "##RO", "##IT", "3" ], "ids": [ 21342, 130, 25067, 11090, 35066, 37611, 124 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "2", "Milwaukee", "0" ], "ids": [ 39774, 30889, 109865, 11403, 123, 36413, 121 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "Oakland", "3", "BA", "##L", "##TI", "##M", "##OR", "##E", "0" ], "ids": [ 38340, 124, 39999, 11369, 72286, 11517, 42622, 11259, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "TO", "##RO", "##NT", "##O", "6", "Minnesota", "1" ], "ids": [ 58573, 35066, 77261, 11403, 127, 16306, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 9 ] }, { "tokens": [ "KA", "##NS", "##AS", "C", "##IT", "##Y", "4", "Texas", "3", "(", "12", "innings", ")" ], "ids": [ 85314, 69196, 38025, 140, 37611, 14703, 125, 12466, 124, 113, 10186, 48974, 114 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Boston", "7", "CA", "##L", "##IF", "##OR", "##NI", "##A", "4" ], "ids": [ 13683, 128, 24707, 11369, 53668, 42622, 52898, 10738, 125 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "10", "New", "York", "2" ], "ids": [ 23056, 32071, 11090, 51036, 10150, 10287, 10482, 123 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "T", "##EN", "##NI", "##S", "-", "MA", "##RT", "##INE", "##Z", "GE", "##TS", "AG", "##G", "##RE", "##SS", "##IV", "##E", "AT", "U", ".", "S", ".", "OP", "##EN", "." ], "ids": [ 157, 50655, 52898, 10731, 118, 27277, 46935, 83198, 13966, 62997, 36545, 17935, 11447, 66014, 49248, 91238, 11259, 30554, 158, 119, 156, 119, 55355, 50655, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9 ] }, { "tokens": [ "Larry", "Fine" ], "ids": [ 19629, 24846 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "28" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##chi", "##ta", "Martinez", "decided", "that", "when", "in", "New", "York", ",", "do", "as", "the", "New", "Yorker", "##s", "do", "-", "-", "and", "the", "Spania", "##rd", "'", "s", "new", "-", "found", "aggressive", "##ness", "seems", "to", "have", "put", "her", "in", "the", "right", "frame", "of", "mind", "for", "the", "U", ".", "S", ".", "Open", "." ], "ids": [ 12845, 12806, 10213, 50203, 17270, 10189, 10841, 10106, 10287, 10482, 117, 10149, 10146, 10105, 10287, 57218, 10107, 10149, 118, 118, 10111, 10105, 42751, 12023, 112, 187, 10751, 118, 11823, 75388, 14010, 34208, 10114, 10529, 14499, 10485, 10106, 10105, 13448, 31532, 10108, 21133, 10142, 10105, 158, 119, 156, 119, 11919, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9 ] }, { "tokens": [ "The", "fourth", "-", "seed", "##ed", "Spania", "##rd", ",", "who", "is", "ta", "##ck", "##ling", "the", "world", "class", "traffic", "of", "New", "York", "City", "as", "a", "warm", "-", "up", "by", "driving", "to", "the", "tennis", "centre", "for", "her", "matches", ",", "ran", "over", "France", "'", "s", "Nathalie", "Tau", "##zia", "##t", "6", "-", "1", "6", "-", "3", "on", "Wednesday", "to", "take", "her", "place", "in", "the", "third", "round", "." ], "ids": [ 10117, 16918, 118, 49282, 10336, 42751, 12023, 117, 10479, 10124, 11057, 11263, 11945, 10105, 11356, 13596, 26482, 10108, 10287, 10482, 10773, 10146, 169, 50089, 118, 10741, 10155, 37897, 10114, 10105, 20944, 12672, 10142, 10485, 18258, 117, 17044, 10491, 10688, 112, 187, 64682, 88233, 14767, 10123, 127, 118, 122, 127, 118, 124, 10135, 57611, 10114, 13574, 10485, 11192, 10106, 10105, 12628, 13569, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "'", "ve", "been", "trying", "my", "whole", "career", "to", "be", "aggressive", ",", "\"", "said", "the", "24", "-", "year", "-", "old", "Martinez", "after", "c", "##rush", "##ing", "Tau", "##zia", "##t", "in", "just", "over", "an", "hour", "." ], "ids": [ 107, 146, 112, 10323, 10590, 32862, 15127, 21047, 13021, 10114, 10347, 75388, 117, 107, 12415, 10105, 10233, 118, 10924, 118, 12898, 50203, 10662, 171, 60796, 10230, 88233, 14767, 10123, 10106, 12820, 10491, 10151, 24730, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "What", "I", "'", "m", "trying", "to", "do", "is", "be", "aggressive", "all", "the", "time", ",", "may", "##be", "go", "up", "to", "the", "net", "a", "few", "times", "like", "I", "did", "ton", "##ight", "." ], "ids": [ 107, 12489, 146, 112, 181, 32862, 10114, 10149, 10124, 10347, 75388, 10435, 10105, 10635, 117, 11387, 11044, 11783, 10741, 10114, 10105, 11988, 169, 13824, 13465, 11850, 146, 12172, 22464, 27521, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "would", "really", "help", ".", "\"" ], "ids": [ 13646, 10894, 30181, 15217, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martinez", ",", "the", "1994", "Wimbledon", "champion", ",", "used", "to", "struggle", "at", "the", "Open", ",", "but", "has", "come", "to", "terms", "with", "the", "noise", ",", "crowd", "##s", "and", "chaos", "." ], "ids": [ 50203, 117, 10105, 10444, 37932, 17689, 117, 11031, 10114, 48919, 10160, 10105, 11919, 117, 10473, 10393, 10678, 10114, 18873, 10169, 10105, 58638, 117, 50059, 10107, 10111, 92108, 119 ], "entity": [ "B-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "is", "a", "lot", "of", "things", "that", "can", "happen", ",", "\"", "Martinez", "said", "about", "her", "early", "difficulties", "ad", "##just", "##ing", "to", "tennis", "on", "the", "ce", "##ment", "at", "Fl", "##ush", "##ing", "Meadows", "." ], "ids": [ 107, 11723, 10124, 169, 19826, 10108, 24682, 10189, 10944, 84630, 117, 107, 50203, 12415, 10978, 10485, 11732, 64557, 10840, 106670, 10230, 10114, 20944, 10135, 10105, 10794, 10426, 10160, 29981, 37026, 10230, 94508, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "\"", "Like", "traffic", "." ], "ids": [ 107, 15105, 26482, 119 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "We", "stay", "in", "Manhattan", "and", "it", "'", "s", "a", "long", "way", "to", "come", "." ], "ids": [ 12865, 29597, 10106, 23115, 10111, 10271, 112, 187, 169, 11695, 13170, 10114, 10678, 119 ], "entity": [ "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "crowd", "##s", ",", "they", "speak", "lo", "##uder", "or", "they", "move", "." ], "ids": [ 10117, 50059, 10107, 117, 10689, 41541, 10406, 84009, 10345, 10689, 18577, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "does", "n", "'", "t", "happen", "in", "other", "Grand", "Slam", "##s", "." ], "ids": [ 13646, 15107, 182, 112, 188, 84630, 10106, 10684, 11319, 33445, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9 ] }, { "tokens": [ "That", "'", "s", "where", "the", "real", "champion", "wins", "." ], "ids": [ 13646, 112, 187, 10940, 10105, 13486, 17689, 27279, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "You", "have", "to", "con", "##centra", "##te", "for", "these", "two", "weeks", ".", "\"" ], "ids": [ 11065, 10529, 10114, 10173, 97368, 10216, 10142, 11762, 10551, 20750, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "took", "Martinez", "four", "Open", "##s", "to", "get", "as", "far", "as", "the", "quarters", ",", "and", "another", "four", "to", "match", "that", "." ], "ids": [ 10377, 12149, 50203, 11598, 11919, 10107, 10114, 15329, 10146, 13301, 10146, 10105, 79322, 117, 10111, 12864, 11598, 10114, 12356, 10189, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "year", ",", "Martinez", ",", "who", "finished", "1995", "ranked", "second", "in", "the", "world", ",", "reached", "the", "semifinals", "before", "bow", "##ing", "out", "to", "Monica", "Se", "##les", "." ], "ids": [ 14812, 10924, 117, 50203, 117, 10479, 15972, 10436, 25250, 11132, 10106, 10105, 11356, 117, 17087, 10105, 82726, 11360, 98073, 10230, 10950, 10114, 29242, 11045, 11268, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Now", "she", "feels", "she", "is", "in", "the", "swing", "of", "things", "." ], "ids": [ 17121, 10833, 84992, 10833, 10124, 10106, 10105, 74772, 10108, 24682, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "have", "my", "own", "car", "now", "and", "that", "helps", ",", "\"", "said", "Martinez", "." ], "ids": [ 107, 146, 10529, 15127, 12542, 13000, 11858, 10111, 10189, 58170, 117, 107, 12415, 50203, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "\"", "Sometimes", "the", "transportation", "they", "(", "the", "tournament", ")", "provide", "gets", "a", "little", "messe", "##d", "up", "." ], "ids": [ 107, 74138, 10105, 48546, 10689, 113, 10105, 17390, 114, 16871, 30811, 169, 16745, 94536, 10162, 10741, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "time", "it", "did", "n", "'", "t", "happen", "." ], "ids": [ 10747, 10635, 10271, 12172, 182, 112, 188, 84630, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "do", "the", "driving", "and", "I", "love", "it", "." ], "ids": [ 146, 10149, 10105, 37897, 10111, 146, 16138, 10271, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "gets", "my", "ad", "##rena", "##lin", "going", ",", "those", "taxi", "drivers", "." ], "ids": [ 10377, 30811, 15127, 10840, 37816, 13020, 19090, 117, 12676, 72231, 54598, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "change", "lane", "##s", "all", "the", "time", "in", "Barcelona", "." ], "ids": [ 107, 12865, 15453, 23636, 10107, 10435, 10105, 10635, 10106, 12113, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "I", "'", "m", "used", "to", "it", "and", "I", "like", "to", "drive", "fast", ".", "\"" ], "ids": [ 146, 112, 181, 11031, 10114, 10271, 10111, 146, 11850, 10114, 23806, 15040, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##SE", "##BA", "##LL", "-", "BR", "##AV", "##ES", "SI", "##G", "##N", "NE", "##AG", "##LE", "." ], "ids": [ 39999, 39039, 35999, 82834, 118, 49351, 99903, 25054, 39675, 11447, 11537, 86607, 109865, 51036, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##A", "1996", "-", "08", "-", "28" ], "ids": [ 30554, 44376, 77261, 10738, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "defending", "world", "champion", "Atlanta", "Braves", ",", "with", "the", "best", "record", "and", "best", "pitch", "##ing", "in", "baseball", ",", "added", "another", "weapon", "Wednesday", ",", "ac", "##qui", "##ring", "Denny", "Ne", "##agle", ",", "the", "winning", "##est", "left", "-", "hand", "##er", "in", "the", "National", "League", ",", "from", "the", "Pittsburgh", "Pirates", "." ], "ids": [ 10117, 53730, 11356, 17689, 19600, 97242, 117, 10169, 10105, 12504, 12410, 10111, 12504, 50892, 10230, 10106, 22450, 117, 16288, 12864, 54157, 57611, 117, 13621, 39639, 13135, 83903, 19416, 103392, 117, 10105, 16542, 13051, 12153, 118, 15230, 10165, 10106, 10105, 10655, 11074, 117, 10188, 10105, 23812, 41839, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "The", "Pirates", ",", "who", "con", "##ceded", "earlier", "this", "week", "they", "would", "be", "forced", "to", "trim", "salary", "from", "next", "season", "'", "s", "pay", "##roll", ",", "received", "Ron", "Wright", ",", "a", "first", "base", "##man", "at", "Double", "-", "A", "Green", "##ville", ";", "Corey", "Pointe", "##r", ",", "a", "pitcher", "at", "Class", "-", "A", "Eugene", ",", "and", "a", "player", "to", "be", "named", "." ], "ids": [ 10117, 41839, 117, 10479, 10173, 75214, 18905, 10531, 16118, 10689, 10894, 10347, 20054, 10114, 102859, 96108, 10188, 13451, 11226, 112, 187, 16868, 51091, 117, 12296, 20368, 16980, 117, 169, 10422, 11404, 10589, 10160, 23655, 118, 138, 13068, 12043, 132, 72262, 45065, 10129, 117, 169, 64603, 10160, 19220, 118, 138, 26831, 117, 10111, 169, 12928, 10114, 10347, 12038, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "another", "st", "##unn", "##ing", "mid", "-", "season", "acquisition", "for", "the", "Braves", ",", "who", "already", "have", "an", "11", "-", "game", "lead", "in", "the", "National", "League", "Eastern", "Division", "." ], "ids": [ 10377, 10134, 12864, 28780, 104939, 10230, 15607, 118, 11226, 41714, 10142, 10105, 97242, 117, 10479, 19034, 10529, 10151, 10193, 118, 11661, 14107, 10106, 10105, 10655, 11074, 16311, 11987, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "In", "the", "last", "15", "days", ",", "Atlanta", "has", "traded", "for", "third", "base", "##man", "Terry", "Pen", "##dle", "##ton", ",", "claimed", "out", "##field", "##er", "Luis", "Polonia", "on", "wa", "##iver", "##s", "and", "called", "up", "minor", "-", "league", "ph", "##eno", "##m", "And", "##ru", "##w", "Jones", ",", "all", "in", "preparation", "for", "their", "fifth", "post", "-", "season", "." ], "ids": [ 10167, 10105, 12469, 10208, 13990, 117, 19600, 10393, 52696, 10142, 12628, 11404, 10589, 19902, 52559, 27477, 11183, 117, 20737, 10950, 13408, 10165, 12816, 21915, 10135, 11471, 37884, 10107, 10111, 11552, 10741, 17746, 118, 15616, 99142, 16818, 10147, 12689, 11680, 10874, 12298, 117, 10435, 10106, 59386, 10142, 10455, 22237, 11841, 118, 11226, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "SU", "##MM", "##AR", "##Y", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 86643, 93252, 52188, 14703, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "28" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Summary", "of", "Dutch", "first", "division", "soccer", "match", "played", "on", "Thursday", ":" ], "ids": [ 42027, 10108, 17693, 10422, 13751, 41356, 12356, 11553, 10135, 67067, 131 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##C", "Breda", "1", "(", "Abdel", "##lao", "##ui", "20th", "penalty", ")", "NEC", "Nijmegen", "1", "(", "G", "##rae", "##f", "36", "##th", ")", "." ], "ids": [ 56586, 10858, 57883, 122, 113, 102882, 55400, 11990, 18604, 40924, 114, 97104, 81444, 122, 113, 144, 73803, 10575, 11055, 11143, 114, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 4, 8, 8, 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Half", "##time", "1", "-", "1", "." ], "ids": [ 33100, 18086, 122, 118, 122, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", "10", ",", "760", "." ], "ids": [ 46080, 10150, 117, 40633, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "D", "##UT", "##CH", "F", "##IR", "##ST", "DI", "##VI", "##SI", "##ON", "RE", "##SU", "##L", "##TS", "/", "ST", "##AN", "##DI", "##NG", "##S", "." ], "ids": [ 71020, 65622, 24093, 118, 141, 65729, 86448, 143, 73522, 32995, 110014, 90939, 44802, 30118, 71033, 88592, 11369, 36545, 120, 53317, 41275, 58730, 34065, 10731, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "29" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Res", "##ult", "of", "a", "Dutch", "first" ], "ids": [ 32070, 16203, 10108, 169, 17693, 10422 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "division", "soccer", "match", "played", "on", "Thursday", ":" ], "ids": [ 13751, 41356, 12356, 11553, 10135, 67067, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##C", "Breda", "1", "NEC", "Nijmegen", "1" ], "ids": [ 56586, 10858, 57883, 122, 97104, 81444, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Play", "##ed", "on", "Wednesday", ":" ], "ids": [ 17712, 10336, 10135, 57611, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vi", "##tesse", "Arnhem", "1", "Sparta", "Rotterdam", "1" ], "ids": [ 31826, 100319, 76323, 122, 36354, 25136, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Utrecht", "0", "Twente", "En", "##sche", "##de", "0" ], "ids": [ 24890, 121, 104879, 10243, 12279, 10253, 121 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Groningen", "1", "Roda", "JC", "Kerk", "##rade", "1" ], "ids": [ 36806, 122, 97751, 76199, 36156, 18752, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Feyenoord", "2", "G", "##raaf", "##schap", "Doe", "##tin", "##chem", "1" ], "ids": [ 103340, 123, 144, 71647, 21289, 71335, 15364, 34884, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Willem", "II", "Til", "##burg", "1", "RK", "##C", "W", "##aal", "##wijk", "3" ], "ids": [ 20903, 10335, 27853, 12248, 122, 105546, 10858, 160, 19641, 42727, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Vol", "##enda", "##m", "1", "PSV", "Eindhoven", "3" ], "ids": [ 12546, 27808, 10147, 122, 66922, 55552, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 9 ] }, { "tokens": [ "Ajax", "Amsterdam", "1", "AZ", "Al", "##km", "##aar", "0" ], "ids": [ 37057, 14017, 122, 81705, 10883, 23440, 21960, 121 ], "entity": [ "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "Play", "##ed", "on", "Tuesday", ":" ], "ids": [ 17712, 10336, 10135, 70245, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Sitt", "##ard", "2", "Heer", "##en", "##veen", "4" ], "ids": [ 59890, 105987, 13167, 123, 49764, 10136, 53467, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "Standing", "##s", "(", "tab", "##ulate", "under", "played", ",", "won", ",", "drawn", ",", "lost", ",", "goals" ], "ids": [ 58592, 10107, 113, 100781, 70863, 10571, 11553, 117, 11367, 117, 34788, 117, 14172, 117, 18173 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", ",", "goals", "against", ",", "points", ")", ":" ], "ids": [ 10142, 117, 18173, 11327, 117, 12789, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PSV", "Eindhoven", "3", "3", "0", "0", "11", "3", "9" ], "ids": [ 66922, 55552, 124, 124, 121, 121, 10193, 124, 130 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Feyenoord", "Rotterdam", "3", "2", "1", "0", "6", "2", "7" ], "ids": [ 103340, 25136, 124, 123, 122, 121, 127, 123, 128 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vi", "##tesse", "Arnhem", "3", "2", "1", "0", "4", "1", "7" ], "ids": [ 31826, 100319, 76323, 124, 123, 122, 121, 125, 122, 128 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Heer", "##en", "##veen", "3", "2", "0", "1", "7", "5", "6" ], "ids": [ 49764, 10136, 53467, 124, 123, 121, 122, 128, 126, 127 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ajax", "Amsterdam", "3", "2", "0", "1", "2", "2", "6" ], "ids": [ 37057, 14017, 124, 123, 121, 122, 123, 123, 127 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Twente", "En", "##sche", "##de", "3", "1", "2", "0", "4", "2", "5" ], "ids": [ 104879, 10243, 12279, 10253, 124, 122, 123, 121, 125, 123, 126 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RK", "##C", "W", "##aal", "##wijk", "3", "1", "1", "1", "7", "6", "4" ], "ids": [ 105546, 10858, 160, 19641, 42727, 124, 122, 122, 122, 128, 127, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##raaf", "##schap", "Doe", "##tin", "##chem", "3", "1", "1", "1", "5", "5", "4" ], "ids": [ 144, 71647, 21289, 71335, 15364, 34884, 124, 122, 122, 122, 126, 126, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NA", "##C", "Breda", "3", "1", "1", "1", "2", "2", "4" ], "ids": [ 56586, 10858, 57883, 124, 122, 122, 122, 123, 123, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fortuna", "Sitt", "##ard", "3", "1", "1", "1", "3", "4", "4" ], "ids": [ 59890, 105987, 13167, 124, 122, 122, 122, 124, 125, 125 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Roda", "JC", "Kerk", "##rade", "3", "0", "3", "0", "3", "3", "3" ], "ids": [ 97751, 76199, 36156, 18752, 124, 121, 124, 121, 124, 124, 124 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Utrecht", "3", "0", "2", "1", "2", "3", "2" ], "ids": [ 24890, 124, 121, 123, 122, 123, 124, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sparta", "Rotterdam", "3", "0", "2", "1", "1", "2", "2" ], "ids": [ 36354, 25136, 124, 121, 123, 122, 122, 123, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Groningen", "3", "0", "2", "1", "2", "5", "2" ], "ids": [ 36806, 124, 121, 123, 122, 123, 126, 123 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NEC", "Nijmegen", "3", "0", "2", "1", "2", "5", "2" ], "ids": [ 97104, 81444, 124, 121, 123, 122, 123, 126, 123 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Willem", "II", "Til", "##burg", "3", "0", "1", "2", "1", "4", "1" ], "ids": [ 20903, 10335, 27853, 12248, 124, 121, 122, 123, 122, 125, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AZ", "Al", "##km", "##aar", "3", "0", "1", "1", "0", "3", "1" ], "ids": [ 81705, 10883, 23440, 21960, 124, 121, 122, 122, 121, 124, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vol", "##enda", "##m", "3", "0", "1", "2", "2", "7", "1" ], "ids": [ 12546, 27808, 10147, 124, 121, 122, 123, 123, 128, 122 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##HL", "##ET", "##IC", "##S", "-", "J", "##OH", "##NS", "##ON", ",", "CH", "##RI", "##ST", "##IE", ",", "BA", "##IL", "##E", "##Y", "TO", "R", "##UN", "O", "##W", "##EN", "##S", "RE", "##LA", "##Y", "." ], "ids": [ 30554, 39810, 52338, 30889, 10731, 118, 147, 55859, 69196, 30118, 117, 39774, 46876, 32995, 71655, 117, 39999, 38850, 11259, 14703, 58573, 155, 69849, 152, 13034, 50655, 10731, 71033, 44376, 14703, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 4, 8, 8, 8, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Adrian", "Warner" ], "ids": [ 23928, 17853 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "BE", "##R", "##L", "##IN", "1996", "-", "08", "-", "29" ], "ids": [ 46291, 11273, 11369, 27128, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Olympic", "champions", "Michael", "Johnson", "and", "Donovan", "Bailey", "and", "former", "champion", "Lin", "##ford", "Christie", "will", "run", "in", "a", "\"", "Dream", "Team", "\"", "sprint", "relay", "squad", "in", "honour", "of", "Jesse", "Owens", "on", "Friday", "." ], "ids": [ 17952, 27745, 10631, 13241, 10111, 55072, 29761, 10111, 11775, 17689, 35207, 13387, 34964, 11337, 14095, 10106, 169, 107, 17316, 12140, 107, 42707, 74973, 30580, 10106, 46948, 10108, 27213, 58551, 10135, 30767, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 9, 4, 8, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Johnson", ",", "the", "200", "metres", "world", "record", "holder", ",", "and", "Britain", "'", "s", "1992", "Olympic", "100", "champion", "Christie", "confirmed", "on", "Thursday", "that", "they", "would", "join", "100", "record", "holder", "Bailey", "and", "Namibia", "'", "s", "Frankie", "Frederick", "##s", "in", "one", "of", "the", "greatest", "4x100", "squad", "##s", "ever", "assembled", "." ], "ids": [ 13241, 117, 10105, 10777, 16393, 11356, 12410, 48938, 117, 10111, 16032, 112, 187, 10450, 17952, 10407, 17689, 34964, 27347, 10135, 67067, 10189, 10689, 10894, 23707, 10407, 12410, 48938, 29761, 10111, 46670, 112, 187, 51059, 17132, 10107, 10106, 10464, 10108, 10105, 31434, 84531, 30580, 10107, 17038, 84376, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 2, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "will", "run", "against", "quart", "##ets", "from", "the", "United", "States", ",", "Europe", "and", "Africa", "in", "a", "special", "race", "at", "the", "Berlin", "Grand", "Prix", "meeting", "to", "mark", "the", "60", "##th", "anniversary", "of", "Owens", "'", "s", "four", "gold", "medals", "at", "the", "1936", "Olympics", "in", "the", "German", "capital", "." ], "ids": [ 11696, 11337, 14095, 11327, 49461, 17137, 10188, 10105, 10609, 10859, 117, 11767, 10111, 12880, 10106, 169, 14478, 14025, 10160, 10105, 11193, 11319, 12835, 19822, 10114, 29221, 10105, 10709, 11143, 37157, 10108, 58551, 112, 187, 11598, 18128, 48512, 10160, 10105, 11123, 19185, 10106, 10105, 12026, 12185, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 1, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Christie", "will", "run", "the", "anchor", "leg", "after", "Canada", "'", "s", "Bailey", ",", "American", "Johnson", "and", "Olympic", "silver", "medal", "##list", "Frederick", "##s", "have", "run", "the", "first", "three", "stages", "of", "the", "relay", "." ], "ids": [ 34964, 11337, 14095, 10105, 72027, 33810, 10662, 11635, 112, 187, 29761, 117, 10536, 13241, 10111, 17952, 23394, 16531, 21476, 17132, 10107, 10529, 14095, 10105, 10422, 11003, 35023, 10108, 10105, 74973, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "O", "B-MISC", "B-PER", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 9, 2, 4, 9, 2, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "participation", "of", "Bailey", "and", "Frederick", "##s", "had", "been", "known", "before", "Thursday", "." ], "ids": [ 10117, 25784, 10108, 29761, 10111, 17132, 10107, 10374, 10590, 11053, 11360, 67067, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Christie", "did", "not", "anno", "##unce", "his", "decision", "to", "run", "until", "the", "ev", "##e", "of", "the", "meeting", "when", "organiser", "##s", "also", "confirmed", "Johnson", "would", "take", "part", "." ], "ids": [ 16976, 34964, 12172, 10472, 11671, 93050, 10226, 19231, 10114, 14095, 11444, 10105, 38034, 10112, 10108, 10105, 19822, 10841, 93446, 10107, 10379, 27347, 13241, 10894, 13574, 10668, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "Christie", "is", "due", "to", "retire", "from", "international", "competition", "at", "the", "end", "of", "the", "season", "although", "he", "may", "compete", "for", "Britain", "in", "next", "season", "'", "s", "European", "Cup", "." ], "ids": [ 34964, 10124, 10850, 10114, 30753, 10188, 12533, 16622, 10160, 10105, 11572, 10108, 10105, 11226, 14779, 10261, 11387, 33400, 10142, 16032, 10106, 13451, 11226, 112, 187, 11914, 11544, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "Although", "Christie", ",", "who", "is", "not", "racing", "the", "individual", "100", "metres", "in", "Berlin", ",", "took", "his", "time", "to", "agree", "to", "run", ",", "the", "veteran", "was", "clearly", "del", "##ight", "##ed", "to", "be", "part", "of", "the", "tribute", "to", "the", "black", "American", "." ], "ids": [ 15785, 34964, 117, 10479, 10124, 10472, 31008, 10105, 16080, 10407, 16393, 10106, 11193, 117, 12149, 10226, 10635, 10114, 68312, 10114, 14095, 117, 10105, 55669, 10134, 52340, 10127, 27521, 10336, 10114, 10347, 10668, 10108, 10105, 51903, 10114, 10105, 15045, 10536, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "When", "five", "former", "Olympic", "100", "champions", "from", "1948", "to", "1980", ",", "who", "have", "been", "invited", "to", "watch", "the", "race", ",", "turned", "up", "at", "a", "news", "conference", "on", "Thursday", ",", "Christie", "was", "quick", "to", "put", "his", "auto", "##graph", "book", "in", "front", "of", "the", "them", "." ], "ids": [ 12242, 12403, 11775, 17952, 10407, 27745, 10188, 11004, 10114, 10538, 117, 10479, 10529, 10590, 33392, 10114, 34481, 10105, 14025, 117, 21031, 10741, 10160, 169, 14424, 25029, 10135, 67067, 117, 34964, 10134, 69609, 10114, 14499, 10226, 18257, 28176, 12748, 10106, 14589, 10108, 10105, 11345, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "n", "'", "t", "normally", "do", "this", "but", "can", "you", "pl", "##eas", "##e", "sign", ",", "\"", "he", "said", "th", "##rust", "##ing", "an", "or", "##nate", "white", "book", "in", "front", "of", "Americans", "Harrison", "Dil", "##lard", "(", "1948", ")", ",", "Lin", "##dy", "Re", "##mig", "##ino", "(", "1952", ")", ",", "Jim", "Hi", "##nes", "(", "1968", ")", ",", "Trinidad", "'", "s", "Has", "##ely", "Crawford", "(", "1976", ")", "and", "Britain", "'", "s", "Allan", "Wells", "(", "1980", ")", "." ], "ids": [ 107, 146, 10149, 182, 112, 188, 48252, 10149, 10531, 10473, 10944, 13028, 20648, 42658, 10112, 26794, 117, 107, 10261, 12415, 77586, 56657, 10230, 10151, 10345, 36884, 15263, 12748, 10106, 14589, 10108, 25069, 19845, 95649, 62477, 113, 11004, 114, 117, 35207, 12355, 20304, 72498, 12349, 113, 11100, 114, 117, 14178, 20065, 11496, 113, 10698, 114, 117, 31327, 112, 187, 45896, 44096, 32945, 113, 10705, 114, 10111, 16032, 112, 187, 18750, 25325, 113, 10538, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Jesse", "Owens", "inspired", "everyone", "here", "and", "it", "is", "great", "to", "have", "a", "tribute", "to", "him", ".", "\"" ], "ids": [ 107, 27213, 58551, 27055, 48628, 19353, 10111, 10271, 10124, 14772, 10114, 10529, 169, 51903, 10114, 10957, 119, 107 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Owens", "'", "s", "widow", "Ruth", "is", "not", "well", "enough", "to", "attend", "but", "a", "message", "from", "her", "will", "be", "read", "out", "by", "the", "sprint", "##er", "'", "s", "grand", "-", "daughter", "Gina", "Till", "##man", "during", "the", "meeting" ], "ids": [ 58551, 112, 187, 71598, 23979, 10124, 10472, 11206, 21408, 10114, 34465, 10473, 169, 30514, 10188, 10485, 11337, 10347, 24944, 10950, 10155, 10105, 42707, 10165, 112, 187, 13023, 118, 15243, 61116, 32259, 10589, 10939, 10105, 19822 ], "entity": [ "B-PER", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Berlin", "organiser", "##s", "hoped", "to", "have", "American", "1984", "and", "1988", "champion", "Carl", "Lewis", "in", "the", "squad", "but", "he", "injured", "himself", "in", "last", "Friday", "'", "s", "Brussels", "meeting", "." ], "ids": [ 11193, 93446, 10107, 84245, 10114, 10529, 10536, 10597, 10111, 10548, 17689, 12225, 13759, 10106, 10105, 30580, 10473, 10261, 36081, 14764, 10106, 12469, 30767, 112, 187, 41239, 19822, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "GE", "##NO", "##A", "A", "##WA", "##RD", "##ED", "IT", "##AL", "##IA", "##N", "C", "##UP", "W", "##IN", "." ], "ids": [ 71020, 65622, 24093, 118, 62997, 67292, 10738, 138, 42196, 84444, 33809, 26956, 32002, 35976, 11537, 140, 57487, 160, 27128, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "MI", "##LA", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 75416, 44376, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "soccer", "'", "s", "sports", "judge", "on", "Thursday", "ruled", "that", "Genoa", ",", "beaten", "3", "-", "0", "by", "Lecce", "in", "the", "first", "round", "of", "the", "Italian", "Cup", ",", "should", "be", "awarded", "a", "2", "-", "0", "victory", "because", "their", "opponents", "field", "##ed", "a", "banned", "player", "." ], "ids": [ 11667, 41356, 112, 187, 18204, 31624, 10135, 67067, 34920, 10189, 63362, 117, 74075, 124, 118, 121, 10155, 79419, 10106, 10105, 10422, 13569, 10108, 10105, 11667, 11544, 117, 14819, 10347, 16150, 169, 123, 118, 121, 19735, 12373, 10455, 63568, 13939, 10336, 169, 58587, 12928, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ruling", "meant", "that", "serie", "B", "club", "Genoa", "now", "meet", "local", "serie", "A", "arch", "-", "rivals", "Sam", "##p", "##doria", "in", "the", "second", "round", "." ], "ids": [ 10117, 50788, 31580, 10189, 11185, 139, 11111, 63362, 11858, 23267, 11436, 11185, 138, 69154, 118, 71908, 14268, 10410, 101233, 10106, 10105, 11132, 13569, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 2, 6, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Genoa", "appeal", "##ed", "after", "their", "defeat", "last", "Saturday", "on", "the", "grounds", "that", "Lecce", "striker", "Jonathan", "Bach", "##ini", ",", "who", "came", "on", "in", "the", "71", "##st", "minute", "with", "his", "team", "leading", "2", "-", "0", ",", "still", "had", "a", "one", "-", "match", "suspension", "to", "serve", "from", "last", "season", "." ], "ids": [ 63362, 44861, 10336, 10662, 10455, 24800, 12469, 24848, 10135, 10105, 38190, 10189, 79419, 103325, 16395, 18965, 11778, 117, 10479, 13383, 10135, 10106, 10105, 12513, 10562, 21760, 10169, 10226, 11121, 16018, 123, 118, 121, 117, 12647, 10374, 169, 10464, 118, 12356, 52341, 10114, 19430, 10188, 12469, 11226, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "N", "##IC", "##E", "SA", "##C", "##K", "CO", "##AC", "##H", "EM", "##ON", "." ], "ids": [ 71020, 65622, 24093, 118, 151, 30889, 11259, 21318, 10858, 11733, 32992, 30340, 12396, 20569, 30118, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "N", "##IC", "##E", ",", "France", "1996", "-", "08", "-", "29" ], "ids": [ 151, 30889, 11259, 117, 10688, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "St", "##rug", "##gli", "##ng", "French", "first", "division", "side", "Nice", "on", "Thursday", "announced", "they", "were", "parti", "##ng", "with", "coach", "Albert", "Em", "##on", "after", "a", "string", "of", "poor", "results", "." ], "ids": [ 10838, 58550, 20986, 10376, 11894, 10422, 13751, 12250, 26918, 10135, 67067, 13854, 10689, 10309, 14869, 10376, 10169, 15701, 12422, 11289, 10263, 10662, 169, 33714, 10108, 23247, 17466, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Club", "president", "Andre", "Bois", "said", "a", "successor", "would", "be", "named", "on", "Friday", "." ], "ids": [ 11316, 12931, 25188, 26384, 12415, 169, 33095, 10894, 10347, 12038, 10135, 30767, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "former", "player", "for", "Marseille", "and", "Monaco", ",", "Em", "##on", ",", "43", ",", "has", "coached", "Nice", "since", "1992", "." ], "ids": [ 138, 11775, 12928, 10142, 25016, 10111, 24661, 117, 11289, 10263, 117, 11370, 117, 10393, 71909, 26918, 11764, 10450, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "B-ORG", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 3, 9, 4, 8, 9, 9, 9, 9, 9, 3, 9, 9, 9 ] }, { "tokens": [ "The", "announcement", "came", "24", "hours", "after", "the", "team", "from", "the", "French", "Riviera", "lost", "at", "home", "to", "G", "##uing", "##amp", "2", "-", "1", "in", "a", "league", "match", "." ], "ids": [ 10117, 76557, 13383, 10233, 19573, 10662, 10105, 11121, 10188, 10105, 11894, 97092, 14172, 10160, 11816, 10114, 144, 94213, 53692, 123, 118, 122, 10106, 169, 15616, 12356, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nice", "are", "18th", "in", "the", "table", "." ], "ids": [ 26918, 10301, 27669, 10106, 10105, 21783, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "T", "##H", "##RE", "##E", "P", "##UL", "##L", "O", "##UT", "OF", "D", "##UT", "##CH", "S", "##Q", "##U", "##AD", "FOR", "BR", "##A", "##Z", "##IL", "." ], "ids": [ 71020, 65622, 24093, 118, 157, 12396, 66014, 11259, 153, 100673, 11369, 152, 65729, 23240, 141, 65729, 86448, 156, 19282, 12022, 55538, 109544, 49351, 10738, 13966, 38850, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "29" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Three", "Dutch", "players", "have", "pulled", "out", "of", "the", "squad", "for", "Saturday", "'", "s", "friendly", "international", "soccer", "match", "against", "Brazil", "in", "Amsterdam", "." ], "ids": [ 15139, 17693, 16021, 10529, 65884, 10950, 10108, 10105, 30580, 10142, 24848, 112, 187, 43941, 12533, 41356, 12356, 11327, 16765, 10106, 14017, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Ajax", "defender", "John", "Ve", "##ld", "##man", "and", "his", "team", "mate", "Richard", "Wit", "##sch", "##ge", "are", "injured", ",", "while", "PSV", "midfielder", "Philip", "Co", "##cu", "has", "a", "fever", "." ], "ids": [ 37057, 36426, 10421, 19561, 12620, 10589, 10111, 10226, 11121, 43465, 11118, 83735, 12044, 10525, 10301, 36081, 117, 11371, 66922, 68049, 13324, 13098, 12352, 10393, 169, 105142, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "coach", "G", "##uus", "Hi", "##ddin", "##k", "called", "in", "Feyenoord", "midfielder", "Giovanni", "van", "Bron", "##ck", "##horst", "and", "Vi", "##tesse", "defender", "Fe", "##rdy", "Vier", "##kla", "##u", "for", "Co", "##cu", "and", "Ve", "##ld", "##man", ",", "but", "did", "not", "name", "a", "replacement", "for", "midfielder", "Wit", "##sch", "##ge", "." ], "ids": [ 17693, 15701, 144, 33639, 20065, 51256, 10174, 11552, 10106, 103340, 68049, 13297, 10145, 78745, 11263, 84549, 10111, 31826, 100319, 36426, 20187, 75507, 49410, 22444, 10138, 10142, 13098, 12352, 10111, 19561, 12620, 10589, 117, 10473, 12172, 10472, 11324, 169, 41636, 10142, 68049, 83735, 12044, 10525, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 8, 9, 9, 3, 9, 4, 8, 8, 8, 8, 9, 3, 7, 9, 4, 8, 8, 8, 8, 9, 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "BR", "##IT", "##A", "##IN", "W", "##EL", "##CO", "##ME", "##S", "ROM", "##AN", "##IA", "-", "H", "##UN", "##GA", "##R", "##Y", "TR", "##EA", "##T", "##Y", "ACC", "##OR", "##D", "." ], "ids": [ 49351, 37611, 10738, 27128, 160, 68999, 82272, 42424, 10731, 41068, 41275, 35976, 118, 145, 69849, 39061, 11273, 14703, 80047, 36789, 11090, 14703, 106857, 42622, 11490, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UC", "##HA", "##RE", "##ST", "1996", "-", "08", "-", "29" ], "ids": [ 139, 93089, 58132, 66014, 32995, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "joined", "the", "United", "States", "on", "Thursday", "in", "wel", "##coming", "Romania", "and", "Hungary", "'", "s", "agreement", "on", "the", "text", "of", "a", "much", "-", "delayed", "friendship", "treaty", ",", "which", "it", "said", "would", "contribute", "to", "stability", "in", "the", "area", "." ], "ids": [ 16032, 13914, 10105, 10609, 10859, 10135, 67067, 10106, 16829, 38701, 13927, 10111, 24601, 112, 187, 25432, 10135, 10105, 15541, 10108, 169, 13172, 118, 67058, 74447, 56353, 117, 10319, 10271, 12415, 10894, 72484, 10114, 69884, 10106, 10105, 11168, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "United", "Kingdom", "believes", "that", "such", "a", "treaty", "will", "contribute", "positive", "##ly", "to", "the", "further", "development", "of", "good", "nei", "##gh", "##bour", "##ly", "relations", "between", "the", "two", "countries", "and", "en", "##hance", "the", "stability", "of", "the", "region", ",", "\"", "said", "the", "British", "Foreign", "office", "statement", "." ], "ids": [ 107, 10117, 10609, 14648, 56920, 10189, 11049, 169, 56353, 11337, 72484, 19737, 10454, 10114, 10105, 14586, 13405, 10108, 15198, 11888, 15774, 71527, 10454, 19824, 10948, 10105, 10551, 15911, 10111, 10110, 100586, 10105, 69884, 10108, 10105, 12220, 117, 107, 12415, 10105, 11160, 20277, 14301, 33311, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "The", "accord", ",", "agreed", "two", "weeks", "ago", ",", "is", "expected", "to", "end", "years", "of", "disputes", "over", "the", "status", "of", "Romania", "'", "s", "large", "ethnic", "Hungarian", "minority", "." ], "ids": [ 10117, 35233, 117, 25577, 10551, 20750, 36390, 117, 10124, 25973, 10114, 11572, 10855, 10108, 89357, 10491, 10105, 14042, 10108, 13927, 112, 187, 12077, 34216, 24364, 54147, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "It", "will", "also", "bo", "##ost", "both", "countries", "'", "amb", "##itions", "to", "join", "NATO", "and", "the", "European", "Union", "." ], "ids": [ 10377, 11337, 10379, 20506, 18239, 11408, 15911, 112, 10559, 52213, 10114, 23707, 21662, 10111, 10105, 11914, 11457, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Bucharest", "and", "Budapest", "say", "the", "treaty", "should", "be", "signed", "in", "the", "first", "half", "of", "September", "." ], "ids": [ 100824, 10111, 14745, 23763, 10105, 56353, 14819, 10347, 14775, 10106, 10105, 10422, 13877, 10108, 10596, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "United", "Kingdom", "looks", "forward", "to", "the", "early", "signature", "of", "the", "treaty", ",", "\"", "the", "statement", "said", "." ], "ids": [ 107, 10117, 10609, 14648, 59148, 23307, 10114, 10105, 11732, 44852, 10108, 10105, 56353, 117, 107, 10105, 33311, 12415, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "EM", "##BA", "##SS", "##Y", "IN", "AT", "##H", "##EN", "##S", "CL", "##OS", "##ED", "ON", "LA", "##B", "##O", "##UR", "DA", "##Y", ",", "SE", "##P", "2", "." ], "ids": [ 158, 119, 156, 119, 20569, 35999, 49248, 14703, 36351, 30554, 12396, 50655, 10731, 75151, 21793, 33809, 49339, 29079, 11274, 11403, 98348, 47855, 14703, 117, 23056, 11127, 123, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 2, 6, 6, 6, 9, 1, 5, 5, 5, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "U", ".", "S", ".", "em", "##bas", "##sy", "in", "Athens", ",", "the", "consul", "##ates", "general", "in", "Athens", "and", "Thessaloniki", "and", "all", "U", ".", "S", ".", "government", "offices", "in", "Greece", "will", "be", "closed", "on", "Monday", ",", "September", "2", "in", "observa", "##nce", "of", "Labour", "Day", ",", "a", "U", ".", "S", ".", "national", "holiday", ",", "the", "em", "##bas", "##sy", "said", "." ], "ids": [ 10117, 158, 119, 156, 119, 10266, 21322, 16105, 10106, 33765, 117, 10105, 53704, 26171, 11389, 10106, 33765, 10111, 107824, 10111, 10435, 158, 119, 156, 119, 12047, 29918, 10106, 25154, 11337, 10347, 18440, 10135, 40714, 117, 10596, 123, 10106, 78071, 12150, 10108, 25606, 12360, 117, 169, 158, 119, 156, 119, 11844, 71806, 117, 10105, 10266, 21322, 16105, 12415, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 5, 5, 5, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "George", "Georgi", "##op", "##oul", "##os", ",", "Athens", "News", "##room", "+", "301", "331", "##18", "##12", "-", "4" ], "ids": [ 118, 118, 10955, 84854, 13362, 75631, 10310, 117, 33765, 12219, 25525, 116, 26224, 30690, 45987, 24747, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "N", "##D", "PA", "##RT", "##Y", "P", "##IC", "##KS", "SP", "##OT", "T", "##H", "##OM", "##S", "##ON", ",", "B", "##OL", "##D", "/", "O", "##GI", "##L", "##V", "##Y", ",", "MA", "##TH", "##ER", "FOR", "AD", "CA", "##MP", "##A", "##IG", "##N", "." ], "ids": [ 151, 11490, 32349, 46935, 14703, 153, 30889, 62828, 22570, 62146, 157, 12396, 37079, 10731, 30118, 117, 139, 39272, 11490, 120, 152, 100075, 11369, 11779, 14703, 117, 27277, 109166, 24093, 109544, 22992, 24707, 79936, 10738, 89696, 11537, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##H", "##EN", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 30554, 12396, 50655, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Greek", "conservative", "New", "democracy", "party", "picked", "Bold", "/", "Og", "##il", "##vy", "and", "Math", "##er", "advertising", "companies", "for", "its", "pre", "-", "election", "campaign", "and", "Spot", "Thomson", "to", "help", "party", "president", "Mil", "##tia", "##dis", "Ever", "##t", "on", "communication", "strategy", ",", "it", "said", "in", "a", "statement", "." ], "ids": [ 15286, 50202, 10287, 67519, 14039, 52289, 87457, 120, 69519, 11030, 15343, 10111, 51322, 10165, 49828, 18866, 10142, 10474, 12229, 118, 13685, 17323, 10111, 97362, 25045, 10114, 15217, 14039, 12931, 75311, 16180, 17442, 42055, 10123, 10135, 24990, 40919, 117, 10271, 12415, 10106, 169, 33311, 119 ], "entity": [ "B-MISC", "O", "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 3, 7, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Spot", "Thomson", "will", "also", "be", "responsible", "for", "the", "campaign", "TV", "and", "radio", "spots", ",", "it", "said", "." ], "ids": [ 97362, 25045, 11337, 10379, 10347, 21586, 10142, 10105, 17323, 10813, 10111, 12429, 64148, 117, 10271, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Dimitri", "##s", "Ko", "##nto", "##gian", "##nis", ",", "Athens", "News", "##room", "+", "301", "331", "##18", "##12", "-", "4" ], "ids": [ 118, 118, 73589, 10107, 30186, 15088, 38531, 12597, 117, 33765, 12219, 25525, 116, 26224, 30690, 45987, 24747, 118, 125 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rugby", "star", "once", "linked", "to", "Princess", "Diana", "divorce", "##s", "." ], "ids": [ 21803, 16624, 14907, 37947, 10114, 22292, 22365, 58277, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "England", "rugby", "captain", "Will", "Carl", "##ing", ",", "whose", "marriage", "broke", "down", "after", "he", "was", "romantic", "##ally", "linked", "to", "Princess", "Diana", ",", "was", "divorced", "by", "his", "wife", "on", "Thursday", ",", "just", "24", "hours", "after", "Diana", "and", "Prince", "Charles", "divorced", "." ], "ids": [ 42355, 11701, 19812, 28157, 15380, 12225, 10230, 117, 16879, 21288, 30500, 12935, 10662, 10261, 10134, 57349, 19777, 37947, 10114, 22292, 22365, 117, 10134, 81440, 10155, 10226, 14384, 10135, 67067, 117, 12820, 10233, 19573, 10662, 22365, 10111, 14185, 10925, 81440, 119 ], "entity": [ "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 4, 8, 9, 9 ] }, { "tokens": [ "The", "Times", "newspaper", "said", "Diana", "was", "not", "named", "in", "the", "divorce", "petition", "heard", "by", "a", "court", "in", "Surrey", ",", "southern", "England", "." ], "ids": [ 10117, 12020, 22047, 12415, 22365, 10134, 10472, 12038, 10106, 10105, 58277, 88022, 32240, 10155, 169, 14866, 10106, 42858, 117, 17156, 11701, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 7, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 9 ] }, { "tokens": [ "But", "Julia", "Carl", "##ing", ",", "a", "television", "presenter", ",", "is", "said", "to", "have", "bl", "##amed", "Diana", "for", "the", "problems", "in", "her", "marriage", "and", "she", "has", "repeatedly", "moc", "##ked", "the", "princes", "##s", "on", "her", "break", "##fast", "television", "programme", "." ], "ids": [ 16976, 19332, 12225, 10230, 117, 169, 14162, 76527, 117, 10124, 12415, 10114, 10529, 21484, 83865, 22365, 10142, 10105, 20390, 10106, 10485, 21288, 10111, 10833, 10393, 77998, 60914, 30511, 10105, 87641, 10107, 10135, 10485, 24194, 84445, 14162, 19611, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Diana", "met", "Will", "Carl", "##ing", "at", "an", "exclusive", "gymnasium", "in", "London", "." ], "ids": [ 22365, 10428, 15380, 12225, 10230, 10160, 10151, 50007, 94965, 10106, 10829, 119 ], "entity": [ "B-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 4, 8, 8, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "He", "has", "always", "insisted", "that", "they", "were", "just", "friends", "." ], "ids": [ 10357, 10393, 19540, 110660, 10189, 10689, 10309, 12820, 21997, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "L", "##IF", "##F", "##E", "future", "##s", "AP", "##T", "closing", "prices", "." ], "ids": [ 10829, 149, 53668, 11565, 11259, 16711, 10107, 30909, 11090, 57409, 57476, 119 ], "entity": [ "B-LOC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "London", "International", "Financial", "Futures", "Exchange", "auto", "##mated", "pit", "trading", "(", "AP", "##T", ")", "tab", "##ular", "details", ":" ], "ids": [ 10829, 10771, 30738, 56713, 32424, 18257, 59746, 55277, 46663, 113, 30909, 11090, 114, 100781, 18062, 29500, 131 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##NT", "##RA", "##CT", "(", "MO", "##NT", "##H", ")", "AP", "##T", "CL", "##OS", "##E", "SE", "##T", "##T", "##LE", "##ME", "##NT", "PR", "##E", "##VI", "##O", "##US", "SE", "##T", "##T", "##LE" ], "ids": [ 32992, 77261, 29990, 91995, 113, 102059, 77261, 12396, 114, 30909, 11090, 75151, 21793, 11259, 23056, 11090, 11090, 51036, 42424, 77261, 23837, 11259, 90939, 11403, 32612, 23056, 11090, 11090, 51036 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##G", "G", "##IL", "##T", "(", "SE", "##P", ")", "(", "1", "/", "32", ")", "107", "-", "12", "107", "-", "10", "107", "-", "06" ], "ids": [ 149, 30118, 11447, 144, 38850, 11090, 113, 23056, 11127, 114, 113, 122, 120, 10842, 114, 15844, 118, 10186, 15844, 118, 10150, 15844, 118, 10719 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SH", "##OR", "##T", "ST", "##ER", "##L", "##ING", "(", "SE", "##P", ")", "94", ".", "26", "94", ".", "26", "94", ".", "26" ], "ids": [ 38702, 42622, 11090, 53317, 24093, 11369, 50183, 113, 23056, 11127, 114, 12749, 119, 10314, 12749, 119, 10314, 12749, 119, 10314 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GE", "##R", "##MA", "##N", "GO", "##V", "##T", "B", "##ON", "##D", "(", "SE", "##P", ")", "97", ".", "42", "97", ".", "38", "97", ".", "34" ], "ids": [ 62997, 11273, 30696, 11537, 41525, 11779, 11090, 139, 30118, 11490, 113, 23056, 11127, 114, 12328, 119, 11276, 12328, 119, 11171, 12328, 119, 11069 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EU", "##RO", "##MA", "##R", "##K", "(", "SE", "##P", ")", "96", ".", "84", "96", ".", "83", "96", ".", "83" ], "ids": [ 17751, 35066, 30696, 11273, 11733, 113, 23056, 11127, 114, 12308, 119, 11761, 12308, 119, 12408, 12308, 119, 12408 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IT", "##AL", "##IA", "##N", "GO", "##V", "##T", "B", "##ON", "##D", "(", "SE", "##P", ")", "115", ".", "62", "115", ".", "58", "115", ".", "32" ], "ids": [ 26956, 32002, 35976, 11537, 41525, 11779, 11090, 139, 30118, 11490, 113, 23056, 11127, 114, 15680, 119, 12066, 15680, 119, 11824, 15680, 119, 10842 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EU", "##RO", "##L", "##IR", "##A", "(", "SE", "##P", ")", "91", ".", "37", "91", ".", "36", "91", ".", "33" ], "ids": [ 17751, 35066, 11369, 73522, 10738, 113, 23056, 11127, 114, 12519, 119, 11204, 12519, 119, 11055, 12519, 119, 11000 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EU", "##RO", "##S", "##W", "##IS", "##S", "(", "SE", "##P", ")", "97", ".", "79", "97", ".", "80", "97", ".", "82" ], "ids": [ 17751, 35066, 10731, 13034, 19088, 10731, 113, 23056, 11127, 114, 12328, 119, 12791, 12328, 119, 10832, 12328, 119, 12180 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##TS", "##E", "100", "(", "SE", "##P", ")", "3", ",", "894", ".", "00", "3", ",", "894", ".", "00", "3", ",", "941", ".", "50" ], "ids": [ 143, 36545, 11259, 10407, 113, 23056, 11127, 114, 124, 117, 74406, 119, 11025, 124, 117, 74406, 119, 11025, 124, 117, 82944, 119, 10462 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Za", "##ire", "instal", "##ls", "first", "election", "dele", "##gates", "." ], "ids": [ 14074, 11627, 50562, 11747, 10422, 13685, 28250, 71675, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##IN", "##SH", "##AS", "##A", "1996", "-", "08", "-", "29" ], "ids": [ 148, 27128, 64091, 38025, 10738, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "total", "of", "116", "dele", "##gates", "to", "Za", "##ire", "'", "s", "National", "Election", "Commission", "(", "CN", "##E", ")", "were", "formally", "installed", "on", "Thursday", ",", "launch", "##ing", "another", "phase", "of", "the", "Central", "African", "nation", "'", "s", "much", "-", "delayed", "democratic", "transition", "." ], "ids": [ 138, 11339, 10108, 17095, 28250, 71675, 10114, 14074, 11627, 112, 187, 10655, 36512, 14941, 113, 73067, 11259, 114, 10309, 43082, 34398, 10135, 67067, 117, 29227, 10230, 12864, 20394, 10108, 10105, 11885, 13839, 22274, 112, 187, 13172, 118, 67058, 72209, 35959, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "116", ",", "representing", "political", "parties", "in", "the", "capital", "Kinshasa", ",", "will", "help", "organise", "a", "voter", "census", ",", "a", "constitutional", "referendum", "planned", "for", "January", "and", "efforts", "to", "brief", "potential", "voters", "on", "what", "ballot", "##ing", "involves", "." ], "ids": [ 10117, 17095, 117, 31221, 13736, 18708, 10106, 10105, 12185, 30084, 117, 11337, 15217, 55081, 169, 101309, 14670, 117, 169, 61537, 39697, 24292, 10142, 11238, 10111, 22116, 10114, 29040, 23078, 55450, 10135, 12976, 93339, 10230, 53963, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "total", "of", "9", ",", "446", "dele", "##gates", "will", "be", "deployed", "throughout", "Za", "##ire", "'", "s", "11", "provinces", "for", "the", "elections", ",", "which", "must", "be", "held", "by", "July", "1997", "under", "the", "transition", "##al", "constitution", "." ], "ids": [ 138, 11339, 10108, 130, 117, 40709, 28250, 71675, 11337, 10347, 54503, 15916, 14074, 11627, 112, 187, 10193, 31209, 10142, 10105, 22054, 117, 10319, 14982, 10347, 11991, 10155, 11112, 10391, 10571, 10105, 35959, 10415, 34953, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Presidential", ",", "parliamentary", "and", "municipal", "elections", "are", "planned", "for", "May", "." ], "ids": [ 55505, 117, 50485, 10111, 14935, 22054, 10301, 24292, 10142, 10725, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "can", "meet", "the", "required", "dead", "##lines", "for", "organi", "##sing", "the", "elections", "." ], "ids": [ 107, 12865, 10944, 23267, 10105, 17468, 23457, 31782, 10142, 91969, 16357, 10105, 22054, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "that", "is", "needed", "is", "for", "everyone", "to", "show", "good", "##wil", "##l", ",", "\"", "Commission", "spoke", "##sman", "Yo", "##ka", "L", "##ye", "Muda", "##ba", "told", "reporter", "##s", "." ], "ids": [ 11101, 10189, 10124, 23794, 10124, 10142, 48628, 10114, 11897, 15198, 70185, 10161, 117, 107, 14941, 50005, 24305, 30665, 10371, 149, 12871, 74164, 10537, 21937, 41408, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Del", "##ega", "##tes", "to", "the", "commission", "from", "the", "other", "10", "provinces", "will", "be", "installed", "progressive", "##ly", "from", "next", "week", "with", "the", "provinces", "of", "North", "and", "South", "Ki", "##vu", ",", "Mani", "##ema", ",", "Sha", "##ba", "and", "Band", "##undu", "having", "priority", ",", "he", "said", "." ], "ids": [ 15973, 19172, 11197, 10114, 10105, 26568, 10188, 10105, 10684, 10150, 31209, 11337, 10347, 34398, 45194, 10454, 10188, 13451, 16118, 10169, 10105, 31209, 10108, 11225, 10111, 11056, 28941, 13048, 117, 93673, 18089, 117, 106583, 10537, 10111, 11928, 87316, 13677, 92602, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 5, 9, 1, 5, 9, 1, 5, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "installation", "of", "dele", "##gates", "was", "initially", "scheduled", "for", "July", "." ], "ids": [ 10117, 38639, 10108, 28250, 71675, 10134, 20465, 34081, 10142, 11112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Official", "##s", "said", "lack", "of", "funding", "had", "delayed", "the", "process", "." ], "ids": [ 17678, 10107, 12415, 23582, 10108, 30446, 10374, 67058, 10105, 15138, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Mo", "##but", "##u", "Ses", "##e", "Se", "##ko", ",", "who", "seized", "power", "in", "a", "1965", "coup", ",", "introduced", "a", "multi", "-", "party", "system", "in", "1990", "but", "Za", "##ire", "'", "s", "transition", "has", "lag", "##ged", "well", "behind", "that", "of", "other", "states", "in", "the", "region", "." ], "ids": [ 12811, 34987, 23170, 10138, 23387, 10112, 11045, 10440, 117, 10479, 80176, 13183, 10106, 169, 10839, 26854, 117, 17037, 169, 21247, 118, 14039, 11787, 10106, 10420, 10473, 14074, 11627, 112, 187, 35959, 10393, 14587, 18832, 11206, 17155, 10189, 10108, 10684, 16316, 10106, 10105, 12220, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "past", ",", "Mo", "##but", "##u", "has", "been", "elected", "without", "opposition", "." ], "ids": [ 10167, 10105, 17781, 117, 34987, 23170, 10138, 10393, 10590, 14254, 13663, 21227, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nigeria", "would", "not", "refuse", "Commonwealth", "officials", "." ], "ids": [ 22045, 10894, 10472, 48787, 22603, 27730, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "LA", "##GO", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 29079, 83821, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nigeria", "would", "not", "object", "to", "a", "visit", "by", "Commonwealth", "officials", "but", "ins", "##ists", "its", "suspension", "from", "the", "organisation", "be", "resolved", "before", "any", "other", "questions", "are", "addressed", ",", "Foreign", "Minister", "Tom", "Iki", "##mi", "said", "on", "Thursday", "." ], "ids": [ 22045, 10894, 10472, 29331, 10114, 169, 27541, 10155, 22603, 27730, 10473, 15498, 18206, 10474, 52341, 10188, 10105, 19688, 10347, 100052, 11360, 11178, 10684, 26686, 10301, 71121, 117, 20277, 14355, 12275, 82618, 10500, 12415, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Iki", "##mi", "rei", "##tera", "##ted", "his", "position", "that", "the", "Commonwealth", "had", "no", "mandate", "to", "send", "a", "fact", "-", "finding", "mission", "." ], "ids": [ 82618, 10500, 14243, 22833, 11912, 10226, 12956, 10189, 10105, 22603, 10374, 10192, 106424, 10114, 45567, 169, 18638, 118, 43977, 17032, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "request", "I", "have", "received", "is", "for", "their", "officials", "to", "come", "and", "talk", "to", "my", "officials", "." ], "ids": [ 107, 10117, 37449, 146, 10529, 12296, 10124, 10142, 10455, 27730, 10114, 10678, 10111, 31311, 10114, 15127, 27730, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "cannot", "object", "to", "people", "want", "##ing", "to", "visit", "Nigeria", ",", "\"", "Iki", "##mi", "told", "Reuters", "by", "telephone", "from", "the", "capital", "Abu", "##ja", "." ], "ids": [ 12865, 25259, 29331, 10114, 11426, 21528, 10230, 10114, 27541, 22045, 117, 107, 82618, 10500, 21937, 46617, 10155, 69009, 10188, 10105, 12185, 18332, 10320, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 4, 8, 9, 3, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "The", "fundamental", "problem", "we", "have", "with", "the", "Commonwealth", "is", "our", "un", "##fair", "suspension", "." ], "ids": [ 107, 10117, 27971, 18077, 11951, 10529, 10169, 10105, 22603, 10124, 17446, 10119, 82198, 52341, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Any", "discussions", "we", "have", "at", "minister", "##ial", "level", "will", "be", "a", "continuat", "##ion", "of", "what", "we", "began", "in", "London", "on", "that", "." ], "ids": [ 47336, 66608, 11951, 10529, 10160, 16930, 15619, 13277, 11337, 10347, 169, 101576, 11046, 10108, 12976, 11951, 11941, 10106, 10829, 10135, 10189, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Before", "that", "is", "accomplished", "we", "cannot", "address", "anything", "else", ".", "\"" ], "ids": [ 19318, 10189, 10124, 83251, 11951, 25259, 32198, 42819, 40843, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nigeria", "was", "suspended", "from", "the", "Commonwealth", "in", "November", "after", "the", "execution", "of", "Ken", "Sar", "##o", "-", "Wi", "##wa", "and", "eight", "other", "minority", "rights", "activists", "in", "def", "##iance", "of", "international", "pl", "##eas", "for", "c", "##lemen", "##cy", "." ], "ids": [ 22045, 10134, 49799, 10188, 10105, 22603, 10106, 10819, 10662, 10105, 62341, 10108, 19355, 64696, 10133, 118, 52742, 11037, 10111, 16222, 10684, 54147, 16691, 84024, 10106, 100745, 84667, 10108, 12533, 20648, 42658, 10142, 171, 54657, 11710, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "meeting", "of", "Commonwealth", "ministers", "in", "London", "on", "Wednesday", "said", "it", "planned", "to", "send", "a", "team", "of", "senior", "officials", "to", "Nigeria", "as", "soon", "as", "possible", "to", "pers", "##ua", "##de", "Abu", "##ja", "to", "accept", "a", "fact", "-", "finding", "mission", "." ], "ids": [ 138, 19822, 10108, 22603, 66281, 10106, 10829, 10135, 57611, 12415, 10271, 24292, 10114, 45567, 169, 11121, 10108, 17843, 27730, 10114, 22045, 10146, 17864, 10146, 14128, 10114, 108839, 11908, 10253, 18332, 10320, 10114, 45218, 169, 18638, 118, 43977, 17032, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tim", "##ing", "of", "that", "mission", "has", "yet", "to", "be", "determined", "." ], "ids": [ 10117, 19604, 10230, 10108, 10189, 17032, 10393, 21833, 10114, 10347, 30706, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "latest", "diplomatic", "row", "between", "Nigeria", "'", "s", "military", "government", "and", "the", "club", "of", "Britain", "and", "its", "former", "colonies", "eru", "##pted", "over", "the", "terms", "of", "a", "visit", "by", "Commonwealth", "ministers", "to", "discuss", "Nigeria", "'", "s", "suspension", "." ], "ids": [ 10117, 50908, 64838, 45006, 10948, 22045, 112, 187, 14041, 12047, 10111, 10105, 11111, 10108, 16032, 10111, 10474, 11775, 44975, 18098, 64471, 10491, 10105, 18873, 10108, 169, 27541, 10155, 22603, 66281, 10114, 71695, 22045, 112, 187, 52341, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Nigeria", "said", "they", "would", "be", "restricted", "to", "a", "two", "-", "day", "meeting", "with", "government", "officials", ",", "but", "the", "Commonwealth", "said", "it", "wanted", "to", "hold", "meetings", "with", "people", "outside", "the", "government", "and", "called", "off", "the", "visit", "." ], "ids": [ 22045, 12415, 10689, 10894, 10347, 58750, 10114, 169, 10551, 118, 11940, 19822, 10169, 12047, 27730, 117, 10473, 10105, 22603, 12415, 10271, 22591, 10114, 18500, 47307, 10169, 11426, 17555, 10105, 12047, 10111, 11552, 11898, 10105, 27541, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dutch", "Queen", "Beatrix", "to", "visit", "S", ".", "Africa", "in", "October", "." ], "ids": [ 17693, 13704, 88328, 10114, 27541, 156, 119, 12880, 10106, 11212, 119 ], "entity": [ "B-MISC", "O", "B-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 9, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "J", "##OH", "##AN", "##NE", "##S", "##BU", "##R", "##G", "1996", "-", "08", "-", "29" ], "ids": [ 147, 55859, 41275, 93280, 10731, 108865, 11273, 11447, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Queen", "Beatrix", "of", "The", "Netherlands", "will", "pay", "a", "four", "-", "day", "state", "visit", "to", "South", "Africa", "in", "October", ",", "the", "first", "by", "a", "ruling", "Dutch", "mon", "##arch", ",", "the", "South", "African", "foreign", "ministry", "said", "on", "Thursday", "." ], "ids": [ 13704, 88328, 10108, 10117, 22043, 11337, 16868, 169, 11598, 118, 11940, 11388, 27541, 10114, 11056, 12880, 10106, 11212, 117, 10105, 10422, 10155, 169, 50788, 17693, 34372, 96355, 117, 10105, 11056, 13839, 20796, 65338, 12415, 10135, 67067, 119 ], "entity": [ "O", "B-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "She", "will", "be", "accompanied", "by", "several", "officials", "who", "will", "sign", "a", "cultural", "agreement", "with", "South", "Africa", ",", "where", "the", "Dutch", "were", "the", "first", "European", "settlers", "in", "1652", "." ], "ids": [ 11149, 11337, 10347, 39951, 10155, 11736, 27730, 10479, 11337, 26794, 169, 14817, 25432, 10169, 11056, 12880, 117, 10940, 10105, 17693, 10309, 10105, 10422, 11914, 54709, 10106, 41713, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 2, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "The", "queen", "will", "be", "accompanied", "by", "her", "husband", "Prince", "Claus", "on", "the", "September", "30", "to", "October", "3", "visit", "." ], "ids": [ 10117, 62343, 11337, 10347, 39951, 10155, 10485, 19634, 14185, 41051, 10135, 10105, 10596, 10244, 10114, 11212, 124, 27541, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Senegal", "ban", "##s", "guns", "ahead", "of", "local", "elections", "." ], "ids": [ 38052, 11915, 10107, 31199, 35629, 10108, 11436, 22054, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DA", "##KA", "##R", "1996", "-", "08", "-", "29" ], "ids": [ 47855, 67813, 11273, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "tension", "rising", "among", "Senegal", "'", "s", "political", "parties", "ahead", "of", "local", "elections", "on", "November", "24", ",", "the", "interior", "ministry", "on", "Thursday", "banned", "the", "carrying", "of", "guns", "and", "ammunition", "until", "the", "end", "of", "the", "year", "." ], "ids": [ 12613, 55027, 53816, 13328, 38052, 112, 187, 13736, 18708, 35629, 10108, 11436, 22054, 10135, 10819, 10233, 117, 10105, 14806, 65338, 10135, 67067, 58587, 10105, 39157, 10108, 31199, 10111, 77036, 11444, 10105, 11572, 10108, 10105, 10924, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "for", "##bidden", "for", "holder", "##s", "of", "permit", "##s", "for", "weapons", "of", "all", "categories", "to", "transport", "the", "said", "arms", "and", "their", "ammunition", "outside", "their", "homes", ",", "\"", "the", "statement", "said", "." ], "ids": [ 107, 10377, 10124, 10142, 71810, 10142, 48938, 10107, 10108, 52345, 10107, 10142, 31881, 10108, 10435, 43398, 10114, 16024, 10105, 12415, 28150, 10111, 10455, 77036, 17555, 10455, 14154, 117, 107, 10105, 33311, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "the", "ban", "applied", "to", "Senegal", "##ese", "national", "##s", "and", "foreign", "residents", "." ], "ids": [ 10377, 12415, 10105, 11915, 26850, 10114, 38052, 13565, 11844, 10107, 10111, 20796, 22058, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chad", "parliamentary", "election", "set", "for", "November", "24", "." ], "ids": [ 32148, 50485, 13685, 11847, 10142, 10819, 10233, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "N", "'", "DJ", "##AM", "##EN", "##A", "1996", "-", "08", "-", "29" ], "ids": [ 151, 112, 16057, 36535, 50655, 10738, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Chad", "'", "s", "President", "Idris", "##s", "De", "##by", "has", "signed", "a", "decree", "fi", "##xin", "##g", "November", "24", "as", "the", "date", "for", "parliamentary", "elections", ",", "state", "radio", "said", "on", "Thursday", "." ], "ids": [ 32148, 112, 187, 12811, 96982, 10107, 10190, 11530, 10393, 14775, 169, 109157, 14045, 76750, 10240, 10819, 10233, 10146, 10105, 13664, 10142, 50485, 22054, 117, 11388, 12429, 12415, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nom", "##ads", "will", "vote", "at", "mobile", "poll", "##ing", "stations", "around", "the", "vast", "Central", "African", "country", "between", "November", "20", "and", "24", "." ], "ids": [ 107732, 72341, 11337, 18926, 10160, 24662, 70156, 10230, 18592, 12166, 10105, 35472, 11885, 13839, 12723, 10948, 10819, 10197, 10111, 10233, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "electoral", "commission", "said", "the", "new", "125", "-", "member", "national", "assembly", "would", "be", "installed", "on", "February", "10", "." ], "ids": [ 10117, 29125, 26568, 12415, 10105, 10751, 14048, 118, 12008, 11844, 38946, 10894, 10347, 34398, 10135, 11508, 10150, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "De", "##by", "took", "power", "in", "an", "armed", "up", "##rising", "in", "1990", "." ], "ids": [ 10190, 11530, 12149, 13183, 10106, 10151, 34174, 10741, 70904, 10106, 10420, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "won", "69", "percent", "of", "votes", "in", "the", "second", "round", "of", "presidential", "elections", "on", "July", "3", ",", "1996", ".", "." ], "ids": [ 10357, 11367, 12573, 22362, 10108, 24659, 10106, 10105, 11132, 13569, 10108, 36476, 22054, 10135, 11112, 124, 117, 10389, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "supporters", "will", "contest", "the", "parliamentary", "election", "in", "a", "coalition", "of", "30", "mainly", "small", "parties", ",", "the", "Republican", "Front", ",", "led", "by", "De", "##by", "'", "s", "Patriot", "##ic", "Sal", "##vation", "Movement", "." ], "ids": [ 11597, 42957, 11337, 37596, 10105, 50485, 13685, 10106, 169, 41028, 10108, 10244, 20827, 12474, 18708, 117, 10105, 21776, 19241, 117, 12857, 10155, 10190, 11530, 112, 187, 107222, 11130, 64831, 39784, 28516, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 4, 8, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Ivory", "Coast", "-", "Aug", "29", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 83233, 17498, 118, 53012, 10386, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9 ] }, { "tokens": [ "AB", "##ID", "##J", "##AN", "1996", "-", "08", "-", "29" ], "ids": [ 21644, 28895, 15417, 41275, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "These", "are", "significant", "stories", "in", "the", "Ivo", "##rian", "press", "on", "Thursday", "." ], "ids": [ 13252, 10301, 17912, 21158, 10106, 10105, 46024, 20764, 21040, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "FR", "##AT", "##ER", "##NI", "##TE", "MA", "##TI", "##N" ], "ids": [ 64655, 32071, 24093, 52898, 29833, 27277, 72286, 11537 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Cabinet", "meeting", "establish", "##es", "five", "new", "administrative", "regions", "and", "four", "new", "departments", "as", "part", "of", "government", "de", "##centra", "##lis", "##ation", "policy", "." ], "ids": [ 118, 49855, 19822, 33623, 10171, 12403, 10751, 18401, 21721, 10111, 11598, 10751, 61704, 10146, 10668, 10108, 12047, 10104, 97368, 12536, 11809, 14368, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "V", "##O", "##IE" ], "ids": [ 29079, 159, 11403, 71655 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Members", "of", "parliament", "seek", "higher", "pay", "and", "more", "benefits", "." ], "ids": [ 118, 44659, 10108, 40519, 48394, 17981, 16868, 10111, 10798, 48297, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "speaker", "of", "parliament", ",", "Charles", "Bau", "##za", "Don", "##wah", "##i", ",", "will", "meet", "President", "Henri", "Ko", "##nan", "Bed", "##ie", "on", "September", "3", "to", "discuss", "their", "request", "." ], "ids": [ 10117, 57738, 10108, 40519, 117, 10925, 18727, 10637, 11740, 63784, 10116, 117, 11337, 23267, 12811, 13612, 30186, 13470, 76757, 10400, 10135, 10596, 124, 10114, 71695, 10455, 37449, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Deputy", "director", "of", "animal", "health", "department", "Do", "##uat", "##i", "Alphonse", "says", "his", "agents", "have", "seized", "46", "tonnes", "of", "ill", "##ici", "##t", "por", "##k", "in", "a", "two", "-", "week", "operation", "to", "ensure", "com", "##pliance", "with", "a", "ban", "imposed", "after", "an", "outbreak", "of", "s", "##win", "##e", "fever", "." ], "ids": [ 118, 32389, 12461, 10108, 18882, 17004, 21079, 11791, 48439, 10116, 48006, 22153, 10226, 32124, 10529, 80176, 11528, 39435, 10108, 32941, 13439, 10123, 10183, 10174, 10106, 169, 10551, 118, 16118, 20080, 10114, 40781, 10212, 107826, 10169, 169, 11915, 83358, 10662, 10151, 63831, 10108, 187, 24748, 10112, 105142, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LE", "J", "##O", "##UR" ], "ids": [ 84977, 147, 11403, 98348 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Raphael", "La", "##k", "##pe", ",", "publisher", "of", "the", "daily", "Le", "Pop", "##ulaire", ",", "was", "released", "on", "Wednesday", "evening", "after", "three", "days", "in", "custody", "and", "will", "appear", "in", "court", "on", "Thursday", "morning", "." ], "ids": [ 118, 58514, 10159, 10174, 11355, 117, 45072, 10108, 10105, 27636, 10281, 17565, 41578, 117, 10134, 11539, 10135, 57611, 42135, 10662, 11003, 13990, 10106, 103772, 10111, 11337, 22641, 10106, 14866, 10135, 67067, 28757, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Cabinet", "meeting", "app", "##oint", "##s", "Colonel", "Severin", "Ko", "##nan", "Ko", "##ua", "##me", "as", "gen", "##darmerie", "commander", ",", "replacing", "General", "Joseph", "Tan", "##ny", ",", "who", "has", "been", "appointed", "secretary", "-", "general", "of", "the", "National", "Security", "Council", "." ], "ids": [ 118, 49855, 19822, 72894, 94453, 10107, 24782, 89924, 30186, 13470, 30186, 11908, 10627, 10146, 15331, 103094, 27703, 117, 45857, 11220, 11379, 30594, 10756, 117, 10479, 10393, 10590, 14896, 37664, 118, 11389, 10108, 10105, 10655, 20924, 12821, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "-", "-", "Abi", "##djan", "news", "##room", "+", "225", "21", "90", "90" ], "ids": [ 118, 118, 101604, 69062, 14424, 25525, 116, 20843, 10296, 10919, 10919 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NATO", "releases", "Ser", "##b", "police", ",", "crisis", "ea", "##sing", "-", "NATO", "." ], "ids": [ 21662, 45906, 39759, 10457, 15034, 117, 22859, 22257, 16357, 118, 21662, 119 ], "entity": [ "B-ORG", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 2, 6, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "SAR", "##A", "##J", "##E", "##VO", "1996", "-", "08", "-", "29" ], "ids": [ 97404, 10738, 15417, 11259, 70325, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NATO", "forces", "released", "a", "group", "of", "Bosnia", "##n", "Ser", "##b", "police", "##men", "late", "on", "Thursday", "and", "a", "ten", "##se", "con", "##frontation", "appeared", "to", "be", "ea", "##sing", ",", "an", "alliance", "spoke", "##sman", "said", "." ], "ids": [ 21662, 13729, 11539, 169, 11795, 10108, 29634, 10115, 39759, 10457, 15034, 11418, 13002, 10135, 67067, 10111, 169, 11769, 10341, 10173, 85437, 14565, 10114, 10347, 22257, 16357, 117, 10151, 36758, 50005, 24305, 12415, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "situation", "in", "Mahal", "##a", "seems", "to", "be", "very", "much", "on", "its", "way", "toward", "resolution", "." ], "ids": [ 107, 10117, 18586, 10106, 96363, 10113, 34208, 10114, 10347, 12558, 13172, 10135, 10474, 13170, 32216, 40017, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "My", "understanding", "is", "the", "(", "Ser", "##b", ")", "police", "have", "been", "released", ".", ".", "." ], "ids": [ 11590, 37149, 10124, 10105, 113, 39759, 10457, 114, 15034, 10529, 10590, 11539, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "Z", "##vor", "##nik", ",", "we", "think", "the", "situation", "is", "wind", "##ing", "down", "as", "well", ",", "\"", "NATO", "spoke", "##sman", "Lieutenant", "Colonel", "Max", "Mar", "##rine", "##r", "told", "Reuters", "." ], "ids": [ 10167, 163, 19360, 12027, 117, 11951, 27874, 10105, 18586, 10124, 31346, 10230, 12935, 10146, 11206, 117, 107, 21662, 50005, 24305, 23342, 24782, 12854, 15734, 28728, 10129, 21937, 46617, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O" ], "entity_ids": [ 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 4, 8, 8, 8, 9, 3, 9 ] }, { "tokens": [ "NATO", "troops", "det", "##ained", "65", "Bosnia", "##n", "Ser", "##b", "police", "##men", "early", "on", "Thursday", "after", "they", "attacked", "Mo", "##sle", "##m", "refugees", "returning", "to", "homes", "in", "Mahal", "##a", ",", "a", "Ser", "##b", "-", "controlled", "village", "on", "Bosnia", "'", "s", "internal", "boundary", "line", "." ], "ids": [ 21662, 20836, 10349, 65804, 10843, 29634, 10115, 39759, 10457, 15034, 11418, 11732, 10135, 67067, 10662, 10689, 30272, 34987, 42176, 10147, 71797, 30052, 10114, 14154, 10106, 96363, 10113, 117, 169, 39759, 10457, 118, 29050, 11607, 10135, 29634, 112, 187, 29868, 42584, 12117, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 1, 5, 9, 9, 2, 6, 6, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "apparent", "ret", "##alia", "##tion", "for", "NATO", "'", "s", "det", "##ention", "of", "the", "Ser", "##bs", ",", "an", "ang", "##ry", "Ser", "##b", "mo", "##b", "including", "police", "##men", "trap", "##ped", "six", "una", "##rmed", "U", ".", "N", ".", "police", "monitor", "##s", "and", "three", "local", "aide", "##s", "in", "their", "office", "in", "the", "town", "of", "Z", "##vor", "##nik", ",", "east", "of", "Mahal", "##a", "." ], "ids": [ 10167, 51200, 62893, 35954, 10822, 10142, 21662, 112, 187, 10349, 90372, 10108, 10105, 39759, 19528, 117, 10151, 10488, 10908, 39759, 10457, 46912, 10457, 11198, 15034, 11418, 72398, 16898, 12449, 10153, 98119, 158, 119, 151, 119, 15034, 60774, 10107, 10111, 11003, 11436, 23135, 10107, 10106, 10455, 14301, 10106, 10105, 12221, 10108, 163, 19360, 12027, 117, 13827, 10108, 96363, 10113, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Mar", "##rine", "##r", "said", "NATO", "forces", "con", "##fis", "##cated", "25", "long", "-", "barrel", "##ed", "AK", "-", "47", "automatic", "assault", "rifle", "##s", "from", "the", "det", "##ained", "Ser", "##bs", "before", "setting", "them", "free", "." ], "ids": [ 15734, 28728, 10129, 12415, 21662, 13729, 10173, 65702, 57736, 10258, 11695, 118, 93397, 10336, 36723, 118, 11413, 57472, 50150, 59116, 10107, 10188, 10105, 10349, 65804, 39759, 19528, 11360, 29421, 11345, 13961, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Local", "radio", "and", "television", "there", "(", "in", "Z", "##vor", "##nik", ")", "are", "ad", "##visi", "##ng", "people", "to", "step", "back", "and", "take", "it", "easy", "." ], "ids": [ 107, 22693, 12429, 10111, 14162, 11155, 113, 10106, 163, 19360, 12027, 114, 10301, 10840, 45145, 10376, 11426, 10114, 31877, 12014, 10111, 13574, 10271, 44346, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "think", "that", "when", "the", "word", "about", "how", "things", "are", "going", "in", "Mahal", "##a", "which", "is", "about", "35", "minutes", "away", "by", "road", "reaches", "Z", "##vor", "##nik", "that", "should", "help", ",", "\"", "Mar", "##rine", "##r", "said", "." ], "ids": [ 12865, 27874, 10189, 10841, 10105, 12307, 10978, 14796, 24682, 10301, 19090, 10106, 96363, 10113, 10319, 10124, 10978, 10803, 15304, 14942, 10155, 15485, 56663, 163, 19360, 12027, 10189, 14819, 15217, 117, 107, 15734, 28728, 10129, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Storm", "kills", "11", "at", "Macedonian", "religious", "festival", "." ], "ids": [ 23894, 69179, 10193, 10160, 92341, 19366, 15242, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "SK", "##OP", "##J", "##E", "1996", "-", "08", "-", "29" ], "ids": [ 21275, 44917, 15417, 11259, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "11", "people", "were", "killed", "and", "60", "others", "injured", "on", "Thursday", "when", "light", "##ning", "struck", "a", "group", "of", "people", "attending", "a", "religious", "festival", "in", "Macedonia", ",", "police", "and", "municipal", "officials", "said", "." ], "ids": [ 11699, 16298, 10193, 11426, 10309, 15875, 10111, 10709, 14633, 36081, 10135, 67067, 10841, 15765, 11269, 45622, 169, 11795, 10108, 11426, 54234, 169, 19366, 15242, 10106, 34840, 117, 15034, 10111, 14935, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "in", "Be", "##rov", "##o", ",", "150", "km", "(", "90", "miles", ")", "west", "of", "the", "capital", "Skopje", ",", "said", "there", "were", "around", "15", ",", "000", "people", "gathered", "around", "the", "town", "'", "s", "cathedral", "when", "the", "light", "##ning", "struck", "the", "group", "during", "a", "thu", "##nders", "##tor", "##m", "." ], "ids": [ 18051, 10106, 14321, 23229, 10133, 117, 11766, 10204, 113, 10919, 14148, 114, 13735, 10108, 10105, 12185, 54454, 117, 12415, 11155, 10309, 12166, 10208, 117, 10259, 11426, 69918, 12166, 10105, 12221, 112, 187, 76128, 10841, 10105, 15765, 11269, 45622, 10105, 11795, 10939, 169, 23886, 72975, 11813, 10147, 119 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Korn", "##blu", "##m", ",", "Milo", "##se", "##vic", "discuss", "election", "crisis", "." ], "ids": [ 96287, 88506, 10147, 117, 77181, 10341, 48175, 71695, 13685, 22859, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Peter", "G", "##reste" ], "ids": [ 10979, 144, 69829 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "29" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "en", "##voy", "John", "Korn", "##blu", "##m", "met", "Serbian", "President", "S", "##lob", "##odan", "Milo", "##se", "##vic", "on", "Thursday", "in", "an", "effort", "to", "def", "##use", "a", "growing", "crisis", "surrounding", "Bosnia", "'", "s", "post", "-", "war", "elections", "." ], "ids": [ 158, 119, 156, 119, 10110, 81843, 10421, 96287, 88506, 10147, 10428, 37952, 12811, 156, 79775, 75630, 77181, 10341, 48175, 10135, 67067, 10106, 10151, 24912, 10114, 100745, 12730, 169, 25566, 22859, 27027, 29634, 112, 187, 11841, 118, 10338, 22054, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 4, 8, 8, 8, 9, 2, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "American", "diplomat", "arrived", "in", "Belgrade", "two", "days", "after", "international", "organiser", "##s", "post", "##pone", "##d", "municipal", "elections", "in", "Bosnia", "due", "to", "irregular", "##ities", "in", "the", "registration", "of", "Ser", "##b", "refuge", "##e", "voters", "." ], "ids": [ 10117, 10536, 45652, 22584, 10106, 48084, 10551, 13990, 10662, 12533, 93446, 10107, 11841, 35741, 10162, 14935, 22054, 10106, 29634, 10850, 10114, 55143, 17285, 10106, 10105, 80315, 10108, 39759, 10457, 63655, 10112, 55450, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "discussed", "the", "decision", "to", "post", "##pone", "the", "municipal", "elections", "and", "I", "made", "clear", "it", "was", "primarily", "the", "mani", "##pulation", "of", "voter", "registration", "by", "the", "Republika", "Srpska", "(", "Bosnia", "##n", "Ser", "##b", "republic", ")", "which", "led", "to", "this", "development", ",", "\"", "Korn", "##blu", "##m", "said", "after", "three", "hours", "of", "talks", "." ], "ids": [ 107, 12865, 55424, 10105, 19231, 10114, 11841, 35741, 10105, 14935, 22054, 10111, 146, 11019, 24866, 10271, 10134, 22426, 10105, 52321, 105717, 10108, 101309, 80315, 10155, 10105, 20747, 58255, 113, 29634, 10115, 39759, 10457, 108499, 114, 10319, 12857, 10114, 10531, 13405, 117, 107, 96287, 88506, 10147, 12415, 10662, 11003, 19573, 10108, 56672, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "he", "said", "the", "United", "States", "still", "believed", "it", "was", "important", "to", "go", "ahead", "with", "national", "elections", "in", "Bosnia", "as", "scheduled", "on", "September", "14", "to", "bol", "##ster", "the", "peace", "process", "." ], "ids": [ 16976, 10261, 12415, 10105, 10609, 10859, 12647, 20718, 10271, 10134, 12452, 10114, 11783, 35629, 10169, 11844, 22054, 10106, 29634, 10146, 34081, 10135, 10596, 10247, 10114, 14038, 12765, 10105, 28101, 15138, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Korn", "##blu", "##m", "gave", "no", "indication", "that", "he", "had", "won", "any", "specific", "commitment", "from", "Milo", "##se", "##vic", ",", "the", "patron", "of", "the", "Bosnia", "##n", "Ser", "##bs", ",", "to", "re", "##cti", "##fy", "any", "abuse", "##s", "in", "the", "registration", "process", "." ], "ids": [ 96287, 88506, 10147, 15362, 10192, 102383, 10189, 10261, 10374, 11367, 11178, 19182, 75010, 10188, 77181, 10341, 48175, 117, 10105, 44979, 10108, 10105, 29634, 10115, 39759, 19528, 117, 10114, 11639, 76344, 24203, 11178, 51401, 10107, 10106, 10105, 80315, 15138, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bosnia", "'", "s", "Mo", "##sle", "##m", "political", "parties", "have", "ur", "##ged", "their", "refugees", "to", "boy", "##cott", "the", "elections", "until", "irregular", "##ities", "with", "voter", "registration", "are", "resolved", "." ], "ids": [ 29634, 112, 187, 34987, 42176, 10147, 13736, 18708, 10529, 10399, 18832, 10455, 71797, 10114, 26905, 48426, 10105, 22054, 11444, 55143, 17285, 10169, 101309, 80315, 10301, 100052, 119 ], "entity": [ "B-LOC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Human", "rights", "workers", "say", "Serbian", "and", "Bosnia", "##n", "Ser", "##b", "authorities", "co", "##er", "##ced", "refugees", "to", "register", "only", "in", "Ser", "##b", "-", "held", "territory", "in", "Bosnia", "to", "solid", "##ify", "the", "results", "of", "war", "##time", "ex", "##pulsion", "##s", "and", "military", "conquest", "." ], "ids": [ 15426, 16691, 23829, 23763, 37952, 10111, 29634, 10115, 39759, 10457, 28308, 11170, 10165, 38039, 71797, 10114, 47424, 10893, 10106, 39759, 10457, 118, 11991, 24399, 10106, 29634, 10114, 37751, 48281, 10105, 17466, 10108, 10338, 18086, 11419, 52883, 10107, 10111, 14041, 17841, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Serbian", "officials", "have", "denied", "any", "abuse", "##s", "occurred", "during", "a", "10", "-", "day", "registration", "period", "and", "the", "Bosnia", "##n", "Ser", "##bs", ",", "ang", "##ry", "at", "the", "post", "##pone", "##ment", "of", "municipal", "elections", ",", "have", "threatened", "to", "hold", "local", "poll", "##s", "on", "their", "territory", "without", "the", "international", "community", "'", "s", "ble", "##ssing", "." ], "ids": [ 37952, 27730, 10529, 47467, 11178, 51401, 10107, 25738, 10939, 169, 10150, 118, 11940, 80315, 13127, 10111, 10105, 29634, 10115, 39759, 19528, 117, 10488, 10908, 10160, 10105, 11841, 35741, 10426, 10108, 14935, 22054, 117, 10529, 44593, 10114, 18500, 11436, 70156, 10107, 10135, 10455, 24399, 13663, 10105, 12533, 13354, 112, 187, 10718, 63400, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Korn", "##blu", "##m", "said", "only", "elections", "endorsed", "by", "the", "Organisation", "for", "Security", "and", "Cooperation", "in", "Europe", "(", "OS", "##CE", ")", "would", "be", "legi", "##timate", "." ], "ids": [ 96287, 88506, 10147, 12415, 10893, 22054, 108417, 10155, 10105, 22223, 10142, 20924, 10111, 97225, 10106, 11767, 113, 18398, 43161, 114, 10894, 10347, 78198, 80021, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "As", "we", "have", "said", "publicly", "before", ",", "if", "there", "is", "any", "effort", "to", "do", "so", "(", "hold", "local", "elections", ")", "these", "elections", "will", "not", "be", "valid", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 107, 10882, 11951, 10529, 12415, 53577, 11360, 117, 12277, 11155, 10124, 11178, 24912, 10114, 10149, 10380, 113, 18500, 11436, 22054, 114, 11762, 22054, 11337, 10472, 10347, 64999, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "elections", "which", "are", "valid", "are", "those", "conducted", "by", "the", "international", "community", "under", "the", "management", "of", "the", "OS", "##CE", ".", "\"" ], "ids": [ 10117, 22054, 10319, 10301, 64999, 10301, 12676, 23736, 10155, 10105, 12533, 13354, 10571, 10105, 17150, 10108, 10105, 18398, 43161, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "After", "meeting", "Milo", "##se", "##vic", ",", "Korn", "##blu", "##m", "flew", "to", "the", "Croatian", "capital", "Zagreb", "." ], "ids": [ 11301, 19822, 77181, 10341, 48175, 117, 96287, 88506, 10147, 64284, 10114, 10105, 48963, 12185, 18772, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 4, 8, 8, 9, 9, 9, 2, 9, 1, 9 ] }, { "tokens": [ "He", "was", "due", "to", "head", "to", "the", "Bosnia", "##n", "town", "of", "Banja", "Luka", "on", "Friday", "to", "meet", "Bosnia", "##n", "Ser", "##b", "acting", "president", "Bil", "##jana", "Pla", "##vs", "##ic", "and", "Bosnia", "##n", "Ser", "##b", "opposition", "leaders", "." ], "ids": [ 10357, 10134, 10850, 10114, 13578, 10114, 10105, 29634, 10115, 12221, 10108, 100274, 51201, 10135, 30767, 10114, 23267, 29634, 10115, 39759, 10457, 25086, 12931, 82608, 20611, 83292, 30168, 11130, 10111, 29634, 10115, 39759, 10457, 21227, 24155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 4, 8, 8, 8, 8, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "He", "also", "planned", "to", "travel", "to", "Sarajevo", "to", "over", "##see", "the", "formal", "dissolution", "of", "the", "separat", "##ist", "C", "##roat", "mini", "-", "state", "in", "western", "Bosnia", "." ], "ids": [ 10357, 10379, 24292, 10114, 23595, 10114, 21402, 10114, 10491, 20262, 10105, 23129, 71930, 10108, 10105, 81806, 11293, 140, 64825, 25103, 118, 11388, 10106, 16672, 29634, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "U", ".", "N", ".", "police", ",", "relief", "workers", "and", "NATO", "officers", "have", "reported", "a", "rise", "in", "political", "violence", "across", "Bosnia", "in", "the", "run", "-", "up", "to", "the", "September", "14", "elections", "." ], "ids": [ 158, 119, 151, 119, 15034, 117, 31276, 23829, 10111, 21662, 23579, 10529, 15943, 169, 28710, 10106, 13736, 26342, 15130, 29634, 10106, 10105, 14095, 118, 10741, 10114, 10105, 10596, 10247, 22054, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vo", "##ters", "will", "be", "cho", "##osing", "a", "three", "-", "member", "presidency", "and", "a", "parliament", "to", "rule", "over", "a", "loose", "union", "of", "Bosnia", ",", "comprised", "of", "a", "Ser", "##b", "republic", "and", "a", "Mo", "##sle", "##m", "-", "C", "##roat", "fede", "##ration", "." ], "ids": [ 59482, 21891, 11337, 10347, 11257, 90739, 169, 11003, 118, 12008, 97059, 10111, 169, 40519, 10114, 21983, 10491, 169, 102920, 20763, 10108, 29634, 117, 108240, 10108, 169, 39759, 10457, 108499, 10111, 169, 34987, 42176, 10147, 118, 140, 64825, 83482, 19466, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Ga", "##z", "##pro", "##m", "rises", "to", "2", ",", "901", ".", "48", "r", "##bl", "##s", "at", "auction", "." ], "ids": [ 69699, 10305, 73099, 10147, 91144, 10114, 123, 117, 70732, 119, 11300, 186, 31766, 10107, 10160, 106733, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MO", "##SC", "##OW", "1996", "-", "08", "-", "29" ], "ids": [ 102059, 36175, 33893, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "stake", "of", "10", "million", "shares", "in", "Russian", "gas", "mono", "##poly", "RA", "##O", "Ga", "##z", "##pro", "##m", "was", "sold", "at", "auction", "on", "Thursday", "at", "an", "average", "2", ",", "901", ".", "48", "ro", "##ub", "##les", "a", "share", ",", "up", "from", "2", ",", "891", ".", "00", "ro", "##ub", "##les", "a", "week", "ago", ",", "the", "Federal", "Sec", "##urities", "Corporation", "(", "FF", "##K", ")", "said", "." ], "ids": [ 138, 90081, 10108, 10150, 12473, 45751, 10106, 13463, 16091, 70997, 91733, 64007, 11403, 69699, 10305, 73099, 10147, 10134, 15337, 10160, 106733, 10135, 67067, 10160, 10151, 13551, 123, 117, 70732, 119, 11300, 25470, 20664, 11268, 169, 23867, 117, 10741, 10188, 123, 117, 80250, 119, 11025, 25470, 20664, 11268, 169, 16118, 36390, 117, 10105, 14492, 109754, 82073, 14456, 113, 44297, 11733, 114, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Starting", "price", "at", "the", "auction", "was", "2", ",", "746", "ro", "##ub", "##les", "a", "share", "and", "the", "40", "lots", "sold", "for", "between", "2", ",", "840", "and", "2", ",", "998", "ro", "##ub", "##les", "a", "share", ",", "the", "FF", "##K", "said", "in", "a", "statement", "." ], "ids": [ 65149, 30839, 10160, 10105, 106733, 10134, 123, 117, 76770, 25470, 20664, 11268, 169, 23867, 10111, 10105, 10533, 87202, 15337, 10142, 10948, 123, 117, 42935, 10111, 123, 117, 77378, 25470, 20664, 11268, 169, 23867, 117, 10105, 44297, 11733, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "stake", "represented", "0", ".", "042", "percent", "of", "Ga", "##z", "##pro", "##m", "'", "s", "capital", "." ], "ids": [ 10117, 90081, 18839, 121, 119, 97672, 22362, 10108, 69699, 10305, 73099, 10147, 112, 187, 12185, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "FF", "##K", "said", "that", "since", "auction", "##s", "began", ",", "139", ".", "75", "million", "shares", ",", "equivalent", "to", "0", ".", "59", "percent", "of", "Ga", "##z", "##pro", "##m", ",", "have", "changed", "hands", "." ], "ids": [ 10117, 44297, 11733, 12415, 10189, 11764, 106733, 10107, 11941, 117, 19615, 119, 11417, 12473, 45751, 117, 30647, 10114, 121, 119, 11867, 22362, 10108, 69699, 10305, 73099, 10147, 117, 10529, 17695, 27925, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ga", "##z", "##pro", "##m", ",", "Russia", "'", "s", "biggest", "company", "by", "market", "capital", "##isation", ",", "has", "massive", "reserves", "and", "potentially", "huge", "earning", "##s", "." ], "ids": [ 69699, 10305, 73099, 10147, 117, 14664, 112, 187, 36304, 12100, 10155, 17313, 12185, 20312, 117, 10393, 35394, 60405, 10111, 80916, 42126, 56981, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "However", ",", "its", "23", ".", "6", "billion", "shares", "are", "highly", "ill", "##iq", "##uid", "and", "management", "permission", "is", "required", "to", "sell", "them", "." ], "ids": [ 12209, 117, 10474, 10328, 119, 127, 25848, 45751, 10301, 22625, 32941, 35692, 45977, 10111, 17150, 52389, 10124, 17468, 10114, 36300, 11345, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ga", "##z", "##pro", "##m", "has", "recently", "tight", "##ened", "these", "rules", ",", "making", "it", "hard", "##er", "for", "share", "##holders", "to", "sell", "to", "who", "##ever", "they", "want", ",", "when", "they", "want", "." ], "ids": [ 69699, 10305, 73099, 10147, 10393, 23746, 85202, 27867, 11762, 23123, 117, 14293, 10271, 19118, 10165, 10142, 23867, 75111, 10114, 36300, 10114, 10479, 23433, 10689, 21528, 117, 10841, 10689, 21528, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "has", "organised", "regular", "auction", "##s", "of", "its", "shares", "to", "create", "an", "order", "##ly", "market", "in", "the", "paper", "." ], "ids": [ 10117, 12100, 10393, 54200, 15670, 106733, 10107, 10108, 10474, 45751, 10114, 18842, 10151, 12990, 10454, 17313, 10106, 10105, 17895, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "the", "first", "auction", "on", "March", "6", ",", "shares", "sold", "for", "an", "average", "406", ".", "6", "ro", "##ub", "##les", "each", ",", "and", "prices", "have", "been", "rising", "st", "##ead", "##ily", "since", "then", ",", "but", "the", "rise", "in", "price", "this", "week", "and", "last", "was", "much", "less", "than", "in", "previous", "auction", "##s", "." ], "ids": [ 11699, 10105, 10422, 106733, 10135, 11144, 127, 117, 45751, 15337, 10142, 10151, 13551, 28081, 119, 127, 25470, 20664, 11268, 11948, 117, 10111, 57476, 10529, 10590, 53816, 28780, 30297, 32464, 11764, 11059, 117, 10473, 10105, 28710, 10106, 30839, 10531, 16118, 10111, 12469, 10134, 13172, 15306, 11084, 10106, 16741, 106733, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "the", "Russian", "Trading", "System", ",", "Ga", "##z", "##pro", "##m", "shares", "rose", "25", "percent", "on", "Thursday", "to", "$", "0", ".", "375", "from", "$", "0", ".", "300", ",", "after", "falling", "by", "over", "a", "third", "earlier", "this", "week", "." ], "ids": [ 10576, 10105, 13463, 110260, 11512, 117, 69699, 10305, 73099, 10147, 45751, 29467, 10258, 22362, 10135, 67067, 10114, 109, 121, 119, 25403, 10188, 109, 121, 119, 11093, 117, 10662, 54756, 10155, 10491, 169, 12628, 18905, 10531, 16118, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Art", "##yo", "##m", "Daniel", "##yan", ",", "Moscow", "News", "##room", ",", "+", "709", "##5", "941", "852", "##0" ], "ids": [ 118, 118, 11397, 15594, 10147, 11792, 15976, 117, 18744, 12219, 25525, 117, 116, 67432, 11166, 82944, 70072, 10929 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Serbian", "police", "##man", "shot", "dead", "in", "Kosovo", "province", "." ], "ids": [ 37952, 15034, 10589, 19508, 23457, 10106, 26077, 14342, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "29" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "police", "##man", "has", "been", "shot", "dead", "in", "Serbia", "'", "s", "trouble", "##d", "Kosovo", "province", ",", "Serbian", "police", "said", "on", "Thursday", "." ], "ids": [ 138, 15034, 10589, 10393, 10590, 19508, 23457, 10106, 20141, 112, 187, 58285, 10162, 26077, 14342, 117, 37952, 15034, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "the", "fifth", "attack", "on", "police", "this", "month", "in", "the", "southern", "province", ",", "a", "hot", "spot", "of", "ethnic", "tension", "where", "the", "Albanian", "majority", "have", "boy", "##cott", "##ed", "Serbian", "institutions", "and", "set", "up", "their", "own", ",", "which", "are", "considered", "illegal", "by", "Belgrade", "." ], "ids": [ 10377, 10134, 10105, 22237, 16342, 10135, 15034, 10531, 14064, 10106, 10105, 17156, 14342, 117, 169, 29698, 28504, 10108, 34216, 55027, 10940, 10105, 54257, 19471, 10529, 26905, 48426, 10336, 37952, 24671, 10111, 11847, 10741, 10455, 12542, 117, 10319, 10301, 14289, 39806, 10155, 48084, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "sl", "##ain", "police", "##man", "E", "##ju", "##p", "Ba", "##j", "##gora", ",", "42", ",", "was", "an", "Albanian", "who", "had", "served", "in", "the", "Serbian", "police", "and", "state", "security", "since", "1987", ",", "police", "told", "the", "Yugoslav", "news", "agency", "Tan", "##ju", "##g", "." ], "ids": [ 10117, 38523, 18073, 15034, 10589, 142, 10761, 10410, 21333, 10418, 67036, 117, 11276, 117, 10134, 10151, 54257, 10479, 10374, 12325, 10106, 10105, 37952, 15034, 10111, 11388, 21849, 11764, 10581, 117, 15034, 21937, 10105, 93444, 14424, 34649, 30594, 10761, 10240, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "He", "was", "shot", "on", "Wednesday", "afternoon", "as", "he", "stepped", "off", "a", "bus", "near", "his", "family", "home", "in", "the", "village", "of", "Don", "##je", "L", "##ju", "##pce", "in", "the", "municipality", "of", "Pod", "##uje", "##vo", "." ], "ids": [ 10357, 10134, 19508, 10135, 57611, 73213, 10146, 10261, 99116, 11898, 169, 19369, 12883, 10226, 11365, 11816, 10106, 10105, 11607, 10108, 11740, 10381, 149, 10761, 106177, 10106, 10105, 17288, 10108, 23319, 13064, 11244, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Just", "hours", "before", "Wednesday", "'", "s", "shooting", ",", "three", "hand", "gr", "##ena", "##des", "were", "thrown", "at", "a", "police", "station", "in", "Cel", "##ope", "##k", "." ], "ids": [ 17116, 19573, 11360, 57611, 112, 187, 38969, 117, 11003, 15230, 30518, 13032, 10920, 10309, 88590, 10160, 169, 15034, 11825, 10106, 82804, 38978, 10174, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "They", "caused", "damage", "but", "no", "casualties", ",", "police", "said", "." ], "ids": [ 11696, 19513, 26115, 10473, 10192, 69297, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Serbian", "authorities", "bl", "##ame", "Albanian", "dis", "##siden", "##ts", "for", "the", "recent", "sp", "##ate", "of", "attacks", "." ], "ids": [ 10117, 37952, 28308, 21484, 18969, 54257, 27920, 42323, 10806, 10142, 10105, 19037, 32650, 12436, 10108, 26483, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "None", "of", "the", "attack", "##ers", "has", "been", "caught", "." ], "ids": [ 86481, 10108, 10105, 16342, 10901, 10393, 10590, 39797, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kosovo", "'", "s", "auto", "##nomy", "was", "rev", "##oked", "in", "1987", "and", "Ser", "##b", "police", "forces", "c", "##rack", "##ed", "down", "on", "Albanian", "protests", "." ], "ids": [ 26077, 112, 187, 18257, 100395, 10134, 86095, 76792, 10106, 10581, 10111, 39759, 10457, 15034, 13729, 171, 71189, 10336, 12935, 10135, 54257, 60931, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "Albanian", "moderate", "##s", "want", "auto", "##nomy", "restored", "but", "hard", "##liner", "##s", "want", "to", "join", "up", "with", "neighbouring", "Albania", "." ], "ids": [ 54257, 62483, 10107, 21528, 18257, 100395, 39256, 10473, 19118, 103140, 10107, 21528, 10114, 23707, 10741, 10169, 79475, 28931, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "Ser", "##bs", ",", "who", "make", "up", "10", "percent", "of", "the", "province", "'", "s", "1", ".", "8", "million", "people", ",", "claim", "Kosovo", "as", "the", "c", "##rad", "##le", "of", "their", "culture", "." ], "ids": [ 10117, 39759, 19528, 117, 10479, 13086, 10741, 10150, 22362, 10108, 10105, 14342, 112, 187, 122, 119, 129, 12473, 11426, 117, 27445, 26077, 10146, 10105, 171, 18599, 10284, 10108, 10455, 15162, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vir", "##al", "mening", "##itis", "epi", "##demi", "##c", "kills", "10", "in", "Romania", "." ], "ids": [ 106433, 10415, 87927, 36967, 17247, 108986, 10350, 69179, 10150, 10106, 13927, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "B", "##UC", "##HA", "##RE", "##ST", "1996", "-", "08", "-", "29" ], "ids": [ 139, 93089, 58132, 66014, 32995, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vir", "##al", "mening", "##itis", "has", "killed", "10", "people", "in", "Romania", "'", "s", "capital", "Bucharest", "this", "month", "in", "what", "doctors", "said", "on", "Thursday", "was", "the", "worst", "epi", "##demi", "##c", "of", "its", "type", "in", "the", "country", "for", "a", "decade", "." ], "ids": [ 106433, 10415, 87927, 36967, 10393, 15875, 10150, 11426, 10106, 13927, 112, 187, 12185, 100824, 10531, 14064, 10106, 12976, 82782, 12415, 10135, 67067, 10134, 10105, 62006, 17247, 108986, 10350, 10108, 10474, 12807, 10106, 10105, 12723, 10142, 169, 35858, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "170", "middle", "-", "aged", "and", "elderly", "people", "with", "the", "disease", "were", "being", "treated", "in", "hospital", ",", "doctors", "said", "." ], "ids": [ 13885, 15410, 20181, 118, 30262, 10111, 106226, 11426, 10169, 10105, 21911, 10309, 11223, 45369, 10106, 18141, 117, 82782, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Doctor", "Em", "##anu", "##il", "Cea", "##usu", ",", "head", "of", "Bucharest", "'", "s", "Victor", "Babe", "##s", "hospital", "for", "in", "##fect", "##ious", "diseases", ",", "said", "the", "epi", "##demi", "##c", "had", "been", "caused", "by", "a", "virus", "yet", "to", "be", "identified", "." ], "ids": [ 17376, 11289, 27225, 11030, 109435, 41025, 117, 13578, 10108, 100824, 112, 187, 14173, 94052, 10107, 18141, 10142, 10106, 84732, 25087, 54231, 117, 12415, 10105, 17247, 108986, 10350, 10374, 10590, 19513, 10155, 169, 20399, 21833, 10114, 10347, 26121, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 9, 9, 1, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ill", "##ness", "from", "viral", "mening", "##itis", "last", "##s", "around", "a", "week", "." ], "ids": [ 101288, 14010, 10188, 82356, 87927, 36967, 12469, 10107, 12166, 169, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "affect", "##s", "the", "gas", "##tro", "-", "inte", "##stina", "##l", "tra", "##ct", ",", "causing", "high", "fever", ",", "head", "##ache", "and", "vom", "##iting", "." ], "ids": [ 10377, 60600, 10107, 10105, 16091, 14239, 118, 14168, 83600, 10161, 11264, 14526, 117, 34705, 11846, 105142, 117, 13578, 41944, 10111, 11036, 48802, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "1986", "Romania", "suffered", "an", "epi", "##demi", "##c", "of", "the", "more", "dangerous", "bacteria", "##l", "mening", "##itis", "which", "has", "killed", "some", "15", ",", "000", "people", "in", "central", "Africa", "this", "year", "." ], "ids": [ 10167, 10578, 13927, 26090, 10151, 17247, 108986, 10350, 10108, 10105, 10798, 57195, 63318, 10161, 87927, 36967, 10319, 10393, 15875, 11152, 10208, 117, 10259, 11426, 10106, 12397, 12880, 10531, 10924, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Serbia", "'", "s", "Za", "##stava", "workers", "protest", "enters", "9th", "day", "." ], "ids": [ 20141, 112, 187, 14074, 33653, 23829, 36627, 58379, 35065, 11940, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BE", "##L", "##G", "##RA", "##DE", "1996", "-", "08", "-", "29" ], "ids": [ 46291, 11369, 11447, 29990, 60675, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Workers", "at", "Serbia", "'", "s", "Za", "##stava", "arms", "factory", "entered", "the", "ninth", "day", "of", "their", "protest", "over", "un", "##pai", "##d", "wa", "##ges", "on", "Thursday", "with", "management", "accused", "them", "of", "re", "##ject", "##ing", "talks", "." ], "ids": [ 52896, 10160, 20141, 112, 187, 14074, 33653, 28150, 34974, 19226, 10105, 54905, 11940, 10108, 10455, 36627, 10491, 10119, 48778, 10162, 11471, 13156, 10135, 67067, 10169, 17150, 37303, 11345, 10108, 11639, 56617, 10230, 56672, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "workers", "keep", "on", "gathering", "in", "the", "centre", "of", "the", "town", ",", "\"", "the", "factory", "'", "s", "general", "manager", "Vu", "##kasi", "##n", "Filip", "##ovi", "##c", "told", "Reuters", ".", "\"" ], "ids": [ 107, 10117, 23829, 23819, 10135, 88666, 10106, 10105, 12672, 10108, 10105, 12221, 117, 107, 10105, 34974, 112, 187, 11389, 16935, 100154, 37997, 10115, 31445, 16653, 10350, 21937, 46617, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 3, 9, 9 ] }, { "tokens": [ "But", "they", "do", "not", "want", "to", "talk", "to", "anyone", ".", "\"" ], "ids": [ 16976, 10689, 10149, 10472, 21528, 10114, 31311, 10114, 51747, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "want", "to", "discuss", "in", "public", ",", "at", "their", "protest", "meetings", ",", "\"", "Filip", "##ovi", "##c", "said", ".", "\"" ], "ids": [ 107, 11696, 21528, 10114, 71695, 10106, 11683, 117, 10160, 10455, 36627, 47307, 117, 107, 31445, 16653, 10350, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "And", "that", "is", "impossible", ".", "\"" ], "ids": [ 12689, 10189, 10124, 38199, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Za", "##stava", "works", "in", "the", "central", "town", "of", "Kr", "##agu", "##jeva", "##c", "is", "the", "back", "##bone", "of", "Serbia", "'", "s", "defence", "industry", ",", "supply", "##ing", "the", "army", "with", "a", "whole", "range", "of", "weapons", "." ], "ids": [ 10117, 14074, 33653, 14009, 10106, 10105, 12397, 12221, 10108, 17640, 47540, 36367, 10350, 10124, 10105, 12014, 66666, 10108, 20141, 112, 187, 47245, 17425, 117, 28914, 10230, 10105, 17977, 10169, 169, 21047, 15601, 10108, 31881, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Its", "workers", "are", "sta", "##ging", "protests", "in", "the", "town", "'", "s", "main", "square", "demand", "##ing", "June", "and", "July", "wa", "##ges", "and", "last", "year", "'", "s", "holiday", "pay", "." ], "ids": [ 14864, 23829, 10301, 16527, 13808, 60931, 10106, 10105, 12221, 112, 187, 12126, 15163, 34394, 10230, 11120, 10111, 11112, 11471, 13156, 10111, 12469, 10924, 112, 187, 71806, 16868, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Wednesday", ",", "the", "union", "demanded", "the", "resignation", "of", "the", "factory", "manager", "." ], "ids": [ 10576, 57611, 117, 10105, 20763, 78164, 10105, 66129, 10108, 10105, 34974, 16935, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "Filip", "##ovi", "##c", "said", "he", "would", "not", "quit", "under", "pressure", ".", "\"" ], "ids": [ 16976, 31445, 16653, 10350, 12415, 10261, 10894, 10472, 101237, 10571, 23460, 119, 107 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "can", "talk", "about", "it", "and", "I", "am", "prepared", "to", "take", "all", "the", "consequences", "of", "misma", "##nage", "##ment", "if", "any", ".", "\"" ], "ids": [ 12865, 10944, 31311, 10978, 10271, 10111, 146, 10392, 39837, 10114, 13574, 10435, 10105, 82459, 10108, 18833, 45211, 10426, 12277, 11178, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Venezuela", "Fin", "##M", "##in", "to", "make", "statement", "mid", "##day", "Thursday", "." ], "ids": [ 15693, 39982, 11517, 10245, 10114, 13086, 33311, 15607, 24558, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##RA", "##CA", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 24707, 29990, 46900, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Venezuela", "##n", "Finance", "Minister", "Luis", "Raul", "Mato", "##s", "Az", "##oca", "##r", "will", "make", "an", "\"", "important", "announcement", "\"", "on", "Thursday", "at", "1230", "local", "/", "1630", "GMT", "at", "a", "Central", "Bank", "press", "conference", ",", "the", "Finance", "Ministry", "said", "." ], "ids": [ 15693, 10115, 38533, 14355, 12816, 76615, 46866, 10107, 11122, 44207, 10129, 11337, 13086, 10151, 107, 12452, 76557, 107, 10135, 67067, 10160, 58449, 11436, 120, 33222, 20362, 10160, 169, 11885, 13533, 21040, 25029, 117, 10105, 38533, 19170, 12415, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "The", "press", "conference", "replace", "##s", "Mato", "##s", "'", "s", "scheduled", "appearance", "at", "an", "IM", "##F", "-", "hosted", "semi", "##nar", "Thursday", "on", "Venezuela", "'", "s", "economic", "reform", "program", ",", "Venezuela", "##n", "Age", "##nda", "." ], "ids": [ 10117, 21040, 25029, 37156, 10107, 46866, 10107, 112, 187, 34081, 19099, 10160, 10151, 97126, 11565, 118, 25415, 15900, 14582, 67067, 10135, 15693, 112, 187, 13925, 34800, 12483, 117, 15693, 10115, 17385, 11861, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "-", "-", "Caracas", "news", "##room", ",", "582", "834", "##40", "##5" ], "ids": [ 118, 118, 35958, 14424, 25525, 117, 50254, 84229, 38109, 11166 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colombia", "police", "find", "mari", "##juana", "on", "ship", "." ], "ids": [ 15223, 15034, 17860, 24538, 69454, 10135, 17309, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##O", "##GO", "##TA", ",", "Colombia", "1996", "-", "08", "-", "29" ], "ids": [ 139, 11403, 83821, 24951, 117, 15223, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "they", "found", "35", "metric", "tons", "of", "mari", "##juana", "on", "Thursday", "on", "a", "ship", "preparing", "to", "set", "sail", "for", "the", "Netherlands", "from", "Colombia", "'", "s", "Caribbean", "port", "of", "Cartagena", "." ], "ids": [ 18051, 12415, 10689, 11823, 10803, 105200, 33882, 10108, 24538, 69454, 10135, 67067, 10135, 169, 17309, 90798, 10114, 11847, 83595, 10142, 10105, 22043, 10188, 15223, 112, 187, 31778, 16874, 10108, 62636, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 1, 9, 9, 1, 9 ] }, { "tokens": [ "They", "said", "the", "drug", "had", "been", "pack", "##ed", "into", "a", "shipping", "contain", "##er", "and", "was", "surrounded", "by", "ground", "coffee", "." ], "ids": [ 11696, 12415, 10105, 20998, 10374, 10590, 78978, 10336, 10708, 169, 72888, 36003, 10165, 10111, 10134, 45785, 10155, 16912, 69954, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "arrest", "##s", "had", "been", "made", ",", "a", "police", "spoke", "##sman", "said", "." ], "ids": [ 10657, 45165, 10107, 10374, 10590, 11019, 117, 169, 15034, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Venezuela", "non", "-", "oil", "export", "##s", "rise", "10", ".", "6", "p", "##ct", "in", "July", "." ], "ids": [ 15693, 10446, 118, 21073, 59220, 10107, 28710, 10150, 119, 127, 184, 14526, 10106, 11112, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##RA", "##CA", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 24707, 29990, 46900, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Venezuela", "'", "s", "non", "-", "traditional", "export", "##s", ",", "which", "ex", "##clu", "##de", "oil", "and", "iron", ",", "rose", "10", ".", "6", "percent", "in", "July", "to", "reach", "$", "334", "million", "compared", "to", "$", "302", "million", "in", "June", ",", "according", "to", "the", "Central", "Office", "of", "Statistics", "and", "Information", "(", "O", "##CE", "##I", ")", "." ], "ids": [ 15693, 112, 187, 10446, 118, 17531, 59220, 10107, 117, 10319, 11419, 78225, 10253, 21073, 10111, 32374, 117, 29467, 10150, 119, 127, 22362, 10106, 11112, 10114, 24278, 109, 33956, 12473, 25626, 10114, 109, 28614, 12473, 10106, 11120, 117, 18071, 10114, 10105, 11885, 13348, 10108, 18499, 10111, 12145, 113, 152, 43161, 11281, 114, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "\"", "The", "rise", "was", "due", "to", "the", "end", "of", "exchange", "controls", ",", "\"", "O", "##CE", "##I", "said", "." ], "ids": [ 107, 10117, 28710, 10134, 10850, 10114, 10105, 11572, 10108, 27714, 59897, 117, 107, 152, 43161, 11281, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Foreign", "exchange", "controls", "were", "removed", "April", "22", "as", "part", "of", "a", "wider", "IM", "##F", "-", "sponsored", "program", "." ], "ids": [ 20277, 27714, 59897, 10309, 23898, 10780, 10306, 10146, 10668, 10108, 169, 50514, 97126, 11565, 118, 44747, 12483, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "Nevertheless", ",", "export", "##s", "over", "the", "first", "seven", "months", "of", "the", "year", "were", "16", ".", "8", "percent", "lower", "than", "during", "the", "same", "period", "last", "year", ",", "at", "$", "2", ".", "240", "billion", "compared", "to", "$", "2", ".", "693", "billion", "." ], "ids": [ 71823, 117, 59220, 10107, 10491, 10105, 10422, 15767, 15555, 10108, 10105, 10924, 10309, 10250, 119, 129, 22362, 18165, 11084, 10939, 10105, 11561, 13127, 12469, 10924, 117, 10160, 109, 123, 119, 16017, 25848, 25626, 10114, 109, 123, 119, 71073, 25848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Over", "the", "seven", "months", ",", "the", "private", "sector", "account", "##ed", "for", "76", "percent", "of", "total", "export", "##s", ",", "with", "\"", "common", "metal", "##s", "\"", "the", "strong", "##est", "export", "sector", "accounting", "for", "$", "951", "million", ",", "or", "42", ".", "5", "percent", "of", "total", "export", "##s", "." ], "ids": [ 15704, 10105, 15767, 15555, 117, 10105, 14591, 17417, 23200, 10336, 10142, 12428, 22362, 10108, 11339, 59220, 10107, 117, 10169, 107, 14624, 13795, 10107, 107, 10105, 18093, 13051, 59220, 17417, 106010, 10142, 109, 34173, 12473, 117, 10345, 11276, 119, 126, 22362, 10108, 11339, 59220, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Chemical", "products", "\"", "came", "next", "with", "a", "13", "percent", "share", ",", "then", "\"", "transport", "materials", "\"", "with", "nine", "percent", ",", "and", "finally", "foods", ",", "drink", "##s", "and", "tobacco", "with", "6", ".", "3", "percent", "." ], "ids": [ 107, 25660, 20895, 107, 13383, 13451, 10169, 169, 10249, 22362, 23867, 117, 11059, 107, 16024, 23193, 107, 10169, 19964, 22362, 117, 10111, 21256, 109310, 117, 69423, 10107, 10111, 92887, 10169, 127, 119, 124, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Colombia", "was", "the", "chief", "market", "for", "Venezuela", "'", "s", "non", "-", "traditional", "export", "##s", "with", "27", ".", "4", "percent", "." ], "ids": [ 15223, 10134, 10105, 19421, 17313, 10142, 15693, 112, 187, 10446, 118, 17531, 59220, 10107, 10169, 10365, 119, 125, 22362, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "U", ".", "S", ".", "followed", "with", "a", "24", ".", "6", "percent", "share", "." ], "ids": [ 10117, 158, 119, 156, 119, 15689, 10169, 169, 10233, 119, 127, 22362, 23867, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Caracas", "news", "##room", ",", "582", "834", "##40", "##5", "RE", "##UT", "##ER", "JP", "##R" ], "ids": [ 118, 118, 35958, 14424, 25525, 117, 50254, 84229, 38109, 11166, 71033, 65729, 24093, 45657, 11273 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Buenos", "Aires", "fraud", "cop", "##s", "held", "in", "ex", "##tor", "##tion", "ra", "##cket", "." ], "ids": [ 13929, 13960, 93070, 35691, 10107, 11991, 10106, 11419, 11813, 10822, 11859, 28721, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##UE", "##NO", "##S", "AI", "##RE", "##S", ",", "Argentina", "1996", "-", "08", "-", "29" ], "ids": [ 139, 62674, 67292, 10731, 62405, 66014, 10731, 117, 12853, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Th", "##irt", "##een", "senior", "police", "officers", "from", "the", "fraud", "squad", "of", "Buenos", "Aires", "province", "have", "been", "arrested", "on", "charges", "of", "running", "an", "ex", "##tor", "##tion", "ra", "##cket", ",", "security", "officials", "said", "on", "Thursday", "." ], "ids": [ 51635, 82856, 13129, 17843, 15034, 23579, 10188, 10105, 93070, 30580, 10108, 13929, 13960, 14342, 10529, 10590, 29479, 10135, 31128, 10108, 18020, 10151, 11419, 11813, 10822, 11859, 28721, 117, 21849, 27730, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "included", "all", "the", "top", "officers", "from", "the", "fraud", "division", "of", "the", "north", "of", "Buenos", "Aires", "province", ",", "including", "Commissioner", "Juan", "Carlos", "Lago", "." ], "ids": [ 11696, 12742, 10435, 10105, 12364, 23579, 10188, 10105, 93070, 13751, 10108, 10105, 12756, 10108, 13929, 13960, 14342, 117, 11198, 24366, 11686, 12050, 31581, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "Police", "were", "seeking", "a", "14th", "officer", "." ], "ids": [ 18051, 10309, 51285, 169, 38399, 19288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "La", "Na", "##cion", "newspaper", "said", "the", "officers", "were", "suspected", "of", "demand", "##ing", "br", "##ibes", "of", "$", "50", ",", "000", "to", "$", "500", ",", "000", "from", "companies", "being", "investigated", "for", "tax", "eva", "##sion", "in", "order", "to", "\"", "lose", "\"", "their", "files", "." ], "ids": [ 10159, 10685, 15204, 22047, 12415, 10105, 23579, 10309, 80337, 10108, 34394, 10230, 33989, 74844, 10108, 109, 10462, 117, 10259, 10114, 109, 10757, 117, 10259, 10188, 18866, 11223, 100767, 10142, 25468, 103730, 17467, 10106, 12990, 10114, 107, 48742, 107, 10455, 33646, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "c", "##redi", "##bility", "of", "the", "Buenos", "Aires", "provincial", "police", ",", "the", "largest", "force", "in", "Argentina", ",", "has", "been", "under", "##mine", "##d", "this", "year", "by", "scandal", "##s", "that", "included", "the", "ind", "##ict", "##ment", "of", "three", "officers", "for", "links", "to", "the", "1994", "bombing", "of", "a", "Jewish", "community", "centre", "and", "the", "arrest", "of", "an", "entire", "drugs", "squad", "for", "drug", "traffic", "##king", "." ], "ids": [ 10117, 171, 110685, 20838, 10108, 10105, 13929, 13960, 24900, 15034, 117, 10105, 15363, 15031, 10106, 12853, 117, 10393, 10590, 10571, 18333, 10162, 10531, 10924, 10155, 83458, 10107, 10189, 12742, 10105, 30386, 106788, 10426, 10108, 11003, 23579, 10142, 23608, 10114, 10105, 10444, 67011, 10108, 169, 17119, 13354, 12672, 10111, 10105, 45165, 10108, 10151, 19192, 40421, 30580, 10142, 20998, 26482, 15629, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Alberto", "Pio", "##tti", ",", "security", "chief", "of", "Buenos", "Aires", "province", ",", "told", "local", "television", "that", "3", ",", "600", "dis", "##hone", "##st", "officers", "had", "been", "pur", "##ged", "from", "the", "force", "'", "s", "ranks", "in", "the", "past", "five", "years", "." ], "ids": [ 15796, 42712, 12683, 117, 21849, 19421, 10108, 13929, 13960, 14342, 117, 21937, 11436, 14162, 10189, 124, 117, 11796, 27920, 50198, 10562, 23579, 10374, 10590, 32385, 18832, 10188, 10105, 15031, 112, 187, 52593, 10106, 10105, 17781, 12403, 10855, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "is", "an", "ongoing", "task", "." ], "ids": [ 107, 10377, 10124, 10151, 57626, 37758, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "these", "investigations", "into", "police", "corruption", "are", "only", "possible", "because", "there", "are", "people", "bra", "##ve", "enough", "to", "den", "##oun", "##ce", "them", ",", "\"", "Pio", "##tti", "said", ",", "pro", "##mising", "a", "major", "over", "##hau", "##l", "of", "the", "provincial", "police", "next", "month", "." ], "ids": [ 12689, 11762, 87748, 10708, 15034, 50410, 10301, 10893, 14128, 12373, 11155, 10301, 11426, 67603, 10612, 21408, 10114, 10140, 43971, 10419, 11345, 117, 107, 42712, 12683, 12415, 117, 11284, 81654, 169, 11922, 10491, 52332, 10161, 10108, 10105, 24900, 15034, 13451, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazil", "gov", "'", "t", "set", "to", "send", "1997", "budget", "to", "Congress", "." ], "ids": [ 16765, 13585, 112, 188, 11847, 10114, 45567, 10391, 25293, 10114, 15984, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9 ] }, { "tokens": [ "BR", "##AS", "##IL", "##IA", "1996", "-", "08", "-", "29" ], "ids": [ 49351, 38025, 38850, 35976, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazilian", "Planning", "Minister", "Antonio", "Kan", "##dir", "will", "sub", "##mit", "to", "a", "draft", "copy", "of", "the", "1997", "federal", "budget", "to", "Congress", "on", "Thursday", ",", "a", "ministry", "spoke", "##s", "##woman", "said", "." ], "ids": [ 32818, 49276, 14355, 11873, 57528, 11957, 11337, 13987, 15772, 10114, 169, 28447, 39740, 10108, 10105, 10391, 16293, 25293, 10114, 15984, 10135, 67067, 117, 169, 65338, 50005, 10107, 79999, 12415, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Congress", "is", "constitutional", "##ly", "ob", "##lige", "##d", "to", "app", "##rove", "the", "budget", "by", "the", "end", "of", "year", "but", "regularly", "fail", "##s", "to", "meet", "that", "requirement", "." ], "ids": [ 15984, 10124, 61537, 10454, 17339, 14425, 10162, 10114, 72894, 75662, 10105, 25293, 10155, 10105, 11572, 10108, 10924, 10473, 36942, 84891, 10107, 10114, 23267, 10189, 75425, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mexico", "same", "-", "day", "Cet", "##es", "rates", "rise", "on", "ner", "##vous", "##ness", "." ], "ids": [ 10490, 11561, 118, 11940, 21851, 10171, 38200, 28710, 10135, 59097, 61211, 14010, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ME", "##X", "##IC", "##O", "C", "##IT", "##Y", "1996", "-", "08", "-", "29" ], "ids": [ 47430, 12674, 30889, 11403, 140, 37611, 14703, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mexico", "'", "s", "same", "-", "day", "Cet", "##es", "rates", "rose", "50", "basis", "points", "to", "24", ".", "25", "percent", "on", "ner", "##vous", "##ness", "over", "a", "new", "round", "of", "attacks", "by", "guerrilla", "##s", "in", "two", "southern", "states", ",", "deal", "##ers", "said", "." ], "ids": [ 10490, 112, 187, 11561, 118, 11940, 21851, 10171, 38200, 29467, 10462, 17172, 12789, 10114, 10233, 119, 10258, 22362, 10135, 59097, 61211, 14010, 10491, 169, 10751, 13569, 10108, 26483, 10155, 106552, 10107, 10106, 10551, 17156, 16316, 117, 19918, 10901, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "are", "people", "who", "are", "taking", "advantage", "of", "the", "news", "to", "put", "pressure", "on", "rates", ",", "however", ",", "there", "are", "enough", "players", "who", "will", "buy", "and", "that", "will", "keep", "rates", "from", "rising", "too", "much", ",", "\"", "said", "one", "deal", "##er", "." ], "ids": [ 107, 11723, 10301, 11426, 10479, 10301, 18084, 38119, 10108, 10105, 14424, 10114, 14499, 23460, 10135, 38200, 117, 13800, 117, 11155, 10301, 21408, 16021, 10479, 11337, 47715, 10111, 10189, 11337, 23819, 38200, 10188, 53816, 16683, 13172, 117, 107, 12415, 10464, 19918, 10165, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Co", "-", "ord", "##inate", "##d", "guerrilla", "attacks", "in", "two", "southern", "states", "over", "##night", "that", "left", "at", "least", "13", "people", "dead", "have", "caused", "ner", "##vous", "##ness", "in", "Mexico", "'", "s", "financial", "markets", "." ], "ids": [ 13098, 118, 39381, 78321, 10162, 106552, 26483, 10106, 10551, 17156, 16316, 10491, 45217, 10189, 12153, 10160, 16298, 10249, 11426, 23457, 10529, 19513, 59097, 61211, 14010, 10106, 10490, 112, 187, 20570, 42893, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bank", "notes", "and", "acceptance", "##s", ",", "including", "pagar", "##es", ",", "rose", "46", "basis", "points", "to", "25", ".", "10", "percent", "." ], "ids": [ 13533, 19899, 10111, 103024, 10107, 117, 11198, 44259, 10171, 117, 29467, 11528, 17172, 12789, 10114, 10258, 119, 10150, 22362, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "said", "that", "the", "volume", "of", "longer", "-", "term", "government", "paper", "declined", "due", "to", "market", "ner", "##vous", "##ness", "." ], "ids": [ 54521, 10901, 12415, 10189, 10105, 15901, 10108, 20165, 118, 13719, 12047, 17895, 44948, 10850, 10114, 17313, 59097, 61211, 14010, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "least", "13", "people", "were", "killed", "when", "scores", "of", "mask", "##ed", "rebels", "struck", "at", "police", "and", "military", "posts", "in", "Oaxaca", "and", "Guerrero", "states", "over", "##night", "in", "the", "biggest", "assault", "##s", "in", "more", "than", "two", "years", ",", "officials", "said", "on", "Thursday", "." ], "ids": [ 11699, 16298, 10249, 11426, 10309, 15875, 10841, 49931, 10108, 107425, 10336, 57545, 45622, 10160, 15034, 10111, 14041, 68699, 10106, 43620, 10111, 32639, 16316, 10491, 45217, 10106, 10105, 36304, 50150, 10107, 10106, 10798, 11084, 10551, 10855, 117, 27730, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mat", "##uring", "credits", "are", "seen", "at", "2", ".", "209", "billion", "pesos", ",", "and", "there", "is", "an", "over", "##su", "##pp", "##ly", "of", "684", "billion", "pesos", "from", "the", "primary", "auction", "." ], "ids": [ 57471, 31653, 48357, 10301, 15652, 10160, 123, 119, 23404, 25848, 68019, 117, 10111, 11155, 10124, 10151, 10491, 12892, 16587, 10454, 10108, 53608, 25848, 68019, 10188, 10105, 17627, 106733, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "estimate", "that", "the", "short", "##fall", "will", "increase", "due", "to", "the", "in", "##flow", "of", "funds", "before", "the", "end", "of", "the", "month", "." ], "ids": [ 54521, 10901, 78059, 10189, 10105, 13716, 16220, 11337, 20299, 10850, 10114, 10105, 10106, 105739, 10108, 32067, 11360, 10105, 11572, 10108, 10105, 14064, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "Patricia", "Le", "##zama", ",", "Mexico", "City", "new", "##room", "(", "525", ")", "728", "955", "##4" ], "ids": [ 118, 118, 118, 26751, 10281, 79786, 117, 10490, 10773, 10751, 25525, 113, 35316, 114, 73423, 60640, 11011 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ten", "##sion", "build", "##s", "in", "Mexican", "state", "ahead", "of", "elections", "." ], "ids": [ 16411, 17467, 23332, 10107, 10106, 15323, 11388, 35629, 10108, 22054, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "[", "CO", "##R", "##RE", "##CT", "##ED", "05", ":", "53", "GMT", "]" ], "ids": [ 164, 32992, 11273, 66014, 91995, 33809, 10831, 131, 11756, 20362, 166 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "CH", "##IL", "##PA", "##NC", "##ING", "##O", ",", "Mexico", "1996", "-", "08", "-", "28" ], "ids": [ 39774, 38850, 52099, 100230, 50183, 11403, 117, 10490, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pre", "-", "electoral", "bi", "##cker", "##ing", "fl", "##ared", "on", "Wednesday", "in", "the", "trouble", "##d", "western", "Mexican", "state", "of", "Guerrero", "as", "some", "opposition", "politicians", "demanded", "the", "army", "pull", "out", "of", "the", "area", "ahead", "of", "an", "upcoming", "state", "poll", "." ], "ids": [ 35248, 118, 29125, 11342, 19153, 10230, 58768, 104931, 10135, 57611, 10106, 10105, 58285, 10162, 16672, 15323, 11388, 10108, 32639, 10146, 11152, 21227, 75284, 78164, 10105, 17977, 80870, 10950, 10108, 10105, 11168, 35629, 10108, 10151, 78228, 11388, 70156, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "mayor", "of", "A", "##cate", "##pec", ",", "a", "small", "town", "some", "310", "miles", "(", "500", "km", ")", "south", "of", "Mexico", "City", ",", "sent", "a", "letter", "to", "Mexico", "'", "s", "National", "Human", "Rights", "Commission", "com", "##plain", "##ing", "the", "army", "'", "s", "heavy", "presence", "in", "the", "town", "would", "inter", "##fere", "with", "the", "Oct", ".", "6", "election", "." ], "ids": [ 10117, 12747, 10108, 138, 26054, 53625, 117, 169, 12474, 12221, 11152, 23993, 14148, 113, 10757, 10204, 114, 13144, 10108, 10490, 10773, 117, 14541, 169, 19310, 10114, 10490, 112, 187, 10655, 15426, 22305, 14941, 10212, 88975, 10230, 10105, 17977, 112, 187, 18296, 25599, 10106, 10105, 12221, 10894, 22021, 50544, 10169, 10105, 45442, 119, 127, 13685, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mayor", "Antonio", "Gonzalez", "Garcia", ",", "of", "the", "opposition", "Revolutionary", "Workers", "'", "Party", ",", "said", "in", "Wednesday", "'", "s", "letter", "that", "army", "troops", "recently", "raid", "##ed", "several", "local", "farms", ",", "sto", "##le", "cattle", "and", "rape", "##d", "women", "." ], "ids": [ 19719, 11873, 72460, 26585, 117, 10108, 10105, 21227, 52514, 52896, 112, 12529, 117, 12415, 10106, 57611, 112, 187, 19310, 10189, 17977, 20836, 23746, 52152, 10336, 11736, 11436, 83951, 117, 47264, 10284, 56980, 10111, 82523, 10162, 13190, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "letter", "was", "signed", "by", "some", "200", "area", "residents", "and", "indigenous", "leaders", "." ], "ids": [ 10117, 19310, 10134, 14775, 10155, 11152, 10777, 11168, 22058, 10111, 49226, 24155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "electoral", "watch", "##dog", "groups", "also", "said", "the", "presence", "of", "the", "army", ",", "which", "has", "fann", "##ed", "out", "across", "the", "state", "in", "the", "past", "month", "in", "search", "of", "a", "new", "guerrilla", "group", ",", "was", "likely", "to", "int", "##imi", "##date", "voters", "and", "had", "st", "##ir", "##red", "up", "tension", "in", "the", "state", "." ], "ids": [ 13885, 29125, 34481, 62039, 15647, 10379, 12415, 10105, 25599, 10108, 10105, 17977, 117, 10319, 10393, 94987, 10336, 10950, 15130, 10105, 11388, 10106, 10105, 17781, 14064, 10106, 22419, 10108, 169, 10751, 106552, 11795, 117, 10134, 22497, 10114, 26391, 20934, 81921, 55450, 10111, 10374, 28780, 10835, 15711, 10741, 55027, 10106, 10105, 11388, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "French", "group", "of", "electoral", "observer", "##s", ",", "A", "##gir", "Ensemble", "pour", "les", "Dr", "##oit", "##s", "de", "l", "'", "Homme", ",", "concluded", "the", "army", "presence", "ex", "##erted", "a", "heavy", "psychological", "pressure", "on", "local", "farmers", "and", "would", "prevent", "a", "fair", "vote", "." ], "ids": [ 138, 11894, 11795, 10108, 29125, 79368, 10107, 117, 138, 28908, 29830, 10322, 10152, 11612, 84055, 10107, 10104, 180, 112, 39237, 117, 37074, 10105, 17977, 25599, 11419, 46949, 169, 18296, 74927, 23460, 10135, 11436, 55543, 10111, 10894, 29320, 169, 45122, 18926, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Up", "for", "gra", "##bs", "in", "the", "election", "are", "the", "state", "legislature", "and", "75", "town", "hall", "##s", "." ], "ids": [ 13656, 10142, 63706, 19528, 10106, 10105, 13685, 10301, 10105, 11388, 62879, 10111, 11417, 12221, 21007, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Cor", "##rec", "##ts", "to", "show", "elections", "are", "not", "for", "governor", ")", "." ], "ids": [ 113, 93495, 74755, 10806, 10114, 11897, 22054, 10301, 10472, 10142, 28795, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Despite", "the", "criticism", ",", "acting", "state", "Go", "##v", "." ], "ids": [ 21230, 10105, 43291, 117, 25086, 11388, 14439, 10477, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Angel", "Aguirre", "pl", "##ed", "##ged", "the", "elections", "will", "be", "free", "and", "fair", "and", "said", "he", "did", "not", "ex", "##pect", "any", "trouble", "from", "the", "elu", "##sive", "new", "guerrilla", "group", ",", "the", "Popular", "Revolutionary", "Army", "." ], "ids": [ 17567, 70109, 20648, 10336, 18832, 10105, 22054, 11337, 10347, 13961, 10111, 45122, 10111, 12415, 10261, 12172, 10472, 11419, 51511, 11178, 58285, 10188, 10105, 95575, 37413, 10751, 106552, 11795, 117, 10105, 18710, 52514, 12762, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "\"", "The", "electoral", "process", "has", "been", "pro", "##ceed", "##ing", "in", "accordance", "with", "the", "new", "state", "electoral", "law", ",", "\"", "Aguirre", "said", ",", "adding", "that", "the", "poll", "would", "be", "\"", "an", "exercise", "in", "true", "democracy", ".", "\"" ], "ids": [ 107, 10117, 29125, 15138, 10393, 10590, 11284, 66390, 10230, 10106, 88651, 10169, 10105, 10751, 11388, 29125, 13255, 117, 107, 70109, 12415, 117, 44841, 10189, 10105, 70156, 10894, 10347, 107, 10151, 56120, 10106, 22024, 67519, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazil", "police", "arrest", "wanted", "Italian", "man", "-", "report", "." ], "ids": [ 16765, 15034, 45165, 22591, 11667, 10817, 118, 17553, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "SAO", "PA", "##UL", "##O", ",", "Brazil", "1996", "-", "08", "-", "28" ], "ids": [ 90616, 32349, 100673, 11403, 117, 16765, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brazilian", "authorities", "on", "Wednesday", "arrested", "a", "47", "-", "year", "-", "old", "Italian", "man", "wanted", "in", "Italy", "for", "ties", "to", "the", "left", "##ist", "Red", "Brigade", "guerrilla", "group", "of", "the", "1970s", ",", "local", "television", "said", "." ], "ids": [ 32818, 28308, 10135, 57611, 29479, 169, 11413, 118, 10924, 118, 12898, 11667, 10817, 22591, 10106, 11619, 10142, 45169, 10114, 10105, 12153, 11293, 11641, 21909, 106552, 11795, 10108, 10105, 21844, 117, 11436, 14162, 12415, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TV", "Globo", "said", "the", "Supreme", "Federal", "Tribunal", "ordered", "the", "arrest", "of", "Luciano", "Pe", "##ssin", "##a", ",", "a", "political", "scientist", "who", "owns", "two", "Rio", "de", "Janeiro", "restaurants", ",", "based", "on", "an", "extra", "##dition", "request", "from", "the", "Italian", "government", "." ], "ids": [ 10813, 40601, 12415, 10105, 22872, 14492, 28774, 23782, 10105, 45165, 10108, 35491, 29005, 43756, 10113, 117, 169, 13736, 59248, 10479, 76282, 10551, 12109, 10104, 14822, 42460, 117, 11610, 10135, 10151, 19868, 34540, 37449, 10188, 10105, 11667, 12047, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 3, 7, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "report", ",", "which", "could", "not", "be", "independently", "veri", "##fied", "on", "Wednesday", "night", ",", "said", "Pe", "##ssin", "##a", "was", "sentenced", "in", "Italy", "to", "eight", "years", "and", "11", "months", "in", "prison", "for", "ro", "##bber", "##y", "and", "illegal", "weapons", "and", "ex", "##plosive", "##s", "possession", "." ], "ids": [ 10117, 17553, 117, 10319, 12174, 10472, 10347, 74480, 55011, 19907, 10135, 57611, 16903, 117, 12415, 29005, 43756, 10113, 10134, 53365, 10106, 11619, 10114, 16222, 10855, 10111, 10193, 15555, 10106, 20538, 10142, 25470, 60805, 10157, 10111, 39806, 31881, 10111, 11419, 83655, 10107, 36294, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Globo", "quoted", "Pe", "##ssin", "##a", "'", "s", "lawyer", "as", "saying", "he", "had", "already", "been", "imprisoned", "in", "Italy", "and", ",", "when", "free", "##d", ",", "travelled", "to", "Brazil", "." ], "ids": [ 40601, 70676, 29005, 43756, 10113, 112, 187, 38055, 10146, 22807, 10261, 10374, 19034, 10590, 73412, 10106, 11619, 10111, 117, 10841, 13961, 10162, 117, 61330, 10114, 16765, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Seven", "churches", "sl", "##am", "Brazil", "rural", "violence", ",", "im", "##pun", "##ity", "." ], "ids": [ 21077, 38172, 38523, 11008, 16765, 18380, 26342, 117, 10211, 19554, 11949, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BR", "##AS", "##IL", "##IA", "1996", "-", "08", "-", "28" ], "ids": [ 49351, 38025, 38850, 35976, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Seven", "churches", "joined", "voices", "on", "Wednesday", "to", "conde", "##mn", "the", "\"", "day", "-", "to", "-", "day", "violence", "\"", "of", "Brazil", "'", "s", "rural", "hinter", "##land", "and", "the", "government", "'", "s", "failure", "to", "pun", "##ish", "those", "responsible", "for", "massacre", "##s", "of", "land", "##less", "pe", "##asan", "##ts", "." ], "ids": [ 21077, 38172, 13914, 77314, 10135, 57611, 10114, 28866, 47929, 10105, 107, 11940, 118, 10114, 118, 11940, 26342, 107, 10108, 16765, 112, 187, 18380, 26022, 11080, 10111, 10105, 12047, 112, 187, 31562, 10114, 32310, 15529, 12676, 21586, 10142, 53810, 10107, 10108, 11773, 14985, 11161, 32322, 10806, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "In", "the", "name", "of", "Jesus", ",", "we", "want", "to", "bring", "your", "attention", "to", "what", "is", "going", "on", "in", "the", "Brazilian", "country", "##side", ",", "\"", "two", "church", "um", "##brella", "groups", "said", "in", "a", "Letter", "to", "the", "Brazilian", "People", "." ], "ids": [ 107, 10167, 10105, 11324, 10108, 15831, 117, 11951, 21528, 10114, 26092, 20442, 21341, 10114, 12976, 10124, 19090, 10135, 10106, 10105, 32818, 12723, 18103, 117, 107, 10551, 14201, 10293, 88807, 15647, 12415, 10106, 169, 40534, 10114, 10105, 32818, 14235, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "letter", "from", "National", "Council", "of", "Christian", "Churches", "of", "Brazil", "and", "the", "Co", "##ord", "##inate", "of", "E", "##cum", "##enic", "##al", "Service", "was", "sent", "to", "President", "Fernando", "Henrique", "Cardoso", "after", "a", "semi", "##nar", "on", "endemic", "violence", "gr", "##ip", "##ping", "rural", "Brazil", "." ], "ids": [ 10117, 19310, 10188, 10655, 12821, 10108, 11757, 81458, 10108, 16765, 10111, 10105, 13098, 17392, 78321, 10108, 142, 23722, 69181, 10415, 13489, 10134, 14541, 10114, 12811, 14022, 40804, 89450, 10662, 169, 15900, 14582, 10135, 50143, 26342, 30518, 17437, 15398, 18380, 16765, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Thirty", "-", "six", "people", "have", "died", "so", "far", "this", "year", "in", "conflicts", "over", "land", "in", "the", "Brazilian", "country", "##side", ",", "including", "19", "land", "##less", "pe", "##asan", "##ts", "massacre", "##d", "by", "police", "in", "April", "in", "the", "northern", "state", "of", "Para", "." ], "ids": [ 79446, 118, 12449, 11426, 10529, 12482, 10380, 13301, 10531, 10924, 10106, 83594, 10491, 11773, 10106, 10105, 32818, 12723, 18103, 117, 11198, 10270, 11773, 14985, 11161, 32322, 10806, 53810, 10162, 10155, 15034, 10106, 10780, 10106, 10105, 17335, 11388, 10108, 13497, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "The", "problem", "of", "land", "is", "one", "of", "the", "most", "serious", "facing", "Brazil", ",", "\"", "said", "Lucas", "Moreira", "Neve", "##s", ",", "president", "of", "the", "Catholic", "church", "'", "s", "National", "Conference", "of", "Bishop", "##s", "of", "Brazil", "." ], "ids": [ 107, 10117, 18077, 10108, 11773, 10124, 10464, 10108, 10105, 10992, 32342, 48237, 16765, 117, 107, 12415, 17943, 80136, 107505, 10107, 117, 12931, 10108, 10105, 15473, 14201, 112, 187, 10655, 16424, 10108, 17576, 10107, 10108, 16765, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "The", "letter", "made", "reference", "to", "massacre", "##s", "of", "land", "##less", "pe", "##asan", "##ts", "in", "August", "1995", "and", "April", "1996", ",", "which", "claimed", "the", "lives", "of", "27", "land", "##less", "pe", "##asan", "##ts", "." ], "ids": [ 10117, 19310, 11019, 21457, 10114, 53810, 10107, 10108, 11773, 14985, 11161, 32322, 10806, 10106, 10735, 10436, 10111, 10780, 10389, 117, 10319, 20737, 10105, 21418, 10108, 10365, 11773, 14985, 11161, 32322, 10806, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thai", "official", "fl", "##ees", "Hong", "Kong", "after", "pass", "##port", "s", "##cam", "." ], "ids": [ 26207, 14731, 58768, 22229, 15078, 14577, 10662, 23392, 15520, 187, 67354, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "29" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "Thai", "consul", "##ar", "official", "has", "fled", "Hong", "Kong", "after", "being", "questioned", "by", "anti", "-", "corruption", "police", "in", "connection", "with", "soli", "##citing", "br", "##ibes", "to", "issue", "a", "pass", "##port", ",", "Hong", "Kong", "government", "radio", "said", "on", "Thursday", "." ], "ids": [ 138, 26207, 53704, 10354, 14731, 10393, 56598, 15078, 14577, 10662, 11223, 101173, 10155, 14249, 118, 50410, 15034, 10106, 31671, 10169, 36766, 104360, 33989, 74844, 10114, 15557, 169, 23392, 15520, 117, 15078, 14577, 12047, 12429, 12415, 10135, 67067, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "un", "##named", "suspect", "left", "the", "British", "colony", "after", "being", "det", "##ained", "and", "then", "free", "##d", "by", "the", "Independent", "Commission", "Against", "Cor", "##ruption", "(", "IC", "##AC", ")", ",", "the", "radio", "said", "." ], "ids": [ 10117, 10119, 95196, 97881, 12153, 10105, 11160, 48968, 10662, 11223, 10349, 65804, 10111, 11059, 13961, 10162, 10155, 10105, 20199, 14941, 29809, 93495, 56615, 113, 11649, 30340, 114, 117, 10105, 12429, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "man", "was", "released", "after", "his", "arrest", "on", "Tuesday", ",", "pen", "##ding", "further", "in", "##qui", "##ries", ",", "the", "IC", "##AC", "said", "in", "a", "statement", "." ], "ids": [ 10117, 10817, 10134, 11539, 10662, 10226, 45165, 10135, 70245, 117, 66558, 13971, 14586, 10106, 39639, 15388, 117, 10105, 11649, 30340, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "anti", "-", "graf", "##t", "body", "was", "discuss", "##ing", "the", "case", "with", "the", "Thai", "government", ",", "especially", "the", "suspect", "'", "s", "status", ",", "it", "said", "." ], "ids": [ 10117, 14249, 118, 26194, 10123, 14333, 10134, 71695, 10230, 10105, 13474, 10169, 10105, 26207, 12047, 117, 17491, 10105, 97881, 112, 187, 14042, 117, 10271, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "not", "clear", "if", "the", "fu", "##git", "##ive", "had", "diplomatic", "status", "in", "Hong", "Kong", ",", "and", "officials", "from", "the", "Thai", "Con", "##sula", "##te", "were", "not", "available", "for", "comment", "." ], "ids": [ 10377, 10124, 10472, 24866, 12277, 10105, 11005, 26264, 11942, 10374, 64838, 14042, 10106, 15078, 14577, 117, 10111, 27730, 10188, 10105, 26207, 12845, 57170, 10216, 10309, 10472, 14579, 10142, 49641, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "arrest", "came", "after", "the", "IC", "##AC", "received", "a", "com", "##plain", "##t", "that", "the", "man", "had", "demanded", "a", "br", "##ibe", "of", "HK", "$", "100", ",", "000", "(", "US", "$", "12", ",", "940", ")", "to", "issue", "a", "Thai", "pass", "##port", ",", "the", "IC", "##AC", "said", "." ], "ids": [ 10117, 45165, 13383, 10662, 10105, 11649, 30340, 12296, 169, 10212, 88975, 10123, 10189, 10105, 10817, 10374, 78164, 169, 33989, 43954, 10108, 33150, 109, 10407, 117, 10259, 113, 10808, 109, 10186, 117, 53762, 114, 10114, 15557, 169, 26207, 23392, 15520, 117, 10105, 11649, 30340, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "At", "the", "time", "of", "his", "arrest", ",", "IC", "##AC", "officers", "seized", "HK", "$", "100", ",", "000", ",", "it", "added", "." ], "ids": [ 11699, 10105, 10635, 10108, 10226, 45165, 117, 11649, 30340, 23579, 80176, 33150, 109, 10407, 117, 10259, 117, 10271, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "IC", "##AC", "has", "kept", "a", "close", "eye", "on", "pass", "##port", "s", "##cam", "##s", "after", "a", "U", ".", "S", ".", "official", "was", "jail", "##ed", "for", "traffic", "##king", "fa", "##ke", "Hon", "##dura", "##n", "pass", "##ports", "as", "part", "of", "an", "immigration", "ra", "##cket", "aimed", "at", "Chinese", "." ], "ids": [ 10117, 11649, 30340, 10393, 26546, 169, 16065, 32684, 10135, 23392, 15520, 187, 67354, 10107, 10662, 169, 158, 119, 156, 119, 14731, 10134, 75934, 10336, 10142, 26482, 15629, 12211, 10550, 19431, 26507, 10115, 23392, 60036, 10146, 10668, 10108, 10151, 55031, 11859, 28721, 53004, 10160, 13299, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "Thai", "poll", "shows", "military", "wants", "PM", "Ban", "##har", "##n", "out", "." ], "ids": [ 26207, 70156, 15573, 14041, 45769, 46161, 21631, 18387, 10115, 10950, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "BA", "##NG", "##KO", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 39999, 34065, 57277, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Thailand", "'", "s", "powerful", "military", "think", "##s", "the", "government", "is", "dis", "##hone", "##st", "and", "Prime", "Minister", "Ban", "##har", "##n", "Si", "##lpa", "-", "arch", "##a", "'", "s", "resignation", "might", "solve", "the", "nation", "'", "s", "political", "and", "economic", "wo", "##es", ",", "an", "opinion", "poll", "showed", "on", "Thursday", "." ], "ids": [ 19621, 112, 187, 29481, 14041, 27874, 10107, 10105, 12047, 10124, 27920, 50198, 10562, 10111, 19924, 14355, 21631, 18387, 10115, 11741, 70285, 118, 69154, 10113, 112, 187, 66129, 20970, 100679, 10105, 22274, 112, 187, 13736, 10111, 13925, 12796, 10171, 117, 10151, 32282, 70156, 27463, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Near", "##ly", "half", "the", "1", ",", "617", "military", "personnel", "survey", "##ed", "in", "the", "Raja", "##pat", "Institute", "poll", "suggested", "that", "Ban", "##har", "##n", "res", "##ign", ",", "while", "about", "28", "percent", "thought", "he", "should", "disso", "##lve", "parliament", "and", "24", "percent", "thought", "a", "cabinet", "res", "##hu", "##ffle", "could", "resolve", "the", "government", "'", "s", "problems", "." ], "ids": [ 16140, 10454, 13877, 10105, 122, 117, 56159, 14041, 23889, 35035, 10336, 10106, 10105, 19452, 18115, 12031, 70156, 27675, 10189, 21631, 18387, 10115, 39429, 58445, 117, 11371, 10978, 10348, 22362, 18957, 10261, 14819, 32375, 49992, 40519, 10111, 10233, 22362, 18957, 169, 33801, 39429, 13723, 66267, 12174, 102825, 10105, 12047, 112, 187, 20390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ban", "##har", "##n", ",", "who", "leads", "a", "six", "-", "party", ",", "13", "-", "month", "-", "old", "coalition", "government", ",", "faces", "a", "no", "-", "confidence", "debate", "in", "parliament", "next", "month", "." ], "ids": [ 21631, 18387, 10115, 117, 10479, 34868, 169, 12449, 118, 14039, 117, 10249, 118, 14064, 118, 12898, 41028, 12047, 117, 48343, 169, 10192, 118, 74187, 29632, 10106, 40519, 13451, 14064, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "prime", "minister", ",", "who", "has", "already", "lost", "one", "coalition", "partner", "this", "month", ",", "is", "expected", "to", "have", "a", "tou", "##gh", "battle", "in", "the", "debate", "because", "of", "in", "##fig", "##hti", "##ng", "in", "his", "own", "party", "and", "warning", "##s", "of", "more", "pull", "##outs", "by", "other", "coalition", "partners", "." ], "ids": [ 10117, 19287, 16930, 117, 10479, 10393, 19034, 14172, 10464, 41028, 22825, 10531, 14064, 117, 10124, 25973, 10114, 10529, 169, 52586, 15774, 18758, 10106, 10105, 29632, 12373, 10108, 10106, 74115, 31270, 10376, 10106, 10226, 12542, 14039, 10111, 70990, 10107, 10108, 10798, 80870, 72199, 10155, 10684, 41028, 48125, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "poll", ",", "conducted", "earlier", "this", "month", "after", "Ban", "##har", "##n", "'", "s", "coalition", "completed", "one", "year", "in", "office", ",", "showed", "the", "military", "would", "pre", "##fer", "General", "Chat", "##ich", "##ai", "Cho", "##on", "##hav", "##an", "-", "-", "a", "former", "prime", "minister", "who", "was", "ou", "##sted", "in", "a", "military", "coup", "in", "February", "1991", "-", "-", "as", "prime", "minister", "." ], "ids": [ 10117, 70156, 117, 23736, 18905, 10531, 14064, 10662, 21631, 18387, 10115, 112, 187, 41028, 15782, 10464, 10924, 10106, 14301, 117, 27463, 10105, 14041, 10894, 12229, 14854, 11220, 103205, 14401, 11542, 50690, 10263, 79313, 10206, 118, 118, 169, 11775, 19287, 16930, 10479, 10134, 10431, 36018, 10106, 169, 14041, 26854, 10106, 11508, 10442, 118, 118, 10146, 19287, 16930, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Defence", "Minister", "Cha", "##vali", "##t", "Yong", "##cha", "##iy", "##ud", "##h", ",", "head", "of", "coalition", "member", "the", "New", "As", "##pira", "##tion", "Party", ",", "was", "the", "second", "choice", "for", "prime", "minister", ",", "the", "poll", "showed", "." ], "ids": [ 31621, 14355, 53453, 22263, 10123, 70171, 12964, 25729, 11679, 10237, 117, 13578, 10108, 41028, 12008, 10105, 10287, 10882, 51198, 10822, 12529, 117, 10134, 10105, 11132, 30865, 10142, 19287, 16930, 117, 10105, 70156, 27463, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ban", "##har", "##n", "came", "in", "last", "on", "the", "list", "of", "proposed", "leaders", "with", "less", "than", "one", "percent", "of", "the", "votes", "." ], "ids": [ 21631, 18387, 10115, 13383, 10106, 12469, 10135, 10105, 13416, 10108, 21622, 24155, 10169, 15306, 11084, 10464, 22362, 10108, 10105, 24659, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Near", "##ly", "two", "-", "third", "##s", "of", "the", "people", "survey", "##ed", "thought", "the", "government", "was", "dis", "##hone", "##st", "and", "ins", "##in", "##cere", ",", "and", "65", "percent", "bl", "##amed", "the", "government", "'", "s", "poor", "performance", "for", "the", "country", "'", "s", "economic", "slow", "##down", "." ], "ids": [ 16140, 10454, 10551, 118, 12628, 10107, 10108, 10105, 11426, 35035, 10336, 18957, 10105, 12047, 10134, 27920, 50198, 10562, 10111, 15498, 10245, 51159, 117, 10111, 10843, 22362, 21484, 83865, 10105, 12047, 112, 187, 23247, 14432, 10142, 10105, 12723, 112, 187, 13925, 41573, 27160, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "opinion", "of", "the", "military", "in", "Thailand", ",", "which", "has", "seen", "17", "coups", "or", "attempted", "coups", "since", "the", "country", "switched", "to", "parliamentary", "democracy", "from", "absolute", "mon", "##archy", "in", "1932", ",", "always", "carries", "weight", "in", "the", "political", "scene", ",", "despite", "officials", "'", "vo", "##ws", "to", "distance", "the", "military", "from", "politics", "." ], "ids": [ 10117, 32282, 10108, 10105, 14041, 10106, 19621, 117, 10319, 10393, 15652, 10273, 69693, 10345, 30881, 69693, 11764, 10105, 12723, 66795, 10114, 50485, 67519, 10188, 48573, 34372, 107718, 10106, 11333, 117, 19540, 64216, 25512, 10106, 10105, 13736, 18167, 117, 22087, 27730, 112, 12556, 25080, 10114, 18527, 10105, 14041, 10188, 25674, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hamas", "c", "##leri", "##c", "jail", "##ed", "in", "Israel", "hospital", "##ised", "briefly", "." ], "ids": [ 83152, 171, 12538, 10350, 75934, 10336, 10106, 12991, 18141, 20666, 36327, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "29" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israeli", "prison", "officials", "took", "jail", "##ed", "Islamic", "militant", "Hamas", "founder", "Sheikh", "Ahmed", "Ya", "##ssin", "to", "hospital", "briefly", "on", "Thursday", "for", "medical", "tests", ",", "officials", "said", "." ], "ids": [ 28446, 20538, 27730, 12149, 75934, 10336, 22150, 79006, 83152, 22826, 58837, 25530, 25148, 43756, 10114, 18141, 36327, 10135, 67067, 10142, 19436, 34926, 117, 27730, 12415, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-MISC", "O", "B-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 2, 9, 3, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "This", "evening", "Sheikh", "Ya", "##ssin", "completed", "medical", "check", "##s", "and", "returned", "to", "Ram", "##le", "prison", "##s", "authority", "medical", "centre", ",", "\"", "said", "a", "spoke", "##sman", "for", "Israel", "'", "s", "internal", "security", "ministry", "." ], "ids": [ 107, 10747, 42135, 58837, 25148, 43756, 15782, 19436, 43662, 10107, 10111, 14030, 10114, 42932, 10284, 20538, 10107, 26772, 19436, 12672, 117, 107, 12415, 169, 50005, 24305, 10142, 12991, 112, 187, 29868, 21849, 65338, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "prison", "official", "said", "Ya", "##ssin", "had", "a", "mild", "case", "of", "pne", "##umon", "##ia", "." ], "ids": [ 138, 20538, 14731, 12415, 25148, 43756, 10374, 169, 89176, 13474, 10108, 63821, 108689, 10280, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "60", "-", "year", "-", "old", "Mo", "##sle", "##m", "c", "##leri", "##c", ",", "jail", "##ed", "by", "Israel", "since", "1989", ",", "is", "serving", "a", "life", "sentence", "for", "order", "##ing", "attacks", "by", "Hamas", "guerrilla", "##s", "against", "Israeli", "targets", "." ], "ids": [ 10117, 10709, 118, 10924, 118, 12898, 34987, 42176, 10147, 171, 12538, 10350, 117, 75934, 10336, 10155, 12991, 11764, 10524, 117, 10124, 20252, 169, 12103, 49219, 10142, 12990, 10230, 26483, 10155, 83152, 106552, 10107, 11327, 28446, 56996, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "ail", "##ing", "Ya", "##ssin", "is", "the", "spiritual", "leader", "of", "the", "fundamental", "##ist", "Hamas", "group", "which", "has", "killed", "scores", "of", "Israeli", "##s", "in", "suicide", "attacks", "aimed", "at", "w", "##reck", "##ing", "Israel", "-", "PL", "##O", "peace", "deals", "." ], "ids": [ 10117, 91230, 10230, 25148, 43756, 10124, 10105, 42422, 15014, 10108, 10105, 27971, 11293, 83152, 11795, 10319, 10393, 15875, 49931, 10108, 28446, 10107, 10106, 35656, 26483, 53004, 10160, 191, 80442, 10230, 12991, 118, 71341, 11403, 28101, 78037, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "President", "Ya", "##sser", "Ara", "##fat", "has", "demanded", "that", "Israel", "release", "Ya", "##ssin", "-", "-", "who", "is", "confine", "##d", "to", "a", "wheel", "##cha", "##ir", "-", "-", "on", "human", "##itarian", "grounds", "." ], "ids": [ 56119, 12811, 25148, 33519, 54789, 25616, 10393, 78164, 10189, 12991, 14072, 25148, 43756, 118, 118, 10479, 10124, 52202, 10162, 10114, 169, 46812, 12964, 10835, 118, 118, 10135, 14179, 63378, 38190, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 9, 9, 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Israel", "said", "last", "month", "after", "it", "recovered", "the", "body", "of", "a", "soldier", "ab", "##duct", "##ed", "by", "Hamas", "seven", "years", "ago", "that", "it", "would", "consider", "free", "##ing", "Ya", "##ssin", "." ], "ids": [ 12991, 12415, 12469, 14064, 10662, 10271, 55051, 10105, 14333, 10108, 169, 50803, 11357, 54489, 10336, 10155, 83152, 15767, 10855, 36390, 10189, 10271, 10894, 44856, 13961, 10230, 25148, 43756, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Moro", "##cca", "##n", "King", "meets", "former", "Israel", "PM", "Pere", "##s", "." ], "ids": [ 66832, 20057, 10115, 11515, 40427, 11775, 12991, 46161, 33511, 10107, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 1, 9, 4, 8, 9 ] }, { "tokens": [ "SK", "##HI", "##RA", "##T", ",", "Morocco", "1996", "-", "08", "-", "29" ], "ids": [ 21275, 108880, 29990, 11090, 117, 57295, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "King", "Hassan", "of", "Morocco", "met", "former", "Israeli", "prime", "minister", "Shi", "##mon", "Pere", "##s", "on", "Thursday", "at", "the", "coastal", "resort", "of", "S", "##kh", "##irat", ",", "20", "km", "(", "12", "miles", ")", "south", "of", "Rabat", ",", "an", "official", "source", "said", "." ], "ids": [ 11515, 35004, 10108, 57295, 10428, 11775, 28446, 19287, 16930, 44795, 16278, 33511, 10107, 10135, 67067, 10160, 10105, 41328, 60637, 10108, 156, 48502, 56610, 117, 10197, 10204, 113, 10186, 14148, 114, 13144, 10108, 38929, 117, 10151, 14731, 15247, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Mr", "Shi", "##mon", "Pere", "##s", ",", "who", "is", "on", "a", "pure", "##ly", "private", "and", "family", "visit", "to", "Morocco", ",", "was", "received", "on", "Thursday", "by", "his", "Majesty", "King", "Hassan", "at", "the", "royal", "palace", "of", "S", "##kh", "##irat", ",", "\"", "the", "source", "said", "." ], "ids": [ 107, 12916, 44795, 16278, 33511, 10107, 117, 10479, 10124, 10135, 169, 33166, 10454, 14591, 10111, 11365, 27541, 10114, 57295, 117, 10134, 12296, 10135, 67067, 10155, 10226, 71298, 11515, 35004, 10160, 10105, 23954, 52140, 10108, 156, 48502, 56610, 117, 107, 10105, 15247, 12415, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "##cco", "##mpa", "##nie", "##d", "by", "his", "wife", "and", "grandson", ",", "Pere", "##s", "arrived", "in", "Morocco", "on", "August", "25", "." ], "ids": [ 138, 20493, 31285, 11297, 10162, 10155, 10226, 14384, 10111, 60111, 117, 33511, 10107, 22584, 10106, 57295, 10135, 10735, 10258, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Pere", "##s", "is", "expected", "to", "fly", "home", "on", "Friday", ",", "officials", "said", "." ], "ids": [ 33511, 10107, 10124, 25973, 10114, 26155, 11816, 10135, 30767, 117, 27730, 12415, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sc", "##anda", "##l", "hits", "Clinton", "campaign", "at", "vital", "moment", "." ], "ids": [ 55260, 41971, 10161, 27922, 24139, 17323, 10160, 48196, 14316, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Michael", "Con", "##lon" ], "ids": [ 10631, 12845, 15709 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "29" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Bill", "Clinton", "'", "s", "tri", "##ump", "##hal", "appearance", "at", "the", "Democratic", "convention", ",", "a", "vital", "moment", "in", "his", "bid", "for", "a", "second", "term", ",", "was", "mar", "##red", "on", "Thursday", "by", "the", "resignation", "of", "a", "top", "ad", "##viser", "in", "a", "reported", "sex", "scandal", "." ], "ids": [ 12811, 13160, 24139, 112, 187, 15633, 67299, 18453, 19099, 10160, 10105, 19281, 37812, 117, 169, 48196, 14316, 10106, 10226, 50385, 10142, 169, 11132, 13719, 117, 10134, 12318, 15711, 10135, 67067, 10155, 10105, 66129, 10108, 169, 12364, 10840, 54478, 10106, 169, 15943, 18549, 83458, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "was", "at", "work", "on", "the", "nomination", "acceptance", "speech", "that", "will", "launch", "his", "10", "-", "week", "re", "-", "election", "campaign", "when", "political", "str", "##ategi", "##st", "Dick", "Morris", "ab", "##rupt", "##ly", "announced", "his", "resignation", "on", "Thursday", "." ], "ids": [ 24139, 10134, 10160, 11424, 10135, 10105, 30807, 103024, 29811, 10189, 11337, 29227, 10226, 10150, 118, 16118, 11639, 118, 13685, 17323, 10841, 13736, 17791, 82956, 10562, 19988, 17161, 11357, 46791, 10454, 13854, 10226, 66129, 10135, 67067, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "tab", "##lo", "##id", "Star", "magazine", "reported", "the", "married", "Morris", "had", "a", "length", "##y", "affair", "with", "a", "$", "200", "-", "an", "-", "hour", "pro", "##stitute", "who", "he", "allowed", "to", "ea", "##ves", "##dro", "##p", "on", "telephone", "conversation", "##s", "with", "Clinton", ",", "and", "with", "whom", "he", "shared", "White", "House", "speech", "##es", "before", "they", "were", "made", "." ], "ids": [ 10117, 100781, 10715, 11249, 11836, 15438, 15943, 10105, 13524, 17161, 10374, 169, 17283, 10157, 63879, 10169, 169, 109, 10777, 118, 10151, 118, 24730, 11284, 69442, 10479, 10261, 18162, 10114, 22257, 13136, 26252, 10410, 10135, 69009, 72028, 10107, 10169, 24139, 117, 10111, 10169, 18104, 10261, 29054, 12136, 11545, 29811, 10171, 11360, 10689, 10309, 11019, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Dick", "Morris", "is", "my", "friend", ",", "and", "he", "is", "a", "super", "##b", "political", "str", "##ategi", "##st", ",", "\"", "Clinton", "said", "in", "a", "written", "statement", ".", "\"" ], "ids": [ 107, 19988, 17161, 10124, 15127, 20104, 117, 10111, 10261, 10124, 169, 25212, 10457, 13736, 17791, 82956, 10562, 117, 107, 24139, 12415, 10106, 169, 13398, 33311, 119, 107 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "am", "and", "always", "will", "be", "gra", "##te", "##ful", "for", "the", "great", "contributions", "he", "has", "made", "to", "my", "campaigns", "and", "for", "the", "in", "##val", "##uable", "work", "he", "has", "done", "for", "me", "over", "the", "last", "two", "years", ".", "\"" ], "ids": [ 146, 10392, 10111, 19540, 11337, 10347, 63706, 10216, 14446, 10142, 10105, 14772, 28715, 10261, 10393, 11019, 10114, 15127, 61604, 10111, 10142, 10105, 10106, 12234, 101305, 11424, 10261, 10393, 20378, 10142, 10911, 10491, 10105, 12469, 10551, 10855, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Morris", "declined", "to", "address", "the", "allegations", "directly", "in", "his", "resignation", "statement", "but", "said", "he", "was", "quit", "##ting", "to", "avoid", "becoming", "a", "campaign", "issue", "." ], "ids": [ 17161, 44948, 10114, 32198, 10105, 85190, 22062, 10106, 10226, 66129, 33311, 10473, 12415, 10261, 10134, 101237, 12141, 10114, 33253, 19881, 169, 17323, 15557, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "surprise", "development", "cap", "##tivat", "##ed", "the", "thousands", "of", "reporter", "##s", "at", "the", "convention", "and", "clearly", "wo", "##rri", "##ed", "some", "Democrats", ",", "who", "had", "planned", "a", "tri", "##ump", "##hal", "celebration", "of", "Clinton", "'", "s", "lead", "over", "Dol", "##e", "in", "the", "opinion", "poll", "##s", "." ], "ids": [ 10117, 48886, 13405, 13337, 109369, 10336, 10105, 39966, 10108, 41408, 10107, 10160, 10105, 37812, 10111, 52340, 12796, 24874, 10336, 11152, 56282, 117, 10479, 10374, 24292, 169, 15633, 67299, 18453, 69173, 10108, 24139, 112, 187, 14107, 10491, 100035, 10112, 10106, 10105, 32282, 70156, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Senator", "Dia", "##nne", "Fe", "##ins", "##tein", ",", "a", "California", "Democrat", ",", "called", "it", "a", "\"", "big", "bu", "##mp", "\"", "in", "the", "way", "of", "the", "Clinton", "campaign", "." ], "ids": [ 30397, 18552, 15490, 20187, 14411, 20248, 117, 169, 11621, 45338, 117, 11552, 10271, 169, 107, 22185, 11499, 18573, 107, 10106, 10105, 13170, 10108, 10105, 24139, 17323, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 9, 1, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "\"", "It", "comes", "at", "the", "worst", "possible", "time", "on", "one", "of", "the", "biggest", "days", "for", "the", "president", ",", "\"", "Fe", "##ins", "##tein", "said", "." ], "ids": [ 107, 10377, 21405, 10160, 10105, 62006, 14128, 10635, 10135, 10464, 10108, 10105, 36304, 13990, 10142, 10105, 12931, 117, 107, 20187, 14411, 20248, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "Clinton", "was", "to", "deliver", "his", "acceptance", "speech", "at", "the", "final", "session", "of", "the", "Democratic", "Convention", "opening", "at", "8", "p", ".", "m", ".", "ED", "##T", "(", "mid", "##night", "GMT", ")", "." ], "ids": [ 24139, 10134, 10114, 80498, 10226, 103024, 29811, 10160, 10105, 11070, 30066, 10108, 10105, 19281, 25318, 17975, 10160, 129, 184, 119, 181, 119, 74053, 11090, 113, 15607, 45217, 20362, 114, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "50", "-", "year", "-", "old", "president", "has", "been", "dog", "##ged", "for", "years", "by", "allegations", "of", "financial", "wrong", "##do", "##ing", ",", "sexual", "mis", "##con", "##duct", "and", "question", "##able", "judgment", "in", "select", "##ing", "his", "ad", "##viser", "##s", "." ], "ids": [ 10117, 10462, 118, 10924, 118, 12898, 12931, 10393, 10590, 17835, 18832, 10142, 10855, 10155, 85190, 10108, 20570, 56126, 10317, 10230, 117, 19616, 12606, 23486, 54489, 10111, 20210, 13096, 104118, 10106, 47054, 10230, 10226, 10840, 54478, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Republicans", "hope", "to", "seize", "on", "the", "\"", "character", "\"", "issue", "to", "bol", "##ster", "Clinton", "'", "s", "challenge", "##r", "Bob", "Dol", "##e", "in", "the", "final", "weeks", "of", "the", "campaign", "." ], "ids": [ 93700, 50725, 10114, 75325, 10135, 10105, 107, 15092, 107, 15557, 10114, 14038, 12765, 24139, 112, 187, 36040, 10129, 13583, 100035, 10112, 10106, 10105, 11070, 20750, 10108, 10105, 17323, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Speak", "##ing", "in", "Santa", "Barbara", ",", "California", ",", "Dol", "##e", "did", "not", "directly", "refer", "to", "the", "sexual", "scandal", "but", "said", "the", "departure", "of", "Morris", ",", "who", "had", "advised", "Clinton", "to", "chart", "a", "more", "centri", "##st", "political", "course", ",", "would", "make", "Clinton", "drift", "back", "to", "the", "left", "." ], "ids": [ 104326, 10230, 10106, 11154, 16010, 117, 11621, 117, 100035, 10112, 12172, 10472, 22062, 42803, 10114, 10105, 19616, 83458, 10473, 12415, 10105, 51598, 10108, 17161, 117, 10479, 10374, 94780, 24139, 10114, 21746, 169, 10798, 64286, 10562, 13736, 15348, 117, 10894, 13086, 24139, 60246, 12014, 10114, 10105, 12153, 119 ], "entity": [ "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 1, 5, 9, 1, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Morris", "has", "been", "trying", "to", "make", "President", "Clinton", "a", "Republican", ",", "now", "may", "##be", "he", "'", "ll", "rev", "##ert", "to", "the", "liberal", "Democrat", "that", "he", "really", "is", ",", "\"", "Dol", "##e", "told", "reporter", "##s", "." ], "ids": [ 107, 17161, 10393, 10590, 32862, 10114, 13086, 12811, 24139, 169, 21776, 117, 11858, 11387, 11044, 10261, 112, 22469, 86095, 11605, 10114, 10105, 28950, 45338, 10189, 10261, 30181, 10124, 117, 107, 100035, 10112, 21937, 41408, 10107, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 4, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "will", "hit", "the", "road", "on", "Friday", "for", "a", "bus", "tour", "across", "several", "states", "in", "his", "fight", "to", "become", "the", "first", "Democratic", "incumbent", "re", "-", "elected", "to", "a", "second", "term", "since", "the", "days", "of", "Franklin", "D", ".", "Roosevelt", "." ], "ids": [ 24139, 11337, 14946, 10105, 15485, 10135, 30767, 10142, 169, 19369, 12842, 15130, 11736, 16316, 10106, 10226, 20780, 10114, 13461, 10105, 10422, 19281, 63122, 11639, 118, 14254, 10114, 169, 11132, 13719, 11764, 10105, 13990, 10108, 18003, 141, 119, 27758, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "Aid", "##es", "said", "Clinton", "planned", "to", "spend", "most", "of", "Thursday", "in", "his", "hotel", "room", "several", "miles", "(", "km", ")", "from", "the", "convention", "hall", "working", "on", "his", "speech", "." ], "ids": [ 68407, 10171, 12415, 24139, 24292, 10114, 63222, 10992, 10108, 67067, 10106, 10226, 19157, 19555, 11736, 14148, 113, 10204, 114, 10188, 10105, 37812, 21007, 14616, 10135, 10226, 29811, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "apparently", "ne", "##gle", "##cted", "on", "his", "long", "\"", "w", "##his", "##tle", "-", "stop", "\"", "train", "trip", "to", "the", "convention", ",", "during", "which", "he", "rev", "##elle", "##d", "in", "contact", "with", "friendly", "crowd", "##s", "across", "the", "country", "'", "s", "heart", "##land", "." ], "ids": [ 10377, 10134, 47731, 10554, 23239, 27756, 10135, 10226, 11695, 107, 191, 49311, 16406, 118, 20517, 107, 17767, 37307, 10114, 10105, 37812, 117, 10939, 10319, 10261, 86095, 14000, 10162, 10106, 20637, 10169, 43941, 50059, 10107, 15130, 10105, 12723, 112, 187, 21736, 11080, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "also", "hoa", "##rse", "and", "was", "giving", "his", "voice", "a", "rest", "." ], "ids": [ 10357, 10134, 10379, 13006, 16239, 10111, 10134, 24426, 10226, 21264, 169, 17333, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "first", "lady", "Hillary", "Rod", "##ham", "Clinton", "told", "ABC", "television", ",", "\"", "He", "'", "s", "really", "fired", "up", ".", "\"" ], "ids": [ 16976, 10422, 61082, 72734, 30602, 13196, 24139, 21937, 16052, 14162, 117, 107, 10357, 112, 187, 30181, 38903, 10741, 119, 107 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "wants", "to", "out", "##line", "to", "the", "American", "people", "what", "he", "think", "##s", "has", "been", "accomplished", "in", "the", "last", "four", "years", ",", "and", "what", "he", "would", "like", "to", "see", "done", "in", "the", "next", "four", "years", ",", "\"", "she", "said", "." ], "ids": [ 107, 10357, 45769, 10114, 10950, 12953, 10114, 10105, 10536, 11426, 12976, 10261, 27874, 10107, 10393, 10590, 83251, 10106, 10105, 12469, 11598, 10855, 117, 10111, 12976, 10261, 10894, 11850, 10114, 12888, 20378, 10106, 10105, 13451, 11598, 10855, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "He", "'", "s", "very", "ex", "##cited", "about", "this", "convention", ".", ".", "." ], "ids": [ 107, 10357, 112, 187, 12558, 11419, 96691, 10978, 10531, 37812, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "'", "s", "ex", "##cited", "about", "the", "campaign", "." ], "ids": [ 10357, 112, 187, 11419, 96691, 10978, 10105, 17323, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "more", "than", "that", ",", "he", "'", "s", "very", "reso", "##lut", "##e", "about", "what", "he", "wants", "to", "do", ".", "\"" ], "ids": [ 16976, 10798, 11084, 10189, 117, 10261, 112, 187, 12558, 86286, 40846, 10112, 10978, 12976, 10261, 45769, 10114, 10149, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "do", "n", "'", "t", "take", "anything", "for", "granted", "." ], "ids": [ 107, 146, 10149, 182, 112, 188, 13574, 42819, 10142, 26964, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "always", "ex", "##pect", "elections", "to", "get", "close", "." ], "ids": [ 146, 19540, 11419, 51511, 22054, 10114, 15329, 16065, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "ex", "##pect", "to", "have", "a", "great", "deal", "of", "up", "and", "down", "days", "between", "now", "and", "then", ",", "\"", "she", "said", "of", "the", "November", "5", "election", "date", "." ], "ids": [ 146, 11419, 51511, 10114, 10529, 169, 14772, 19918, 10108, 10741, 10111, 12935, 13990, 10948, 11858, 10111, 11059, 117, 107, 10833, 12415, 10108, 10105, 10819, 126, 13685, 13664, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "is", "leading", "Dol", "##e", "by", "as", "much", "as", "15", "points", "according", "to", "some", "poll", "##s", "." ], "ids": [ 24139, 10124, 16018, 100035, 10112, 10155, 10146, 13172, 10146, 10208, 12789, 18071, 10114, 11152, 70156, 10107, 119 ], "entity": [ "B-PER", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "campaign", "pit", "##s", "Dol", "##e", ",", "a", "man", "of", "quick", "and", "with", "##ering", "wit", "and", "long", "-", "time", "public", "service", ",", "but", "stil", "##ted", "speaking", "style", ",", "against", "the", "gli", "##b", "and", "con", "##fi", "##dent", "Clinton", ",", "who", "has", "perfect", "##ed", "a", "style", "that", "makes", "direct", "eye", "contact", "with", "his", "audience", "." ], "ids": [ 10117, 17323, 55277, 10107, 100035, 10112, 117, 169, 10817, 10108, 69609, 10111, 10169, 19232, 43612, 10111, 11695, 118, 10635, 11683, 11989, 117, 10473, 28510, 11912, 33740, 13351, 117, 11327, 10105, 11167, 10457, 10111, 10173, 14403, 21029, 24139, 117, 10479, 10393, 43477, 10336, 169, 13351, 10189, 20562, 16934, 32684, 20637, 10169, 10226, 26070, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Montana", "weekly", "mun", "##i", "bond", "indice", "##s", "-", "Piper", "Ja", "##ff", "##ray", "." ], "ids": [ 24408, 33159, 101833, 10116, 55185, 75878, 10107, 118, 30462, 28248, 13820, 23432, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "following", "Montana", "tax", "-", "ex", "##em", "##pt", "municipal", "bond", "indice", "##s", "were", "compiled", "by", "Piper", "Ja", "##ff", "##ray", "Inc", "for", "the", "week", "ending", "August", "30", "." ], "ids": [ 10117, 11901, 24408, 25468, 118, 11419, 10451, 14971, 14935, 55185, 75878, 10107, 10309, 71319, 10155, 30462, 28248, 13820, 23432, 13604, 10142, 10105, 16118, 29077, 10735, 10244, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pre", "##vio", "##us" ], "ids": [ 35248, 18574, 10251 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "8", "/", "30", "Week", "Change" ], "ids": [ 129, 120, 10244, 25227, 23305 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-", "-" ], "ids": [ 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "A", "-", "rated", "Gen", "'", "l", "Ob", "##liga", "##tion", "4", ".", "45", "%", "4", ".", "40", "%", "+", "0", ".", "05" ], "ids": [ 13567, 138, 118, 48069, 32560, 112, 180, 43019, 15678, 10822, 125, 119, 10827, 110, 125, 119, 10533, 110, 116, 121, 119, 10831 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", "Year", "A", "-", "rated", "Gen", "'", "l", "Ob", "##liga", "##tion", "4", ".", "90", "%", "4", ".", "90", "%", "-", "-", "-", "-", "-" ], "ids": [ 10150, 13567, 138, 118, 48069, 32560, 112, 180, 43019, 15678, 10822, 125, 119, 10919, 110, 125, 119, 10919, 110, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "15", "Year", "A", "-", "rated", "Gen", "'", "l", "Ob", "##liga", "##tion", "5", ".", "40", "%", "5", ".", "35", "%", "+", "0", ".", "05" ], "ids": [ 10208, 13567, 138, 118, 48069, 32560, 112, 180, 43019, 15678, 10822, 126, 119, 10533, 110, 126, 119, 10803, 110, 116, 121, 119, 10831 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "20", "Year", "A", "-", "rated", "Gen", "'", "l", "Ob", "##liga", "##tion", "5", ".", "55", "%", "5", ".", "50", "%", "+", "0", ".", "05" ], "ids": [ 10197, 13567, 138, 118, 48069, 32560, 112, 180, 43019, 15678, 10822, 126, 119, 11358, 110, 126, 119, 10462, 110, 116, 121, 119, 10831 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "30", "Year", "A", "-", "rated", "Housing", "Rev", "6", ".", "05", "%", "6", ".", "00", "%", "+", "0", ".", "05" ], "ids": [ 10244, 13567, 138, 118, 48069, 52229, 24774, 127, 119, 10831, 110, 127, 119, 11025, 110, 116, 121, 119, 10831 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "U", ".", "S", ".", "Municipal", "Des", "##k", ",", "212", "-", "859", "-", "1650" ], "ids": [ 118, 118, 158, 119, 156, 119, 18069, 13810, 10174, 117, 22023, 118, 80786, 118, 29117 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Research", "##ers", "report", "progress", "in", "muscular", "dy", "##stro", "##ph", "##y", "." ], "ids": [ 12959, 10901, 17553, 40316, 10106, 97976, 13906, 34582, 28088, 10157, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##HI", "##LA", "##DE", "##L", "##P", "##HI", "##A", "1996", "-", "08", "-", "29" ], "ids": [ 153, 108880, 44376, 60675, 11369, 11127, 108880, 10738, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "University", "of", "Pennsylvania", "researchers", "on", "Thursday", "said", "a", "new", "gene", "-", "therapy", "technique", "for", "treat", "##ing", "muscular", "dy", "##stro", "##ph", "##y", "disease", "had", "shown", "progress", "in", "laboratory", "animals", "." ], "ids": [ 10404, 10108, 14726, 53719, 10135, 67067, 12415, 169, 10751, 24910, 118, 49619, 21701, 10142, 81634, 10230, 97976, 13906, 34582, 28088, 10157, 21911, 10374, 19989, 40316, 10106, 67047, 22528, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Word", "of", "the", "findings", ",", "to", "be", "published", "in", "the", "Oct", ".", "1", "issue", "of", "the", "journal", "\"", "Human", "Gene", "Therapy", ",", "\"", "came", "in", "advance", "of", "the", "annual", "Jerry", "Lewis", "Labour", "Day", "weekend", "tele", "##thon", "to", "raise", "money", "for", "muscular", "dy", "##stro", "##ph", "##y", "research", "." ], "ids": [ 34368, 10108, 10105, 79441, 117, 10114, 10347, 12304, 10106, 10105, 45442, 119, 122, 15557, 10108, 10105, 19061, 107, 15426, 22787, 89541, 117, 107, 13383, 10106, 34809, 10108, 10105, 19246, 17686, 13759, 25606, 12360, 43440, 56142, 83915, 10114, 42439, 17920, 10142, 97976, 13906, 34582, 28088, 10157, 14108, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Several", "hur", "##dles", "must", "be", "overcome", "before", "the", "method", "is", "used", "in", "human", "trials", "." ], "ids": [ 28604, 52824, 92503, 14982, 10347, 105445, 11360, 10105, 22414, 10124, 11031, 10106, 14179, 54076, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nevertheless", ",", "\"", "a", "treatment", "based", "on", "the", "new", "strategy", ".", ".", ".", ".", "may", "have", "the", "potential", "to", "benefit", "many", "patients", ",", "\"", "the", "University", "of", "Pennsylvania", "Medical", "Centre", "said", "in", "a", "release", "." ], "ids": [ 71823, 117, 107, 169, 21379, 11610, 10135, 10105, 10751, 40919, 119, 119, 119, 119, 11387, 10529, 10105, 23078, 10114, 43074, 11299, 25965, 117, 107, 10105, 10404, 10108, 14726, 18363, 12838, 12415, 10106, 169, 14072, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mus", "##cular", "dy", "##stro", "##ph", "##y", "is", "a", "fatal", "illness", "in", "which", "the", "body", "'", "s", "muscle", "tissue", "de", "##gene", "##rates", "and", "is", "replaced", "by", "fat", "." ], "ids": [ 31013, 24236, 13906, 34582, 28088, 10157, 10124, 169, 71126, 56507, 10106, 10319, 10105, 14333, 112, 187, 59331, 63329, 10104, 34447, 32406, 10111, 10124, 16478, 10155, 67952, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Death", "strikes", "in", "early", "adult", "##hood", "." ], "ids": [ 15467, 86206, 10106, 11732, 30521, 30123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Individual", "##s", "with", "the", "disease", "have", "a", "non", "-", "working", "version", "of", "a", "gene", "responsible", "for", "producing", "a", "crucial", "muscle", "protein", "called", "dy", "##stro", "##phin", "." ], "ids": [ 58191, 10107, 10169, 10105, 21911, 10529, 169, 10446, 118, 14616, 11674, 10108, 169, 24910, 21586, 10142, 31958, 169, 63113, 59331, 18693, 11552, 13906, 34582, 59091, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "study", "at", "the", "University", "'", "s", "Institute", "for", "Human", "Gene", "Therapy", ",", "researchers", "altered", "a", "common", "-", "cold", "virus", "to", "carry", "a", "version", "of", "the", "working", "dy", "##stro", "##phin", "gene", "." ], "ids": [ 10167, 10105, 14687, 10160, 10105, 10404, 112, 187, 12031, 10142, 15426, 22787, 89541, 117, 53719, 78598, 169, 14624, 118, 41626, 20399, 10114, 31626, 169, 11674, 10108, 10105, 14616, 13906, 34582, 59091, 24910, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "virus", ",", "which", "also", "was", "altered", "to", "mini", "##mise", "its", "sus", "##cept", "##ibility", "to", "the", "immune", "system", ",", "was", "then", "in", "##ject", "##ed", "into", "the", "muscle", "cells", "of", "mic", "##e", "bred", "to", "lack", "dy", "##stro", "##phin", "genes", "." ], "ids": [ 10117, 20399, 117, 10319, 10379, 10134, 78598, 10114, 25103, 19738, 10474, 10846, 97782, 68348, 10114, 10105, 96945, 11787, 117, 10134, 11059, 10106, 56617, 10336, 10708, 10105, 59331, 23182, 10108, 84314, 10112, 57795, 10114, 23582, 13906, 34582, 59091, 41158, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "experiment", ",", "between", "30", "to", "40", "percent", "of", "the", "muscle", "fiber", "##s", "in", "one", "group", "of", "mic", "##e", "produced", "dy", "##stro", "##phin", "for", "two", "weeks", "before", "di", "##mini", "##shing", "." ], "ids": [ 10167, 10105, 48580, 117, 10948, 10244, 10114, 10533, 22362, 10108, 10105, 59331, 99159, 10107, 10106, 10464, 11795, 10108, 84314, 10112, 13433, 13906, 34582, 59091, 10142, 10551, 20750, 11360, 10120, 37249, 74062, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Similar", "results", "had", "been", "obtained", "previously", "in", "test", "-", "tube", "cell", "cultures", ",", "but", "not", "in", "live", "animals", ",", "the", "university", "said", "." ], "ids": [ 97572, 17466, 10374, 10590, 27345, 17477, 10106, 15839, 118, 45245, 20748, 36782, 117, 10473, 10472, 10106, 12962, 22528, 117, 10105, 19756, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "university", "said", "methods", "are", "still", "needed", "to", "make", "enough", "of", "the", "altered", "virus", "to", "treat", "humans", ",", "to", "further", "decrease", "the", "immune", "-", "system", "response", "to", "the", "virus", ",", "and", "to", "deliver", "the", "virus", "to", "human", "muscle", "tissue", "." ], "ids": [ 10117, 19756, 12415, 27413, 10301, 12647, 23794, 10114, 13086, 21408, 10108, 10105, 78598, 20399, 10114, 81634, 26058, 117, 10114, 14586, 82112, 10105, 96945, 118, 11787, 21001, 10114, 10105, 20399, 117, 10111, 10114, 80498, 10105, 20399, 10114, 14179, 59331, 63329, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Export", "Business", "-", "G", "##rain", "/", "oil", "##see", "##ds", "complex", "." ], "ids": [ 108268, 15281, 118, 144, 32782, 120, 21073, 20262, 13268, 17217, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "29" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##rain", "and", "oil", "##see", "##d", "export", "##s", "reported", "by", "USD", "##A", "and", "private", "export", "sources", "." ], "ids": [ 144, 32782, 10111, 21073, 20262, 10162, 59220, 10107, 15943, 10155, 24868, 10738, 10111, 14591, 59220, 19023, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##H", "##EA", "##T", "SA", "##LE", "##S", "-", "Taiwan", "Fl", "##our", "Mills", "Ass", "##n", "bought", "98", ",", "000", "tonnes", "of", "U", ".", "S", ".", "No", ".", "1", "or", "No", ".", "2", "wheat", "from", "Car", "##gil", "##l", ",", "Mit", "##su", "##i", ",", "Continental", "and", "Louis", "Dreyfus", "Corp", "for", "ship", "##ment", "from", "the", "Pacific", "Northwest", "." ], "ids": [ 160, 12396, 36789, 11090, 21318, 51036, 10731, 118, 19449, 29981, 17964, 29250, 77014, 10115, 28870, 12327, 117, 10259, 39435, 10108, 158, 119, 156, 119, 10657, 119, 122, 10345, 10657, 119, 123, 109653, 10188, 23962, 32837, 10161, 117, 12699, 12892, 10116, 117, 27202, 10111, 11334, 86517, 44687, 10142, 17309, 10426, 10188, 10105, 14597, 40816, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 3, 9, 3, 7, 7, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "For", "Sept", "10", "-", "30", ":", "16", ",", "300", "tonnes", "of", "dark", "northern", "spring", "(", "DNS", ")", "at", "$", "212", ".", "00", ";", "7", ",", "000", "of", "hard", "red", "winter", "(", "HR", "##W", ")", "at", "$", "205", ".", "10", ";", "2", ",", "700", "of", "western", "white", "(", "W", "##W", ")", "at", "$", "202", ".", "65", "." ], "ids": [ 11399, 51768, 10150, 118, 10244, 131, 10250, 117, 11093, 39435, 10108, 25100, 17335, 26053, 113, 53768, 114, 10160, 109, 22023, 119, 11025, 132, 128, 117, 10259, 10108, 19118, 10680, 25977, 113, 47114, 13034, 114, 10160, 109, 20862, 119, 10150, 132, 123, 117, 12367, 10108, 16672, 15263, 113, 160, 13034, 114, 10160, 109, 22171, 119, 10843, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "Sept", "20", "-", "Oct", "10", ":", "19", ",", "500", "of", "DNS", "at", "$", "212", ".", "25", ",", "10", ",", "000", "of", "HR", "##W", "at", "$", "204", ".", "74", ",", "4", ",", "500", "of", "W", "##W", "at", "$", "199", ".", "71", "." ], "ids": [ 11399, 51768, 10197, 118, 45442, 10150, 131, 10270, 117, 10757, 10108, 53768, 10160, 109, 22023, 119, 10258, 117, 10150, 117, 10259, 10108, 47114, 13034, 10160, 109, 22253, 119, 12535, 117, 125, 117, 10757, 10108, 160, 13034, 10160, 109, 23366, 119, 12513, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "Sept", "25", "-", "Oct", "20", ":", "23", ",", "500", "of", "DNS", "at", "$", "212", ".", "25", ",", "9", ",", "600", "HR", "##W", "at", "$", "204", ".", "74", ",", "4", ",", "900", "W", "##W", "at", "$", "199", ".", "56", "." ], "ids": [ 11399, 51768, 10258, 118, 45442, 10197, 131, 10328, 117, 10757, 10108, 53768, 10160, 109, 22023, 119, 10258, 117, 130, 117, 11796, 47114, 13034, 10160, 109, 22253, 119, 12535, 117, 125, 117, 13545, 160, 13034, 10160, 109, 23366, 119, 11628, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##H", "##EA", "##T", "SA", "##LE", "##S", "-", "The", "Com", "##mo", "##dity", "Credit", "Corp", "of", "USD", "##A", "bought", "18", ",", "278", "tonnes", "of", "dark", "northern", "spring", "(", "DNS", ")", "wheat", "from", "Car", "##gil", "##l", "Inc", "at", "$", "195", ".", "79", "per", "ton", "##ne", ",", "F", "##O", "##B", ",", "for", "donation", "to", "Nicaragua", "." ], "ids": [ 160, 12396, 36789, 11090, 21318, 51036, 10731, 118, 10117, 16680, 11033, 100060, 75181, 44687, 10108, 24868, 10738, 28870, 10218, 117, 29417, 39435, 10108, 25100, 17335, 26053, 113, 53768, 114, 109653, 10188, 23962, 32837, 10161, 13604, 10160, 109, 21825, 119, 12791, 10178, 22464, 10238, 117, 143, 11403, 11274, 117, 10142, 93008, 10114, 32337, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Ship", "##ment", "is", "for", "Nov", "15", "-", "Dec", "10", "." ], "ids": [ 51776, 10426, 10124, 10142, 36779, 10208, 118, 46147, 10150, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##H", "##EA", "##T", "/", "BA", "##R", "##LE", "##Y", "SA", "##LE", "-", "The", "Japanese", "Food", "Agency", "said", "it", "bought", "20", ",", "000", "tonnes", "of", "U", ".", "S", ".", "dark", "northern", "spring", "wheat", ",", "20", ",", "000", "of", "Canadian", "western", "red", "spring", "wheat", ",", "20", ",", "000", "of", "Australian", "standard", "white", "wheat", "and", "20", ",", "000", "of", "Australian", "feed", "bar", "##ley", "at", "its", "weekly", "tender", ",", "all", "for", "October", "ship", "##ment", "." ], "ids": [ 160, 12396, 36789, 11090, 120, 39999, 11273, 51036, 14703, 21318, 51036, 118, 10117, 13847, 24182, 21887, 12415, 10271, 28870, 10197, 117, 10259, 39435, 10108, 158, 119, 156, 119, 25100, 17335, 26053, 109653, 117, 10197, 117, 10259, 10108, 14023, 16672, 10680, 26053, 109653, 117, 10197, 117, 10259, 10108, 12829, 14979, 15263, 109653, 10111, 10197, 117, 10259, 10108, 12829, 44988, 18121, 12105, 10160, 10474, 33159, 96486, 117, 10435, 10142, 11212, 17309, 10426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##Y", "##B", "##EA", "##N", "SA", "##LE", "##S", "-", "The", "Tai", "##chung", "division", "of", "Taiwan", "'", "s", "Breakfast", "So", "##y", "##bea", "##n", "Proc", "##ure", "##ment", "Ass", "##n", "bought", "108", ",", "000", "tonnes", "of", "U", ".", "S", ".", "soy", "##bea", "##ns", "." ], "ids": [ 71020, 14703, 11274, 36789, 11537, 21318, 51036, 10731, 118, 10117, 25633, 35077, 13751, 10108, 19449, 112, 187, 105729, 12882, 10157, 92710, 10115, 38050, 12101, 10426, 77014, 10115, 28870, 15845, 117, 10259, 39435, 10108, 158, 119, 156, 119, 103559, 92710, 10891, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 1, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Bu", "##nge", "sold", "the", "first", "ship", "##ment", "and", "Car", "##gil", "##l", "the", "second", ",", "trade", "##rs", "said", "." ], "ids": [ 11916, 18180, 15337, 10105, 10422, 17309, 10426, 10111, 23962, 32837, 10161, 10105, 11132, 117, 18908, 10943, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "Nov", "11", "-", "25", "from", "the", "U", ".", "S", ".", "Gulf", "or", "Nov", "26", "-", "Dec", "10", "from", "P", "##N", "##W", "it", "paid", "$", "0", ".", "858", "##4", "per", "bus", "##hel", "over", "CB", "##OT", "January", "soy", "##bea", "##ns", "and", "for", "Dec", "6", "-", "20", "or", "Dec", "21", "-", "Jan", "it", "paid", "$", ".", "878", "##7", "over", "CB", "##OT", "January", "." ], "ids": [ 11399, 36779, 10193, 118, 10258, 10188, 10105, 158, 119, 156, 119, 28239, 10345, 36779, 10314, 118, 46147, 10150, 10188, 153, 11537, 13034, 10271, 25938, 109, 121, 119, 78390, 11011, 10178, 19369, 31572, 10491, 59791, 62146, 11238, 103559, 92710, 10891, 10111, 10142, 46147, 127, 118, 10197, 10345, 46147, 10296, 118, 11806, 10271, 25938, 109, 119, 74002, 11305, 10491, 59791, 62146, 11238, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Pakistan", "bought", "31", ",", "412", "tonnes", "of", "PL", "-", "480", "No", ".", "2", "yellow", "soy", "##bea", "##ns", "from", "Car", "##gil", "##l", "Inc", "for", "$", "303", ".", "19", "per", "ton", "##ne", ",", "F", "##O", "##B", "U", ".", "S", ".", "Gulf", ",", "agents", "for", "the", "buy", "##er", "said", "." ], "ids": [ 118, 15437, 28870, 10413, 117, 32736, 39435, 10108, 71341, 118, 23144, 10657, 119, 123, 29815, 103559, 92710, 10891, 10188, 23962, 32837, 10161, 13604, 10142, 109, 27167, 119, 10270, 10178, 22464, 10238, 117, 143, 11403, 11274, 158, 119, 156, 119, 28239, 117, 32124, 10142, 10105, 47715, 10165, 12415, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "soy", "##bea", "##ns", "were", "for", "Oct", "15", "-", "30", "ship", "##ment", "." ], "ids": [ 10117, 103559, 92710, 10891, 10309, 10142, 45442, 10208, 118, 10244, 17309, 10426, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##R", "##LE", "##Y", "T", "##EN", "##DE", "##R", "-", "The", "Cyprus", "G", "##rain", "Commission", "said", "it", "invited", "offers", "September", "3", "to", "supply", "25", ",", "000", "tonnes", "of", "feed", "bar", "##ley", ",", "with", "ship", "##ment", "for", "Sept", "25", "-", "Oct", "10", "from", "Europe", "or", "Sept", "15", "-", "30", "from", "North", "America", "." ], "ids": [ 39999, 11273, 51036, 14703, 157, 50655, 60675, 11273, 118, 10117, 45639, 144, 32782, 14941, 12415, 10271, 33392, 23818, 10596, 124, 10114, 28914, 10258, 117, 10259, 39435, 10108, 44988, 18121, 12105, 117, 10169, 17309, 10426, 10142, 51768, 10258, 118, 45442, 10150, 10188, 11767, 10345, 51768, 10208, 118, 10244, 10188, 11225, 11440, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "MA", "##R", "##K", "##ET", "TA", "##L", "##K", "-", "Sri", "Lanka", "plans", "to", "import", "up", "to", "400", ",", "000", "tonnes", "of", "rice", "by", "the", "end", "of", "this", "year", "to", "meet", "a", "crop", "short", "##fall", "caused", "by", "dro", "##ught", "and", "rising", "demand", ",", "government", "officials", "said", "on", "Thursday", "." ], "ids": [ 27277, 11273, 11733, 52338, 91075, 11369, 11733, 118, 16098, 20828, 18195, 10114, 67622, 10741, 10114, 11176, 117, 10259, 39435, 10108, 59039, 10155, 10105, 11572, 10108, 10531, 10924, 10114, 23267, 169, 99402, 13716, 16220, 19513, 10155, 33741, 53206, 10111, 53816, 34394, 117, 12047, 27730, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MA", "##R", "##K", "##ET", "TA", "##L", "##K", "-", "USD", "##A", "net", "change", "in", "weekly", "export", "commitment", "##s", "for", "the", "week", "ended", "August", "22", ",", "includes", "old", "crop", "and", "new", "crop", ",", "were", ":", "wheat", "up", "595", ",", "400", "tonnes", "old", ",", "ni", "##l", "new", ";", "corn", "up", "1", ",", "900", "old", ",", "up", "319", ",", "600", "new", ";", "soy", "##bea", "##ns", "down", "12", ",", "300", "old", ",", "up", "300", ",", "800", "new", ";", "up", "##land", "cotton", "up", "50", ",", "400", "bal", "##es", "new", ",", "ni", "##l", "old", ";", "soy", "##mea", "##l", "54", ",", "800", "old", ",", "up", "100", ",", "600", "new", ",", "soy", "##oi", "##l", "ni", "##l", "old", ",", "up", "75", ",", "000", "new", ";", "bar", "##ley", "up", "1", ",", "700", "old", ",", "ni", "##l", "new", ";", "sor", "##gh", "##um", "6", ",", "200", "old", ",", "up", "156", ",", "700", "new", ";", "pi", "##ma", "cotton", "up", "4", ",", "000", "bal", "##es", "old", ",", "ni", "##l", "new", ";", "rice", "up", "49", ",", "900", "old", ",", "ni", "##l", "new", ".", ".", "." ], "ids": [ 27277, 11273, 11733, 52338, 91075, 11369, 11733, 118, 24868, 10738, 11988, 15453, 10106, 33159, 59220, 75010, 10107, 10142, 10105, 16118, 18428, 10735, 10306, 117, 15433, 12898, 99402, 10111, 10751, 99402, 117, 10309, 131, 109653, 10741, 53584, 117, 11176, 39435, 12898, 117, 10414, 10161, 10751, 132, 93599, 10741, 122, 117, 13545, 12898, 117, 10741, 30917, 117, 11796, 10751, 132, 103559, 92710, 10891, 12935, 10186, 117, 11093, 12898, 117, 10741, 11093, 117, 11900, 10751, 132, 10741, 11080, 77946, 10741, 10462, 117, 11176, 20873, 10171, 10751, 117, 10414, 10161, 12898, 132, 103559, 41947, 10161, 11653, 117, 11900, 12898, 117, 10741, 10407, 117, 11796, 10751, 117, 103559, 14638, 10161, 10414, 10161, 12898, 117, 10741, 11417, 117, 10259, 10751, 132, 18121, 12105, 10741, 122, 117, 12367, 12898, 117, 10414, 10161, 10751, 132, 56011, 15774, 10465, 127, 117, 10777, 12898, 117, 10741, 20410, 117, 12367, 10751, 132, 24109, 10369, 77946, 10741, 125, 117, 10259, 20873, 10171, 12898, 117, 10414, 10161, 10751, 132, 59039, 10741, 11580, 117, 13545, 12898, 117, 10414, 10161, 10751, 119, 119, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "USD", "##A", "Thursday", "for", "##eca", "##st", "U", ".", "S", ".", "agricultural", "export", "##s", "in", "fiscal", "year", "1997", "would", "decline", "to", "$", "58", "billion", ",", "down", "$", "2", "billion", "from", "the", "record", "$", "60", "billion", "seen", "for", "fiscal", "1996", "." ], "ids": [ 24868, 10738, 67067, 10142, 33588, 10562, 158, 119, 156, 119, 35365, 59220, 10107, 10106, 43645, 10924, 10391, 10894, 46695, 10114, 109, 11824, 25848, 117, 12935, 109, 123, 25848, 10188, 10105, 12410, 109, 10709, 25848, 15652, 10142, 43645, 10389, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oil", "##see", "##d", "export", "##s", "are", "expected", "to", "rise", "by", "$", "800", "million", "and", "lives", "##tock", ",", "pou", "##lt", "##ry", "and", "fruits", "and", "veg", "##eta", "##bles", "are", "seen", "gaining", "more", "than", "$", "1", "billion", "." ], "ids": [ 33049, 20262, 10162, 59220, 10107, 10301, 25973, 10114, 28710, 10155, 109, 11900, 12473, 10111, 21418, 60458, 117, 23491, 11533, 10908, 10111, 47353, 10111, 108193, 14724, 14273, 10301, 15652, 75993, 10798, 11084, 109, 122, 25848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "USD", "##A", "pe", "##gged", "U", ".", "S", ".", "wheat", "export", "##s", "at", "25", ".", "0", "million", "tonnes", "in", "fiscal", "1997", "versus", "32", ".", "0", "million", "tonnes", "the", "prior", "year", ".", ".", "." ], "ids": [ 24868, 10738, 11161, 91518, 158, 119, 156, 119, 109653, 59220, 10107, 10160, 10258, 119, 121, 12473, 39435, 10106, 43645, 10391, 32412, 10842, 119, 121, 12473, 39435, 10105, 20972, 10924, 119, 119, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "European", "Union", "agreed", "on", "Thursday", "to", "increase", "by", "300", ",", "000", "tonnes", "the", "quota", "of", "German", "intervention", "bar", "##ley", "available", "for", "export", ",", "France", "ON", "##IC", "said", "." ], "ids": [ 10117, 11914, 11457, 25577, 10135, 67067, 10114, 20299, 10155, 11093, 117, 10259, 39435, 10105, 59027, 10108, 12026, 40152, 18121, 12105, 14579, 10142, 59220, 117, 10688, 49339, 30889, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 3, 7, 9, 9 ] }, { "tokens": [ "The", "EU", "'", "s", "grain", "panel", "will", "add", "two", "tra", "##nches", "of", "150", ",", "000", "tonnes", "each", "to", "the", "existing", "allo", "##cation", ",", "it", "said", "." ], "ids": [ 10117, 17751, 112, 187, 69132, 36387, 11337, 42852, 10551, 11264, 101385, 10108, 11766, 117, 10259, 39435, 11948, 10114, 10105, 26636, 20779, 26287, 117, 10271, 12415, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Chicago", "news", "##des", "##k", "312", "-", "408", "-", "872", "##0", "-", "-" ], "ids": [ 118, 118, 12317, 14424, 10920, 10174, 25104, 118, 36899, 118, 77107, 10929, 118, 118 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "USD", "##A", "gross", "cut", "##out", "hide", "and", "off", "##al", "value", "." ], "ids": [ 24868, 10738, 92746, 21610, 17514, 96935, 10111, 11898, 10415, 19211, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##S", "MO", "##INE", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 25067, 10731, 102059, 83198, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "hide", "and", "off", "##al", "value", "from", "a", "typical", "sl", "##au", "##ghter", "st", "##eer", "for", "Thursday", "was", "estimated", "at", "$", "9", ".", "76", "per", "c", "##w", "##t", "live", ",", "up", "$", "0", ".", "03", "when", "compared", "with", "Wednesday", "'", "s", "value", "." ], "ids": [ 10117, 96935, 10111, 11898, 10415, 19211, 10188, 169, 36772, 38523, 11705, 45953, 28780, 23869, 10142, 67067, 10134, 25267, 10160, 109, 130, 119, 12428, 10178, 171, 10874, 10123, 12962, 117, 10741, 109, 121, 119, 10907, 10841, 25626, 10169, 57611, 112, 187, 19211, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "USD", "##A" ], "ids": [ 118, 24868, 10738 ], "entity": [ "O", "B-ORG", "I-ORG" ], "entity_ids": [ 9, 3, 7 ] }, { "tokens": [ "Help", "-", "wanted", "ad", "index", "fell", "in", "July", "." ], "ids": [ 49983, 118, 22591, 10840, 19776, 25194, 10106, 11112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "help", "-", "wanted", "advertising", "index", "fell", "in", "July", ",", "the", "Conference", "Board", "said", "Thursday", ",", "reflect", "##ing", "the", "une", "##ven", "nature", "of", "the", "nation", "'", "s", "labour", "markets", "." ], "ids": [ 10117, 15217, 118, 22591, 49828, 19776, 25194, 10106, 11112, 117, 10105, 16424, 14743, 12415, 67067, 117, 67569, 10230, 10105, 10231, 11975, 16613, 10108, 10105, 22274, 112, 187, 40763, 42893, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "monthly", "index", "fell", "to", "83", ".", "0", "in", "July", "against", "a", "reading", "of", "85", ".", "0", "in", "June", ",", "the", "private", "business", "research", "group", "said", "." ], "ids": [ 10117, 61673, 19776, 25194, 10114, 12408, 119, 121, 10106, 11112, 11327, 169, 32432, 10108, 12017, 119, 121, 10106, 11120, 117, 10105, 14591, 14155, 14108, 11795, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "July", ",", "the", "volume", "of", "help", "-", "wanted", "advertising", "fell", "in", "five", "of", "the", "nine", "U", ".", "S", ".", "regions", "." ], "ids": [ 10167, 11112, 117, 10105, 15901, 10108, 15217, 118, 22591, 49828, 25194, 10106, 12403, 10108, 10105, 19964, 158, 119, 156, 119, 21721, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "\"", "The", "labour", "market", "has", "been", "expanding", "throughout", "1996", ",", "but", "in", "a", "very", "une", "##ven", "pattern", ",", "\"", "Conference", "Board", "e", "##cono", "##mist", "Ken", "Goldstein", "said", ".", "\"" ], "ids": [ 107, 10117, 40763, 17313, 10393, 10590, 82158, 15916, 10389, 117, 10473, 10106, 169, 12558, 10231, 11975, 36265, 117, 107, 16424, 14743, 173, 27447, 24987, 19355, 89755, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "Recent", "want", "-", "ad", "figures", "indicate", "that", "conservative", "hiri", "##ng", "plans", "are", "keeping", "job", "growth", "below", "the", "rate", "of", "overall", "economic", "activity", ".", "\"" ], "ids": [ 45459, 21528, 118, 10840, 21068, 35802, 10189, 50202, 55356, 10376, 18195, 10301, 51318, 23627, 14609, 17544, 10105, 18344, 10108, 20947, 13925, 22205, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "With", "2", ".", "5", "percent", "gross", "domestic", "product", "growth", "expected", "for", "1996", ",", "new", "job", "growth", "should", "slowly", "lower", "the", "une", "##mployment", "rate", "over", "the", "rest", "of", "the", "year", "." ], "ids": [ 12613, 123, 119, 126, 22362, 92746, 31084, 21535, 14609, 25973, 10142, 10389, 117, 10751, 23627, 14609, 14819, 63088, 18165, 10105, 10231, 108472, 18344, 10491, 10105, 17333, 10108, 10105, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "With", "the", "une", "##mployment", "rate", "stay", "##ing", "close", "to", "about", "5", ".", "5", "percent", "over", "the", "last", "two", "years", ",", "there", "is", "a", "good", "chance", "the", "rate", "will", "slowly", "drop", "to", "about", "5", ".", "0", "percent", "by", "the", "end", "of", "the", "year", ",", "\"", "Goldstein", "said", "." ], "ids": [ 107, 12613, 10105, 10231, 108472, 18344, 29597, 10230, 16065, 10114, 10978, 126, 119, 126, 22362, 10491, 10105, 12469, 10551, 10855, 117, 11155, 10124, 169, 15198, 27893, 10105, 18344, 11337, 63088, 36365, 10114, 10978, 126, 119, 121, 22362, 10155, 10105, 11572, 10108, 10105, 10924, 117, 107, 89755, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "The", "July", "index", "match", "##ed", "the", "reading", "for", "July", ",", "1995", "." ], "ids": [ 10117, 11112, 19776, 12356, 10336, 10105, 32432, 10142, 11112, 117, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "greatest", "decline", "##s", "in", "the", "volume", "of", "help", "-", "wanted", "advertising", "were", "in", "the", "New", "England", ",", "Mountain", "and", "West", "South", "Central", "regions", "." ], "ids": [ 10117, 31434, 46695, 10107, 10106, 10105, 15901, 10108, 15217, 118, 22591, 49828, 10309, 10106, 10105, 10287, 11701, 117, 15135, 10111, 11164, 11056, 11885, 21721, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "The", "greatest", "increase", "was", "in", "the", "East", "North", "Central", "region", "." ], "ids": [ 10117, 31434, 20299, 10134, 10106, 10105, 11830, 11225, 11885, 12220, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9 ] }, { "tokens": [ "Police", "seek", "suspect", "##s", "in", "Atlantic", "City", "je", "##wel", "he", "##ist", "." ], "ids": [ 18051, 48394, 97881, 10107, 10106, 16739, 10773, 10144, 20706, 10261, 11293, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##IC", "C", "##IT", "##Y", ",", "N", ".", "J", ".", "1996", "-", "08", "-", "29" ], "ids": [ 30554, 44376, 77261, 30889, 140, 37611, 14703, 117, 151, 119, 147, 119, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Atlantic", "City", "police", "said", "Thursday", "they", "were", "seeking", "two", "men", "and", "two", "women", "in", "connection", "with", "a", "$", "690", ",", "000", "the", "##ft", "of", "je", "##wel", "##ry", "and", "cash", "from", "a", "guest", "of", "the", "Show", "##boat", "Hotel", "and", "Casino", "." ], "ids": [ 16739, 10773, 15034, 12415, 67067, 10689, 10309, 51285, 10551, 10588, 10111, 10551, 13190, 10106, 31671, 10169, 169, 109, 47824, 117, 10259, 10105, 12961, 10108, 10144, 20706, 10908, 10111, 52828, 10188, 169, 26959, 10108, 10105, 13450, 68589, 15411, 10111, 40461, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cap", "##t", "." ], "ids": [ 24069, 10123, 119 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Richard", "Andrews", "said", "police", "were", "seeking", "a", "man", "shown", "on", "a", "hotel", "video", "##ta", "##pe", "carrying", "a", "suit", "##case", "res", "##em", "##bling", "the", "victim", "'", "s", ".", "\"" ], "ids": [ 11118, 29583, 12415, 15034, 10309, 51285, 169, 10817, 19989, 10135, 169, 19157, 12078, 10213, 11355, 39157, 169, 26315, 41621, 39429, 10451, 38245, 10105, 62585, 112, 187, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "want", "to", "talk", "to", "him", ",", "\"", "Andrews", "said", "of", "the", "man", "." ], "ids": [ 12865, 21528, 10114, 31311, 10114, 10957, 117, 107, 29583, 12415, 10108, 10105, 10817, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "second", "man", "and", "two", "women", "also", "were", "being", "sought", "." ], "ids": [ 138, 11132, 10817, 10111, 10551, 13190, 10379, 10309, 11223, 32570, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "the", "##fts", "occurred", "Sunday", "when", "the", "victim", ",", "New", "York", "je", "##wel", "##ry", "whole", "##sale", "##r", "Jerry", "Sc", "##hei", "##n", ",", "left", "three", "suit", "##case", "##s", "in", "a", "close", "##t", "at", "Somerset", "Je", "##well", "##ers", "in", "the", "hotel", "while", "he", "check", "##ed", "out", "." ], "ids": [ 10117, 10105, 105475, 25738, 19731, 10841, 10105, 62585, 117, 10287, 10482, 10144, 20706, 10908, 21047, 88258, 10129, 17686, 55260, 89508, 10115, 117, 12153, 11003, 26315, 41621, 10107, 10106, 169, 16065, 10123, 10160, 35434, 13796, 15862, 10901, 10106, 10105, 19157, 11371, 10261, 43662, 10336, 10950, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "he", "was", "gone", ",", "two", "women", "in", "their", "mid", "-", "t", "##went", "##ies", "and", "an", "older", "man", "entered", "the", "je", "##wel", "##ry", "store", "and", "tried", "to", "dis", "##tract", "store", "owner", "Charles", "McGill", "##ey", "." ], "ids": [ 14600, 10261, 10134, 45041, 117, 10551, 13190, 10106, 10455, 15607, 118, 188, 89835, 11624, 10111, 10151, 18757, 10817, 19226, 10105, 10144, 20706, 10908, 13708, 10111, 27156, 10114, 27920, 94666, 13708, 24414, 10925, 82826, 13005, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9 ] }, { "tokens": [ "When", "Sc", "##hei", "##n", "returned", "two", "of", "the", "suit", "##case", "##s", "were", "missing", "." ], "ids": [ 12242, 55260, 89508, 10115, 14030, 10551, 10108, 10105, 26315, 41621, 10107, 10309, 39542, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "contained", "$", "650", ",", "000", "in", "je", "##wel", "##ry", "and", "$", "40", ",", "000", "in", "cash", ",", "Andrews", "said", "." ], "ids": [ 11696, 31763, 109, 21132, 117, 10259, 10106, 10144, 20706, 10908, 10111, 109, 10533, 117, 10259, 10106, 52828, 117, 29583, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "He", "said", "the", "man", "on", "the", "video", "##ta", "##pe", "did", "not", "match", "the", "description", "given", "by", "the", "je", "##wel", "##ry", "store", "owner", "." ], "ids": [ 10357, 12415, 10105, 10817, 10135, 10105, 12078, 10213, 11355, 12172, 10472, 12356, 10105, 26799, 13507, 10155, 10105, 10144, 20706, 10908, 13708, 24414, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", ".", "J", ".", "Simpson", "hin", "##ts", "at", "more", "supporting", "evidence", "." ], "ids": [ 152, 119, 147, 119, 24582, 19911, 10806, 10160, 10798, 32403, 18713, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jackie", "Frank" ], "ids": [ 30567, 11872 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", ".", "J", ".", "Simpson", "said", "on", "Thursday", "he", "was", "financial", "##ly", "broken", "by", "his", "defence", "against", "murder", "charges", "but", "he", "was", "hope", "##ful", "new", "evidence", "to", "support", "him", "would", "be", "available", "for", "a", "civil", "trial", "next", "month", "." ], "ids": [ 152, 119, 147, 119, 24582, 12415, 10135, 67067, 10261, 10134, 20570, 10454, 36197, 10155, 10226, 47245, 11327, 29448, 31128, 10473, 10261, 10134, 50725, 14446, 10751, 18713, 10114, 13145, 10957, 10894, 10347, 14579, 10142, 169, 14161, 23626, 13451, 14064, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "former", "football", "star", "was", "found", "not", "guilty", "by", "a", "criminal", "trial", "jury", "last", "October", "of", "the", "murders", "of", "his", "former", "wife", ",", "Nicole", "Brown", "Simpson", ",", "and", "her", "friend", ",", "Ronald", "Goldman", ",", "in", "June", "1994", "." ], "ids": [ 10117, 11775, 12485, 16624, 10134, 11823, 10472, 56044, 10155, 169, 30931, 23626, 33182, 12469, 11212, 10108, 10105, 110165, 10108, 10226, 11775, 14384, 117, 27142, 12623, 24582, 117, 10111, 10485, 20104, 117, 21474, 57886, 117, 10106, 11120, 10444, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "now", "faces", "a", "civil", "suit", "brought", "by", "families", "of", "the", "victims", "who", "hold", "him", "responsible", "for", "the", "deaths", "." ], "ids": [ 10357, 11858, 48343, 169, 14161, 26315, 17327, 10155, 15300, 10108, 10105, 41205, 10479, 18500, 10957, 21586, 10142, 10105, 50438, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "told", "reporter", "##s", "a", "court", "order", "not", "to", "talk", "about", "his", "case", "kept", "him", "from", "detail", "##ing", "how", "he", "has", "fu", "##lf", "##ille", "##d", "his", "pl", "##ed", "##ge", "to", "find", "the", "killer", "##s", "." ], "ids": [ 10357, 21937, 41408, 10107, 169, 14866, 12990, 10472, 10114, 31311, 10978, 10226, 13474, 26546, 10957, 10188, 45485, 10230, 14796, 10261, 10393, 11005, 35173, 14420, 10162, 10226, 20648, 10336, 10525, 10114, 17860, 10105, 61976, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "he", "added", "without", "ela", "##bora", "##ting", ",", "\"", "hope", "##fully", "we", "will", "see", "some", "things", "come", "out", "in", "this", "next", "trial", ".", "\"" ], "ids": [ 16976, 10261, 16288, 13663, 12593, 22337, 12141, 117, 107, 50725, 42920, 11951, 11337, 12888, 11152, 24682, 10678, 10950, 10106, 10531, 13451, 23626, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "judge", "in", "the", "civil", "trial", "has", "imposed", "a", "s", "##we", "##eping", "ga", "##g", "order", "that", "pro", "##hib", "##its", "lawyer", "##s", ",", "witnesses", "and", "parties", "to", "the", "case", "from", "discuss", "##ing", "it", "with", "the", "media", "or", "elsewhere", "in", "public", "." ], "ids": [ 10117, 31624, 10106, 10105, 14161, 23626, 10393, 83358, 169, 187, 12577, 79654, 11887, 10240, 12990, 10189, 11284, 76560, 15508, 38055, 10107, 117, 109898, 10111, 18708, 10114, 10105, 13474, 10188, 71695, 10230, 10271, 10169, 10105, 12518, 10345, 60249, 10106, 11683, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "would", "love", "to", "speak", "about", "everything", ",", "\"", "said", "Simpson", ",", "who", "vo", "##wed", "after", "his", "ac", "##qui", "##tta", "##l", "to", "find", "the", "killer", "##s", "and", "offered", "a", "substantial", "re", "##ward", "." ], "ids": [ 107, 146, 10894, 16138, 10114, 41541, 10978, 42536, 117, 107, 12415, 24582, 117, 10479, 12556, 48854, 10662, 10226, 13621, 39639, 12201, 10161, 10114, 17860, 10105, 61976, 10107, 10111, 20841, 169, 50608, 11639, 16988, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "His", "lawyer", "##s", "have", "said", "his", "defence", "in", "the", "civil", "trial", "that", "starts", "Sept", "." ], "ids": [ 11597, 38055, 10107, 10529, 12415, 10226, 47245, 10106, 10105, 14161, 23626, 10189, 33039, 51768, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "17", "will", "be", "that", "he", "did", "not", "kill", "the", "victims", "." ], "ids": [ 10273, 11337, 10347, 10189, 10261, 12172, 10472, 32099, 10105, 41205, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Simpson", "said", "at", "the", "hotel", "news", "conference", "his", "plans", "include", "eventually", "writing", "another", "book", "." ], "ids": [ 24582, 12415, 10160, 10105, 19157, 14424, 25029, 10226, 18195, 12363, 16328, 17637, 12864, 12748, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "added", "that", "he", "has", "had", "job", "offers", "but", "more", "have", "come", "from", "abroad", "than", "at", "home", "." ], "ids": [ 10357, 16288, 10189, 10261, 10393, 10374, 23627, 23818, 10473, 10798, 10529, 10678, 10188, 50901, 11084, 10160, 11816, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "'", "m", "broke", "." ], "ids": [ 107, 146, 112, 181, 30500, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "am", "not", "c", "##ry", "##ing", "the", "blues", "." ], "ids": [ 146, 10392, 10472, 171, 10908, 10230, 10105, 28158, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "can", "get", "along", "just", "fine", ",", "\"", "he", "said", ".", "\"" ], "ids": [ 146, 10944, 15329, 12400, 12820, 13435, 117, 107, 10261, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "What", "##ever", "you", "want", "to", "send", "me", ",", "I", "need", ".", "\"" ], "ids": [ 12489, 23433, 13028, 21528, 10114, 45567, 10911, 117, 146, 17367, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "again", "accused", "the", "news", "media", "of", "er", "##rone", "##ous", "reporting", "on", "his", "case", "but", "did", "not", "signal", "any", "plans", "for", "lawsuit", "##s", "as", "he", "did", "on", "Wednesday", "in", "an", "address", "at", "a", "jam", "-", "pack", "##ed", "Washington", "church", "." ], "ids": [ 10357, 13123, 37303, 10105, 14424, 12518, 10108, 10163, 34962, 13499, 60524, 10135, 10226, 13474, 10473, 12172, 10472, 25495, 11178, 18195, 10142, 83706, 10107, 10146, 10261, 12172, 10135, 57611, 10106, 10151, 32198, 10160, 169, 25694, 118, 78978, 10336, 11586, 14201, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Contra", "##ry", "to", "news", "reports", ",", "Simpson", "said", ",", "he", "has", "received", "support", "from", "both", "black", "##s", "and", "white", "##s", "." ], "ids": [ 62046, 10908, 10114, 14424, 26610, 117, 24582, 12415, 117, 10261, 10393, 12296, 13145, 10188, 11408, 15045, 10107, 10111, 15263, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "again", "dismissed", "charges", "that", "he", "had", "distance", "##d", "himself", "from", "the", "black", "community", "during", "his", "successful", "football", "and", "commercial", "career", ",", "only", "to", "seek", "their", "support", "after", "he", "faced", "murder", "charges", "." ], "ids": [ 10357, 13123, 59379, 31128, 10189, 10261, 10374, 18527, 10162, 14764, 10188, 10105, 15045, 13354, 10939, 10226, 17330, 12485, 10111, 17331, 13021, 117, 10893, 10114, 48394, 10455, 13145, 10662, 10261, 31952, 29448, 31128, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "crowd", "of", "2", ",", "000", "paid", "$", "10", "a", "head", "to", "hear", "the", "former", "star", "running", "back", "for", "the", "Buffalo", "Bills", "professional", "football", "club", "and", "a", "Football", "Hall", "of", "Fame", "member", "on", "Wednesday", "night", "." ], "ids": [ 138, 50059, 10108, 123, 117, 10259, 25938, 109, 10150, 169, 13578, 10114, 62064, 10105, 11775, 16624, 18020, 12014, 10142, 10105, 25990, 99051, 14054, 12485, 11111, 10111, 169, 12499, 11763, 10108, 18033, 12008, 10135, 57611, 16903, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "crowd", "in", "the", "church", "was", "wild", "##ly", "support", "##ive", ",", "show", "##ering", "Simpson", "with", "gift", "##s", "and", "praise", "." ], "ids": [ 10117, 50059, 10106, 10105, 14201, 10134, 32290, 10454, 13145, 11942, 117, 11897, 19232, 24582, 10169, 20592, 10107, 10111, 80753, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "outside", ",", "dozen", "##s", "of", "protest", "##ers", "from", "the", "D", ".", "C", ".", "Coalition", "Against", "Dome", "##stic", "Violence", "called", "for", "the", "church", "to", "support", "victims", "of", "violence", "instead", "." ], "ids": [ 16976, 17555, 117, 84956, 10107, 10108, 36627, 10901, 10188, 10105, 141, 119, 140, 119, 65836, 29809, 63722, 26666, 68412, 11552, 10142, 10105, 14201, 10114, 13145, 41205, 10108, 26342, 17427, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "ad", "##viser", "Morris", "anno", "##unces", "resignation", "." ], "ids": [ 24139, 10840, 54478, 17161, 11671, 79603, 66129, 119 ], "entity": [ "B-PER", "O", "O", "B-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 4, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "29" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Bill", "Clinton", "'", "s", "top", "political", "str", "##ategi", "##st", "Dick", "Morris", "resigned", "on", "Thursday", ",", "saying", "he", "did", "not", "want", "to", "become", "an", "issue", "in", "Clinton", "'", "s", "re", "-", "election", "campaign", "." ], "ids": [ 12811, 13160, 24139, 112, 187, 12364, 13736, 17791, 82956, 10562, 19988, 17161, 34784, 10135, 67067, 117, 22807, 10261, 12172, 10472, 21528, 10114, 13461, 10151, 15557, 10106, 24139, 112, 187, 11639, 118, 13685, 17323, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "written", "statement", ",", "distributed", "by", "the", "Clinton", "campaign", ",", "Morris", "avoid", "##ed", "comment", "on", "published", "allegations", "that", "he", "had", "engaged", "in", "a", "year", "-", "long", "affair", "with", "a", "$", "200", "-", "an", "-", "hour", "pro", "##stitute", "." ], "ids": [ 10167, 169, 13398, 33311, 117, 35123, 10155, 10105, 24139, 17323, 117, 17161, 33253, 10336, 49641, 10135, 12304, 85190, 10189, 10261, 10374, 34377, 10106, 169, 10924, 118, 11695, 63879, 10169, 169, 109, 10777, 118, 10151, 118, 24730, 11284, 69442, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "statement", "from", "Morris", "said", "that", "he", "had", "submitted", "his", "resignation", "on", "Wednesday", "night", ".", "\"" ], "ids": [ 10117, 33311, 10188, 17161, 12415, 10189, 10261, 10374, 58544, 10226, 66129, 10135, 57611, 16903, 119, 107 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "I", "served", "I", "sought", "to", "avoid", "the", "li", "##mel", "##ight", "because", "I", "did", "not", "want", "to", "become", "the", "message", "." ], "ids": [ 14600, 146, 12325, 146, 32570, 10114, 33253, 10105, 11614, 19390, 27521, 12373, 146, 12172, 10472, 21528, 10114, 13461, 10105, 30514, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Now", ",", "I", "res", "##ign", "so", "I", "will", "not", "become", "the", "issue", ",", "\"", "he", "said", "." ], "ids": [ 17121, 117, 146, 39429, 58445, 10380, 146, 11337, 10472, 13461, 10105, 15557, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "announcement", "followed", "a", "report", "in", "the", "weekly", "super", "##market", "tab", "##lo", "##id", "Star", "magazine", ",", "reprinted", "in", "Thursday", "'", "s", "editions", "of", "the", "New", "York", "Post", ",", "that", "the", "married", "ad", "##viser", "had", "hired", "a", "37", "-", "year", "-", "old", "pro", "##stitute", "on", "a", "weekly", "basis", "while", "visiting", "Washington", "to", "ad", "##vise", "Clinton", "on", "his", "re", "-", "election", "campaign", "." ], "ids": [ 10117, 76557, 15689, 169, 17553, 10106, 10105, 33159, 25212, 60336, 100781, 10715, 11249, 11836, 15438, 117, 109298, 10106, 67067, 112, 187, 52699, 10108, 10105, 10287, 10482, 14539, 117, 10189, 10105, 13524, 10840, 54478, 10374, 35444, 169, 11204, 118, 10924, 118, 12898, 11284, 69442, 10135, 169, 33159, 17172, 11371, 48780, 11586, 10114, 10840, 36540, 24139, 10135, 10226, 11639, 118, 13685, 17323, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "will", "not", "subject", "my", "wife", ",", "family", "or", "friends", "to", "the", "sad", "##istic", ",", "vit", "##rio", "##l", "of", "yellow", "journalism", "." ], "ids": [ 107, 146, 11337, 10472, 20036, 15127, 14384, 117, 11365, 10345, 21997, 10114, 10105, 81708, 29025, 117, 29716, 12013, 10161, 10108, 29815, 87910, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "will", "not", "dig", "##ni", "##fy", "such", "journalism", "with", "a", "rep", "##ly", "or", "an", "answer", "." ], "ids": [ 146, 11337, 10472, 80592, 10342, 24203, 11049, 87910, 10169, 169, 76456, 10454, 10345, 10151, 57085, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "never", "will", ",", "\"", "his", "statement", "said", "." ], "ids": [ 146, 14794, 11337, 117, 107, 10226, 33311, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "distributed", "to", "reporter", "##s", "at", "the", "press", "centre", "of", "Clinton", "'", "s", "Democratic", "convention", "headquarters", "just", "hours", "before", "the", "president", "was", "to", "address", "the", "dele", "##gates", "accept", "##ing", "the", "party", "'", "s", "nomination", "for", "a", "second", "four", "-", "year", "term", "in", "the", "White", "House", "." ], "ids": [ 10377, 10134, 35123, 10114, 41408, 10107, 10160, 10105, 21040, 12672, 10108, 24139, 112, 187, 19281, 37812, 28245, 12820, 19573, 11360, 10105, 12931, 10134, 10114, 32198, 10105, 28250, 71675, 45218, 10230, 10105, 14039, 112, 187, 30807, 10142, 169, 11132, 11598, 118, 10924, 13719, 10106, 10105, 12136, 11545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "U", ".", "S", ".", "surgeon", "investigated", "for", "disc", "##ardi", "##ng", "foot", "." ], "ids": [ 158, 119, 156, 119, 105343, 100767, 10142, 27224, 96666, 10376, 24963, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##AR", "##LE", "##ST", "##ON", ",", "S", ".", "C", ".", "1996", "-", "08", "-", "29" ], "ids": [ 39774, 52188, 51036, 32995, 30118, 117, 156, 119, 140, 119, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Health", "officials", "said", "on", "Thursday", "they", "were", "in", "##vesti", "##gating", "the", "discovery", "of", "an", "am", "##putat", "##ed", "foot", "on", "a", "beach", "near", "Charleston", "to", "determine", "whether", "a", "local", "surgeon", "had", "im", "##pro", "##per", "##ly", "dispose", "##d", "of", "in", "##fect", "##ious", "waste", "." ], "ids": [ 15931, 27730, 12415, 10135, 67067, 10689, 10309, 10106, 63996, 91045, 10105, 30419, 10108, 10151, 10392, 57408, 10336, 24963, 10135, 169, 45405, 12883, 52975, 10114, 37284, 21883, 169, 11436, 105343, 10374, 10211, 73099, 12713, 10454, 37386, 10162, 10108, 10106, 84732, 25087, 59158, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "foot", ",", "which", "was", "##hed", "up", "on", "Sullivan", "'", "s", "Island", "beach", "this", "month", ",", "was", "am", "##putat", "##ed", "three", "years", "ago", "from", "a", "child", "whose", "legs", "were", "def", "##orme", "##d", "." ], "ids": [ 10117, 24963, 117, 10319, 10134, 16081, 10741, 10135, 23476, 112, 187, 11848, 45405, 10531, 14064, 117, 10134, 10392, 57408, 10336, 11003, 10855, 36390, 10188, 169, 18048, 16879, 51863, 10309, 100745, 54576, 10162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "foot", "had", "to", "be", "removed", "so", "the", "infant", "could", "be", "fitted", "with", "a", "pro", "##st", "##hes", "##is", "." ], "ids": [ 10117, 24963, 10374, 10114, 10347, 23898, 10380, 10105, 76072, 12174, 10347, 55037, 10169, 169, 11284, 10562, 19904, 10291, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "ort", "##hop", "##edi", "##c", "surgeon", "was", "given", "permission", "by", "the", "child", "'", "s", "parents", "and", "the", "hospital", "to", "keep", "the", "foot", "for", "research", "and", "educational", "purposes", "." ], "ids": [ 10313, 25461, 57654, 32212, 10350, 105343, 10134, 13507, 52389, 10155, 10105, 18048, 112, 187, 17293, 10111, 10105, 18141, 10114, 23819, 10105, 24963, 10142, 14108, 10111, 30848, 36740, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Health", "officials", "said", "the", "surgeon", "told", "authorities", "he", "stored", "the", "foot", "in", "his", "free", "##zer", "at", "home", ",", "but", "the", "free", "##zer", "recently", "broke", "down", "and", "the", "contents", "sp", "##oi", "##led", "." ], "ids": [ 15931, 27730, 12415, 10105, 105343, 21937, 28308, 10261, 70809, 10105, 24963, 10106, 10226, 13961, 14210, 10160, 11816, 117, 10473, 10105, 13961, 14210, 23746, 30500, 12935, 10111, 10105, 97831, 32650, 14638, 16376, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "surgeon", ",", "who", "apo", "##logi", "##sed", "for", "the", "incident", ",", "said", "he", "decided", "to", "put", "the", "foot", "in", "a", "c", "##rab", "trap", "to", "remove", "the", "fl", "##esh", "." ], "ids": [ 10117, 105343, 117, 10479, 34768, 25504, 16219, 10142, 10105, 28005, 117, 12415, 10261, 17270, 10114, 14499, 10105, 24963, 10106, 169, 171, 55645, 72398, 10114, 51600, 10105, 58768, 38806, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "foot", "later", "was", "##hed", "up", "on", "the", "beach", "." ], "ids": [ 10117, 24963, 10873, 10134, 16081, 10741, 10135, 10105, 45405, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Florida", "cop", "dis", "##gui", "##sed", "as", "sh", "##rub", "na", "##bs", "bad", "gu", "##ys", "." ], "ids": [ 13668, 35691, 27920, 55818, 16219, 10146, 48201, 71376, 10132, 19528, 15838, 75980, 12682, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MI", "##AM", "##I", "1996", "-", "08", "-", "29" ], "ids": [ 75416, 36535, 11281, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "a", "bus", "##h", "that", "bag", "##ged", "the", "bad", "gu", "##ys", "." ], "ids": [ 10377, 10134, 169, 19369, 10237, 10189, 56332, 18832, 10105, 15838, 75980, 12682, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "When", "four", "would", "-", "be", "ro", "##bber", "##s", ",", "armed", "and", "mask", "##ed", ",", "showed", "up", "to", "ro", "##b", "a", "Check", "##er", "'", "s", "restaurant", "in", "the", "Fort", "Lau", "##derd", "##ale", "suburb", "of", "Pembroke", "Pine", "##s", "on", "Tuesday", ",", "they", "had", "no", "idea", "the", "sh", "##rub", "near", "the", "drive", "-", "through", "window", "was", "tot", "##ing", "a", "shot", "##gun", "." ], "ids": [ 12242, 11598, 10894, 118, 10347, 25470, 60805, 10107, 117, 34174, 10111, 107425, 10336, 117, 27463, 10741, 10114, 25470, 10457, 169, 50177, 10165, 112, 187, 26234, 10106, 10105, 14326, 73185, 60135, 12223, 54824, 10108, 106678, 45427, 10107, 10135, 70245, 117, 10689, 10374, 10192, 14932, 10105, 48201, 71376, 12883, 10105, 23806, 118, 11222, 39051, 10134, 10697, 10230, 169, 19508, 32657, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Detective", "Earl", "Fe", "##ugi", "##ll", ",", "cam", "##ou", "##f", "##lage", "##d", "as", "a", "sh", "##agg", "##y", "green", "bus", "##h", ",", "ordered", "them", "to", "free", "##ze", ".", "\"" ], "ids": [ 41608, 18877, 20187, 70765, 11231, 117, 88406, 11010, 10575, 20433, 10162, 10146, 169, 48201, 99274, 10157, 23320, 19369, 10237, 117, 23782, 11345, 10114, 13961, 10870, 119, 107 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "were", "quite", "surprise", "##d", ",", "\"", "he", "told", "the", "Miami", "Herald", "." ], "ids": [ 11696, 10309, 31324, 48886, 10162, 117, 107, 10261, 21937, 10105, 17626, 31052, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "Fe", "##ugi", "##ll", "said", "he", "made", "the", "hot", ",", "heavy", "suit", ",", "which", "he", "first", "used", "in", "the", "Marines", ",", "by", "att", "##aching", "strips", "of", "bu", "##rla", "##p", "to", "a", "cam", "##ou", "##f", "##lage", "out", "##fit", "." ], "ids": [ 20187, 70765, 11231, 12415, 10261, 11019, 10105, 29698, 117, 18296, 26315, 117, 10319, 10261, 10422, 11031, 10106, 10105, 52061, 117, 10155, 10788, 97815, 107913, 10108, 11499, 28050, 10410, 10114, 169, 88406, 11010, 10575, 20433, 10950, 48865, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Green", "and", "black", "face", "paint", "completed", "his", "dis", "##gui", "##se", "." ], "ids": [ 13068, 10111, 15045, 13295, 72700, 15782, 10226, 27920, 55818, 10341, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "sta", "##king", "out", "the", "restaurant", "after", "a", "series", "of", "ro", "##bber", "##ies", "at", "local", "fast", "-", "food", "places", "." ], "ids": [ 10357, 10134, 16527, 15629, 10950, 10105, 26234, 10662, 169, 11366, 10108, 25470, 60805, 11624, 10160, 11436, 15040, 118, 18301, 19261, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pembroke", "Pine", "##s", "police", "said", "five", "people", "were", "arrested", "as", "a", "result", "of", "the", "90", "-", "minute", "stake", "##out", ",", "including", "the", "four", "ro", "##bber", "##s", "and", "a", "restaurant", "employee", "who", "was", "allegedly", "prepared", "to", "let", "them", "in", "a", "back", "door", "." ], "ids": [ 106678, 45427, 10107, 15034, 12415, 12403, 11426, 10309, 29479, 10146, 169, 14493, 10108, 10105, 10919, 118, 21760, 90081, 17514, 117, 11198, 10105, 11598, 25470, 60805, 10107, 10111, 169, 26234, 69312, 10479, 10134, 78210, 39837, 10114, 13595, 11345, 10106, 169, 12014, 10522, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "DL", "##A", "sets", "tin", "price", "at", "$", "2", ".", "797", "##5", "per", "lb", "." ], "ids": [ 158, 119, 156, 119, 27956, 10738, 23597, 21629, 30839, 10160, 109, 123, 119, 81665, 11166, 10178, 23989, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "U", ".", "S", ".", "Defense", "Lo", "##gist", "##ics", "Agency", "set", "Thursday", "'", "s", "offering", "price", "for", "stock", "##pil", "##e", "tin", "at", "$", "2", ".", "797", "##5", "per", "lb", ",", "versus", "$", "2", ".", "777", "##5", "per", "lb", "ye", "##ster", "##day", "." ], "ids": [ 10117, 158, 119, 156, 119, 26113, 13069, 77362, 16981, 21887, 11847, 67067, 112, 187, 42281, 30839, 10142, 20511, 30678, 10112, 21629, 10160, 109, 123, 119, 81665, 11166, 10178, 23989, 117, 32412, 109, 123, 119, 45773, 11166, 10178, 23989, 11023, 12765, 24558, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Key", "Clinton", "aide", "res", "##ign", "##s", ",", "NBC", "says", "." ], "ids": [ 21663, 24139, 23135, 39429, 58445, 10107, 117, 21762, 22153, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "29" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dick", "Morris", ",", "the", "Republican", "political", "consultant", "who", "res", "##ha", "##ped", "U", ".", "S", ".", "President", "Bill", "Clinton", "'", "s", "re", "##ele", "##ction", "campaign", ",", "has", "resigned", ",", "MS", "-", "NBC", "News", "reported", "Thursday", "." ], "ids": [ 19988, 17161, 117, 10105, 21776, 13736, 64935, 10479, 39429, 10921, 16898, 158, 119, 156, 119, 12811, 13160, 24139, 112, 187, 11639, 12739, 17530, 17323, 117, 10393, 34784, 117, 21018, 118, 21762, 12219, 15943, 67067, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 2, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9 ] }, { "tokens": [ "Morris", "drew", "the", "ir", "##e", "of", "liberal", "Clinton", "aide", "##s", "for", "rep", "##osi", "##tion", "##ing", "the", "president", "in", "the", "political", "centre", "." ], "ids": [ 17161, 49098, 10105, 10478, 10112, 10108, 28950, 24139, 23135, 10107, 10142, 76456, 20316, 10822, 10230, 10105, 12931, 10106, 10105, 13736, 12672, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "There", "was", "no", "immediate", "comment", "on", "the", "report", "from", "the", "White", "House", "." ], "ids": [ 11723, 10134, 10192, 46938, 49641, 10135, 10105, 17553, 10188, 10105, 12136, 11545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "U", ".", "S", ".", "corn", "g", "##lut", "##en", "me", "##al", "st", "##eady", "-", "higher", ",", "feed", "flat", "." ], "ids": [ 158, 119, 156, 119, 93599, 175, 40846, 10136, 10911, 10415, 28780, 61973, 118, 17981, 117, 44988, 31307, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "29" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "corn", "g", "##lut", "##en", "feed", "prices", "were", "flat", "while", "me", "##al", "values", "were", "st", "##eady", "to", "firme", "##r", "on", "Thursday", "." ], "ids": [ 158, 119, 156, 119, 93599, 175, 40846, 10136, 44988, 57476, 10309, 31307, 11371, 10911, 10415, 31313, 10309, 28780, 61973, 10114, 33563, 10129, 10135, 67067, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "noted", "a", "season", "##al", "pick", "##up", "in", "me", "##al", "demand", "." ], "ids": [ 54521, 10901, 18575, 169, 11226, 10415, 36833, 14590, 10106, 10911, 10415, 34394, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-" ], "ids": [ 118, 118 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "AR", "##EA", "MI", "##LL", "##S", "(", "dollars", "per", "short", "ton", ")" ], "ids": [ 39774, 30889, 109865, 11403, 50884, 36789, 75416, 82834, 10731, 113, 27953, 10178, 13716, 22464, 114 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##lut", "##en", "feed", "21", "p", "##ct", "bulk", "Spot", "-", "117", ".", "00", "un", "##c" ], "ids": [ 144, 40846, 10136, 44988, 10296, 184, 14526, 91415, 97362, 118, 16628, 119, 11025, 10119, 10350 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##lut", "##en", "feed", "pelle", "##ts", "Spot", "-", "un", "##q" ], "ids": [ 144, 40846, 10136, 44988, 100361, 10806, 97362, 118, 10119, 11703 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##lut", "##en", "me", "##al", "60", "p", "##ct", "bulk", "rail", "Spot", "-", "320", ".", "00", "up", "5" ], "ids": [ 144, 40846, 10136, 10911, 10415, 10709, 184, 14526, 91415, 29547, 97362, 118, 18920, 119, 11025, 10741, 126 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DE", "##CA", "##T", "##UR", ",", "IL", "/", "CL", "##IN", "##TO", "##N", "AND", "CE", "##DA", "##R", "RA", "##P", "##ID", "##S", ",", "IA" ], "ids": [ 25067, 46900, 11090, 98348, 117, 37817, 120, 75151, 27128, 60493, 11537, 52428, 31078, 36382, 11273, 64007, 11127, 28895, 10731, 117, 87769 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 1 ] }, { "tokens": [ "G", "##lut", "##en", "feed", "18", "p", "##ct", "pelle", "##ts", "Spot", "-", "117", ".", "00", "un", "##c" ], "ids": [ 144, 40846, 10136, 44988, 10218, 184, 14526, 100361, 10806, 97362, 118, 16628, 119, 11025, 10119, 10350 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "G", "##lut", "##en", "me", "##al", "60", "p", "##ct", "bulk", "Spot", "-", "310", ".", "00", "un", "##c" ], "ids": [ 144, 40846, 10136, 10911, 10415, 10709, 184, 14526, 91415, 97362, 118, 23993, 119, 11025, 10119, 10350 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Chicago", "news", "##des", "##k", "312", "-", "408", "-", "872", "##0", ")" ], "ids": [ 113, 12317, 14424, 10920, 10174, 25104, 118, 36899, 118, 77107, 10929, 114 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EU", "bar", "##ley", "sale", "worth", "$", "145", "/", "T", ",", "for", "Saudi", "-", "sources", "." ], "ids": [ 17751, 18121, 12105, 15488, 43509, 109, 17862, 120, 157, 117, 10142, 26598, 118, 19023, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "European", "Union", "sale", "of", "234", ",", "324", "tonnes", "of", "German", "intervention", "bar", "##ley", "is", "worth", "some", "$", "145", "per", "ton", "##ne", "f", "##ob", "Germany", "and", "is", "mostly", "des", "##tine", "##d", "for", "Saudi", "Arabia", ",", "European", "grain", "sources", "said", "on", "Thursday", "." ], "ids": [ 138, 11914, 11457, 15488, 10108, 24966, 117, 30723, 39435, 10108, 12026, 40152, 18121, 12105, 10124, 43509, 11152, 109, 17862, 10178, 22464, 10238, 174, 31165, 12775, 10111, 10124, 19774, 10139, 28830, 10162, 10142, 26598, 27860, 117, 11914, 69132, 19023, 12415, 10135, 67067, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "EU", "'", "s", "ce", "##real", "##s", "management", "committee", "sold", "234", ",", "324", "tonnes", "of", "German", "intervention", "bar", "##ley", "at", "a", "minimum", "price", "of", "105", ".", "07", "E", "##cus", "per", "ton", "##ne", "." ], "ids": [ 10117, 17751, 112, 187, 10794, 42923, 10107, 17150, 27634, 15337, 24966, 117, 30723, 39435, 10108, 12026, 40152, 18121, 12105, 10160, 169, 26503, 30839, 10108, 14519, 119, 10878, 142, 14319, 10178, 22464, 10238, 119 ], "entity": [ "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Saudi", "Arabia", "provisional", "##ly", "bought", "800", ",", "000", "tonnes", "of", "optional", "-", "origin", "bar", "##ley", "at", "an", "August", "21", "tender", "at", "prices", "between", "$", "160", "and", "$", "162", "including", "cost", ",", "insurance", "and", "freight", ",", "trade", "##rs", "said", "last", "week", "." ], "ids": [ 26598, 27860, 59086, 10454, 28870, 11900, 117, 10259, 39435, 10108, 96645, 118, 22608, 18121, 12105, 10160, 10151, 10735, 10296, 96486, 10160, 57476, 10948, 109, 13849, 10111, 109, 21638, 11198, 18849, 117, 49756, 10111, 75843, 117, 18908, 10943, 12415, 12469, 16118, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "European", "grain", "trade", "##rs", "and", "officials", "said", "the", "Saudi", "##s", "might", "reduce", "the", "purchase", "to", "600", ",", "000", "tonnes", "." ], "ids": [ 16976, 11914, 69132, 18908, 10943, 10111, 27730, 12415, 10105, 26598, 10107, 20970, 29888, 10105, 37891, 10114, 11796, 117, 10259, 39435, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "have", "said", "a", "substantial", "part", "of", "the", "deal", "was", "likely", "to", "come", "from", "the", "European", "Union", ",", "which", "enjoy", "##s", "a", "supply", "and", "freight", "advantage", "over", "other", "producers", "." ], "ids": [ 15006, 10943, 10529, 12415, 169, 50608, 10668, 10108, 10105, 19918, 10134, 22497, 10114, 10678, 10188, 10105, 11914, 11457, 117, 10319, 84874, 10107, 169, 28914, 10111, 75843, 38119, 10491, 10684, 46511, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "sub", "##tract", "##ing", "freight", "costs", ",", "the", "equivalent", "f", "##ob", "price", "of", "the", "deal", "is", "around", "$", "142", ",", "well", "below", "the", "$", "149", "per", "ton", "##ne", "floor", "price", "which", "the", "EU", "put", "on", "its", "bar", "##ley", "as", "news", "of", "the", "deal", "emerged", "last", "week", "." ], "ids": [ 16976, 13987, 94666, 10230, 75843, 34495, 117, 10105, 30647, 174, 31165, 30839, 10108, 10105, 19918, 10124, 12166, 109, 19893, 117, 11206, 17544, 10105, 109, 19438, 10178, 22464, 10238, 23861, 30839, 10319, 10105, 17751, 14499, 10135, 10474, 18121, 12105, 10146, 14424, 10108, 10105, 19918, 50658, 12469, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "Thursday", "the", "EU", "sold", "34", ",", "277", "tonnes", "of", "German", "intervention", "bar", "##ley", "at", "a", "minimum", "price", "of", "109", ".", "36", "E", "##cus", "per", "ton", "##ne", ",", "which", "was", "seen", "as", "worth", "$", "149", "per", "ton", "##ne", "f", "##ob", "." ], "ids": [ 14812, 67067, 10105, 17751, 15337, 11069, 117, 28884, 39435, 10108, 12026, 40152, 18121, 12105, 10160, 169, 26503, 30839, 10108, 16296, 119, 11055, 142, 14319, 10178, 22464, 10238, 117, 10319, 10134, 15652, 10146, 43509, 109, 19438, 10178, 22464, 10238, 174, 31165, 119 ], "entity": [ "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Paris", "news", "##room", "+", "331", "422", "##1", "543", "##2" ], "ids": [ 118, 118, 10728, 14424, 25525, 116, 30690, 38735, 10759, 50268, 10729 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "ship", "##yard", "workers", "march", "against", "job", "cuts", "." ], "ids": [ 11894, 17309, 29629, 23829, 78466, 11327, 23627, 73311, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RE", "##N", "##NE", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 71033, 11537, 93280, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "About", "3", ",", "500", "naval", "ship", "##yard", "workers", "marche", "##d", "in", "the", "centre", "of", "the", "northern", "port", "town", "of", "Cherbourg", "on", "Thursday", "to", "protest", "against", "defence", "rest", "##ru", "##ct", "##uring", ",", "a", "union", "official", "said", "." ], "ids": [ 16260, 124, 117, 10757, 25922, 17309, 29629, 23829, 56229, 10162, 10106, 10105, 12672, 10108, 10105, 17335, 16874, 12221, 10108, 109717, 10135, 67067, 10114, 36627, 11327, 47245, 17333, 11680, 14526, 31653, 117, 169, 20763, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "local", "police", "headquarters", "did", "not", "give", "a", "figure", "but", "said", "1", ",", "800", "workers", "at", "the", "Cherbourg", "year", "##d", "had", "stopped", "work", "." ], "ids": [ 10117, 11436, 15034, 28245, 12172, 10472, 18090, 169, 17527, 10473, 12415, 122, 117, 11900, 23829, 10160, 10105, 109717, 10924, 10162, 10374, 40949, 11424, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "cut", "##back", "plan", "could", "sl", "##im", "their", "numbers", "to", "1", ",", "700", "from", "4", ",", "200", "." ], "ids": [ 138, 21610, 18666, 13065, 12174, 38523, 11759, 10455, 20953, 10114, 122, 117, 12367, 10188, 125, 117, 10777, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Several", "hundred", "workers", "also", "marche", "##d", "in", "the", "western", "town", "of", "Indre", "where", "500", "or", "1", ",", "600", "jobs", "are", "at", "risk", "." ], "ids": [ 28604, 34242, 23829, 10379, 56229, 10162, 10106, 10105, 16672, 12221, 10108, 42484, 10940, 10757, 10345, 122, 117, 11796, 45083, 10301, 10160, 24179, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Pakistan", "-", "August", "29", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 15437, 118, 10735, 10386, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Following", "are", "some", "of", "the", "main", "stories", "in", "Thursday", "'", "s", "Pakistani", "newspapers", ":" ], "ids": [ 18317, 10301, 11152, 10108, 10105, 12126, 21158, 10106, 67067, 112, 187, 66797, 48473, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "DA", "##WN" ], "ids": [ 47855, 105844 ], "entity": [ "B-ORG", "I-ORG" ], "entity_ids": [ 3, 7 ] }, { "tokens": [ "-", "The", "government", "has", "decided", "to", "transfer", "the", "entire", "distribution", "network", "of", "electricity", "to", "foreign", "management", "##s", "to", "curta", "##il", "losses", "of", "billion", "##s", "of", "ru", "##pe", "##es", "." ], "ids": [ 118, 10117, 12047, 10393, 17270, 10114, 21110, 10105, 19192, 18477, 17175, 10108, 55955, 10114, 20796, 17150, 10107, 10114, 51738, 11030, 45353, 10108, 25848, 10107, 10108, 13483, 11355, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "The", "government", "has", "suffered", "a", "loss", "of", "11", "billion", "ru", "##pe", "##es", "due", "to", "tax", "holiday", "##s", "at", "industrial", "estates", "in", "Hub", "and", "Ga", "##do", "##on", "." ], "ids": [ 118, 10117, 12047, 10393, 26090, 169, 18576, 10108, 10193, 25848, 13483, 11355, 10171, 10850, 10114, 25468, 71806, 10107, 10160, 18138, 87704, 10106, 104451, 10111, 69699, 10317, 10263, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 5, 5, 9 ] }, { "tokens": [ "-", "High", "Court", "officials", "have", "une", "##art", "##hed", "police", "-", "run", "human", "ca", "##ges", "at", "Tan", "##do", "Allah", "##yar", "near", "Hyderabad", "." ], "ids": [ 118, 11956, 14100, 27730, 10529, 10231, 15391, 16081, 15034, 118, 14095, 14179, 11135, 13156, 10160, 30594, 10317, 22734, 22953, 12883, 73047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 1, 9 ] }, { "tokens": [ "Some", "27", "people", "were", "rescued", "from", "the", "private", "jail", "set", "up", "by", "the", "police", "." ], "ids": [ 13885, 10365, 11426, 10309, 106435, 10188, 10105, 14591, 75934, 11847, 10741, 10155, 10105, 15034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Opposition", "leader", "Na", "##wa", "##z", "Sharif", "renewed", "a", "pl", "##ed", "##ge", "to", "ou", "##st", "the", "Pakistan", "People", "'", "s", "Party", "government", "headed", "by", "Prime", "Minister", "Ben", "##azi", "##r", "B", "##hut", "##to", "." ], "ids": [ 118, 69053, 15014, 10685, 11037, 10305, 94724, 81783, 169, 20648, 10336, 10525, 10114, 10431, 10562, 10105, 15437, 14235, 112, 187, 12529, 12047, 33336, 10155, 19924, 14355, 13304, 28059, 10129, 139, 46296, 10340, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9 ] }, { "tokens": [ "B", "##US", "##INE", "##SS", "RE", "##CO", "##RD", "##ER" ], "ids": [ 139, 32612, 83198, 49248, 71033, 82272, 84444, 24093 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Gas", "prices", "may", "go", "up", "by", "five", "percent", "to", "increase", "the", "rate", "of", "return", "of", "Sui", "Southern", "Gas", "and", "Sui", "Northern", "Gas", "companies", "." ], "ids": [ 118, 34874, 57476, 11387, 11783, 10741, 10155, 12403, 22362, 10114, 20299, 10105, 18344, 10108, 15079, 10108, 97500, 15120, 34874, 10111, 97500, 15352, 34874, 18866, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "-", "Japan", "is", "import", "##ing", "80", "percent", "of", "cotton", "ya", "##rn", "from", "Pakistan", "every", "year", "." ], "ids": [ 118, 11891, 10124, 67622, 10230, 10832, 22362, 10108, 77946, 10549, 13061, 10188, 15437, 14234, 10924, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "-", "The", "government", "has", "bl", "##amed", "sugar", "tech", "##nol", "##ogist", "##s", "for", "not", "supporting", "a", "long", "-", "term", "programme", "of", "research", "and", "development", "to", "increase", "production", "of", "sugar", "##can", "##e", "." ], "ids": [ 118, 10117, 12047, 10393, 21484, 83865, 60390, 100986, 36941, 100191, 10107, 10142, 10472, 32403, 169, 11695, 118, 13719, 19611, 10108, 14108, 10111, 13405, 10114, 20299, 12116, 10108, 60390, 24154, 10112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##IN", "##AN", "##CI", "##AL", "P", "##OS", "##T" ], "ids": [ 143, 27128, 41275, 89955, 32002, 153, 21793, 11090 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Armed", "ro", "##bber", "##s", "pi", "##lla", "##ged", "70", "barrel", "##s", "of", "c", "##rude", "oil", "from", "a", "well", "near", "G", "##uja", "##r", "Khan", "on", "Wednesday", "." ], "ids": [ 118, 51383, 25470, 60805, 10107, 24109, 11083, 18832, 10923, 93397, 10107, 10108, 171, 97417, 21073, 10188, 169, 11206, 12883, 144, 25989, 10129, 16324, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "-", "Pakistan", "will", "pay", "an", "additional", "bill", "of", "$", "244", "million", "as", "private", "power", "projects", "with", "capacity", "of", "3", ",", "225", "meg", "##awa", "##tt", "go", "on", "-", "line", "by", "1998", "/", "99", "." ], "ids": [ 118, 15437, 11337, 16868, 10151, 18568, 34497, 10108, 109, 27590, 12473, 10146, 14591, 13183, 22846, 10169, 23095, 10108, 124, 117, 20843, 12121, 27593, 11527, 11783, 10135, 118, 12117, 10155, 10363, 120, 12187, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "THE", "NA", "##TION" ], "ids": [ 17443, 56586, 98207 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "-", "The", "government", "is", "facing", "extreme", "difficulties", "in", "meeting", "its", "revenue", "collections", "targets", "for", "1996", "/", "97", "." ], "ids": [ 118, 10117, 12047, 10124, 48237, 42331, 64557, 10106, 19822, 10474, 51557, 31141, 56996, 10142, 10389, 120, 12328, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Mo", "##hib", "Text", "##ile", "Mills", "has", "default", "##ed", "to", "nearly", "23", "development", "finance", "institutions", ",", "foreign", "and", "local", "banks", ",", "lea", "##sing", "companies", "and", "moda", "##raba", "##s", "(", "Islamic", "mutual", "funds", ")", "." ], "ids": [ 118, 34987, 76560, 23701, 12808, 29250, 10393, 66860, 10336, 10114, 21377, 10328, 13405, 48053, 24671, 117, 20796, 10111, 11436, 41375, 117, 20169, 16357, 18866, 10111, 38231, 69020, 10107, 113, 22150, 85412, 32067, 114, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Investment", "Minister", "As", "##if", "Ali", "Za", "##rda", "##ri", "expressed", "keen", "##ness", "for", "a", "close", "working", "relationship", "with", "Japanese", "companies", "so", "that", "investment", "from", "Japan", "can", "multi", "##ply", ".", "q" ], "ids": [ 118, 63254, 14355, 10882, 13918, 13518, 14074, 21285, 10401, 31685, 67605, 14010, 10142, 169, 16065, 14616, 19808, 10169, 13847, 18866, 10380, 10189, 37933, 10188, 11891, 10944, 21247, 59146, 119, 185 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Karachi", "Stock", "Exchange", "index", "falls", "by", "7", ".", "84", "points", "." ], "ids": [ 118, 82344, 31916, 32424, 19776, 35017, 10155, 128, 119, 11761, 12789, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "THE", "NEWS" ], "ids": [ 17443, 109023 ], "entity": [ "B-ORG", "I-ORG" ], "entity_ids": [ 3, 7 ] }, { "tokens": [ "-", "The", "prime", "minister", "'", "s", "special", "economic", "assistant", "Shah", "##id", "Hasan", "Khan", "said", "privat", "##isation", "of", "thermal", "power", "plants", ",", "power", "generation", "from", "private", "plants", "and", "management", "contracts", "of", "Area", "Electric", "##ity", "Board", "##s", "would", "help", "achieve", "6", ".", "5", "percent", "GDP", "growth", "." ], "ids": [ 118, 10117, 19287, 16930, 112, 187, 14478, 13925, 20999, 24496, 11249, 36578, 16324, 12415, 51085, 20312, 10108, 82055, 13183, 21422, 117, 13183, 25601, 10188, 14591, 21422, 10111, 17150, 69690, 10108, 17815, 21142, 11949, 14743, 10107, 10894, 15217, 43250, 127, 119, 126, 22362, 47832, 14609, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Pakistan", "'", "s", "Muslim", "Commercial", "Bank", ",", "Vita", "##l", "Information", "System", ",", "and", "Duff", "and", "Phelps", "of", "the", "U", ".", "S", ".", "are", "likely", "to", "anno", "##unce", "a", "strategic", "alliance", "with", "Bangladesh", "'", "s", "only", "credit", "rating", "company", "-", "-", "Credit", "Rat", "##ing", "and", "Information", "Systems", "Ltd", "-", "-", "next", "month", "." ], "ids": [ 118, 15437, 112, 187, 20428, 51204, 13533, 117, 29650, 10161, 12145, 11512, 117, 10111, 75278, 10111, 97041, 10108, 10105, 158, 119, 156, 119, 10301, 22497, 10114, 11671, 93050, 169, 52009, 36758, 10169, 24080, 112, 187, 10893, 37021, 31035, 12100, 118, 118, 75181, 29839, 10230, 10111, 12145, 18953, 15129, 118, 118, 13451, 14064, 119 ], "entity": [ "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 3, 7, 7, 9, 3, 7, 7, 7, 9, 9, 3, 7, 7, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "The", "Sin", "##dh", "High", "Court", "issued", "an", "ad", "-", "interim", "order", "rest", "##rain", "##ing", "the", "Pri", "##vati", "##sation", "Commission", "from", "hand", "##ing", "over", "Ja", "##veda", "##n", "Ce", "##ment", "to", "Dada", "##bh", "##oy", "Investment", "(", "p", "##vt", ")", "Ltd", "until", "it", "can", "consider", "a", "legal", "challenge", "mounted", "by", "unions", "to", "the", "deal", "." ], "ids": [ 118, 10117, 14563, 20193, 11956, 14100, 21694, 10151, 10840, 118, 63313, 12990, 17333, 32782, 10230, 10105, 30797, 27691, 21603, 14941, 10188, 15230, 10230, 10491, 28248, 74923, 10115, 13338, 10426, 10114, 96558, 39554, 20712, 63254, 113, 184, 36220, 114, 15129, 11444, 10271, 10944, 44856, 169, 17139, 36040, 44709, 10155, 76841, 10114, 10105, 19918, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "THE", "M", "##US", "##L", "##IM" ], "ids": [ 17443, 150, 32612, 11369, 42031 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Pakistan", "and", "Iran", "have", "agreed", "to", "expand", "and", "strength", "##en", "political", ",", "trade", "and", "economic", "relations", "." ], "ids": [ 118, 15437, 10111, 12901, 10529, 25577, 10114, 50188, 10111, 33318, 10136, 13736, 117, 18908, 10111, 13925, 19824, 119 ], "entity": [ "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Islam", "##abad", "news", "##room", "925", "##1", "-", "274", "##7", "##57" ], "ids": [ 118, 118, 14727, 45407, 14424, 25525, 59384, 10759, 118, 28925, 11305, 89156 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sala", "##ng", "tunnel", "re", "##open", "##ed", "linking", "Kabul", "with", "north", "." ], "ids": [ 27162, 10376, 31449, 11639, 47656, 10336, 109784, 33716, 10169, 12756, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "SA", "##LA", "##NG", "TU", "##N", "##NE", "##L", ",", "Afghanistan", "1996", "-", "08", "-", "29" ], "ids": [ 21318, 44376, 34065, 94747, 11537, 93280, 11369, 117, 18776, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Sala", "##ng", "tunnel", "linking", "Kabul", "with", "northern", "Afghanistan", "was", "formally", "re", "##open", "##ed", "to", "traffic", "on", "Thursday", "under", "an", "agreement", "between", "the", "government", "and", "an", "opposition", "militia", ",", "witnesses", "said", "." ], "ids": [ 10117, 27162, 10376, 31449, 109784, 33716, 10169, 17335, 18776, 10134, 43082, 11639, 47656, 10336, 10114, 26482, 10135, 67067, 10571, 10151, 25432, 10948, 10105, 12047, 10111, 10151, 21227, 86957, 117, 109898, 12415, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 1, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "dozen", "##s", "of", "trucks", "began", "moving", "through", "the", "tunnel", "from", "both", "directions", "after", "the", "road", "re", "##open", "##ed", "." ], "ids": [ 11696, 12415, 84956, 10107, 10108, 99669, 11941, 23557, 11222, 10105, 31449, 10188, 11408, 74674, 10662, 10105, 15485, 11639, 47656, 10336, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Sala", "##ng", "tunnel", ",", "the", "main", "supply", "route", "for", "Soviet", "troops", "when", "they", "were", "o", "##ccupy", "##ing", "Afghanistan", "in", "the", "1980s", ",", "had", "been", "closed", "since", "1994", "when", "northern", "militia", "leader", "General", "Abdul", "Rashid", "Dos", "##tum", "rebel", "##led", "against", "the", "Kabul", "government", "." ], "ids": [ 10117, 27162, 10376, 31449, 117, 10105, 12126, 28914, 13933, 10142, 15277, 20836, 10841, 10689, 10309, 183, 104560, 10230, 18776, 10106, 10105, 21215, 117, 10374, 10590, 18440, 11764, 10444, 10841, 17335, 86957, 15014, 11220, 23642, 93828, 23846, 15673, 56696, 16376, 11327, 10105, 33716, 12047, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "Witness", "##es", "said", "w", "##reck", "##ed", "tanks", "and", "vehicles", "litt", "##ered", "both", "sides", "of", "the", "heavily", "-", "mine", "##d", "road", "." ], "ids": [ 103594, 10171, 12415, 191, 80442, 10336, 46731, 10111, 27237, 38301, 45452, 11408, 27263, 10108, 10105, 33556, 118, 27546, 10162, 15485, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mines", "had", "been", "removed", "from", "the", "road", "itself", ",", "but", "experts", "of", "the", "Halo", "Trust", "mine", "clear", "##ance", "agency", "said", "it", "would", "take", "a", "week", "to", "clear", "the", "roads", "##ides", "." ], "ids": [ 58995, 10374, 10590, 23898, 10188, 10105, 15485, 17587, 117, 10473, 47306, 10108, 10105, 67679, 22271, 27546, 24866, 16460, 34649, 12415, 10271, 10894, 13574, 169, 16118, 10114, 24866, 10105, 36970, 17092, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Afghan", "Deputy", "Prime", "Minister", "Q", "##ot", "##bud", "##din", "Hi", "##lal", "off", "##icia", "##ted", "at", "the", "re", "##open", "##ing", "ceremony", ",", "which", "was", "delayed", "by", "several", "hours", "while", "the", "two", "sides", "argued", "about", "a", "mutual", "release", "of", "prisoners", "." ], "ids": [ 82228, 32389, 19924, 14355, 154, 11290, 41276, 15612, 20065, 29267, 11898, 38016, 11912, 10160, 10105, 11639, 47656, 10230, 34713, 117, 10319, 10134, 67058, 10155, 11736, 19573, 11371, 10105, 10551, 27263, 35525, 10978, 169, 85412, 14072, 10108, 44094, 119 ], "entity": [ "B-MISC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Two", "Indians", "to", "die", "for", "killing", "23", "bus", "passengers", "." ], "ids": [ 13214, 33032, 10114, 10128, 10142, 34248, 10328, 19369, 37008, 119 ], "entity": [ "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "DE", "##L", "##HI", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 25067, 11369, 108880, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "'", "s", "Supreme", "Court", "on", "Thursday", "sentenced", "two", "men", "to", "death", "after", "finding", "them", "guilty", "of", "killing", "23", "bus", "passengers", ",", "including", "children", "." ], "ids": [ 11098, 112, 187, 22872, 14100, 10135, 67067, 53365, 10551, 10588, 10114, 12557, 10662, 43977, 11345, 56044, 10108, 34248, 10328, 19369, 37008, 117, 11198, 12694, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "the", "two", ",", "after", "ro", "##bbi", "##ng", "the", "passengers", ",", "bu", "##rn", "##t", "them", "alive", "by", "sp", "##rin", "##kling", "the", "bus", "with", "petrol", "and", "setting", "it", "on", "fire", "in", "the", "southern", "state", "of", "Andhra", "Pradesh", "in", "1993", "." ], "ids": [ 10377, 12415, 10105, 10551, 117, 10662, 25470, 37801, 10376, 10105, 37008, 117, 11499, 13061, 10123, 11345, 57057, 10155, 32650, 13778, 56886, 10105, 19369, 10169, 99435, 10111, 29421, 10271, 10135, 13559, 10106, 10105, 17156, 11388, 10108, 61079, 24530, 10106, 10463, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "no", "doubt", "that", "this", "is", "one", "of", "the", "rares", "##t", "of", "the", "rare", "cases", ",", "not", "merely", "due", "to", "the", "number", "of", "inn", "##ocent", "human", "being", "##s", "ro", "##aste", "##d", "alive", "by", "the", "appel", "##lant", "##s", ",", "but", "the", "in", "##hum", "##an", "manner", "in", "which", "they", "plot", "##ted", "the", "scheme", "and", "executed", "it", ",", "\"", "Justice", "K", ".", "T", ".", "Thomas", "said", "in", "the", "verdi", "##ct", "by", "a", "panel", "of", "three", "judges", "." ], "ids": [ 107, 12865, 10529, 10192, 86697, 10189, 10531, 10124, 10464, 10108, 10105, 55703, 10123, 10108, 10105, 23902, 16480, 117, 10472, 70807, 10850, 10114, 10105, 11487, 10108, 15203, 103528, 14179, 11223, 10107, 25470, 25096, 10162, 57057, 10155, 10105, 38425, 29329, 10107, 117, 10473, 10105, 10106, 43504, 10206, 39750, 10106, 10319, 10689, 32473, 11912, 10105, 41209, 10111, 45955, 10271, 117, 107, 17086, 148, 119, 157, 119, 11096, 12415, 10106, 10105, 37922, 14526, 10155, 169, 36387, 10108, 11003, 56181, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Elephant", "tram", "##ples", "woman", "to", "death", "in", "Nepal", "." ], "ids": [ 78054, 51127, 90467, 18299, 10114, 12557, 10106, 22276, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "KA", "##TH", "##MA", "##ND", "##U", "1996", "-", "08", "-", "29" ], "ids": [ 85314, 109166, 30696, 58521, 12022, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "ra", "##mpa", "##ging", "ele", "##pha", "##nt", "drag", "##ged", "a", "sleep", "##ing", "72", "-", "year", "-", "old", "woman", "from", "her", "bed", "and", "tram", "##ple", "##d", "her", "to", "death", "in", "the", "third", "such", "killing", "in", "two", "months", ",", "Nepal", "police", "said", "on", "Thursday", "." ], "ids": [ 138, 11859, 31285, 13808, 12637, 37590, 10368, 71840, 18832, 169, 63658, 10230, 12120, 118, 10924, 118, 12898, 18299, 10188, 10485, 30113, 10111, 51127, 22238, 10162, 10485, 10114, 12557, 10106, 10105, 12628, 11049, 34248, 10106, 10551, 15555, 117, 22276, 15034, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "ele", "##pha", "##nt", "crashed", "into", "Hari", "Maya", "Po", "##ude", "##ls", "house", "in", "Mad", "##hum", "##alla", "village", "earlier", "this", "week", "while", "she", "was", "asl", "##eep", ",", "they", "said", "." ], "ids": [ 10117, 12637, 37590, 10368, 91126, 10708, 39769, 28734, 11255, 17756, 11747, 13215, 10106, 31301, 43504, 26020, 11607, 18905, 10531, 16118, 11371, 10833, 10134, 24491, 91633, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "be", "##ast", "drag", "##ged", "the", "woman", "30", "feet", "(", "nine", "metres", ")", "away", "from", "her", "bed", "and", "tram", "##ple", "##d", "her", "to", "death", ",", "a", "police", "official", "told", "Reuters", "in", "the", "Himalaya", "##n", "kingdom", "##s", "capital", "Kat", "##hman", "##du", "." ], "ids": [ 10117, 10347, 15171, 71840, 18832, 10105, 18299, 10244, 17296, 113, 19964, 16393, 114, 14942, 10188, 10485, 30113, 10111, 51127, 22238, 10162, 10485, 10114, 12557, 117, 169, 15034, 14731, 21937, 46617, 10106, 10105, 62824, 10115, 12293, 10107, 12185, 85467, 49811, 11460, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 2, 6, 9, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "In", "the", "past", "two", "months", "ele", "##pha", "##nts", "have", "killed", "three", "people", "in", "remote", "areas", "of", "east", "and", "central", "Nepal", "." ], "ids": [ 10167, 10105, 17781, 10551, 15555, 12637, 37590, 14073, 10529, 15875, 11003, 11426, 10106, 55808, 14544, 10108, 13827, 10111, 12397, 22276, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Elephant", "##s", "are", "protected", "under", "Nepal", "##i", "law", ",", "which", "provides", "for", "jail", "sentence", "##s", "of", "up", "to", "15", "years", "for", "convicted", "ele", "##pha", "##nt", "killer", "##s", "." ], "ids": [ 78054, 10107, 10301, 38522, 10571, 22276, 10116, 13255, 117, 10319, 20245, 10142, 75934, 49219, 10107, 10108, 10741, 10114, 10208, 10855, 10142, 61487, 12637, 37590, 10368, 61976, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sri", "Lanka", "##n", "rebels", "over", "##run", "police", "post", ",", "kill", "24", "." ], "ids": [ 16098, 20828, 10115, 57545, 10491, 35794, 15034, 11841, 117, 32099, 10233, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##L", "##OM", "##B", "##O", "1996", "-", "08", "-", "29" ], "ids": [ 32992, 11369, 37079, 11274, 11403, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Tamil", "Tiger", "rebels", "over", "##ran", "an", "isolated", "police", "post", "in", "Sri", "Lanka", "'", "s", "northeast", "early", "on", "Thursday", "killing", "24", "police", "##men", ",", "defence", "officials", "said", "." ], "ids": [ 22489, 25899, 57545, 10491, 12111, 10151, 54622, 15034, 11841, 10106, 16098, 20828, 112, 187, 33002, 11732, 10135, 67067, 34248, 10233, 15034, 11418, 117, 47245, 27730, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "large", "group", "of", "Liberation", "Tigers", "of", "Tamil", "E", "##ela", "##m", "(", "L", "##T", "##TE", ")", "rebels", "storm", "##ed", "the", "Ku", "##da", "##pok", "##una", "police", "post", ",", "just", "north", "of", "We", "##lika", "##nda", ",", "200", "km", "(", "125", "miles", ")", "from", "Colombo", ",", "before", "da", "##wn", ",", "they", "said", "." ], "ids": [ 138, 12077, 11795, 10108, 54766, 38640, 10108, 22489, 142, 15108, 10147, 113, 149, 11090, 29833, 114, 57545, 31642, 10336, 10105, 49869, 10229, 58047, 14212, 15034, 11841, 117, 12820, 12756, 10108, 12865, 35732, 11861, 117, 10777, 10204, 113, 14048, 14148, 114, 10188, 40367, 117, 11360, 10143, 20395, 117, 10689, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "entire", "post", "was", "over", "##run", ",", "\"", "said", "a", "defence", "official", "." ], "ids": [ 107, 10117, 19192, 11841, 10134, 10491, 35794, 117, 107, 12415, 169, 47245, 14731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "was", "not", "immediately", "clear", "if", "there", "were", "any", "casualties", "among", "the", "rebels", ",", "who", "are", "fighting", "for", "independence", "for", "minority", "Tamil", "##s", "in", "the", "Indian", "Ocean", "island", "'", "s", "north", "and", "east", "." ], "ids": [ 10377, 10134, 10472, 24029, 24866, 12277, 11155, 10309, 11178, 69297, 13328, 10105, 57545, 117, 10479, 10301, 27535, 10142, 31412, 10142, 54147, 22489, 10107, 10106, 10105, 12544, 20500, 17354, 112, 187, 12756, 10111, 13827, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "the", "second", "time", "in", "three", "days", "that", "the", "rebels", "attacked", "police", "." ], "ids": [ 10377, 10124, 10105, 11132, 10635, 10106, 11003, 13990, 10189, 10105, 57545, 30272, 15034, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sus", "##pect", "##ed", "Tamil", "Tigers", "on", "Tuesday", "hur", "##led", "hand", "gr", "##ena", "##des", "at", "a", "police", "vehicle", "in", "a", "crowd", "##ed", "market", "in", "the", "army", "-", "controlled", "northern", "town", "of", "Va", "##vun", "##iya", ",", "killing", "at", "least", "two", "police", "##men", "." ], "ids": [ 21241, 51511, 10336, 22489, 38640, 10135, 70245, 52824, 16376, 15230, 30518, 13032, 10920, 10160, 169, 15034, 27404, 10106, 169, 50059, 10336, 17313, 10106, 10105, 17977, 118, 29050, 17335, 12221, 10108, 14723, 61717, 14990, 117, 34248, 10160, 16298, 10551, 15034, 11418, 119 ], "entity": [ "O", "O", "O", "B-MISC", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "a", "dozen", "people", ",", "including", "several", "police", "who", "were", "working", "under", "##cover", ",", "were", "wounded", "in", "the", "attack", "." ], "ids": [ 15946, 11084, 169, 84956, 11426, 117, 11198, 11736, 15034, 10479, 10309, 14616, 10571, 51652, 117, 10309, 39127, 10106, 10105, 16342, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Va", "##vun", "##iya", "is", "just", "south", "of", "the", "northern", "mainland", "area", "controlled", "by", "the", "L", "##T", "##TE", "." ], "ids": [ 14723, 61717, 14990, 10124, 12820, 13144, 10108, 10105, 17335, 70083, 11168, 29050, 10155, 10105, 149, 11090, 29833, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "government", "says", "more", "than", "50", ",", "000", "people", "have", "died", "in", "the", "ethnic", "war", ",", "now", "in", "its", "14th", "year", "." ], "ids": [ 10117, 12047, 22153, 10798, 11084, 10462, 117, 10259, 11426, 10529, 12482, 10106, 10105, 34216, 10338, 117, 11858, 10106, 10474, 38399, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vic", "##orp", "Restaurant", "##s", "names", "Sa", "##bour", "##in", "CF", "##O", "." ], "ids": [ 39574, 72504, 57425, 10107, 17978, 12404, 71527, 10245, 29551, 11403, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 1, 5, 5, 9, 9, 9 ] }, { "tokens": [ "DE", "##NV", "##ER", "1996", "-", "08", "-", "29" ], "ids": [ 25067, 95011, 24093, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Vic", "##orp", "Restaurant", "##s", "Inc", "said", "it", "has", "named", "Richard", "Sa", "##bour", "##in", "as", "executive", "vice", "president", "and", "chief", "financial", "officer", "." ], "ids": [ 39574, 72504, 57425, 10107, 13604, 12415, 10271, 10393, 12038, 11118, 12404, 71527, 10245, 10146, 22676, 16543, 12931, 10111, 19421, 20570, 19288, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "said", "Sa", "##bour", "##in", "is", "the", "former", "president", "and", "chief", "executive", "at", "Best", "##op", "Inc", "of", "Boulder", ",", "Colo", "." ], "ids": [ 10117, 12100, 12415, 12404, 71527, 10245, 10124, 10105, 11775, 12931, 10111, 19421, 22676, 10160, 11730, 13362, 13604, 10108, 82175, 117, 75473, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "B-LOC", "I-LOC" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 1, 9, 1, 5 ] }, { "tokens": [ "It", "said", "Craig", "Held", "has", "also", "joined", "the", "company", "as", "executive", "vice", "president", "and", "chief", "marketing", "officer", "." ], "ids": [ 10377, 12415, 21703, 77764, 10393, 10379, 13914, 10105, 12100, 10146, 22676, 16543, 12931, 10111, 19421, 29465, 19288, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "New", "York", "News", "##des", "##k", "212", "859", "1610" ], "ids": [ 118, 118, 10287, 10482, 12219, 10920, 10174, 22023, 80786, 35360 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 9, 9 ] }, { "tokens": [ "So", "##C", "##al", "Edison", "sees", "2", "power", "lines", "back", "today", "." ], "ids": [ 12882, 10858, 10415, 47272, 41369, 123, 13183, 19515, 12014, 18745, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Southern", "California", "Edison", "Co", "said", "it", "expected", "two", "220", "kilo", "##vol", "##t", "(", "KV", ")", "power", "lines", "in", "southern", "California", "to", "res", "##ume", "service", "later", "today", "after", "being", "shut", "late", "Wednesday", "because", "of", "a", "wild", "##fire", "ra", "##ging", "north", "of", "Los", "Angeles", "." ], "ids": [ 15120, 11621, 47272, 13098, 12415, 10271, 25973, 10551, 15817, 86754, 34381, 10123, 113, 65118, 114, 13183, 19515, 10106, 17156, 11621, 10114, 39429, 20467, 11989, 10873, 18745, 10662, 11223, 70323, 13002, 57611, 12373, 10108, 169, 32290, 38990, 11859, 13808, 12756, 10108, 10630, 12233, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "\"", "They", "are", "expected", "to", "be", "placed", "in", "service", "later", "today", ",", "\"", "said", "company", "spoke", "##sman", "Steve", "Con", "##roy", ",", "adding", "repair", "crew", "##s", "have", "been", "removing", "smoke", "and", "other", "fire", "-", "related", "res", "##idu", "##es", ",", "which", "had", "settled", "on", "the", "two", "lines", "." ], "ids": [ 107, 11696, 10301, 25973, 10114, 10347, 16906, 10106, 11989, 10873, 18745, 117, 107, 12415, 12100, 50005, 24305, 13308, 12845, 29099, 117, 44841, 55583, 24032, 10107, 10529, 10590, 100770, 100332, 10111, 10684, 13559, 118, 16382, 39429, 68617, 10171, 117, 10319, 10374, 29014, 10135, 10105, 10551, 19515, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "shut", "##down", "of", "the", "220", "KV", "lines", "reduced", "by", "500", "meg", "##awa", "##tt", "##s", "(", "MW", ")", "the", "amount", "of", "power", "which", "the", "area", "received", "from", "So", "##C", "##al", "Edison", "'", "s", "1", ",", "200", "MW", "Sierra", "hyd", "##roe", "##lec", "##tric", "facility", ",", "he", "said", "." ], "ids": [ 10117, 70323, 27160, 10108, 10105, 15817, 65118, 19515, 25724, 10155, 10757, 12121, 27593, 11527, 10107, 113, 27042, 114, 10105, 24074, 10108, 13183, 10319, 10105, 11168, 12296, 10188, 12882, 10858, 10415, 47272, 112, 187, 122, 117, 10777, 27042, 16899, 56888, 86564, 42507, 45463, 27774, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##roy", "noted", "two", "500", "KV", "and", "another", "220", "KV", "line", "running", "from", "the", "Sierra", "plant", "to", "Los", "Angeles", "remained", "in", "operation", ",", "and", "continued", "to", "carry", "some", "of", "the", "production", "from", "Sierra", "to", "the", "region", "." ], "ids": [ 12845, 29099, 18575, 10551, 10757, 65118, 10111, 12864, 15817, 65118, 12117, 18020, 10188, 10105, 16899, 16430, 10114, 10630, 12233, 15980, 10106, 20080, 117, 10111, 14278, 10114, 31626, 11152, 10108, 10105, 12116, 10188, 16899, 10114, 10105, 12220, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Monday", ",", "the", "two", "500", "KV", "transmission", "cables", "were", "taken", "out", "of", "service", ",", "also", "for", "clean", "##ing", ",", "for", "about", "a", "day", "." ], "ids": [ 10576, 40714, 117, 10105, 10551, 10757, 65118, 35283, 105024, 10309, 15109, 10950, 10108, 11989, 117, 10379, 10142, 55911, 10230, 117, 10142, 10978, 169, 11940, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##tain", "##ment", "of", "the", "fire", "has", "been", "difficult", "because", "of", "the", "hot", ",", "ari", "##d", ",", "wind", "##y", "weather", "in", "the", "region", ",", "Con", "##roy", "said", "." ], "ids": [ 12845, 37879, 10426, 10108, 10105, 13559, 10393, 10590, 25232, 12373, 10108, 10105, 29698, 117, 57173, 10162, 117, 31346, 10157, 35660, 10106, 10105, 12220, 117, 12845, 29099, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "\"", "The", "fires", "keep", "moving", "back", "because", "of", "the", "winds", ",", "\"", "he", "said", ",", "forcing", "the", "utility", "to", "shut", "those", "transmission", "lines", "for", "a", "second", "time", "this", "week", "." ], "ids": [ 107, 10117, 90350, 23819, 23557, 12014, 12373, 10108, 10105, 63782, 117, 107, 10261, 12415, 117, 75098, 10105, 85410, 10114, 70323, 12676, 35283, 19515, 10142, 169, 11132, 10635, 10531, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Local", "authorities", "charged", "a", "teen", "##ager", "for", "starting", "the", "bl", "##aze", "." ], "ids": [ 22693, 28308, 38253, 169, 33003, 37247, 10142, 21868, 10105, 21484, 85744, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "four", "days", ",", "the", "fire", "destroyed", "20", ",", "000", "acres", "of", "forest", "land", "." ], "ids": [ 10167, 11598, 13990, 117, 10105, 13559, 24089, 10197, 117, 10259, 26043, 10108, 27736, 11773, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "R", "Leon", "##g", ",", "New", "York", "Power", "Des", "##k", "+", "1", "212", "859", "1622" ], "ids": [ 118, 118, 155, 19409, 10240, 117, 10287, 10482, 12952, 13810, 10174, 116, 122, 22023, 80786, 41159 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dreyfus", "Strategic", "Mu", "##nis", "monthly", "$", "0", ".", "056", "/", "sh", "##r", "." ], "ids": [ 86517, 58747, 49056, 12597, 61673, 109, 121, 119, 101451, 120, 48201, 10129, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Monthly" ], "ids": [ 46654 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Late", "##st", "Prior" ], "ids": [ 25139, 10562, 29376 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Am", "##oun", "##t", "$", "0", ".", "056", "$", "0", ".", "056" ], "ids": [ 11500, 43971, 10123, 109, 121, 119, 101451, 109, 121, 119, 101451 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pay", "Sept", "27" ], "ids": [ 88031, 51768, 10365 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Record", "Sept", "13" ], "ids": [ 18814, 51768, 10249 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", ":", "Full", "name", "of", "company", "is", "Dreyfus", "Strategic", "Municipal", "##s", "Inc", "." ], "ids": [ 49307, 29833, 131, 23651, 11324, 10108, 12100, 10124, 86517, 58747, 18069, 10107, 13604, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9 ] }, { "tokens": [ "Sierra", "Semi", "##con", "##ductor", "jump", "##s", "on", "exit", "plan", "." ], "ids": [ 16899, 71467, 23486, 74145, 54941, 10107, 10135, 63827, 13065, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "Wo", "##lk" ], "ids": [ 11235, 102204, 24323 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "SE", "##AT", "##T", "##LE", "1996", "-", "08", "-", "29" ], "ids": [ 23056, 32071, 11090, 51036, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sierra", "Semi", "##con", "##ductor", "Corp", "jump", "##ed", "23", "percent", "Thursday", "on", "the", "ex", "##pect", "##ation", "the", "company", "would", "emerge", "as", "a", "smaller", "but", "more", "profit", "##able", "operation", "after", "its", "planned", "exit", "from", "the", "computer", "mode", "##m", "business", "." ], "ids": [ 16899, 71467, 23486, 74145, 44687, 54941, 10336, 10328, 22362, 67067, 10135, 10105, 11419, 51511, 11809, 10105, 12100, 10894, 99467, 10146, 169, 23309, 10473, 10798, 25081, 13096, 20080, 10662, 10474, 24292, 63827, 10188, 10105, 18765, 18417, 10147, 14155, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "San", "Jose", ",", "Cali", "##f", ".", ",", "company", "was", "up", "2", "-", "1", "/", "8", "at", "11", "-", "3", "/", "8", "after", "its", "announcement", "Wednesday", "that", "it", "planned", "to", "pull", "out", "of", "the", "highly", "competitive", "mode", "##m", "-", "chip", "business", "and", "focus", "instead", "on", "the", "fast", "-", "growing", "market", "for", "computer", "network", "##ing", "equipment", "." ], "ids": [ 10117, 10469, 23029, 117, 65458, 10575, 119, 117, 12100, 10134, 10741, 123, 118, 122, 120, 129, 10160, 10193, 118, 124, 120, 129, 10662, 10474, 76557, 57611, 10189, 10271, 24292, 10114, 80870, 10950, 10108, 10105, 22625, 49836, 18417, 10147, 118, 64008, 14155, 10111, 23195, 17427, 10135, 10105, 15040, 118, 25566, 17313, 10142, 18765, 17175, 10230, 24518, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Certain", "##ly", "the", "company", "will", "be", "a", "much", "smaller", "company", "now", ",", "but", "it", "will", "be", "a", "more", "profit", "##able", "business", ",", "\"", "said", "anal", "##yst", "Elias", "Mo", "##osa", "of", "Rob", "##erst", "##on", "Stephens", "&", "Co", "." ], "ids": [ 107, 96888, 10454, 10105, 12100, 11337, 10347, 169, 13172, 23309, 12100, 11858, 117, 10473, 10271, 11337, 10347, 169, 10798, 25081, 13096, 14155, 117, 107, 12415, 106615, 62769, 35824, 34987, 14271, 10108, 20386, 51915, 10263, 54509, 111, 13098, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "But", "anal", "##yst", "##s", "noted", "that", "Sierra", "still", "has", "much", "pain", "##ful", "work", "ahead", "of", "it", ",", "including", "cutting", "as", "many", "as", "150", "jobs", "from", "its", "work", "##force", ",", "which", "currently", "has", "500", "people", ",", "and", "building", "up", "the", "business", "of", "its", "PMC", "-", "Sierra", "unit", ",", "which", "makes", "ro", "##uting", "devices", "and", "chip", "##set", "##s", "for", "high", "-", "speed", "computer", "networks", "." ], "ids": [ 16976, 106615, 62769, 10107, 18575, 10189, 16899, 12647, 10393, 13172, 38576, 14446, 11424, 35629, 10108, 10271, 117, 11198, 63039, 10146, 11299, 10146, 11766, 45083, 10188, 10474, 11424, 39910, 117, 10319, 15313, 10393, 10757, 11426, 117, 10111, 12585, 10741, 10105, 14155, 10108, 10474, 24254, 118, 16899, 16511, 117, 10319, 20562, 25470, 92609, 38120, 10111, 64008, 14488, 10107, 10142, 11846, 118, 19085, 18765, 44570, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "has", "announced", "plans", "to", "take", "a", "charge", "against", "earning", "##s", "of", "$", "50", "million", "to", "$", "80", "million", "to", "write", "down", "the", "value", "of", "assets", "and", "inventor", "##ies", "and", "cover", "sever", "##ance", "payments", "." ], "ids": [ 10117, 12100, 10393, 13854, 18195, 10114, 13574, 169, 18163, 11327, 56981, 10107, 10108, 109, 10462, 12473, 10114, 109, 10832, 12473, 10114, 28685, 12935, 10105, 19211, 10108, 51701, 10111, 63204, 11624, 10111, 16068, 76521, 16460, 99417, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Scott", "Randall", "of", "Sound", "##view", "Financial", "Group", "said", "the", "company", "likely", "would", "have", "difficulty", "selling", "its", "mode", "##m", "-", "chip", "business", "." ], "ids": [ 12812, 41629, 10108, 17432, 30512, 30738, 12054, 12415, 10105, 12100, 22497, 10894, 10529, 66178, 30870, 10474, 18417, 10147, 118, 64008, 14155, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Once", "you", "anno", "##unce", "your", "intention", "to", "exit", "a", "business", ",", "it", "becomes", "a", "complete", "buy", "##er", "'", "s", "market", ",", "\"", "he", "said", "." ], "ids": [ 107, 23075, 13028, 11671, 93050, 20442, 41241, 10114, 63827, 169, 14155, 117, 10271, 23785, 169, 17876, 47715, 10165, 112, 187, 17313, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "he", "said", "that", "while", "the", "company", "is", "focusing", "on", "the", "fastest", "-", "growing", "part", "of", "its", "business", ",", "the", "market", "for", "network", "##ing", "chip", "##s", "has", "begun", "to", "attract", "the", "attention", "of", "much", "-", "larger", "players", "such", "as", "International", "Business", "Machines", "Corp", "." ], "ids": [ 12689, 10261, 12415, 10189, 11371, 10105, 12100, 10124, 74117, 10135, 10105, 61823, 118, 25566, 10668, 10108, 10474, 14155, 117, 10105, 17313, 10142, 17175, 10230, 64008, 10107, 10393, 49510, 10114, 96721, 10105, 21341, 10108, 13172, 118, 20434, 16021, 11049, 10146, 10771, 15281, 101213, 44687, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "\"", "As", "the", "market", "develops", "the", "question", "is", ",", "are", "they", "able", "to", "make", "that", "transition", "to", "be", "a", "much", "larger", "company", "?", "\"" ], "ids": [ 107, 10882, 10105, 17313, 109914, 10105, 20210, 10124, 117, 10301, 10689, 16197, 10114, 13086, 10189, 35959, 10114, 10347, 169, 13172, 20434, 12100, 136, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Randall", "said", "." ], "ids": [ 41629, 12415, 119 ], "entity": [ "B-PER", "O", "O" ], "entity_ids": [ 4, 9, 9 ] }, { "tokens": [ "Other", "anal", "##yst", "##s", "were", "more", "bu", "##llis", "##h", ",", "even", "though", "the", "company", "is", "expected", "to", "sh", "##rin", "##k", "to", "slightly", "more", "than", "half", "its", "current", "size", "in", "sales", "." ], "ids": [ 14490, 106615, 62769, 10107, 10309, 10798, 11499, 44417, 10237, 117, 13246, 15102, 10105, 12100, 10124, 25973, 10114, 48201, 13778, 10174, 10114, 31603, 10798, 11084, 13877, 10474, 14978, 15851, 10106, 23857, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "a", "positive", "strategic", "move", ",", "\"", "said", "Miles", "Kan", "of", "Ham", "##bre", "##cht", "&", "Qui", "##st", "." ], "ids": [ 107, 10377, 112, 187, 169, 19737, 52009, 18577, 117, 107, 12415, 23603, 57528, 10108, 39135, 13724, 11640, 111, 35921, 10562, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "\"", "The", "mode", "##m", "business", "is", "a", "low", "-", "margin", ",", "com", "##mo", "##dity", "business", ",", "\"", "he", "said", "." ], "ids": [ 107, 10117, 18417, 10147, 14155, 10124, 169, 15626, 118, 53388, 117, 10212, 11033, 100060, 14155, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "company", "'", "s", "PMC", "-", "Sierra", "unit", "generated", "$", "33", "million", "of", "the", "company", "'", "s", "$", "117", "million", "in", "sales", "in", "the", "first", "half", "of", "the", "year", ",", "compared", "with", "$", "45", "million", "in", "sales", "of", "mode", "##m", "chip", "##s", ",", "Kan", "said", "." ], "ids": [ 10117, 12100, 112, 187, 24254, 118, 16899, 16511, 48918, 109, 11000, 12473, 10108, 10105, 12100, 112, 187, 109, 16628, 12473, 10106, 23857, 10106, 10105, 10422, 13877, 10108, 10105, 10924, 117, 25626, 10169, 109, 10827, 12473, 10106, 23857, 10108, 18417, 10147, 64008, 10107, 117, 57528, 12415, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "But", "the", "PMC", "unit", "is", "far", "more", "profit", "##able", ",", "he", "said", "." ], "ids": [ 16976, 10105, 24254, 16511, 10124, 13301, 10798, 25081, 13096, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sierra", "'", "s", "stock", "has", "fallen", "from", "a", "high", "of", "nearly", "$", "25", "this", "year", "as", "the", "computer", "chip", "sector", "has", "been", "bat", "##tere", "##d", "by", "falling", "prices", "and", "concern", "about", "slow", "##ing", "demand", "." ], "ids": [ 16899, 112, 187, 20511, 10393, 40055, 10188, 169, 11846, 10108, 21377, 109, 10258, 10531, 10924, 10146, 10105, 18765, 64008, 17417, 10393, 10590, 11519, 45417, 10162, 10155, 54756, 57476, 10111, 43607, 10978, 41573, 10230, 34394, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Seattle", "bureau", "206", "-", "386", "-", "484", "##8" ], "ids": [ 118, 118, 20902, 32340, 21717, 118, 37194, 118, 44884, 11396 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "House", "##cal", "##l", "shares", "sin", "##k", "after", "profit", "warning", "." ], "ids": [ 11545, 15794, 10161, 45751, 10795, 10174, 10662, 25081, 70990, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "in", "home", "health", "##care", "services", "company", "House", "##cal", "##l", "Medical", "Resources", "Inc", "fell", "more", "than", "50", "percent", "on", "Thursday", "after", "the", "company", "said", "it", "expected", "a", "net", "loss", "for", "the", "fiscal", "fourth", "quarter", "." ], "ids": [ 106583, 11234, 10106, 11816, 17004, 22277, 12639, 12100, 11545, 15794, 10161, 18363, 33513, 13604, 25194, 10798, 11084, 10462, 22362, 10135, 67067, 10662, 10105, 12100, 12415, 10271, 25973, 169, 11988, 18576, 10142, 10105, 43645, 16918, 28330, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Morgan", "Stanley", "said", "it", "down", "##grade", "##d", "the", "stock", "to", "under", "##per", "##form", "from", "out", "##per", "##form", "." ], "ids": [ 17133, 15400, 12415, 10271, 12935, 82892, 10162, 10105, 20511, 10114, 10571, 12713, 19757, 10188, 10950, 12713, 19757, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "House", "##cal", "##l", "was", "off", "7", "-", "3", "/", "8", "to", "7", "-", "1", "/", "8", "in", "morning", "trading", "." ], "ids": [ 11545, 15794, 10161, 10134, 11898, 128, 118, 124, 120, 129, 10114, 128, 118, 122, 120, 129, 10106, 28757, 46663, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Atlanta", "-", "based", "company", "went", "public", "in", "April", "at", "$", "16", "a", "share", "." ], "ids": [ 10117, 19600, 118, 11610, 12100, 13446, 11683, 10106, 10780, 10160, 109, 10250, 169, 23867, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wall", "Street", "had", "expected", "the", "company", "to", "earn", "$", "0", ".", "17", "a", "share", "in", "its", "fourth", "quarter", ",", "ended", "June", "30", ",", "according", "to", "First", "Call", "." ], "ids": [ 19523, 11962, 10374, 25973, 10105, 12100, 10114, 65065, 109, 121, 119, 10273, 169, 23867, 10106, 10474, 16918, 28330, 117, 18428, 11120, 10244, 117, 18071, 10114, 12128, 23553, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "House", "##cal", "##l", "said", "fourth", "quarter", "earning", "##s", "and", "revenue", "##s", "were", "expected", "to", "fall", "short", "of", "ex", "##pectations", "." ], "ids": [ 11545, 15794, 10161, 12415, 16918, 28330, 56981, 10107, 10111, 51557, 10107, 10309, 25973, 10114, 18042, 13716, 10108, 11419, 96815, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "said", "its", "non", "-", "Medi", "##care", "in", "##fus", "##ion", "therapy", ",", "hos", "##pice", "and", "nur", "##sing", "services", "businesses", "failed", "to", "meet", "budget", "##ed", "revenue", "##s", "." ], "ids": [ 10377, 12415, 10474, 10446, 118, 41512, 22277, 10106, 55729, 11046, 49619, 117, 16569, 55265, 10111, 11354, 16357, 12639, 37766, 20775, 10114, 23267, 25293, 10336, 51557, 10107, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "also", "cited", "a", "limita", "##tion", "on", "Medi", "##care", "rei", "##mbu", "##rse", "##ment", "for", "some", "services", "provided", "during", "the", "quarter", "." ], "ids": [ 10377, 10379, 41164, 169, 54877, 10822, 10135, 41512, 22277, 14243, 61109, 16239, 10426, 10142, 11152, 12639, 16491, 10939, 10105, 28330, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "Alliance", "net", "income", "sl", "##ips", "." ], "ids": [ 12128, 21892, 11988, 18245, 38523, 77593, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IR", "##VI", "##NE", ",", "Cali", "##f", ".", "1996", "-", "08", "-", "29" ], "ids": [ 86851, 90939, 93280, 117, 65458, 10575, 119, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "Alliance", "Corporation", "and", "Sub", "##sid", "##iar", "##ies" ], "ids": [ 12128, 21892, 14456, 10111, 24358, 34396, 21501, 11624 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "Quarter", "ended", "June", "30", "Six", "Month", "##s", "ended", "June", "30" ], "ids": [ 75820, 18428, 11120, 10244, 20615, 88633, 10107, 18428, 11120, 10244 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1996", "1995", "1996", "1995" ], "ids": [ 10389, 10436, 10389, 10436 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Una", "##udi", "##ted" ], "ids": [ 12148, 35772, 11912 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Total", "revenue" ], "ids": [ 25220, 51557 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "17", ",", "024", ",", "000", "18", ",", "174", ",", "000", "31", ",", "834", ",", "000", "24", ",", "137", ",", "000" ], "ids": [ 10273, 117, 81201, 117, 10259, 10218, 117, 22767, 117, 10259, 10413, 117, 84229, 117, 10259, 10233, 117, 18948, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "ex", "##pense" ], "ids": [ 25220, 11419, 34711 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "7", ",", "718", ",", "000", "6", ",", "828", ",", "000", "14", ",", "668", ",", "000", "13", ",", "09", "##1", ",", "000" ], "ids": [ 128, 117, 61768, 117, 10259, 127, 117, 57721, 117, 10259, 10247, 117, 44832, 117, 10259, 10249, 117, 11035, 10759, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "Inc", "##ome", "9", ",", "167", ",", "000", "11", ",", "175", ",", "000", "16", ",", "909", ",", "000", "10", ",", "880", ",", "000" ], "ids": [ 32577, 13604, 22451, 130, 117, 20905, 117, 10259, 10193, 117, 18101, 117, 10259, 10250, 117, 75018, 117, 10259, 10150, 117, 41418, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "Inc", "##ome", "Per" ], "ids": [ 32577, 13604, 22451, 11982 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##re", "0", ".", "86", "1", ".", "05", "1", ".", "59", "1", ".", "02" ], "ids": [ 106583, 10246, 121, 119, 12224, 122, 119, 10831, 122, 119, 11867, 122, 119, 10983 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wei", "##ght", "##ed", "average", "number", "of" ], "ids": [ 37343, 20687, 10336, 13551, 11487, 10108 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "shares", "outstanding" ], "ids": [ 45751, 53933 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "10", ",", "650", ",", "407", "10", ",", "650", ",", "407", "10", ",", "650", ",", "407", "10", ",", "650", ",", "407" ], "ids": [ 10150, 117, 21132, 117, 35907, 10150, 117, 21132, 117, 35907, 10150, 117, 21132, 117, 35907, 10150, 117, 21132, 117, 35907 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "Forma", ":" ], "ids": [ 14021, 49386, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Historical", "income", "before", "income" ], "ids": [ 17177, 18245, 11360, 18245 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "tax", "provision" ], "ids": [ 25468, 76386 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "9", ",", "306", ",", "000", "11", ",", "346", ",", "000", "17", ",", "166", ",", "000", "11", ",", "046", ",", "000" ], "ids": [ 130, 117, 26114, 117, 10259, 10193, 117, 36972, 117, 10259, 10273, 117, 21505, 117, 10259, 10193, 117, 77305, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "forma", "income", "tax" ], "ids": [ 14021, 11041, 18245, 25468 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "provision", "3", ",", "820", ",", "000", "4", ",", "658", ",", "000", "7", ",", "047", ",", "000", "4", ",", "534", ",", "000" ], "ids": [ 76386, 124, 117, 45443, 117, 10259, 125, 117, 66841, 117, 10259, 128, 117, 108614, 117, 10259, 125, 117, 43177, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "forma", "net" ], "ids": [ 14021, 11041, 11988 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "income", "5", ",", "486", ",", "000", "6", ",", "688", ",", "000", "10", ",", "119", ",", "000", "6", ",", "512", ",", "000" ], "ids": [ 18245, 126, 117, 35333, 117, 10259, 127, 117, 52468, 117, 10259, 10150, 117, 17963, 117, 10259, 127, 117, 29957, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "forma", "net", "income" ], "ids": [ 14021, 11041, 11988, 18245 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "per", "share", "0", ".", "37", "0", ".", "45", "0", ".", "68", "0", ".", "44" ], "ids": [ 10178, 23867, 121, 119, 11204, 121, 119, 10827, 121, 119, 12370, 121, 119, 11126 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Pro", "forma", "weight", "##ed", "average" ], "ids": [ 14021, 11041, 25512, 10336, 13551 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "number", "of", "shares" ], "ids": [ 11487, 10108, 45751 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "outstanding", "14", ",", "775", ",", "000", "14", ",", "775", ",", "000", "14", ",", "775", ",", "000", "14", ",", "775", ",", "000" ], "ids": [ 53933, 10247, 117, 61416, 117, 10259, 10247, 117, 61416, 117, 10259, 10247, 117, 61416, 117, 10259, 10247, 117, 61416, 117, 10259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oasis", "singer", "heads", "for", "U", ".", "S", ".", "after", "illness", "." ], "ids": [ 80898, 17956, 42399, 10142, 158, 119, 156, 119, 10662, 56507, 119 ], "entity": [ "B-ORG", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Liam", "Gallagher", ",", "singer", "of", "Britain", "'", "s", "top", "rock", "group", "Oasis", ",", "flew", "out", "on", "Thursday", "to", "join", "the", "band", "three", "days", "after", "the", "start", "of", "its", "U", ".", "S", ".", "tour", "." ], "ids": [ 48437, 63580, 117, 17956, 10108, 16032, 112, 187, 12364, 12249, 11795, 80898, 117, 64284, 10950, 10135, 67067, 10114, 23707, 10105, 11570, 11003, 13990, 10662, 10105, 15148, 10108, 10474, 158, 119, 156, 119, 12842, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 1, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9 ] }, { "tokens": [ "Gallagher", "made", "his", "usual", "ob", "##sce", "##ne", "ge", "##stu", "##res", "and", "s", "##wo", "##re", "at", "journalists", "as", "he", "prepared", "to", "fly", "from", "London", "'", "s", "Heath", "##row", "airport", "to", "Chicago", "." ], "ids": [ 63580, 11019, 10226, 49176, 17339, 24176, 10238, 46503, 19987, 11234, 10111, 187, 16828, 10246, 10160, 85851, 10146, 10261, 39837, 10114, 26155, 10188, 10829, 112, 187, 42676, 21454, 28460, 10114, 12317, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "I", "hat", "##e", "you", "f", ".", ".", ".", "ing", "lot", ",", "yet", "you", "'", "re", "always", "asking", "me", "too", "many", "things", "." ], "ids": [ 107, 146, 11250, 10112, 13028, 174, 119, 119, 119, 11600, 19826, 117, 21833, 13028, 112, 11639, 19540, 72082, 10911, 16683, 11299, 24682, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "'", "m", "not", "a", "super", "##mo", "##del", "you", "know", ",", "\"", "he", "said", "." ], "ids": [ 146, 112, 181, 10472, 169, 25212, 11033, 14494, 13028, 21852, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "On", "Monday", ",", "just", "15", "minutes", "before", "his", "flight", "was", "due", "to", "de", "##part", ",", "Liam", "decided", "not", "to", "travel", "with", "the", "rest", "of", "the", "group", ",", "which", "includes", "his", "brother", "Noel", "." ], "ids": [ 10576, 40714, 117, 12820, 10208, 15304, 11360, 10226, 23578, 10134, 10850, 10114, 10104, 48433, 117, 48437, 17270, 10472, 10114, 23595, 10169, 10105, 17333, 10108, 10105, 11795, 117, 10319, 15433, 10226, 15739, 38588, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9 ] }, { "tokens": [ "Liam", "caught", "a", "taxi", "back", "to", "London", "saying", "he", "had", "\"", "problems", "at", "home", "\"", "." ], "ids": [ 48437, 39797, 169, 72231, 12014, 10114, 10829, 22807, 10261, 10374, 107, 20390, 10160, 11816, 107, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "was", "believed", "to", "be", "suffering", "from", "lar", "##yn", "##git", "##is", "and", "said", "he", "had", "to", "go", "house", "-", "hunting", "with", "actress", "girlfriend", "Pat", "##sy", "Ken", "##sit", "." ], "ids": [ 10357, 10134, 20718, 10114, 10347, 49552, 10188, 37818, 13379, 26264, 10291, 10111, 12415, 10261, 10374, 10114, 11783, 13215, 118, 57232, 10169, 24268, 77877, 24714, 16105, 19355, 24132, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9 ] }, { "tokens": [ "When", "they", "first", "heard", "that", "Liam", "had", "not", "flow", "##n", "out", "with", "the", "band", "at", "the", "start", "of", "the", "tour", ",", "many", "U", ".", "S", ".", "fans", "asked", "for", "ref", "##unds", "on", "their", "concert", "tickets", "." ], "ids": [ 12242, 10689, 10422, 32240, 10189, 48437, 10374, 10472, 30676, 10115, 10950, 10169, 10105, 11570, 10160, 10105, 15148, 10108, 10105, 12842, 117, 11299, 158, 119, 156, 119, 20950, 22151, 10142, 48056, 105361, 10135, 10455, 19418, 94567, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "group", "began", "the", "U", ".", "S", ".", "tour", ",", "which", "is", "scheduled", "to", "last", "until", "September", "18", ",", "with", "a", "concert", "in", "Chicago", "on", "Tuesday", "at", "which", "Noel", "Gallagher", "filled", "in", "for", "his", "brother", "as", "lead", "singer", "." ], "ids": [ 10117, 11795, 11941, 10105, 158, 119, 156, 119, 12842, 117, 10319, 10124, 34081, 10114, 12469, 11444, 10596, 10218, 117, 10169, 169, 19418, 10106, 12317, 10135, 70245, 10160, 10319, 38588, 63580, 39287, 10106, 10142, 10226, 15739, 10146, 14107, 17956, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##lou", "##gh", "Estate", "##s", "helps", "lift", "property", "sector", "." ], "ids": [ 156, 37925, 15774, 47642, 10107, 58170, 63376, 18381, 17417, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "strong", "set", "of", "interim", "results", "and", "an", "up", "##beat", "out", "##lo", "##ok", "from", "S", "##lou", "##gh", "Estate", "##s", "Pl", "##c", "helped", "to", "bo", "##ost", "the", "property", "sector", "on", "Thursday", "." ], "ids": [ 138, 18093, 11847, 10108, 63313, 17466, 10111, 10151, 10741, 68939, 10950, 10715, 11140, 10188, 156, 37925, 15774, 47642, 10107, 48932, 10350, 20890, 10114, 20506, 18239, 10105, 18381, 17417, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "in", "S", "##lou", "##gh", ",", "which", "earlier", "announced", "a", "14", "percent", "rise", "in", "first", "-", "half", "pret", "##ax", "profit", "to", "37", ".", "4", "million", "st", "##g", ",", "climb", "##ed", "nearly", "six", "percent", ",", "or", "14", "##p", "to", "250", "pen", "##ce", "at", "100", "##9", "GMT", ",", "while", "British", "Land", "added", "12", "-", "1", "/", "2", "##p", "to", "468", "##p", ",", "Land", "Sec", "##urities", "rose", "5", "-", "1", "/", "2", "##p", "to", "691", "##p", "and", "Hammer", "##son", "was", "8", "##p", "higher", "at", "390", "." ], "ids": [ 106583, 11234, 10106, 156, 37925, 15774, 117, 10319, 18905, 13854, 169, 10247, 22362, 28710, 10106, 10422, 118, 13877, 49775, 31691, 25081, 10114, 11204, 119, 125, 12473, 28780, 10240, 117, 93274, 10336, 21377, 12449, 22362, 117, 10345, 10247, 10410, 10114, 12214, 66558, 10419, 10160, 10407, 11373, 20362, 117, 11371, 11160, 12001, 16288, 10186, 118, 122, 120, 123, 10410, 10114, 47121, 10410, 117, 12001, 109754, 82073, 29467, 126, 118, 122, 120, 123, 10410, 10114, 38236, 10410, 10111, 34765, 11599, 10134, 129, 10410, 17981, 10160, 28323, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "said", "positive", "comment", "from", "investment", "banks", "Merrill", "Lynch", "and", "SB", "##C", "War", "##burg", "also", "fuel", "##ed", "the", "gains", "." ], "ids": [ 15006, 10943, 12415, 19737, 49641, 10188, 37933, 41375, 59905, 32703, 10111, 64669, 10858, 11277, 12248, 10379, 30550, 10336, 10105, 92193, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "deal", "##er", "said", "positive", "stan", "##ces", "from", "Merrill", "Lynch", "and", "SB", "##C", "War", "##burg", "were", "the", "key", "factors", "behind", "the", "gains", "." ], "ids": [ 11340, 19918, 10165, 12415, 19737, 45244, 14585, 10188, 59905, 32703, 10111, 64669, 10858, 11277, 12248, 10309, 10105, 18444, 31075, 17155, 10105, 92193, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "spoke", "##sman", "for", "Merrill", "Lynch", "said", "the", "bank", "was", "preparing", "to", "issue", "a", "note", "on", "the", "sector", ".", "\"" ], "ids": [ 138, 50005, 24305, 10142, 59905, 32703, 12415, 10105, 19423, 10134, 90798, 10114, 15557, 169, 19864, 10135, 10105, 17417, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "We", "have", "been", "very", "positive", "(", "on", "property", ")", ",", "\"", "he", "said", ",", "adding", ":", "\"", "On", "a", "technical", "basis", "it", "is", "our", "most", "favour", "##ed", "sector", ".", "\"" ], "ids": [ 12865, 10529, 10590, 12558, 19737, 113, 10135, 18381, 114, 117, 107, 10261, 12415, 117, 44841, 131, 107, 10576, 169, 29914, 17172, 10271, 10124, 17446, 10992, 61264, 10336, 17417, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SB", "##C", "War", "##burg", "issued", "an", "update", "on", "the", "property", "sector", "on", "Thursday", ",", "saying", "that", "most", "of", "the", "prediction", "##s", "it", "made", "at", "the", "start", "of", "the", "year", "were", "being", "real", "##ised", "." ], "ids": [ 64669, 10858, 11277, 12248, 21694, 10151, 35896, 10135, 10105, 18381, 17417, 10135, 67067, 117, 22807, 10189, 10992, 10108, 10105, 78089, 10107, 10271, 11019, 10160, 10105, 15148, 10108, 10105, 10924, 10309, 11223, 13486, 20666, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "In", "the", "property", "market", "it", "is", "a", "case", "of", "so", "far", ",", "so", "good", ",", "\"", "a", "member", "of", "SB", "##C", "War", "##burg", "'", "s", "property", "team", "said", "." ], "ids": [ 107, 10167, 10105, 18381, 17313, 10271, 10124, 169, 13474, 10108, 10380, 13301, 117, 10380, 15198, 117, 107, 169, 12008, 10108, 64669, 10858, 11277, 12248, 112, 187, 18381, 11121, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SB", "##C", "War", "##burg", "said", "it", "is", "maintaining", "its", "for", "##eca", "##st", "for", "five", "percent", "growth", "in", "renta", "##l", "income", "##s", "during", "1996", ",", "but", "it", "has", "sh", "##ave", "##d", "its", "for", "##eca", "##st", "for", "capital", "growth", "to", "five", "percent", "from", "six", "." ], "ids": [ 64669, 10858, 11277, 12248, 12415, 10271, 10124, 72508, 10474, 10142, 33588, 10562, 10142, 12403, 22362, 14609, 10106, 79105, 10161, 18245, 10107, 10939, 10389, 117, 10473, 10271, 10393, 48201, 23641, 10162, 10474, 10142, 33588, 10562, 10142, 12185, 14609, 10114, 12403, 22362, 10188, 12449, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "spoke", "##sman", "said", "SB", "##C", "War", "##burg", "has", "also", "put", "an", "\"", "add", "\"", "re", "##com", "##mend", "##ation", "on", "S", "##lou", "##gh", "Estate", "##s", "'", "shares", ",", "but", "added", "that", "this", "\"", "is", "a", "general", "move", ",", "not", "because", "of", "the", "results", ".", "\"" ], "ids": [ 10117, 50005, 24305, 12415, 64669, 10858, 11277, 12248, 10393, 10379, 14499, 10151, 107, 42852, 107, 11639, 22530, 101480, 11809, 10135, 156, 37925, 15774, 47642, 10107, 112, 45751, 117, 10473, 16288, 10189, 10531, 107, 10124, 169, 11389, 18577, 117, 10472, 12373, 10108, 10105, 17466, 119, 107 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", "##lou", "##gh", "'", "s", "chairman", "Sir", "Nigel", "Mo", "##bb", "##s", "added", "to", "the", "bu", "##llis", "##h", "mo", "##od", "in", "the", "sector", ",", "saying", "in", "a", "statement", "that", "\"", "with", "the", "pro", "##spect", "of", "a", "period", "of", "st", "##eady", "economic", "growth", "and", "low", "inflation", "ahead", ",", "there", "is", "good", "reason", "to", "believe", "that", "the", "property", "sector", "should", "continue", "its", "improvement", ".", "\"" ], "ids": [ 156, 37925, 15774, 112, 187, 27627, 12852, 40668, 34987, 14496, 10107, 16288, 10114, 10105, 11499, 44417, 10237, 46912, 12680, 10106, 10105, 17417, 117, 22807, 10106, 169, 33311, 10189, 107, 10169, 10105, 11284, 77229, 10108, 169, 13127, 10108, 28780, 61973, 13925, 14609, 10111, 15626, 105888, 35629, 117, 11155, 10124, 15198, 27949, 10114, 30587, 10189, 10105, 18381, 17417, 14819, 17734, 10474, 70010, 119, 107 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Jonathan", "Bir", "##t", ",", "London", "News", "##room", "+", "44", "171", "542", "771", "##7" ], "ids": [ 118, 118, 16395, 19319, 10123, 117, 10829, 12219, 25525, 116, 11126, 22478, 51620, 65580, 11305 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Canada", "'", "s", "international", "travel", "account", "gap", "sh", "##rin", "##ks", "." ], "ids": [ 11635, 112, 187, 12533, 23595, 23200, 55995, 48201, 13778, 11676, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "O", "##T", "##TA", "##WA", "1996", "-", "08", "-", "29" ], "ids": [ 152, 11090, 24951, 42196, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Higher", "spending", "by", "foreign", "visitors", "and", "less", "Canadian", "tourist", "spending", "abroad", "cut", "the", "deficit", "in", "Canada", "'", "s", "international", "travel", "account", "by", "26", ".", "5", "percent", "in", "the", "second", "quarter", ",", "Statistics", "Canada", "said", "on", "Thursday", "." ], "ids": [ 35471, 51163, 10155, 20796, 44291, 10111, 15306, 14023, 61431, 51163, 50901, 21610, 10105, 107383, 10106, 11635, 112, 187, 12533, 23595, 23200, 10155, 10314, 119, 126, 22362, 10106, 10105, 11132, 28330, 117, 18499, 11635, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "deficit", "fell", "to", "a", "season", "##ally", "ad", "##justed", "C", "$", "715", "million", "in", "the", "second", "quarter", "from", "C", "$", "973", "million", "in", "the", "first", ",", "as", "foreign", "##ers", "spent", "a", "record", "C", "$", "3", ".", "00", "billion", "season", "##ally", "ad", "##justed", "while", "Canadian", "##s", "reduced", "their", "spending", "abroad", "by", "5", ".", "1", "percent", "to", "C", "$", "3", ".", "72", "billion", "." ], "ids": [ 10117, 107383, 25194, 10114, 169, 11226, 19777, 10840, 101762, 140, 109, 56036, 12473, 10106, 10105, 11132, 28330, 10188, 140, 109, 56468, 12473, 10106, 10105, 10422, 117, 10146, 20796, 10901, 18571, 169, 12410, 140, 109, 124, 119, 11025, 25848, 11226, 19777, 10840, 101762, 11371, 14023, 10107, 25724, 10455, 51163, 50901, 10155, 126, 119, 122, 22362, 10114, 140, 109, 124, 119, 12120, 25848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Reuters", "Ottawa", "Bu", "##rea", "(", "613", ")", "235", "-", "674", "##5" ], "ids": [ 118, 118, 46617, 13731, 11916, 13236, 113, 52305, 114, 21862, 118, 46075, 11166 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jordan", "##ian", "PM", "Ka", "##bari", "##ti", "meets", "Ara", "##fat", "in", "West", "Bank", "." ], "ids": [ 16366, 11630, 46161, 25444, 73840, 10325, 40427, 54789, 25616, 10106, 11164, 13533, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 9, 4, 8, 8, 9, 4, 8, 9, 1, 5, 9 ] }, { "tokens": [ "RAM", "##AL", "##LA", "##H", ",", "West", "Bank", "1996", "-", "08", "-", "29" ], "ids": [ 39604, 32002, 44376, 12396, 117, 11164, 13533, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jordan", "##ian", "Prime", "Minister", "Abdul", "-", "Karim", "al", "-", "Ka", "##bari", "##ti", "began", "talks", "with", "Palestinian", "President", "Ya", "##sser", "Ara", "##fat", "in", "the", "West", "Bank", "on", "Thursday", "on", "the", "stal", "##led", "Middle", "East", "peace", "process", ",", "officials", "said", "." ], "ids": [ 16366, 11630, 19924, 14355, 23642, 118, 71139, 10164, 118, 25444, 73840, 10325, 11941, 56672, 10169, 56119, 12811, 25148, 33519, 54789, 25616, 10106, 10105, 11164, 13533, 10135, 67067, 10135, 10105, 17844, 16376, 15441, 11830, 28101, 15138, 117, 27730, 12415, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ka", "##bari", "##ti", "flew", "by", "helicopter", "to", "Palestinian", "-", "ruled", "Rama", "##llah", "and", "after", "a", "brief", "arrival", "ceremony", "went", "into", "talks", "with", "Ara", "##fat", "." ], "ids": [ 25444, 73840, 10325, 64284, 10155, 80634, 10114, 56119, 118, 34920, 42746, 98134, 10111, 10662, 169, 29040, 40285, 34713, 13446, 10708, 56672, 10169, 54789, 25616, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 2, 6, 6, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "The", "prime", "minister", "'", "s", "visit", ",", "his", "first", "trip", "outside", "the", "country", "since", "Jordan", "was", "sh", "##aken", "by", "food", "rio", "##ts", "earlier", "this", "month", ",", "came", "against", "the", "back", "##dro", "##p", "of", "a", "Palestinian", "general", "strike", "in", "the", "West", "Bank", "and", "Gaza", "." ], "ids": [ 10117, 19287, 16930, 112, 187, 27541, 117, 10226, 10422, 37307, 17555, 10105, 12723, 11764, 16366, 10134, 48201, 46251, 10155, 18301, 27244, 10806, 18905, 10531, 14064, 117, 13383, 11327, 10105, 12014, 26252, 10410, 10108, 169, 56119, 11389, 37456, 10106, 10105, 11164, 13533, 10111, 42434, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ "Ara", "##fat", "called", "the", "four", "-", "hour", "strike", ",", "which", "ended", "at", "no", "##on", "(", "090", "##0", "GMT", ")", "to", "protest", "against", "Israeli", "policy", "on", "settlements", "and", "Jerusalem", "." ], "ids": [ 54789, 25616, 11552, 10105, 11598, 118, 24730, 37456, 117, 10319, 18428, 10160, 10192, 10263, 113, 98472, 10929, 20362, 114, 10114, 36627, 11327, 28446, 14368, 10135, 55959, 10111, 20599, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Jordan", "'", "s", "official", "state", "news", "agency", "Petra", "said", "Ka", "##bari", "##ti", "would", "hold", "discussions", "\"", "on", "the", "latest", "developments", "in", "the", "peace", "process", "and", "bila", "##teral", "cooperation", "\"", "." ], "ids": [ 16366, 112, 187, 14731, 11388, 14424, 34649, 27357, 12415, 25444, 73840, 10325, 10894, 18500, 66608, 107, 10135, 10105, 50908, 74475, 10106, 10105, 28101, 15138, 10111, 12517, 98161, 56547, 107, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iran", "says", "five", "sp", "##y", "networks", "destroyed", ",", "41", "held", "." ], "ids": [ 12901, 22153, 12403, 32650, 10157, 44570, 24089, 117, 11349, 11991, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##E", "##H", "##RA", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 157, 11259, 12396, 29990, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Iranian", "security", "forces", "have", "broken", "up", "five", "es", "##pion", "##age", "rings", "in", "northwestern", "Iran", "and", "arrested", "41", "people", "on", "charges", "of", "sp", "##ying", "for", "un", "##named", "countries", ",", "a", "daily", "newspaper", "said", "on", "Thursday", "." ], "ids": [ 41768, 21849, 13729, 10529, 36197, 10741, 12403, 10196, 75256, 12276, 90937, 10106, 89929, 12901, 10111, 29479, 11349, 11426, 10135, 31128, 10108, 32650, 40018, 10142, 10119, 95196, 15911, 117, 169, 27636, 22047, 12415, 10135, 67067, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jo", "##mh", "##uri", "Es", "##lami", "quoted", "the", "West", "Azerbaijan", "province", "security", "chief", "as", "saying", "those", "held", "con", "##fes", "##sed", "to", "gathering", "con", "##fi", "##dent", "##ial", "information", ",", "photo", "##graph", "##ing", "strategic", "sites", ",", "doing", "propaganda", "against", "state", "officials", "and", "\"", "spread", "##ing", "pan", "-", "Turki", "##sm", "\"", "." ], "ids": [ 20977, 34927, 13091, 10912, 80761, 70676, 10105, 11164, 28810, 14342, 21849, 19421, 10146, 22807, 12676, 11991, 10173, 58058, 16219, 10114, 88666, 10173, 14403, 21029, 15619, 12929, 117, 38171, 28176, 10230, 52009, 16055, 117, 30918, 34510, 11327, 11388, 27730, 10111, 107, 25609, 10230, 24960, 118, 37978, 19534, 107, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9 ] }, { "tokens": [ "It", "was", "not", "clear", "if", "they", "were", "the", "same", "five", "sp", "##y", "rings", ",", "allegedly", "led", "by", "Turkish", "diplomat", "##s", ",", "that", "Iran", "said", "in", "April", "it", "had", "broken", "up", "in", "the", "same", "area", ",", "which", "borders", "Turkey", "." ], "ids": [ 10377, 10134, 10472, 24866, 12277, 10689, 10309, 10105, 11561, 12403, 32650, 10157, 90937, 117, 78210, 12857, 10155, 22814, 45652, 10107, 117, 10189, 12901, 12415, 10106, 10780, 10271, 10374, 36197, 10741, 10106, 10105, 11561, 11168, 117, 10319, 47360, 22519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "April", "arrest", "##s", "were", "announced", "shortly", "after", "a", "row", "in", "which", "Tehran", "asked", "Ankara", "to", "withdraw", "four", "Turkish", "diplomat", "##s", "accused", "of", "sp", "##ying", ",", "and", "Turkey", "expelled", "four", "Iranian", "diplomat", "##s", "for", "their", "alleged", "links", "to", "killing", "##s", "of", "Iranian", "exile", "##s", "." ], "ids": [ 10117, 10780, 45165, 10107, 10309, 13854, 31555, 10662, 169, 45006, 10106, 10319, 73520, 22151, 23883, 10114, 100987, 11598, 22814, 45652, 10107, 37303, 10108, 32650, 40018, 117, 10111, 22519, 90811, 11598, 41768, 45652, 10107, 10142, 10455, 48164, 23608, 10114, 34248, 10107, 10108, 41768, 67696, 10107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9 ] }, { "tokens": [ "Tie", "##s", "between", "the", "two", "nei", "##gh", "##bours", ",", "strain", "##ed", "also", "over", "a", "military", "accord", "between", "Turkey", "and", "Israel", "which", "drew", "strong", "Iranian", "object", "##ions", ",", "have", "improved", "since", "Islam", "##ist", "Ne", "##cm", "##etti", "##n", "Er", "##bakan", "took", "over", "as", "Turkish", "prime", "minister", "in", "June", "." ], "ids": [ 70825, 10107, 10948, 10105, 10551, 11888, 15774, 97497, 117, 110158, 10336, 10379, 10491, 169, 14041, 35233, 10948, 22519, 10111, 12991, 10319, 49098, 18093, 41768, 29331, 15880, 117, 10529, 34605, 11764, 14727, 11293, 19416, 27528, 21985, 10115, 10915, 91850, 12149, 10491, 10146, 22814, 19287, 16930, 10106, 11120, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 2, 6, 4, 8, 8, 8, 8, 8, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "daily", "Iran", "on", "Thursday", "quoted", "Intelligence", "Minister", "Ali", "Fall", "##ahi", "##yan", "as", "saying", "agents", "arrested", "137", "people", "for", "allegedly", "sp", "##ying", "for", "Iraq", ",", "the", "United", "States", "and", "other", "un", "##named", "countries", "in", "the", "Iranian", "year", "which", "ended", "on", "March", "19", "." ], "ids": [ 10117, 27636, 12901, 10135, 67067, 70676, 28854, 14355, 13518, 15750, 100962, 15976, 10146, 22807, 32124, 29479, 18948, 11426, 10142, 78210, 32650, 40018, 10142, 21455, 117, 10105, 10609, 10859, 10111, 10684, 10119, 95196, 15911, 10106, 10105, 41768, 10924, 10319, 18428, 10135, 11144, 10270, 119 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mid", "##eas", "##t", "Gulf", "oil", "out", "##lo", "##ok", "-", "India", "holds", "the", "key", "." ], "ids": [ 42234, 42658, 10123, 28239, 21073, 10950, 10715, 11140, 118, 11098, 28278, 10105, 18444, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "D", "##UB", "##A", "##I", "1996", "-", "08", "-", "29" ], "ids": [ 141, 82439, 10738, 11281, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "will", "continue", "to", "hold", "the", "key", "to", "the", "middle", "dis", "##til", "##lates", "product", "market", "in", "the", "Middle", "East", "Gulf", "in", "the", "short", "term", ",", "trade", "##rs", "in", "the", "region", "said", "on", "Thursday", "." ], "ids": [ 11098, 11337, 17734, 10114, 18500, 10105, 18444, 10114, 10105, 20181, 27920, 19156, 67580, 21535, 17313, 10106, 10105, 15441, 11830, 28239, 10106, 10105, 13716, 13719, 117, 18908, 10943, 10106, 10105, 12220, 12415, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "said", "premiu", "##ms", "on", "high", "quality", "jet", "ker", "##osen", "##e", "have", "wide", "##ned", "to", "around", "$", "1", ",", "and", "are", "likely", "to", "remain", "strong", "in", "the", "near", "term", "." ], "ids": [ 11696, 12415, 93244, 12387, 10135, 11846, 21905, 48504, 53628, 90150, 10112, 10529, 18064, 17021, 10114, 12166, 109, 122, 117, 10111, 10301, 22497, 10114, 25430, 18093, 10106, 10105, 12883, 13719, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "On", "the", "jet", "ker", "##osen", "##e", "side", "we", "must", "be", "ca", "##uti", "##ous", "about", "quality", "." ], "ids": [ 107, 10576, 10105, 48504, 53628, 90150, 10112, 12250, 11951, 14982, 10347, 11135, 19065, 13499, 10978, 21905, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "are", "commanding", "a", "very", "good", "premiu", "##m", "of", "95", "cents", "to", "one", "dollar", "." ], "ids": [ 13885, 10301, 93644, 169, 12558, 15198, 93244, 10147, 10108, 11978, 63487, 10114, 10464, 34807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "'", "s", "been", "99", "cents", "to", "Korea", "." ], "ids": [ 10377, 112, 187, 10590, 12187, 63487, 10114, 14096, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "This", "will", "stay", "at", "this", "sort", "of", "price", "premiu", "##m", "for", "a", "while", ",", "\"", "one", "said", "." ], "ids": [ 10747, 11337, 29597, 10160, 10531, 20363, 10108, 30839, 93244, 10147, 10142, 169, 11371, 117, 107, 10464, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "But", "for", "normal", "jet", "the", "weak", "##ened", "demand", "is", "quite", "notice", "##able", ",", "the", "premiu", "##m", "is", "around", "45", "-", "50", "cents", "." ], "ids": [ 107, 16976, 10142, 16626, 48504, 10105, 61285, 27867, 34394, 10124, 31324, 48323, 13096, 117, 10105, 93244, 10147, 10124, 12166, 10827, 118, 10462, 63487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "differential", "is", "not", "normally", "as", "wide", "as", "this", ",", "\"", "he", "added", "." ], "ids": [ 10117, 90959, 10124, 10472, 48252, 10146, 18064, 10146, 10531, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Another", "put", "the", "premiu", "##m", "for", "jet", "ker", "##osen", "##e", "at", "between", "65", "and", "75", "cents", "." ], "ids": [ 17101, 14499, 10105, 93244, 10147, 10142, 48504, 53628, 90150, 10112, 10160, 10948, 10843, 10111, 11417, 63487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "trade", "##r", "said", "despite", "the", "fact", "that", "some", "ker", "##osen", "##e", "was", "in", "storage", "at", "Dubai", "ports", ",", "demand", "looked", "to", "ex", "##ceed", "supply", "in", "the", "near", "term", "." ], "ids": [ 11340, 18908, 10129, 12415, 22087, 10105, 18638, 10189, 11152, 53628, 90150, 10112, 10134, 10106, 38112, 10160, 35250, 47650, 117, 34394, 59822, 10114, 11419, 66390, 28914, 10106, 10105, 12883, 13719, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jet", "ker", "##osen", "##e", "was", "ass", "##esse", "##d", "at", "$", "27", ".", "40", "-", "$", "27", ".", "70", "a", "barrel", "f", "##ob", "Gulf", "on", "Thursday", ",", "up", "from", "$", "27", ".", "22", "last", "week", "." ], "ids": [ 39933, 53628, 90150, 10112, 10134, 13935, 24641, 10162, 10160, 109, 10365, 119, 10533, 118, 109, 10365, 119, 10923, 169, 93397, 174, 31165, 28239, 10135, 67067, 117, 10741, 10188, 109, 10365, 119, 10306, 12469, 16118, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "expected", "premiu", "##ms", "to", "stick", "around", "current", "levels", "for", "the", "next", "two", "or", "three", "weeks", ",", "before", "they", "get", "a", "bo", "##ost", "in", "the", "second", "half", "of", "September", "from", "demand", "for", "October", "cargo", "##es", "." ], "ids": [ 54521, 10901, 25973, 93244, 12387, 10114, 84081, 12166, 14978, 21559, 10142, 10105, 13451, 10551, 10345, 11003, 20750, 117, 11360, 10689, 15329, 169, 20506, 18239, 10106, 10105, 11132, 13877, 10108, 10596, 10188, 34394, 10142, 11212, 15856, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gas", "oil", ",", "ass", "##esse", "##d", "at", "$", "24", ".", "00", "-", "$", "24", ".", "20", "a", "barrel", "f", "##ob", "Gulf", ",", "was", "little", "changed", "on", "Thursday", "from", "last", "week", "'", "s", "$", "24", ".", "10", "-", "$", "24", ".", "24", "." ], "ids": [ 34874, 21073, 117, 13935, 24641, 10162, 10160, 109, 10233, 119, 11025, 118, 109, 10233, 119, 10197, 169, 93397, 174, 31165, 28239, 117, 10134, 16745, 17695, 10135, 67067, 10188, 12469, 16118, 112, 187, 109, 10233, 119, 10150, 118, 109, 10233, 119, 10233, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "On", "gas", "oil", ",", "in", "the", "near", "term", "demand", "and", "supply", "are", "balance", "##d", "to", "a", "bit", "short", ",", "there", "are", "some", "en", "##qui", "##ries", "into", "east", "Africa", "and", "short", "covering", "in", "India", ",", "\"", "said", "one", "trade", "##r", "." ], "ids": [ 107, 10576, 16091, 21073, 117, 10106, 10105, 12883, 13719, 34394, 10111, 28914, 10301, 40162, 10162, 10114, 169, 17684, 13716, 117, 11155, 10301, 11152, 10110, 39639, 15388, 10708, 13827, 12880, 10111, 13716, 41810, 10106, 11098, 117, 107, 12415, 10464, 18908, 10129, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "The", "Indians", "have", "awarded", "three", "cargo", "##es", ",", "but", "the", "question", "is", "whether", "they", "will", "come", "out", "for", "more", ",", "\"", "he", "added", "." ], "ids": [ 107, 10117, 33032, 10529, 16150, 11003, 15856, 10171, 117, 10473, 10105, 20210, 10124, 21883, 10689, 11337, 10678, 10950, 10142, 10798, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "India", "has", "acquired", "120", ",", "000", "tonnes", "of", "diesel", "in", "three", "cargo", "##es", ",", "bound", "for", "the", "west", "coast", ",", "in", "its", "October", "tender", "." ], "ids": [ 11098, 10393, 21011, 12048, 117, 10259, 39435, 10108, 40233, 10106, 11003, 15856, 10171, 117, 46538, 10142, 10105, 13735, 22216, 117, 10106, 10474, 11212, 96486, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "said", "the", "award", "could", "be", "India", "'", "s", "lowest", "in", "recent", "years", "." ], "ids": [ 15006, 10943, 12415, 10105, 17725, 12174, 10347, 11098, 112, 187, 55702, 10106, 19037, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "After", "IOC", "'", "s", "very", "small", "purchase", "of", "120", ",", "000", "tonnes", ",", "I", "'", "m", "still", "sus", "##pic", "##ious", "that", "they", "will", "buy", "more", "in", "the", "second", "half", "of", "October", ",", "\"", "another", "said", "." ], "ids": [ 107, 11301, 26423, 112, 187, 12558, 12474, 37891, 10108, 12048, 117, 10259, 39435, 117, 146, 112, 181, 12647, 10846, 34891, 25087, 10189, 10689, 11337, 47715, 10798, 10106, 10105, 11132, 13877, 10108, 11212, 117, 107, 12864, 12415, 119 ], "entity": [ "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "trade", "##rs", "see", "the", "market", "remaining", "tight", "in", "the", "short", "-", "term", ",", "with", "some", "sur", "##plus", "ari", "##sing", "closer", "to", "October", "." ], "ids": [ 16976, 18908, 10943, 12888, 10105, 17313, 21448, 85202, 10106, 10105, 13716, 118, 13719, 117, 10169, 11152, 10326, 70413, 57173, 16357, 54561, 10114, 11212, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "see", "an", "over", "##hang", "of", "gas", "oil", "further", "out", ",", "\"", "one", "said", "." ], "ids": [ 107, 146, 12888, 10151, 10491, 30222, 10108, 16091, 21073, 14586, 10950, 117, 107, 10464, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Gas", "oil", "will", "remain", "tight", "in", "the", "short", "term", "up", "to", "mid", "-", "September", "with", "the", "premiu", "##m", "of", "around", "$", "1", "for", "0", ".", "5", "percent", "(", "sul", "##ph", "##ur", "material", ")", "." ], "ids": [ 107, 34874, 21073, 11337, 25430, 85202, 10106, 10105, 13716, 13719, 10741, 10114, 15607, 118, 10596, 10169, 10105, 93244, 10147, 10108, 12166, 109, 122, 10142, 121, 119, 126, 22362, 113, 12037, 28088, 10546, 13540, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "second", "half", "of", "September", "and", "October", "we", "see", "the", "premiu", "##m", "coming", "off", "to", "70", "-", "75", "cents", ".", "\"" ], "ids": [ 10167, 10105, 11132, 13877, 10108, 10596, 10111, 11212, 11951, 12888, 10105, 93244, 10147, 23959, 11898, 10114, 10923, 118, 11417, 63487, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "##rs", "said", "there", "was", "not", "much", "demand", "for", "one", "percent", "sul", "##ph", "##ur", "material", "gas", "oil", ",", "with", "the", "premiu", "##m", "at", "40", "to", "45", "cents", "." ], "ids": [ 15006, 10943, 12415, 11155, 10134, 10472, 13172, 34394, 10142, 10464, 22362, 12037, 28088, 10546, 13540, 16091, 21073, 117, 10169, 10105, 93244, 10147, 10160, 10533, 10114, 10827, 63487, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egypt", "police", "catch", "ancient", "manuscript", "thi", "##eves", "." ], "ids": [ 20440, 15034, 61093, 21226, 32036, 24106, 56591, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##IR", "##O", "1996", "-", "08", "-", "29" ], "ids": [ 24707, 73522, 11403, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egyptian", "police", "have", "arrested", "eight", "people", "who", "were", "trying", "to", "sell", "an", "ancient", "copy", "of", "the", "Old", "Testament", ",", "the", "official", "al", "-", "Ak", "##h", "##bar", "newspaper", "said", "on", "Thursday", "." ], "ids": [ 34624, 15034, 10529, 29479, 16222, 11426, 10479, 10309, 32862, 10114, 36300, 10151, 21226, 39740, 10108, 10105, 13773, 27591, 117, 10105, 14731, 10164, 118, 71275, 10237, 12867, 22047, 12415, 10135, 67067, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "daily", "said", "the", "men", "had", "wanted", "to", "sell", "the", "und", "##ated", "manuscript", "to", "a", "Jewish", "group", "for", "five", "million", "pounds", "(", "$", "1", ".", "5", "million", ")", "." ], "ids": [ 10117, 27636, 12415, 10105, 10588, 10374, 22591, 10114, 36300, 10105, 10130, 22525, 32036, 10114, 169, 17119, 11795, 10142, 12403, 12473, 61982, 113, 109, 122, 119, 126, 12473, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Instead", "an", "under", "##cover", "police", "officer", "pretende", "##d", "to", "be", "interested", "in", "buy", "##ing", "it", "and", "arrested", "them", "." ], "ids": [ 47556, 10151, 10571, 51652, 15034, 19288, 95854, 10162, 10114, 10347, 40905, 10106, 47715, 10230, 10271, 10111, 29479, 11345, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "newspaper", "did", "not", "give", "any", "details", "about", "the", "manuscript", "but", "said", "it", "had", "been", "re", "##lin", "##quis", "##hed", "to", "the", "Islamic", "Museum", "in", "Cairo", "." ], "ids": [ 10117, 22047, 12172, 10472, 18090, 11178, 29500, 10978, 10105, 32036, 10473, 12415, 10271, 10374, 10590, 11639, 13020, 53499, 16081, 10114, 10105, 22150, 11325, 10106, 37580, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9 ] }, { "tokens": [ "New", "U", ".", "S", ".", "ambassador", "arrives", "in", "Saudi", "Arabia", "." ], "ids": [ 10287, 158, 119, 156, 119, 74853, 69631, 10106, 26598, 27860, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 1, 5, 5, 5, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "D", "##UB", "##A", "##I", "1996", "-", "08", "-", "29" ], "ids": [ 141, 82439, 10738, 11281, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Washington", "'", "s", "new", "ambassador", "to", "Saudi", "Arabia", ",", "W", "##ych", "##e", "Fowler", ",", "arrived", "in", "the", "kingdom", "to", "take", "up", "his", "post", ",", "the", "U", ".", "S", ".", "em", "##bas", "##sy", "in", "R", "##iya", "##dh", "said", "on", "Thursday", "." ], "ids": [ 11586, 112, 187, 10751, 74853, 10114, 26598, 27860, 117, 160, 14950, 10112, 49890, 117, 22584, 10106, 10105, 12293, 10114, 13574, 10741, 10226, 11841, 117, 10105, 158, 119, 156, 119, 10266, 21322, 16105, 10106, 155, 14990, 20193, 12415, 10135, 67067, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "Fowler", ",", "a", "lawyer", "and", "former", "senator", ",", "arrived", "late", "on", "Wednesday", ",", "the", "em", "##bas", "##sy", "said", "in", "a", "statement", "." ], "ids": [ 49890, 117, 169, 38055, 10111, 11775, 40954, 117, 22584, 13002, 10135, 57611, 117, 10105, 10266, 21322, 16105, 12415, 10106, 169, 33311, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Bill", "Clinton", "earlier", "this", "month", "in", "##vo", "##ked", "special", "powers", "to", "app", "##oint", "Fowler", "during", "the", "congressional", "re", "##ces", "##s", "because", "the", "Senate", "delayed", "con", "##fir", "##ming", "his", "nomination", "." ], "ids": [ 12811, 13160, 24139, 18905, 10531, 14064, 10106, 11244, 30511, 14478, 32043, 10114, 72894, 94453, 49890, 10939, 10105, 94137, 11639, 14585, 10107, 12373, 10105, 22294, 67058, 10173, 61644, 16405, 10226, 30807, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fowler", "'", "s", "predecessor", "Raymond", "Ma", "##bus", "returned", "to", "the", "United", "States", "in", "May", "." ], "ids": [ 49890, 112, 187, 58875, 17326, 13744, 13763, 14030, 10114, 10105, 10609, 10859, 10106, 10725, 119 ], "entity": [ "B-PER", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 4, 8, 8, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "Jordan", "##ian", "PM", "Ka", "##bari", "##ti", "leaves", "for", "West", "Bank", "." ], "ids": [ 16366, 11630, 46161, 25444, 73840, 10325, 24516, 10142, 11164, 13533, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 2, 6, 9, 4, 8, 8, 9, 9, 1, 5, 9 ] }, { "tokens": [ "AM", "##MA", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 24339, 30696, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jordan", "##ian", "Prime", "Minister", "Abdul", "-", "Karim", "al", "-", "Ka", "##bari", "##ti", "left", "Amman", "on", "Thursday", "for", "the", "West", "Bank", "town", "of", "Rama", "##llah", "to", "hold", "talks", "with", "Palestinian", "President", "Ya", "##sser", "Ara", "##fat", "on", "the", "stal", "##led", "Middle", "East", "peace", "process", ",", "officials", "said", "." ], "ids": [ 16366, 11630, 19924, 14355, 23642, 118, 71139, 10164, 118, 25444, 73840, 10325, 12153, 107098, 10135, 67067, 10142, 10105, 11164, 13533, 12221, 10108, 42746, 98134, 10114, 18500, 56672, 10169, 56119, 12811, 25148, 33519, 54789, 25616, 10135, 10105, 17844, 16376, 15441, 11830, 28101, 15138, 117, 27730, 12415, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 4, 8, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 9, 2, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "official", "state", "news", "agency", "Petra", "said", "Ka", "##bari", "##ti", "would", "hold", "discussions", "\"", "on", "the", "latest", "developments", "in", "the", "peace", "process", "and", "bila", "##teral", "cooperation", "\"", "." ], "ids": [ 10117, 14731, 11388, 14424, 34649, 27357, 12415, 25444, 73840, 10325, 10894, 18500, 66608, 107, 10135, 10105, 50908, 74475, 10106, 10105, 28101, 15138, 10111, 12517, 98161, 56547, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "visit", "was", "Ka", "##bari", "##ti", "'", "s", "first", "trip", "outside", "the", "country", "since", "Jordan", "was", "sh", "##aken", "by", "food", "rio", "##ts", "earlier", "this", "month", "." ], "ids": [ 10117, 27541, 10134, 25444, 73840, 10325, 112, 187, 10422, 37307, 17555, 10105, 12723, 11764, 16366, 10134, 48201, 46251, 10155, 18301, 27244, 10806, 18905, 10531, 14064, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "##s", "end", "four", "-", "hour", "strike", "." ], "ids": [ 56119, 10107, 11572, 11598, 118, 24730, 37456, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##ER", "##US", "##AL", "##EM", "1996", "-", "08", "-", "29" ], "ids": [ 147, 24093, 32612, 32002, 67753, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "##s", "re", "##open", "##ed", "their", "shops", "on", "Thursday", "at", "the", "end", "of", "a", "four", "-", "hour", "strike", "called", "by", "President", "Ya", "##sser", "Ara", "##fat", "to", "protest", "against", "Israel", "'", "s", "policy", "on", "Jewish", "settlements", "and", "Jerusalem", ",", "witnesses", "said", "." ], "ids": [ 56119, 10107, 11639, 47656, 10336, 10455, 62021, 10135, 67067, 10160, 10105, 11572, 10108, 169, 11598, 118, 24730, 37456, 11552, 10155, 12811, 25148, 33519, 54789, 25616, 10114, 36627, 11327, 12991, 112, 187, 14368, 10135, 17119, 55959, 10111, 20599, 117, 109898, 12415, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Shop", "##keeper", "##s", "in", "Arab", "East", "Jerusalem", "rolle", "##d", "up", "their", "shut", "##ters", "some", "10", "minutes", "before", "the", "scheduled", "no", "##on", "(", "090", "##0", "GMT", ")", "end", "of", "the", "stop", "##page", "." ], "ids": [ 44132, 98767, 10107, 10106, 17365, 11830, 20599, 34547, 10162, 10741, 10455, 70323, 21891, 11152, 10150, 15304, 11360, 10105, 34081, 10192, 10263, 113, 98472, 10929, 20362, 114, 11572, 10108, 10105, 20517, 36795, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Palestinian", "leaders", "called", "the", "strike", ",", "the", "first", "in", "the", "West", "Bank", "and", "Gaza", "since", "1994", ",", "a", "warning", "signal", "that", "the", "peace", "process", "with", "Israel", "was", "in", "danger", "." ], "ids": [ 56119, 24155, 11552, 10105, 37456, 117, 10105, 10422, 10106, 10105, 11164, 13533, 10111, 42434, 11764, 10444, 117, 169, 70990, 25495, 10189, 10105, 28101, 15138, 10169, 12991, 10134, 10106, 45882, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Witness", "##es", "said", "most", "shops", "were", "closed", "in", "towns", "and", "villages", "in", "the", "areas", ",", "with", "the", "exception", "of", "He", "##bron", ",", "a", "West", "Bank", "city", "still", "under", "Israeli", "occupation", "." ], "ids": [ 103594, 10171, 12415, 10992, 62021, 10309, 18440, 10106, 26656, 10111, 19303, 10106, 10105, 14544, 117, 10169, 10105, 30646, 10108, 10357, 65038, 117, 169, 11164, 13533, 11584, 12647, 10571, 28446, 28929, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 1, 5, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "wheat", "weekly", "export", "sales", "high", "##lights", "-", "USD", "##A", "." ], "ids": [ 158, 119, 156, 119, 109653, 33159, 59220, 23857, 11846, 56552, 118, 24868, 10738, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "U", ".", "S", ".", "wheat", "major", "net", "sales", "activity", "in", "the", "week", "ended", "Aug", "22", "reported", "by", "export", "##ers", "for", "the", "following", "pur", "##chas", "##ing", "countries", ",", "in", "tonnes", ":" ], "ids": [ 158, 119, 156, 119, 109653, 11922, 11988, 23857, 22205, 10106, 10105, 16118, 18428, 53012, 10306, 15943, 10155, 59220, 10901, 10142, 10105, 11901, 32385, 30389, 10230, 15911, 117, 10106, 39435, 131 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "Sales", ":", "1996", "/", "97", "1997", "/", "98" ], "ids": [ 32577, 48514, 131, 10389, 120, 12328, 10391, 120, 12327 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Egypt", "199", ",", "900", "Nil" ], "ids": [ 20440, 23366, 117, 13545, 66163 ], "entity": [ "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9 ] }, { "tokens": [ "S", ".", "Korea", "149", ",", "100", "-", "A" ], "ids": [ 156, 119, 14096, 19438, 117, 10407, 118, 138 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Japan", "74", ",", "600" ], "ids": [ 11891, 12535, 117, 11796 ], "entity": [ "B-LOC", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9 ] }, { "tokens": [ "China", "55", ",", "000", "-", "B" ], "ids": [ 11593, 11358, 117, 10259, 118, 139 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indonesia", "55", ",", "000", "-", "B" ], "ids": [ 11658, 11358, 117, 10259, 118, 139 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Unknown", "-", "161", ",", "600" ], "ids": [ 66451, 118, 21163, 117, 11796 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "-", "includes", "54", ",", "600", "tonnes", "changed", "from", "unknown", "." ], "ids": [ 138, 118, 15433, 11653, 117, 11796, 39435, 17695, 10188, 27306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "-", "reflects", "55", ",", "000", "tonnes", "changed", "from", "unknown", "." ], "ids": [ 139, 118, 102374, 11358, 117, 10259, 39435, 17695, 10188, 27306, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Primary", "Export", "Des", "##tina", "##tions", ":", "Egypt", ",", "Morocco", ",", "S", ".", "Korea", ",", "Yemen", ",", "Pakistan", ",", "Mexico", "and", "China", "." ], "ids": [ 20863, 108268, 13810, 18515, 15024, 131, 20440, 117, 57295, 117, 156, 119, 14096, 117, 25126, 117, 15437, 117, 10490, 10111, 11593, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 1, 5, 5, 9, 1, 9, 1, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Keane", "wins", "contract", "from", "IN", "##G", "units", "." ], "ids": [ 109464, 27279, 16108, 10188, 36351, 11447, 17163, 119 ], "entity": [ "B-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "B", "##OS", "##TO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 139, 21793, 60493, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Software", "services", "company", "Keane", "Inc", "said", "it", "had", "won", "a", "year", "2000", "com", "##pliance", "contract", "from", "Life", "Insurance", "Co", "of", "Georgia", "and", "South", "##land", "Life", "Insurance", "Co", ",", "both", "part", "of", "The", "Netherlands", "'", "IN", "##G", "Group", "." ], "ids": [ 21176, 12639, 12100, 109464, 13604, 12415, 10271, 10374, 11367, 169, 10924, 10180, 10212, 107826, 16108, 10188, 10337, 61490, 13098, 10108, 15234, 10111, 11056, 11080, 10337, 61490, 13098, 117, 11408, 10668, 10108, 10117, 22043, 112, 36351, 11447, 12054, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 1, 5, 9, 3, 7, 7, 9 ] }, { "tokens": [ "The", "company", "said", "in", "a", "statement", "late", "on", "Wednesday", "it", "would", "conduct", "an", "enterprise", "assessment", "and", "strategic", "com", "##pliance", "plan", "for", "preparing", "all", "the", "main", "##fram", "##e", "systems", "of", "Life", "of", "Georgia", "and", "South", "##land", "Life", "to", "operate", "in", "the", "new", "century", "." ], "ids": [ 10117, 12100, 12415, 10106, 169, 33311, 13002, 10135, 57611, 10271, 10894, 45541, 10151, 89245, 62492, 10111, 52009, 10212, 107826, 13065, 10142, 90798, 10435, 10105, 12126, 110123, 10112, 16768, 10108, 10337, 10108, 15234, 10111, 11056, 11080, 10337, 10114, 34307, 10106, 10105, 10751, 11943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "project", "will", "be", "managed", "by", "Keane", "'", "s", "Atlanta", "office", "." ], "ids": [ 10117, 13920, 11337, 10347, 22391, 10155, 109464, 112, 187, 19600, 14301, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 9, 9, 1, 9, 9 ] }, { "tokens": [ "\"", "The", "client", "'", "s", "goal", "is", "to", "complete", "its", "year", "2000", "conversion", "activities", "by", "the", "end", "of", "1997", ",", "\"", "the", "statement", "said", "." ], "ids": [ 107, 10117, 37748, 112, 187, 16586, 10124, 10114, 17876, 10474, 10924, 10180, 45109, 19286, 10155, 10105, 11572, 10108, 10391, 117, 107, 10105, 33311, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "New", "York", "news", "##room", ",", "(", "212", ")", "859", "-", "1610" ], "ids": [ 118, 118, 10287, 10482, 14424, 25525, 117, 113, 22023, 114, 80786, 118, 35360 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Wall", "Street", "Journal", "-", "Aug", "29", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 19523, 11962, 11929, 118, 53012, 10386, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 86607, 13034, 162, 42622, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "National", "Basketball", "Association", "has", "sue", "##d", "America", "Online", "Inc", ",", "alle", "##ging", "that", "the", "United", "States", "'", "No", "1", "on", "-", "line", "service", "is", "deliver", "##ing", "real", "-", "time", "information", "about", "league", "games", "without", "its", "permission", ",", "The", "Wall", "Street", "Journal", "reported", "on", "Thursday", "." ], "ids": [ 10117, 10655, 25693, 11751, 10393, 15893, 10162, 11440, 14056, 13604, 117, 10968, 13808, 10189, 10105, 10609, 10859, 112, 10657, 122, 10135, 118, 12117, 11989, 10124, 80498, 10230, 13486, 118, 10635, 12929, 10978, 15616, 13332, 13663, 10474, 52389, 117, 10117, 19523, 11962, 11929, 15943, 10135, 67067, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "suit", "was", "filed", "on", "Wednesday", "in", "federal", "court", "in", "Manhattan", "and", "is", "another", "legal", "ski", "##rmi", "##sh", "over", "what", "con", "##stitute", "##s", "a", "\"", "broadcast", "\"", "in", "the", "computer", "age", "." ], "ids": [ 10117, 26315, 10134, 45959, 10135, 57611, 10106, 16293, 14866, 10106, 23115, 10111, 10124, 12864, 17139, 40122, 76936, 13264, 10491, 12976, 10173, 69442, 10107, 169, 107, 21391, 107, 10106, 10105, 18765, 12089, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "suit", "conte", "##nds", "America", "Online", "was", "mis", "##app", "##rop", "##riat", "##ing", "NBA", "property", "by", "providing", "a", "site", "containing", "continua", "##lly", "updated", "scores", "and", "statistics", "of", "NBA", "games", "in", "progress", "." ], "ids": [ 10117, 26315, 26777, 27090, 11440, 14056, 10134, 12606, 102295, 30698, 65441, 10230, 14856, 18381, 10155, 26099, 169, 11920, 27248, 24918, 17903, 13973, 49931, 10111, 36730, 10108, 14856, 13332, 10106, 40316, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "The", "newspaper", "also", "reported", ":" ], "ids": [ 10117, 22047, 10379, 15943, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Baxter", "International", "Inc", "has", "reached", "an", "agreement", "to", "acquire", "Austria", "'", "s", "Im", "##mun", "##o", "International", "AG", "in", "a", "complex", "deal", "valued", "at", "$", "715", "mi", "##ilio", "##n", "." ], "ids": [ 115, 60598, 10771, 13604, 10393, 17087, 10151, 25432, 10114, 86753, 14479, 112, 187, 10796, 34326, 10133, 10771, 17935, 10106, 169, 17217, 19918, 106867, 10160, 109, 56036, 12132, 65927, 10115, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Boeing", "Co", "secure", "##s", "$", "5", ".", "5", "billion", "in", "orders", "for", "new", ",", "larger", "747", "##s", "." ], "ids": [ 115, 20172, 13098, 45853, 10107, 109, 126, 119, 126, 25848, 10106, 31303, 10142, 10751, 117, 20434, 33735, 10107, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "President", "Bill", "Clinton", "is", "expected", "to", "propose", "a", "tax", "break", "on", "home", "sales", "." ], "ids": [ 115, 12811, 13160, 24139, 10124, 25973, 10114, 30027, 169, 25468, 24194, 10135, 11816, 23857, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Philip", "Morris", "Co", "##s", "Inc", "raise", "##s", "divide", "##nd", "20", "percent", "." ], "ids": [ 115, 13324, 17161, 13098, 10107, 13604, 42439, 10107, 41430, 11534, 10197, 22362, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Salomon", "Brothers", "Inc", "anal", "##yst", "is", "bu", "##llis", "##h", "on", "International", "Business", "Machines", "Corp", "." ], "ids": [ 115, 54801, 18274, 13604, 106615, 62769, 10124, 11499, 44417, 10237, 10135, 10771, 15281, 101213, 44687, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "*", "Sierra", "Semi", "##con", "##ductor", "Corp", "puts", "mode", "##m", "chip", "##set", "line", "up", "for", "sale", "and", "sets", "lay", "##off", "##s", "." ], "ids": [ 115, 16899, 71467, 23486, 74145, 44687, 94910, 18417, 10147, 64008, 14488, 12117, 10741, 10142, 15488, 10111, 23597, 47413, 20584, 10107, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Red", "Lion", "Hotels", "Inc", "says", "it", "'", "s", "holding", "merger", "talks", "with", "Double", "##tree", "Corp", "." ], "ids": [ 115, 11641, 27148, 70686, 13604, 22153, 10271, 112, 187, 29008, 53860, 56672, 10169, 23655, 100113, 44687, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "*", "GT", "##E", "Corp", ",", "Baby", "Bells", "and", "their", "allies", "ready", "to", "launch", "challenge", "to", "tele", "##communications", "reform", "law", "." ], "ids": [ 115, 27987, 11259, 44687, 117, 17073, 80312, 10111, 10455, 67675, 42374, 10114, 29227, 36040, 10114, 56142, 100856, 34800, 13255, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Economist", "##s", "see", "second", "-", "quarter", "gross", "domestic", "product", "revised", "down", "0", ".", "1", "percentage", "point", "." ], "ids": [ 115, 88422, 10107, 12888, 11132, 118, 28330, 92746, 31084, 21535, 41226, 12935, 121, 119, 122, 46971, 12331, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "President", "Clinton", "propose", "##s", "five", "-", "point", "plan", "to", "clean", "up", "to", "##xic", "waste", "sites", "." ], "ids": [ 115, 12811, 24139, 30027, 10107, 12403, 118, 12331, 13065, 10114, 55911, 10741, 10114, 52981, 59158, 16055, 119 ], "entity": [ "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "Sec", "##urities", "and", "Exchange", "Commission", "acts", "to", "improve", "stock", "-", "trade", "prices", "for", "investors", "." ], "ids": [ 115, 109754, 82073, 10111, 32424, 14941, 29253, 10114, 33992, 20511, 118, 18908, 57476, 10142, 83795, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "H", "&", "R", "Block", "Inc", "delay", "##s", "spin", "##off", "of", "its", "stake", "in", "Com", "##pu", "##S", "##er", "##ve", "Corp", "." ], "ids": [ 115, 145, 111, 155, 28910, 13604, 76497, 10107, 30428, 20584, 10108, 10474, 90081, 10106, 16680, 17490, 10731, 10165, 10612, 44687, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "*", "Stock", "funds", "see", "cash", "pour", "in", "again", "in", "July", "." ], "ids": [ 115, 31916, 32067, 12888, 52828, 10322, 10106, 13123, 10106, 11112, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "The", "Federal", "Trade", "Commission", "and", "Justice", "Department", "issue", "new", "guide", "##lines", "for", "formation", "of", "doctors", "'", "networks", "." ], "ids": [ 115, 10117, 14492, 15006, 14941, 10111, 17086, 12933, 15557, 10751, 25083, 31782, 10142, 16345, 10108, 82782, 112, 44570, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "New", "York", "news", "##room", ",", "(", "212", ")", "859", "-", "1610" ], "ids": [ 118, 118, 10287, 10482, 14424, 25525, 117, 113, 22023, 114, 80786, 118, 35360 ], "entity": [ "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Baker", "made", "secret", "trip", "to", "Syria", "in", "March", "1995", "." ], "ids": [ 16865, 11019, 23658, 37307, 10114, 25612, 10106, 11144, 10436, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Former", "Secretary", "of", "State", "James", "Baker", "made", "a", "secret", "trip", "to", "Syria", "in", "March", "1995", "in", "an", "unsuccessful", "bid", "to", "break", "an", "im", "##passe", "in", "negotiations", "between", "Syria", "and", "Israel", ",", "the", "Washington", "Post", "reported", "on", "Thursday", "." ], "ids": [ 42355, 19382, 10108, 11104, 10900, 16865, 11019, 169, 23658, 37307, 10114, 25612, 10106, 11144, 10436, 10106, 10151, 57669, 50385, 10114, 24194, 10151, 10211, 71615, 10106, 61946, 10948, 25612, 10111, 12991, 117, 10105, 11586, 14539, 15943, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "The", "paper", "said", "Baker", "declined", "to", "discuss", "the", "trip", ",", "but", "author", "##ised", "an", "associate", "to", "con", "##fir", "##m", "it", "took", "place", "and", "give", "an", "account", "of", "it", "." ], "ids": [ 10117, 17895, 12415, 16865, 44948, 10114, 71695, 10105, 37307, 117, 10473, 17034, 20666, 10151, 46175, 10114, 10173, 61644, 10147, 10271, 12149, 11192, 10111, 18090, 10151, 23200, 10108, 10271, 119 ], "entity": [ "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "News", "of", "the", "secret", "trip", "came", "after", "Baker", "tras", "##hed", "the", "Clinton", "administration", "at", "the", "Republican", "National", "Convention", "two", "weeks", "ago", "for", "its", "efforts", "to", "nu", "##dge", "Syria", "into", "peace", "with", "Israel", "." ], "ids": [ 12219, 10108, 10105, 23658, 37307, 13383, 10662, 16865, 14807, 16081, 10105, 24139, 17941, 10160, 10105, 21776, 10655, 25318, 10551, 20750, 36390, 10142, 10474, 22116, 10114, 11085, 25431, 25612, 10708, 28101, 10169, 12991, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 4, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Baker", "made", "the", "March", "1995", "trip", "on", "the", "ex", "##plicit", "understanding", "that", "it", "remain", "a", "secret", ",", "but", "after", "his", "speech", "at", "the", "GO", "##P", "convention", ",", "Israel", "'", "s", "out", "##going", "ambassador", "It", "##amar", "Ra", "##bino", "##vich", "told", "a", "reporter", "about", "it", ",", "the", "Post", "said", "." ], "ids": [ 16865, 11019, 10105, 11144, 10436, 37307, 10135, 10105, 11419, 70629, 37149, 10189, 10271, 25430, 169, 23658, 117, 10473, 10662, 10226, 29811, 10160, 10105, 41525, 11127, 37812, 117, 12991, 112, 187, 10950, 92037, 74853, 10377, 93196, 38571, 61328, 48190, 21937, 169, 41408, 10978, 10271, 117, 10105, 14539, 12415, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "Baker", "was", "secretary", "of", "state", "in", "the", "Republican", "administration", "of", "President", "George", "Bush", "." ], "ids": [ 16865, 10134, 37664, 10108, 11388, 10106, 10105, 21776, 17941, 10108, 12811, 10955, 21145, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 4, 8, 9 ] }, { "tokens": [ "Clinton", "wins", "Democratic", "re", "-", "nomination", "." ], "ids": [ 24139, 27279, 19281, 11639, 118, 30807, 119 ], "entity": [ "B-PER", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Bill", "Clinton", "was", "formally", "nominated", "on", "Wednesday", "as", "the", "Democratic", "party", "candidate", "for", "a", "second", "four", "-", "year", "term", "in", "the", "White", "House", "." ], "ids": [ 12811, 13160, 24139, 10134, 43082, 25906, 10135, 57611, 10146, 10105, 19281, 14039, 22102, 10142, 169, 11132, 11598, 118, 10924, 13719, 10106, 10105, 12136, 11545, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "Clinton", "won", "the", "nomination", "in", "a", "traditional", "state", "-", "by", "-", "state", "roll", "call", "of", "votes", "at", "the", "party", "convention", "and", "will", "accept", "in", "a", "speech", "on", "Thursday", "." ], "ids": [ 24139, 11367, 10105, 30807, 10106, 169, 17531, 11388, 118, 10155, 118, 11388, 25520, 20575, 10108, 24659, 10160, 10105, 14039, 37812, 10111, 11337, 45218, 10106, 169, 29811, 10135, 67067, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "faces", "Republican", "challenge", "##r", "Bob", "Dol", "##e", "in", "the", "November", "5", "presidential", "election", "." ], "ids": [ 10357, 48343, 21776, 36040, 10129, 13583, 100035, 10112, 10106, 10105, 10819, 126, 36476, 13685, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Beach", "##combe", "##r", "finds", "piece", "that", "could", "be", "T", "##WA", "part", "." ], "ids": [ 15602, 87041, 10129, 31478, 26767, 10189, 12174, 10347, 157, 42196, 10668, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9 ] }, { "tokens": [ "AT", "##LA", "##NT", "##IC", "H", "##IG", "##HL", "##AN", "##DS", ",", "N", ".", "J", ".", "1996", "-", "08", "-", "28" ], "ids": [ 30554, 44376, 77261, 30889, 145, 89696, 39810, 41275, 33953, 117, 151, 119, 147, 119, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 5, 5, 5, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "foot", "-", "long", "piece", "of", "deb", "##ris", "bearing", "marking", "##s", "from", "a", "commercial", "aircraft", "was", "found", "on", "the", "New", "Jersey", "shore", "and", "forward", "##ed", "to", "T", "##WA", "crash", "in", "##vesti", "##gator", "##s", "in", "Long", "Island", ",", "officials", "said", "on", "Wednesday", "." ], "ids": [ 138, 24963, 118, 11695, 26767, 10108, 55493, 12125, 66455, 98316, 10107, 10188, 169, 17331, 16167, 10134, 11823, 10135, 10105, 10287, 14448, 51433, 10111, 23307, 10336, 10114, 157, 42196, 42774, 10106, 63996, 75791, 10107, 10106, 13307, 11848, 117, 27730, 12415, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "person", "walking", "on", "the", "shore", "at", "Island", "Beach", "State", "Park", "found", "the", "deb", "##ris", "and", "ale", "##rte", "##d", "police", "who", "forward", "##ed", "it", "to", "Long", "Island", ",", "New", "York", ",", "where", "the", "National", "Transportation", "Safety", "Board", "and", "the", "FBI", "are", "conducting", "an", "investigation", "." ], "ids": [ 138, 15042, 59381, 10135, 10105, 51433, 10160, 11848, 15602, 11104, 11239, 11823, 10105, 55493, 12125, 10111, 11372, 13733, 10162, 15034, 10479, 23307, 10336, 10271, 10114, 13307, 11848, 117, 10287, 10482, 117, 10940, 10105, 10655, 44063, 38797, 14743, 10111, 10105, 27254, 10301, 80006, 10151, 32719, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 5, 9, 9, 9, 3, 7, 7, 7, 9, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "T", "##WA", "jet", "ex", "##plo", "##ded", "in", "a", "dead", "##ly", "fire", "##ball", "last", "month", ",", "killing", "230", "people", ",", "crash", "##ing", "in", "the", "Atlantic", "Ocean", "at", "least", "80", "miles", "from", "where", "the", "deb", "##ris", "was", "found", "Wednesday", "." ], "ids": [ 10117, 157, 42196, 48504, 11419, 46128, 21597, 10106, 169, 23457, 10454, 13559, 19805, 12469, 14064, 117, 34248, 16888, 11426, 117, 42774, 10230, 10106, 10105, 16739, 20500, 10160, 16298, 10832, 14148, 10188, 10940, 10105, 55493, 12125, 10134, 11823, 57611, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Several", "other", "items", "have", "been", "reported", "found", "along", "the", "New", "Jersey", "shore", ",", "most", "of", "it", "such", "personal", "items", "as", "wall", "##ets", ",", "sh", "##oes", "and", "je", "##wel", "##ry", "." ], "ids": [ 28604, 10684, 34109, 10529, 10590, 15943, 11823, 12400, 10105, 10287, 14448, 51433, 117, 10992, 10108, 10271, 11049, 14927, 34109, 10146, 26699, 17137, 117, 48201, 47125, 10111, 10144, 20706, 10908, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "##vesti", "##gator", "##s", "said", "they", "still", "do", "not", "have", "enough", "evidence", "to", "determine", "whether", "a", "bomb", ",", "a", "missile", "or", "mechanical", "failure", "caused", "the", "crash", "." ], "ids": [ 10167, 63996, 75791, 10107, 12415, 10689, 12647, 10149, 10472, 10529, 21408, 18713, 10114, 37284, 21883, 169, 41654, 117, 169, 45174, 10345, 52159, 31562, 19513, 10105, 42774, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "F", "##EA", "##T", "##UR", "##E", "-", "Rich", "new", "detail", "on", "U", ".", "S", ".", "Civil", "War", "une", "##art", "##hed", "." ], "ids": [ 143, 36789, 11090, 98348, 11259, 118, 27948, 10751, 45485, 10135, 158, 119, 156, 119, 14906, 11277, 10231, 15391, 16081, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Lei", "##la", "Cor", "##cora", "##n" ], "ids": [ 31347, 10330, 93495, 75347, 10115 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8, 8 ] }, { "tokens": [ "W", "##AS", "##HI", "##NG", "##TO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 160, 38025, 108880, 34065, 60493, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "free", "##d", "black", "man", "writes", "to", "his", "still", "-", "ens", "##lave", "##d", "wife", ",", "a", "mother", "pl", "##ead", "##s", "with", "Abraham", "Lincoln", "on", "behalf", "of", "her", "son", "and", "a", "mai", "##med", "soldier", "pose", "##s", "for", "an", "official", "photo", "##graph", "in", "newly", "re", "##open", "##ed", "records", "that", "bring", "the", "U", ".", "S", ".", "Civil", "War", "back", "to", "life", "." ], "ids": [ 138, 13961, 10162, 15045, 10817, 49501, 10114, 10226, 12647, 118, 55683, 57782, 10162, 14384, 117, 169, 15293, 20648, 30297, 10107, 10169, 19946, 16944, 10135, 50683, 10108, 10485, 10312, 10111, 169, 10737, 21986, 50803, 43365, 10107, 10142, 10151, 14731, 38171, 28176, 10106, 26574, 11639, 47656, 10336, 18791, 10189, 26092, 10105, 158, 119, 156, 119, 14906, 11277, 12014, 10114, 12103, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Working", "in", "the", "basement", "of", "the", "National", "Archives", ",", "members", "of", "the", "Civil", "War", "Conservation", "Corps", "are", "organi", "##sing", "the", "military", "records", "of", "volunteers", "who", "fought", "for", "the", "North", "so", "that", "they", "can", "be", "preserved", "on", "micro", "##film", "." ], "ids": [ 38194, 10106, 10105, 98924, 10108, 10105, 10655, 29374, 117, 12464, 10108, 10105, 14906, 11277, 19349, 17248, 10301, 91969, 16357, 10105, 14041, 18791, 10108, 67836, 10479, 29766, 10142, 10105, 11225, 10380, 10189, 10689, 10944, 10347, 45229, 10135, 54396, 16399, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "fa", "##ded", "documents", "have", "been", "sto", "##wed", "away", "in", "the", "Archives", "since", "it", "opened", "in", "1935", "and", "have", "rarely", "seen", "the", "light", "of", "day", "." ], "ids": [ 10117, 12211, 21597, 21784, 10529, 10590, 47264, 48854, 14942, 10106, 10105, 29374, 11764, 10271, 14377, 10106, 11271, 10111, 10529, 57879, 15652, 10105, 15765, 10108, 11940, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Each", "soldier", "'", "s", "file", "is", "a", "gold", "mine", "of", "information", ":", "en", "##list", "##ment", "papers", ",", "must", "##er", "roll", "##s", ",", "medical", "records", ",", "disc", "##harge", "certificate", "##s", ",", "letters", "and", "photographs", "." ], "ids": [ 23223, 50803, 112, 187, 23198, 10124, 169, 18128, 27546, 10108, 12929, 131, 10110, 21476, 10426, 34546, 117, 14982, 10165, 25520, 10107, 117, 19436, 18791, 117, 27224, 92555, 93552, 10107, 117, 26005, 10111, 54194, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Since", "the", "project", "began", "almost", "two", "years", "ago", ",", "corps", "volunteers", "have", "focused", "on", "African", "American", "troops", ",", "preparing", "records", "in", "time", "for", "the", "un", "##vei", "##ling", "in", "Washington", "this", "year", "of", "a", "special", "memorial", "to", "black", "soldiers", "who", "fought", "in", "the", "war", "." ], "ids": [ 15591, 10105, 13920, 11941, 17122, 10551, 10855, 36390, 117, 17593, 67836, 10529, 31293, 10135, 13839, 10536, 20836, 117, 90798, 18791, 10106, 10635, 10142, 10105, 10119, 28349, 11945, 10106, 11586, 10531, 10924, 10108, 169, 14478, 43010, 10114, 15045, 23324, 10479, 29766, 10106, 10105, 10338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "185", ",", "000", "black", "soldiers", "fought", "and", "37", ",", "000", "died", "." ], "ids": [ 15946, 11084, 19859, 117, 10259, 15045, 23324, 29766, 10111, 11204, 117, 10259, 12482, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "one", "letter", ",", "a", "black", "soldier", "heading", "South", "wrote", "his", "wife", ",", "\"", "though", "great", "is", "the", "present", "national", "difficulties", "yet", "I", "look", "forward", "to", "a", "bright", "##er", "day", "when", "I", "shall", "have", "the", "op", "##ort", "##unit", "##y", "of", "seeing", "you", "in", "the", "full", "enjoy", "##ment", "of", "freedom", "." ], "ids": [ 10167, 10464, 19310, 117, 169, 15045, 50803, 82839, 11056, 13954, 10226, 14384, 117, 107, 15102, 14772, 10124, 10105, 12254, 11844, 64557, 21833, 146, 25157, 23307, 10114, 169, 72041, 10165, 11940, 10841, 146, 36216, 10529, 10105, 10303, 16312, 88035, 10157, 10108, 57039, 13028, 10106, 10105, 13375, 84874, 10426, 10108, 33700, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "would", "like", "to", "no", "(", "sic", ")", "if", "you", "are", "still", "in", "slavery", "if", "you", "are", ",", "it", "will", "not", "be", "long", "before", "we", "shall", "have", "c", "##rush", "##ed", "the", "system", "that", "now", "opp", "##rese", "##s", "you", "for", "in", "the", "course", "of", "three", "months", "you", "shall", "have", "your", "liber", "##ty", "." ], "ids": [ 107, 146, 10894, 11850, 10114, 10192, 113, 43654, 114, 12277, 13028, 10301, 12647, 10106, 80061, 12277, 13028, 10301, 117, 10271, 11337, 10472, 10347, 11695, 11360, 11951, 36216, 10529, 171, 60796, 10336, 10105, 11787, 10189, 11858, 15153, 47440, 10107, 13028, 10142, 10106, 10105, 15348, 10108, 11003, 15555, 13028, 36216, 10529, 20442, 72517, 11195, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Great", "is", "the", "out", "##pou", "##ring", "of", "the", "colour", "##ed", "people", "that", "is", "now", "rally", "##ing", "with", "the", "heart", "of", "lion", "##s", "against", "the", "very", "curs", "##e", "that", "has", "separated", "you", "and", "me", ".", "\"" ], "ids": [ 12592, 10124, 10105, 10950, 73535, 13135, 10108, 10105, 43361, 10336, 11426, 10189, 10124, 11858, 58575, 10230, 10169, 10105, 21736, 10108, 73025, 10107, 11327, 10105, 12558, 57887, 10112, 10189, 10393, 39478, 13028, 10111, 10911, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "another", "letter", "dated", "January", "1865", ",", "a", "well", "-", "to", "-", "do", "Washington", "mat", "##ron", "wrote", "to", "Lincoln", "to", "pl", "##ead", "for", "her", "son", ",", "who", "faced", "a", "dis", "##hon", "##our", "##able", "disc", "##harge", "from", "the", "Army", ".", "\"" ], "ids": [ 10167, 12864, 19310, 39724, 11238, 13814, 117, 169, 11206, 118, 10114, 118, 10149, 11586, 17255, 11620, 13954, 10114, 16944, 10114, 20648, 30297, 10142, 10485, 10312, 117, 10479, 31952, 169, 27920, 19792, 17964, 13096, 27224, 92555, 10188, 10105, 12762, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "James", "is", "a", "prisoner", "for", "a", "thought", "##less", "act", "of", "f", "##oll", "##y", ",", "while", "those", "who", "have", "done", "nothing", "for", "the", "cause", "are", "free", ",", "\"", "she", "wrote", "." ], "ids": [ 10900, 10124, 169, 76443, 10142, 169, 18957, 14985, 19833, 10108, 174, 40758, 10157, 117, 11371, 12676, 10479, 10529, 20378, 33338, 10142, 10105, 15311, 10301, 13961, 117, 107, 10833, 13954, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lincoln", "'", "s", "notation", "on", "the", "letter", "read", ":", "\"", "If", "his", "colonel", "will", "say", "in", "writing", "on", "this", "sheet", "he", "is", "willing", "to", "receive", "this", "man", "back", "to", "the", "regiment", ",", "I", "will", "par", "##don", "and", "send", "him", ".", "\"" ], "ids": [ 16944, 112, 187, 100237, 10135, 10105, 19310, 24944, 131, 107, 14535, 10226, 31456, 11337, 23763, 10106, 17637, 10135, 10531, 55030, 10261, 10124, 87615, 10114, 26286, 10531, 10817, 12014, 10114, 10105, 33818, 117, 146, 11337, 10248, 15081, 10111, 45567, 10957, 119, 107 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "soldier", "was", "subsequently", "par", "##done", "##d", "." ], "ids": [ 10117, 50803, 10134, 20961, 10248, 99726, 10162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "the", "letters", "speak", "to", "the", "ang", "##uis", "##h", "of", "separation", ",", "a", "photo", "##graph", "of", "a", "black", "am", "##put", "##ee", "speaks", "to", "the", "terrible", "physical", "cost", "of", "the", "war", "." ], "ids": [ 14600, 10105, 26005, 41541, 10114, 10105, 10488, 31466, 10237, 10108, 72891, 117, 169, 38171, 28176, 10108, 169, 15045, 10392, 27876, 13321, 92678, 10114, 10105, 70032, 22899, 18849, 10108, 10105, 10338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "a", "picture", "required", "for", "his", "military", "disc", "##harge", ",", "P", "##vt", "." ], "ids": [ 10167, 169, 36761, 17468, 10142, 10226, 14041, 27224, 92555, 117, 153, 36220, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lewis", "Martin", ",", "with", "hau", "##nted", "eyes", ",", "pose", "##d", "bare", "-", "chest", "##ed", "to", "reveal", "his", "missing", "arm", "and", "leg", ",", "blow", "##n", "off", "during", "a", "battle", "at", "Petersburg", ",", "Virginia", ",", "in", "July", "1864", "." ], "ids": [ 13759, 11235, 117, 10169, 20091, 58839, 38144, 117, 43365, 10162, 21766, 118, 94230, 10336, 10114, 75790, 10226, 39542, 31251, 10111, 33810, 117, 106194, 10115, 11898, 10939, 169, 18758, 10160, 22801, 117, 13634, 117, 10106, 11112, 13624, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "work", "on", "black", "troops", "has", "provided", "new", "ins", "##ight", "into", "the", "rhythm", "##s", "of", "plantation", "talk", "and", "culture", ",", "said", "John", "Simon", ",", "professor", "of", "history", "at", "Southern", "Illinois", "University", "at", "Carbon", "##dale", "and", "editor", "of", "Gen", "." ], "ids": [ 10117, 11424, 10135, 15045, 20836, 10393, 16491, 10751, 15498, 27521, 10708, 10105, 51720, 10107, 10108, 103170, 31311, 10111, 15162, 117, 12415, 10421, 12237, 117, 13853, 10108, 11486, 10160, 15120, 14922, 10404, 10160, 77315, 22508, 10111, 16595, 10108, 32560, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ulysses", "Grant", "'", "s", "papers", "." ], "ids": [ 87307, 17606, 112, 187, 34546, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "These", "(", "writings", ")", "are", "not", "only", "poet", "##ic", "but", "a", "linguistic", "tre", "##asure", "tro", "##ve", "." ], "ids": [ 107, 13252, 113, 59395, 114, 10301, 10472, 10893, 24633, 11130, 10473, 169, 105768, 11617, 88667, 42169, 10612, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "is", "the", "first", "generation", "of", "African", "Americans", "that", "really", "can", "express", "itself", "without", "fear", "and", "punishment", ",", "\"", "Simon", "said", "." ], "ids": [ 10747, 10124, 10105, 10422, 25601, 10108, 13839, 25069, 10189, 30181, 10944, 47620, 17587, 13663, 44929, 10111, 80149, 117, 107, 12237, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "\"", "I", "think", "there", "'", "s", "probably", "a", "whole", "lot", "of", "material", "that", "would", "expand", "our", "understanding", "of", "the", "socio", "##logy", "of", "the", "war", ",", "\"", "said", "Edward", "Smith", ",", "director", "of", "American", "Studies", "at", "American", "University", "in", "Washington", "." ], "ids": [ 107, 146, 27874, 11155, 112, 187, 23282, 169, 21047, 19826, 10108, 13540, 10189, 10894, 50188, 17446, 37149, 10108, 10105, 48431, 18583, 10108, 10105, 10338, 117, 107, 12415, 11984, 11673, 117, 12461, 10108, 10536, 14024, 10160, 10536, 10404, 10106, 11586, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 3, 7, 9, 3, 7, 9, 1, 9 ] }, { "tokens": [ "The", "war", "between", "the", "North", "and", "South", "ra", "##ged", "for", "nearly", "four", "years", ",", "claimed", "the", "lives", "of", "half", "a", "million", "Americans", "and", "for", "##ever", "sea", "##red", "the", "nation", "'", "s", "consciousness", "." ], "ids": [ 10117, 10338, 10948, 10105, 11225, 10111, 11056, 11859, 18832, 10142, 21377, 11598, 10855, 117, 20737, 10105, 21418, 10108, 13877, 169, 12473, 25069, 10111, 10142, 23433, 14931, 15711, 10105, 22274, 112, 187, 91448, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Southern", "records", "have", "already", "been", "preserved", "." ], "ids": [ 15120, 18791, 10529, 19034, 10590, 45229, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "were", "put", "on", "micro", "##film", "about", "30", "years", "ago", "through", "a", "grant", "from", "the", "United", "Daughter", "##s", "of", "the", "Con", "##fe", "##dera", "##cy", "." ], "ids": [ 11696, 10309, 14499, 10135, 54396, 16399, 10978, 10244, 10855, 36390, 11222, 169, 41100, 10188, 10105, 10609, 54924, 10107, 10108, 10105, 12845, 14601, 24053, 11710, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "The", "Civil", "War", "Conservation", "Corps", "is", "mostly", "retire", "##es", "joined", "by", "students", "during", "the", "school", "year", "." ], "ids": [ 10117, 14906, 11277, 19349, 17248, 10124, 19774, 30753, 10171, 13914, 10155, 13501, 10939, 10105, 11393, 10924, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Director", "Bud", "##ge", "Wei", "##dman", ",", "who", "has", "she", "##pher", "##ded", "the", "project", "from", "the", "beginning", ",", "pred", "##ict", "##s", "it", "will", "take", "up", "to", "a", "decade", "to", "complete", "." ], "ids": [ 15480, 63623, 10525, 37343, 59609, 117, 10479, 10393, 10833, 66837, 21597, 10105, 13920, 10188, 10105, 17967, 117, 18283, 106788, 10107, 10271, 11337, 13574, 10741, 10114, 169, 35858, 10114, 17876, 119 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "work", "was", "inspired", "by", "a", "National", "Park", "Service", "plan", "to", "put", "computer", "databases", "at", "Civil", "War", "battle", "##fields", "across", "the", "country", "so", "that", "Americans", "might", "research", "their", "an", "##cestors", "." ], "ids": [ 10117, 11424, 10134, 27055, 10155, 169, 10655, 11239, 13489, 13065, 10114, 14499, 18765, 66876, 10160, 14906, 11277, 18758, 92381, 15130, 10105, 12723, 10380, 10189, 25069, 20970, 14108, 10455, 10151, 105144, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "records", "also", "provide", "ins", "##ight", "into", "medical", "thinking", "of", "the", "day", "." ], "ids": [ 10117, 18791, 10379, 16871, 15498, 27521, 10708, 19436, 56294, 10108, 10105, 11940, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "One", "soldier", "was", "disc", "##harge", "##d", "because", "of", "\"", "mental", "in", "##cap", "##aci", "##ty", "and", "in", "##ebe", "##tude", "(", "sic", ")", "of", "the", "brain", ",", "alleged", "by", "the", "Pat", "##ient", "to", "be", "connected", "with", "a", "fall", "on", "the", "head", "but", "believed", "to", "ari", "##se", "from", "long", "continued", "and", "excessive", "mas", "##tur", "##bation", ".", "\"" ], "ids": [ 11340, 50803, 10134, 27224, 92555, 10162, 12373, 10108, 107, 27993, 10106, 93103, 28841, 11195, 10111, 10106, 64084, 41781, 113, 43654, 114, 10108, 10105, 34467, 117, 48164, 10155, 10105, 24714, 15617, 10114, 10347, 26989, 10169, 169, 18042, 10135, 10105, 13578, 10473, 20718, 10114, 57173, 10341, 10188, 11695, 14278, 10111, 101215, 11856, 15698, 65603, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "arrives", "in", "Chicago", "on", "day", "of", "re", "-", "nomination", "." ], "ids": [ 24139, 69631, 10106, 12317, 10135, 11940, 10108, 11639, 118, 30807, 119 ], "entity": [ "B-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CH", "##IC", "##AG", "##O", "1996", "-", "08", "-", "28" ], "ids": [ 39774, 30889, 109865, 11403, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "President", "Bill", "Clinton", "arrived", "in", "Chicago", "on", "Wednesday", "as", "the", "Democratic", "convention", "prepared", "to", "re", "-", "nomina", "##te", "him", "for", "a", "second", "four", "-", "year", "term", "." ], "ids": [ 12811, 13160, 24139, 22584, 10106, 12317, 10135, 57611, 10146, 10105, 19281, 37812, 39837, 10114, 11639, 118, 38316, 10216, 10957, 10142, 169, 11132, 11598, 118, 10924, 13719, 119 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 1, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Clinton", "flew", "in", "by", "helicopter", "from", "Michigan", "City", ",", "Indiana", ",", "after", "ending", "a", "four", "-", "day", ",", "559", "-", "mile", "trip", "aboard", "a", "campaign", "train", "from", "Washington", "." ], "ids": [ 24139, 64284, 10106, 10155, 80634, 10188, 15476, 10773, 117, 16564, 117, 10662, 29077, 169, 11598, 118, 11940, 117, 54799, 118, 21128, 37307, 65331, 169, 17323, 17767, 10188, 11586, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "New", "bomb", "attacks", "on", "Corsica", "despite", "c", "##rack", "##down", "vo", "##w", "." ], "ids": [ 10287, 41654, 26483, 10135, 101208, 22087, 171, 71189, 27160, 12556, 10874, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sylvie", "Florence" ], "ids": [ 91991, 23283 ], "entity": [ "B-PER", "I-PER" ], "entity_ids": [ 4, 8 ] }, { "tokens": [ "AJ", "##AC", "##CI", "##O", ",", "Corsica", "1996", "-", "08", "-", "29" ], "ids": [ 41191, 30340, 89955, 11403, 117, 101208, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sep", "##arat", "##ist", "guerrilla", "##s", "planted", "two", "bombs", "over", "##night", "at", "government", "offices", "on", "the", "French", "Mediterranean", "island", "of", "Corsica", "despite", "fresh", "warning", "##s", "of", "a", "c", "##rack", "##down", "by", "Paris", ",", "police", "said", "on", "Thursday", "." ], "ids": [ 67281, 49651, 11293, 106552, 10107, 97444, 10551, 94510, 10491, 45217, 10160, 12047, 29918, 10135, 10105, 11894, 35628, 17354, 10108, 101208, 22087, 54181, 70990, 10107, 10108, 169, 171, 71189, 27160, 10155, 10728, 117, 15034, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 2, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "latest", "in", "a", "wave", "of", "attacks", ",", "a", "two", "kg", "(", "four", "lb", ")", "bomb", "seriously", "damaged", "two", "floors", "of", "Agriculture", "Ministry", "offices", "located", "just", "50", "metres", "(", "yards", ")", "from", "a", "police", "station", "in", "the", "centre", "of", "the", "island", "capital", "A", "##ja", "##ccio", "." ], "ids": [ 10167, 10105, 50908, 10106, 169, 32981, 10108, 26483, 117, 169, 10551, 11895, 113, 11598, 23989, 114, 41654, 75543, 39034, 10551, 83003, 10108, 30954, 19170, 29918, 11954, 12820, 10462, 16393, 113, 25537, 114, 10188, 169, 15034, 11825, 10106, 10105, 12672, 10108, 10105, 17354, 12185, 138, 10320, 38462, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "No", "one", "was", "hur", "##t", "." ], "ids": [ 10657, 10464, 10134, 52824, 10123, 119 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "second", "device", ",", "pack", "##ed", "with", "five", "kg", "(", "10", "lb", "##s", ")", "of", "ex", "##plosive", ",", "was", "def", "##used", "before", "it", "could", "go", "off", ",", "police", "said", "." ], "ids": [ 138, 11132, 33091, 117, 78978, 10336, 10169, 12403, 11895, 113, 10150, 23989, 10107, 114, 10108, 11419, 83655, 117, 10134, 100745, 40015, 11360, 10271, 12174, 11783, 11898, 117, 15034, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "new", "attacks", "followed", "by", "a", "day", "a", "warning", "of", "a", "new", "\"", "get", "-", "tou", "##gh", "\"", "policy", "by", "Paris", "toward", "the", "separat", "##ists", ",", "who", "seek", "greater", "auto", "##nomy", "." ], "ids": [ 10117, 10751, 26483, 15689, 10155, 169, 11940, 169, 70990, 10108, 169, 10751, 107, 15329, 118, 52586, 15774, 107, 14368, 10155, 10728, 32216, 10105, 81806, 18206, 117, 10479, 48394, 25722, 18257, 100395, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Interior", "Minister", "Jean", "-", "Louis", "De", "##bre", ",", "under", "fire", "for", "sta", "##ging", "secret", "talks", "with", "one", "of", "the", "largest", "of", "several", "rival", "underground", "nationalist", "groups", ",", "told", "the", "daily", "La", "Corse", "in", "a", "statement", "he", "had", "given", "\"", "firm", "orders", "\"", "to", "police", "to", "round", "up", "those", "responsible", "for", "the", "bombing", "##s", "and", "bring", "them", "to", "justice", "." ], "ids": [ 33667, 14355, 10766, 118, 11334, 10190, 13724, 117, 10571, 13559, 10142, 16527, 13808, 23658, 56672, 10169, 10464, 10108, 10105, 15363, 10108, 11736, 24792, 37228, 99451, 15647, 117, 21937, 10105, 27636, 10159, 50024, 10106, 169, 33311, 10261, 10374, 13507, 107, 23410, 31303, 107, 10114, 15034, 10114, 13569, 10741, 12676, 21586, 10142, 10105, 67011, 10107, 10111, 26092, 11345, 10114, 25791, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Judge", "##s", "on", "the", "island", "had", "accused", "Paris", "of", "taking", "a", "la", "##x", "stan", "##ce", "on", "guerrilla", "violence", "while", "conducting", "secret", "but", "widely", "-", "reported", "talks", "with", "separat", "##ists", "which", "have", "now", "failed", "." ], "ids": [ 31617, 10107, 10135, 10105, 17354, 10374, 37303, 10728, 10108, 18084, 169, 10109, 10686, 45244, 10419, 10135, 106552, 26342, 11371, 80006, 23658, 10473, 24300, 118, 15943, 56672, 10169, 81806, 18206, 10319, 10529, 11858, 20775, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "latest", "bombing", ",", "close", "on", "the", "heel", "##s", "of", "the", "new", "orders", ",", "brought", "charges", "that", "police", "were", "power", "##less", "." ], "ids": [ 10117, 50908, 67011, 117, 16065, 10135, 10105, 39965, 10107, 10108, 10105, 10751, 31303, 117, 17327, 31128, 10189, 15034, 10309, 13183, 14985, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "No", "search", "##es", ",", "no", "arrest", "##s", ",", "no", "police", "rein", "##forcement", "##s", "visible", "on", "the", "island", ",", "despite", "the", "ministry", "'", "s", "promise", "##s", ",", "\"", "the", "daily", "France", "-", "So", "##ir", "la", "##mente", "##d", "." ], "ids": [ 107, 10657, 22419, 10171, 117, 10192, 45165, 10107, 117, 10192, 15034, 74720, 90202, 10107, 26877, 10135, 10105, 17354, 117, 22087, 10105, 65338, 112, 187, 73871, 10107, 117, 107, 10105, 27636, 10688, 118, 12882, 10835, 10109, 10611, 10162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "On", "the", "island", ",", "as", "at", "the", "Place", "Beau", "##va", "##u", "(", "the", "Interior", "Ministry", "'", "s", "Paris", "address", ")", ",", "people", "are", "well", "aware", "who", "is", "who", "and", "who", "is", "doing", "what", "." ], "ids": [ 107, 10576, 10105, 17354, 117, 10146, 10160, 10105, 17452, 85867, 10362, 10138, 113, 10105, 33667, 19170, 112, 187, 10728, 32198, 114, 117, 11426, 10301, 11206, 66625, 10479, 10124, 10479, 10111, 10479, 10124, 30918, 12976, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 3, 7, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "time", "to", "end", "this", "night", "##ly", "far", "##ce", ",", "\"", "said", "the", "pro", "-", "government", "daily", "Le", "Figaro", "in", "an", "editorial", "." ], "ids": [ 10377, 10124, 10635, 10114, 11572, 10531, 16903, 10454, 13301, 10419, 117, 107, 12415, 10105, 11284, 118, 12047, 27636, 10281, 64300, 10106, 10151, 30202, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9 ] }, { "tokens": [ "No", "one", "immediately", "claimed", "responsibility", "for", "Thursday", "'", "s", "incidents", ",", "which", "brought", "to", "23", "the", "number", "of", "guerrilla", "attacks", "on", "the", "resort", "island", "since", "mid", "-", "August", ",", "when", "separat", "##ist", "guerrilla", "##s", "ended", "a", "sh", "##ak", "##y", "seven", "-", "month", "tr", "##uce", "." ], "ids": [ 10657, 10464, 24029, 20737, 39450, 10142, 67067, 112, 187, 73451, 117, 10319, 17327, 10114, 10328, 10105, 11487, 10108, 106552, 26483, 10135, 10105, 60637, 17354, 11764, 15607, 118, 10735, 117, 10841, 81806, 11293, 106552, 10107, 18428, 169, 48201, 10710, 10157, 15767, 118, 14064, 32221, 24075, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Corsica", "has", "been", "ra", "##cked", "by", "low", "-", "level", "separat", "##ist", "-", "inspired", "violence", ",", "principal", "##ly", "directed", "against", "government", "targets", ",", "for", "two", "decades", "." ], "ids": [ 101208, 10393, 10590, 11859, 72333, 10155, 15626, 118, 13277, 81806, 11293, 118, 27055, 26342, 117, 11652, 10454, 15446, 11327, 12047, 56996, 117, 10142, 10551, 33256, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "daily", "Le", "Monde", "reported", "on", "Wednesday", "some", "separat", "##ist", "movements", "were", "considering", "taking", "their", "attacks", "to", "the", "French", "mainland", "on", "the", "principle", "that", "\"", "300", "gram", "##mes", "of", "ex", "##plosive", "##s", "on", "the", "continent", "have", "more", "impact", "than", "300", "kilo", "##s", "in", "Corsica", "\"", "." ], "ids": [ 10117, 27636, 10281, 33074, 15943, 10135, 57611, 11152, 81806, 11293, 42641, 10309, 81243, 18084, 10455, 26483, 10114, 10105, 11894, 70083, 10135, 10105, 48300, 10189, 107, 11093, 49209, 13546, 10108, 11419, 83655, 10107, 10135, 10105, 39262, 10529, 10798, 21316, 11084, 11093, 86754, 10107, 10106, 101208, 107, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "The", "newspaper", "said", "separat", "##ists", "may", "take", "advantage", "of", "social", "un", "##rest", "widely", "expected", "on", "the", "mainland", "in", "coming", "weeks", "over", "government", "aust", "##erit", "##y", "plans", "to", "sto", "##ke", "a", "popular", "back", "##lash", "against", "the", "government", "." ], "ids": [ 10117, 22047, 12415, 81806, 18206, 11387, 13574, 38119, 10108, 12142, 10119, 34189, 24300, 25973, 10135, 10105, 70083, 10106, 23959, 20750, 10491, 12047, 61728, 101493, 10157, 18195, 10114, 47264, 10550, 169, 12600, 12014, 25297, 11327, 10105, 12047, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sweden", "'", "s", "OM", "to", "open", "London", "forest", "products", "bou", "##rse", "." ], "ids": [ 20937, 112, 187, 100397, 10114, 14087, 10829, 27736, 20895, 94335, 16239, 119 ], "entity": [ "B-LOC", "O", "O", "B-ORG", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 3, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ST", "##OCK", "##H", "##OL", "##M", "1996", "-", "08", "-", "29" ], "ids": [ 53317, 96608, 12396, 39272, 11517, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Swedish", "options", "and", "deriva", "##tives", "exchange", "OM", "Gruppen", "AB", "said", "on", "Thursday", "it", "would", "open", "an", "electronic", "bou", "##rse", "for", "forest", "industry", "products", "in", "London", "in", "the", "first", "half", "of", "1997", "." ], "ids": [ 21381, 53121, 10111, 24778, 37588, 27714, 100397, 19608, 21644, 12415, 10135, 67067, 10271, 10894, 14087, 10151, 20837, 94335, 16239, 10142, 27736, 17425, 20895, 10106, 10829, 10106, 10105, 10422, 13877, 10108, 10391, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Together", "with", "sub", "##sid", "##iar", "##ies", "OM", "##L", "##X", ",", "the", "London", "Sec", "##urities", "&", "Der", "##ivat", "##ives", "Exchange", "and", "OM", "Stockholm", ",", "OM", "Gruppen", "will", "open", "an", "international", "electronic", "bou", "##rse", "for", "forest", "products", "in", "the", "first", "half", "of", "1997", ",", "\"", "OM", "Gruppen", "said", "in", "a", "statement", "." ], "ids": [ 107, 29586, 10169, 13987, 34396, 21501, 11624, 100397, 11369, 12674, 117, 10105, 10829, 109754, 82073, 111, 10445, 34620, 24407, 32424, 10111, 100397, 14607, 117, 100397, 19608, 11337, 14087, 10151, 12533, 20837, 94335, 16239, 10142, 27736, 20895, 10106, 10105, 10422, 13877, 10108, 10391, 117, 107, 100397, 19608, 12415, 10106, 169, 33311, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 3, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "first", "com", "##mo", "##dity", "to", "be", "traded", "on", "the", "P", "##UL", "##P", "##E", "##X", "bou", "##rse", "will", "be", "pu", "##lp", ",", "but", "OM", "said", "trade", "would", "be", "extended", "to", "include", "products", "such", "as", "timber", ",", "re", "##cycle", "##d", "paper", "and", "other", "paper", "quali", "##ties", "." ], "ids": [ 10117, 10422, 10212, 11033, 100060, 10114, 10347, 52696, 10135, 10105, 153, 100673, 11127, 11259, 12674, 94335, 16239, 11337, 10347, 34597, 35451, 117, 10473, 100397, 12415, 18908, 10894, 10347, 21777, 10114, 12363, 20895, 11049, 10146, 55447, 117, 11639, 49274, 10162, 17895, 10111, 10684, 17895, 15510, 14197, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Through", "the", "establishment", "of", "P", "##UL", "##P", "##E", "##X", ",", "London", "will", "have", "a", "com", "##mo", "##diti", "##es", "bou", "##rse", "for", "forest", "products", "which", "complement", "##s", "existing", "bou", "##rse", "##s", "for", "oil", ",", "metal", "##s", "and", "'", "soft", "##s", "'", "(", "coffee", ",", "sugar", "and", "co", "##coa", ")", ",", "\"", "OM", "said", "." ], "ids": [ 107, 23329, 10105, 31989, 10108, 153, 100673, 11127, 11259, 12674, 117, 10829, 11337, 10529, 169, 10212, 11033, 63203, 10171, 94335, 16239, 10142, 27736, 20895, 10319, 106391, 10107, 26636, 94335, 16239, 10107, 10142, 21073, 117, 13795, 10107, 10111, 112, 44898, 10107, 112, 113, 69954, 117, 60390, 10111, 11170, 83592, 114, 117, 107, 100397, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "P", "##UL", "##P", "##E", "##X", "was", "the", "result", "of", "a", "three", "-", "year", "project", "run", "in", "cooperation", "between", "OM", "and", "representatives", "of", "the", "forest", "industry", ",", "the", "company", "said", "." ], "ids": [ 153, 100673, 11127, 11259, 12674, 10134, 10105, 14493, 10108, 169, 11003, 118, 10924, 13920, 14095, 10106, 56547, 10948, 100397, 10111, 49959, 10108, 10105, 27736, 17425, 117, 10105, 12100, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hu", "##ge", "swing", "##s", "in", "the", "price", "of", "pu", "##lp", "over", "the", "past", "few", "years", "have", "made", "pu", "##lp", "producers", "'", "profit", "##ability", "un", "##pred", "##ict", "##able", ",", "and", "made", "in", "##vesti", "##ng", "in", "new", "production", "capacity", "a", "risk", "##y", "business", "." ], "ids": [ 43707, 10525, 74772, 10107, 10106, 10105, 30839, 10108, 34597, 35451, 10491, 10105, 17781, 13824, 10855, 10529, 11019, 34597, 35451, 46511, 112, 25081, 35717, 10119, 88390, 106788, 13096, 117, 10111, 11019, 10106, 63996, 10376, 10106, 10751, 12116, 23095, 169, 24179, 10157, 14155, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Without", "the", "ability", "to", "hed", "##ge", "prices", ",", "changes", "in", "the", "world", "market", "price", "for", "pu", "##lp", "has", "had", "an", "immediate", "impact", "on", "players", "'", "profit", "##ability", ",", "\"", "OM", "said", "." ], "ids": [ 107, 28441, 10105, 23599, 10114, 68012, 10525, 57476, 117, 19010, 10106, 10105, 11356, 17313, 30839, 10142, 34597, 35451, 10393, 10374, 10151, 46938, 21316, 10135, 16021, 112, 25081, 35717, 117, 107, 100397, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "It", "said", "global", "production", "of", "pu", "##lp", "amount", "##ed", "to", "around", "200", "million", "tonnes", "per", "year", ",", "of", "which", "around", "20", "percent", "or", "40", "million", "tonnes", "was", "sold", "on", "the", "spot", "market", "." ], "ids": [ 10377, 12415, 18331, 12116, 10108, 34597, 35451, 24074, 10336, 10114, 12166, 10777, 12473, 39435, 10178, 10924, 117, 10108, 10319, 12166, 10197, 22362, 10345, 10533, 12473, 39435, 10134, 15337, 10135, 10105, 28504, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "At", "current", "prices", ",", "the", "value", "of", "this", "production", "was", "around", "$", "25", "billion", "." ], "ids": [ 11699, 14978, 57476, 117, 10105, 19211, 10108, 10531, 12116, 10134, 12166, 109, 10258, 25848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##UL", "##P", "##E", "##X", "will", "be", "both", "a", "market", "##place", "and", "a", "clear", "##ing", "house", ",", "OM", "said", ",", "adding", "that", "the", "British", "Sec", "##urities", "and", "Investment", "##s", "Board", "had", "been", "informed", "of", "OM", "'", "s", "plans", "." ], "ids": [ 153, 100673, 11127, 11259, 12674, 11337, 10347, 11408, 169, 17313, 30236, 10111, 169, 24866, 10230, 13215, 117, 100397, 12415, 117, 44841, 10189, 10105, 11160, 109754, 82073, 10111, 63254, 10107, 14743, 10374, 10590, 64330, 10108, 100397, 112, 187, 18195, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "P", "##UL", "##P", "##E", "##X", "'", "s", "clear", "##ing", "operation", "will", "be", "covered", "by", "the", "parent", "company", "gu", "##aran", "##tee", "issued", "by", "OM", "Gruppen", "to", "its", "who", "##lly", "-", "owned", "bou", "##rse", "##s", "and", "clear", "##ing", "organisations", "." ], "ids": [ 153, 100673, 11127, 11259, 12674, 112, 187, 24866, 10230, 20080, 11337, 10347, 21543, 10155, 10105, 43045, 12100, 75980, 24367, 47738, 21694, 10155, 100397, 19608, 10114, 10474, 10479, 17903, 118, 17012, 94335, 16239, 10107, 10111, 24866, 10230, 41536, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Stockholm", "news", "##room", ",", "+", "46", "-", "8", "-", "700", "1006" ], "ids": [ 118, 118, 14607, 14424, 25525, 117, 116, 11528, 118, 129, 118, 12367, 59017 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Amsterdam", "-", "Rotterdam", "-", "Antwerp", "oil", "stock", "levels", "fall", "." ], "ids": [ 14017, 118, 25136, 118, 85332, 21073, 20511, 21559, 18042, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ER", "##DA", "##M", "1996", "-", "08", "-", "29" ], "ids": [ 24339, 32995, 24093, 36382, 11517, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Oil", "product", "inventor", "##ies", "held", "in", "independent", "tank", "##age", "in", "the", "Amsterdam", "-", "Rotterdam", "-", "Antwerp", "area", "were", "at", "the", "following", "levels", ",", "with", "week", "-", "ago", "and", "year", "-", "ago", "levels", ",", "industry", "sources", "said", "." ], "ids": [ 33049, 21535, 63204, 11624, 11991, 10106, 16584, 28671, 12276, 10106, 10105, 14017, 118, 25136, 118, 85332, 11168, 10309, 10160, 10105, 11901, 21559, 117, 10169, 16118, 118, 36390, 10111, 10924, 118, 36390, 21559, 117, 17425, 19023, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "All", "figures", "in", "thousands", "of", "tonnes", ":" ], "ids": [ 11101, 21068, 10106, 39966, 10108, 39435, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "29", "/", "8", "/", "96", "22", "/", "8", "/", "96", "1", "/", "9", "/", "95" ], "ids": [ 10386, 120, 129, 120, 12308, 10306, 120, 129, 120, 12308, 122, 120, 130, 120, 11978 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gas", "##oline", "400", "400", "-", "425", "425" ], "ids": [ 34874, 96541, 11176, 11176, 118, 33437, 33437 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Na", "##ph", "##tha", "50", "-", "75", "75", "-", "100", "50", "-", "75" ], "ids": [ 10685, 28088, 25388, 10462, 118, 11417, 11417, 118, 10407, 10462, 118, 11417 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gas", "oil", "1", ",", "600", "1", ",", "650", "1", ",", "850", "-", "1", ",", "900" ], "ids": [ 34874, 21073, 122, 117, 11796, 122, 117, 21132, 122, 117, 24934, 118, 122, 117, 13545 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fuel", "oil", "325", "325", "-", "350", "425" ], "ids": [ 103599, 21073, 25843, 25843, 118, 14992, 33437 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jet", "ker", "##o", "15", "15", "-", "20", "25" ], "ids": [ 39933, 53628, 10133, 10208, 10208, 118, 10197, 10258 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Motor", "gas", "##oline", "stock", "##s", "di", "##pped", "slightly", "as", "bar", "##ges", "left", "for", "Germany", ",", "but", "there", "were", "few", "in", "##flow", "##s", "of", "cargo", "##es", "." ], "ids": [ 19440, 16091, 96541, 20511, 10107, 10120, 44357, 31603, 10146, 18121, 13156, 12153, 10142, 12775, 117, 10473, 11155, 10309, 13824, 10106, 105739, 10107, 10108, 15856, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Na", "##ph", "##tha", "inventor", "##ies", "also", "dropped", "as", "Germany", "again", "took", "bar", "##ges", "and", "no", "cargo", "##es", "entered", "AR", "##A", "." ], "ids": [ 10685, 28088, 25388, 63204, 11624, 10379, 30241, 10146, 12775, 13123, 12149, 18121, 13156, 10111, 10192, 15856, 10171, 19226, 50884, 10738, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gas", "oil", "stock", "##s", "fell", "with", "some", "cargo", "##es", "arriving", "from", "the", "former", "Soviet", "Union", ",", "but", "very", "fast", "through", "##put", "to", "markets", "in", "Ben", "##elu", "##x", ",", "Germany", "and", "Switzerland", "." ], "ids": [ 34874, 21073, 20511, 10107, 25194, 10169, 11152, 15856, 10171, 65200, 10188, 10105, 11775, 15277, 11457, 117, 10473, 12558, 15040, 11222, 27876, 10114, 42893, 10106, 13304, 43560, 10686, 117, 12775, 10111, 26002, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Fuel", "oil", "inventor", "##ies", "di", "##pped", "slightly", "with", "some", "straight", "-", "run", "arrival", "##s", ",", "but", "fair", "bun", "##ker", "##ing", "demand", "removing", "more", "material", "." ], "ids": [ 103599, 21073, 63204, 11624, 10120, 44357, 31603, 10169, 11152, 31214, 118, 14095, 40285, 10107, 117, 10473, 45122, 59230, 11880, 10230, 34394, 100770, 10798, 13540, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jet", "fuel", "stock", "##s", "lower", "##ed", "as", "the", "aviation", "sector", "bought", "." ], "ids": [ 39933, 30550, 20511, 10107, 18165, 10336, 10146, 10105, 45559, 17417, 28870, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Philip", "B", "##len", "##kins", "##op", ",", "Amsterdam", "news", "##room", "31", "20", "504", "5000" ], "ids": [ 118, 118, 13324, 139, 11608, 39460, 13362, 117, 14017, 14424, 25525, 10413, 10197, 43098, 17436 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "German", "anti", "-", "nuclear", "activists", "in", "pan", "##tomi", "##me", "protest", "." ], "ids": [ 12026, 14249, 118, 20761, 84024, 10106, 24960, 81334, 10627, 36627, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##ON", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 139, 30118, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "About", "200", "German", "anti", "-", "nuclear", "activists", "protest", "##ed", "on", "Thursday", "against", "nuclear", "waste", "transportation", "by", "re", "-", "ena", "##cting", "scenes", "from", "a", "demonstration", "they", "staged", "in", "May", "that", "turned", "into", "a", "violent", "c", "##lash", "with", "police", "." ], "ids": [ 16260, 10777, 12026, 14249, 118, 20761, 84024, 36627, 10336, 10135, 67067, 11327, 20761, 59158, 48546, 10155, 11639, 118, 55766, 64716, 32483, 10188, 169, 97929, 10689, 84310, 10106, 10725, 10189, 21031, 10708, 169, 43934, 171, 25297, 10169, 15034, 119 ], "entity": [ "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Act", "##ivi", "##sts", "dressed", "as", "police", "brand", "##ished", "bat", "##ons", "and", "firing", "a", "theatre", "-", "prop", "water", "can", "##non", "at", "\"", "demo", "##nst", "##rators", "\"", "." ], "ids": [ 13968, 22317, 28036, 94092, 10146, 15034, 23467, 54438, 11519, 13326, 10111, 68573, 169, 28016, 118, 30045, 12286, 10944, 17518, 10160, 107, 30776, 40300, 94721, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "who", "had", "turned", "out", "in", "force", "all", "around", "the", "government", "quarter", "fear", "##ing", "violence", "looked", "on", "in", "am", "##usement", "." ], "ids": [ 18051, 10479, 10374, 21031, 10950, 10106, 15031, 10435, 12166, 10105, 12047, 28330, 44929, 10230, 26342, 59822, 10135, 10106, 10392, 51927, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "May", "dozen", "##s", "of", "demo", "##nst", "##rators", "and", "police", "were", "injured", "in", "violent", "c", "##lash", "##es", "around", "the", "Go", "##rle", "##ben", "nuclear", "waste", "depot", "as", "hundreds", "of", "protest", "##ers", "tried", "to", "block", "a", "delivery", "of", "waste", "by", "train", "and", "truck", "." ], "ids": [ 14812, 10725, 84956, 10107, 10108, 30776, 40300, 94721, 10111, 15034, 10309, 36081, 10106, 43934, 171, 25297, 10171, 12166, 10105, 14439, 43539, 10965, 20761, 59158, 91673, 10146, 48329, 10108, 36627, 10901, 27156, 10114, 27242, 169, 55626, 10108, 59158, 10155, 17767, 10111, 58907, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italy", "police", "arrest", "five", "over", "double", "Mafia", "killing", "." ], "ids": [ 11619, 15034, 45165, 12403, 10491, 15790, 60833, 34248, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CA", "##TA", "##NI", "##A", ",", "Sicily", "1996", "-", "08", "-", "29" ], "ids": [ 24707, 24951, 52898, 10738, 117, 79636, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "Police", "said", "on", "Thursday", "they", "had", "arrested", "five", "people", "in", "connection", "with", "the", "sl", "##ay", "##ing", "of", "the", "daughter", "and", "14", "-", "year", "-", "old", "nephew", "of", "a", "Mafia", "boss", "earlier", "this", "week", "." ], "ids": [ 11667, 18051, 12415, 10135, 67067, 10689, 10374, 29479, 12403, 11426, 10106, 31671, 10169, 10105, 38523, 13998, 10230, 10108, 10105, 15243, 10111, 10247, 118, 10924, 118, 12898, 66627, 10108, 169, 60833, 48246, 18905, 10531, 16118, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Santa", "P", "##ug", "##lisi", ",", "22", ",", "and", "Salvatore", "Bot", "##ta", "were", "gun", "##ned", "down", "in", "a", "cemetery", "in", "this", "eastern", "Sicilia", "##n", "city", "on", "Tuesday", "in", "a", "crime", "which", "shock", "##ed", "even", "hard", "##ened", "anti", "-", "Mafia", "in", "##vesti", "##gator", "##s", "." ], "ids": [ 11154, 153, 19951, 70743, 117, 10306, 117, 10111, 39409, 18992, 10213, 10309, 23103, 17021, 12935, 10106, 169, 56810, 10106, 10531, 18677, 24765, 10115, 11584, 10135, 70245, 10106, 169, 22564, 10319, 62868, 10336, 13246, 19118, 27867, 14249, 118, 60833, 10106, 63996, 75791, 10107, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "arrest", "##s", "followed", "a", "tip", "-", "off", "from", "a", "married", "couple", "who", "une", "##xpected", "##ly", "showed", "up", "at", "in", "##vesti", "##gator", "##s", "'", "offices", "on", "Wednesday", ".", "\"" ], "ids": [ 10117, 45165, 10107, 15689, 169, 25119, 118, 11898, 10188, 169, 13524, 20969, 10479, 10231, 101239, 10454, 27463, 10741, 10160, 10106, 63996, 75791, 10107, 112, 29918, 10135, 57611, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "They", "wanted", "to", "get", "a", "weight", "off", "their", "conscience", "##s", ",", "\"", "a", "police", "spoke", "##sman", "said", "." ], "ids": [ 11696, 22591, 10114, 15329, 169, 25512, 11898, 10455, 63789, 10107, 117, 107, 169, 15034, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "added", "the", "couple", "had", "also", "shed", "light", "on", "the", "murder", "last", "year", "of", "the", "wife", "of", "Mafia", "boss", "Ni", "##tto", "Santa", "##pa", "##ola", "." ], "ids": [ 10357, 16288, 10105, 20969, 10374, 10379, 106942, 15765, 10135, 10105, 29448, 12469, 10924, 10108, 10105, 14384, 10108, 60833, 48246, 30409, 15141, 11154, 11359, 15154, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9 ] }, { "tokens": [ "P", "##ug", "##lisi", "was", "shot", "as", "she", "kn", "##elt", "pra", "##ying", "by", "the", "tomb", "of", "her", "young", "husband", ",", "who", "was", "himself", "killed", "last", "year", "in", "a", "Mafia", "amb", "##ush", "." ], "ids": [ 153, 19951, 70743, 10134, 19508, 10146, 10833, 96820, 16769, 69857, 40018, 10155, 10105, 78532, 10108, 10485, 14739, 19634, 117, 10479, 10134, 14764, 15875, 12469, 10924, 10106, 169, 60833, 10559, 37026, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bot", "##ta", ",", "who", "had", "accompanied", "P", "##ug", "##lisi", "to", "the", "ce", "##meta", "##ry", ",", "tried", "to", "fl", "##ee", "the", "lo", "##ne", "gun", "##man", "but", "was", "caught", "and", "killed", "." ], "ids": [ 18992, 10213, 117, 10479, 10374, 39951, 153, 19951, 70743, 10114, 10105, 10794, 65153, 10908, 117, 27156, 10114, 58768, 13321, 10105, 10406, 10238, 23103, 10589, 10473, 10134, 39797, 10111, 15875, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Th", "##ieve", "##s", "make", "off", "with", "cash", "from", "prison", "can", "##teen", "." ], "ids": [ 51635, 38666, 10107, 13086, 11898, 10169, 52828, 10188, 20538, 10944, 20156, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##IM", "##ER", "##IC", "##K", ",", "Ireland", "1996", "-", "08", "-", "29" ], "ids": [ 149, 42031, 24093, 30889, 11733, 117, 14637, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Th", "##ieve", "##s", "sto", "##le", "almost", "2", ",", "000", "Irish", "pounds", "(", "$", "3", ",", "000", ")", "from", "the", "officers", "'", "can", "##teen", "of", "a", "Limerick", "jail", "on", "Thursday", "while", "ward", "##ers", "sl", "##ept", "in", "a", "room", "ups", "##tai", "##rs", "." ], "ids": [ 51635, 38666, 10107, 47264, 10284, 17122, 123, 117, 10259, 15624, 61982, 113, 109, 124, 117, 10259, 114, 10188, 10105, 23579, 112, 10944, 20156, 10108, 169, 90137, 75934, 10135, 67067, 11371, 60026, 10901, 38523, 54973, 10106, 169, 19555, 107717, 26812, 10943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "the", "thi", "##eves", "inter", "##cept", "##ed", "a", "woman", "arriving", "to", "work", "at", "the", "can", "##teen", ",", "forced", "her", "to", "open", "the", "safe", "where", "taking", "##s", "were", "kept", "and", "made", "off", "with", "the", "cash", "." ], "ids": [ 18051, 12415, 10105, 24106, 56591, 22021, 97782, 10336, 169, 18299, 65200, 10114, 11424, 10160, 10105, 10944, 20156, 117, 20054, 10485, 10114, 14087, 10105, 43966, 10940, 18084, 10107, 10309, 26546, 10111, 11019, 11898, 10169, 10105, 52828, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "While", "the", "ro", "##bber", "##y", "was", "going", "on", ",", "several", "officers", "were", "asl", "##eep", "in", "a", "room", "over", "the", "can", "##teen", ",", "which", "is", "in", "the", "grounds", "of", "the", "prison", "on", "Ireland", "'", "s", "southwest", "coast", "." ], "ids": [ 14600, 10105, 25470, 60805, 10157, 10134, 19090, 10135, 117, 11736, 23579, 10309, 24491, 91633, 10106, 169, 19555, 10491, 10105, 10944, 20156, 117, 10319, 10124, 10106, 10105, 38190, 10108, 10105, 20538, 10135, 14637, 112, 187, 37297, 22216, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "##s", "hold", "HIV", "-", "pension", "##er", "for", "har", "##ass", "##ing", "ho", "##oke", "##rs", "." ], "ids": [ 11667, 10107, 18500, 30855, 118, 70838, 10165, 10142, 10453, 98800, 10230, 13173, 37861, 10943, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GE", "##NO", "##A", ",", "Italy", "1996", "-", "08", "-", "29" ], "ids": [ 62997, 67292, 10738, 117, 11619, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Italian", "police", "said", "on", "Thursday", "they", "had", "arrested", "a", "61", "-", "year", "-", "old", "man", "after", "he", "fired", "bl", "##ank", "shots", "at", "pro", "##stitute", "##s", "he", "bl", "##amed", "for", "spread", "##ing", "AIDS", "." ], "ids": [ 11667, 15034, 12415, 10135, 67067, 10689, 10374, 29479, 169, 12314, 118, 10924, 118, 12898, 10817, 10662, 10261, 38903, 21484, 30022, 74437, 10160, 11284, 69442, 10107, 10261, 21484, 83865, 10142, 25609, 10230, 36119, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9 ] }, { "tokens": [ "The", "pension", "##er", ",", "named", "only", "as", "Pietro", "T", ".", ",", "told", "in", "##vesti", "##gator", "##s", "he", "was", "in", "##fected", "with", "HIV", ",", "the", "AIDS", "virus", ",", "and", "his", "wife", "had", "died", "of", "the", "disease", "." ], "ids": [ 10117, 70838, 10165, 117, 12038, 10893, 10146, 17476, 157, 119, 117, 21937, 10106, 63996, 75791, 10107, 10261, 10134, 10106, 108881, 10169, 30855, 117, 10105, 36119, 20399, 117, 10111, 10226, 14384, 10374, 12482, 10108, 10105, 21911, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "did", "not", "say", "how", "they", "had", "contracted", "the", "illness", "." ], "ids": [ 10357, 12172, 10472, 23763, 14796, 10689, 10374, 107661, 10105, 56507, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "the", "man", "had", "recently", "been", "spotted", "c", "##rui", "##sing", "red", "-", "light", "areas", "in", "this", "northern", "Italian", "city", ",", "hur", "##ling", "abuse", "at", "pro", "##stitute", "##s", "and", "firing", "bl", "##ank", "shots", "at", "them", "." ], "ids": [ 18051, 12415, 10105, 10817, 10374, 23746, 10590, 96924, 171, 59559, 16357, 10680, 118, 15765, 14544, 10106, 10531, 17335, 11667, 11584, 117, 52824, 11945, 51401, 10160, 11284, 69442, 10107, 10111, 68573, 21484, 30022, 74437, 10160, 11345, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "said", "they", "found", "in", "his", "apartment", "two", "fa", "##ke", "guns", "and", "a", "pistol", "that", "would", "only", "fire", "bl", "##ank", "##s", ".", "\"" ], "ids": [ 18051, 12415, 10689, 11823, 10106, 10226, 54617, 10551, 12211, 10550, 31199, 10111, 169, 91264, 10189, 10894, 10893, 13559, 21484, 30022, 10107, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Although", "fa", "##ke", "guns", "are", "legal", ",", "the", "use", "he", "made", "of", "them", "means", "he", "could", "be", "tried", ",", "\"", "a", "police", "official", "said", "." ], "ids": [ 15785, 12211, 10550, 31199, 10301, 17139, 117, 10105, 11760, 10261, 11019, 10108, 11345, 17574, 10261, 12174, 10347, 27156, 117, 107, 169, 15034, 14731, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bo", "##dies", "found", "at", "site", "of", "Russian", "jet", "crash", "-", "officials", "." ], "ids": [ 27622, 29470, 11823, 10160, 11920, 10108, 13463, 48504, 42774, 118, 27730, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OS", "##L", "##O", "1996", "-", "08", "-", "29" ], "ids": [ 18398, 11369, 11403, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Bo", "##dies", "have", "been", "sight", "##ed", "but", "no", "survivors", "have", "yet", "been", "found", "at", "the", "site", "of", "Thursday", "'", "s", "crash", "of", "a", "Russian", "airline", "##r", "on", "Norway", "'", "s", "remote", "Arctic", "island", "of", "Sp", "##itz", "##bergen", ",", "Norwegian", "officials", "said", "." ], "ids": [ 27622, 29470, 10529, 10590, 78327, 10336, 10473, 10192, 81690, 10529, 21833, 10590, 11823, 10160, 10105, 11920, 10108, 67067, 112, 187, 42774, 10108, 169, 13463, 67878, 10129, 10135, 22582, 112, 187, 55808, 46910, 17354, 10108, 46361, 18848, 55054, 117, 24783, 27730, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-LOC", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 1, 9, 9, 9, 2, 9, 9, 1, 5, 5, 9, 2, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "have", "found", "dead", "people", ",", "\"", "said", "Rune", "Hansen", ",", "the", "island", "'", "s", "deputy", "governor", ",", "told", "Norwegian", "television", "." ], "ids": [ 107, 12865, 10529, 11823, 23457, 11426, 117, 107, 12415, 87374, 22126, 117, 10105, 17354, 112, 187, 45404, 28795, 117, 21937, 24783, 14162, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "The", "Norwegian", "news", "agency", "NT", "##B", "quoted", "another", "official", "on", "the", "island", "as", "saying", "no", "survivors", "had", "been", "found", "." ], "ids": [ 10117, 24783, 14424, 34649, 49942, 11274, 70676, 12864, 14731, 10135, 10105, 17354, 10146, 22807, 10192, 81690, 10374, 10590, 11823, 119 ], "entity": [ "O", "B-MISC", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "V", "##nu", "##kovo", "Airlines", "Tu", "##pole", "##v", "154", "flight", "from", "Moscow", ",", "carrying", "129", "passengers", "and", "a", "crew", "of", "12", ",", "crashed", "in", "bad", "weather", "10", "km", "(", "six", "miles", ")", "east", "of", "Long", "##ye", "##ar", "##byen", ",", "the", "island", "'", "s", "only", "airs", "##tri", "##p", ",", "officials", "said", "." ], "ids": [ 10117, 159, 11147, 95380, 17768, 20108, 30328, 10477, 20481, 23578, 10188, 18744, 117, 39157, 18336, 37008, 10111, 169, 24032, 10108, 10186, 117, 91126, 10106, 15838, 35660, 10150, 10204, 113, 12449, 14148, 114, 13827, 10108, 13307, 12871, 10354, 40637, 117, 10105, 17354, 112, 187, 10893, 104816, 21570, 10410, 117, 27730, 12415, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 2, 6, 6, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "First", "rescue", "##rs", "arrived", "shortly", "after", "1", "p", ".", "m", ".", "(", "1100", "GMT", ")", "and", "reported", "soon", "afterwards", "that", "most", "of", "the", "three", "-", "engine", "jet", "'", "s", "w", "##reck", "##age", "was", "scattered", "around", "the", "top", "of", "the", "small", "Opera", "mountain", "while", "the", "rest", "had", "sl", "##id", "down", "the", "mountains", "##ide", "." ], "ids": [ 12128, 48022, 10943, 22584, 31555, 10662, 122, 184, 119, 181, 119, 113, 23396, 20362, 114, 10111, 15943, 17864, 49827, 10189, 10992, 10108, 10105, 11003, 118, 18240, 48504, 112, 187, 191, 80442, 12276, 10134, 95335, 12166, 10105, 12364, 10108, 10105, 12474, 16836, 25233, 11371, 10105, 17333, 10374, 38523, 11249, 12935, 10105, 44623, 13315, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Air", "traffic", "officials", "said", "they", "had", "lost", "contact", "with", "the", "flight", ",", "scheduled", "to", "arrive", "at", "around", "10", ".", "15", "a", ".", "m", ".", "(", "08", "##15", "GMT", ")", ",", "shortly", "before", "it", "was", "due", "to", "land", "." ], "ids": [ 11704, 26482, 27730, 12415, 10689, 10374, 14172, 20637, 10169, 10105, 23578, 117, 34081, 10114, 27814, 10160, 12166, 10150, 119, 10208, 169, 119, 181, 119, 113, 11052, 37462, 20362, 114, 117, 31555, 11360, 10271, 10134, 10850, 10114, 11773, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sp", "##itz", "##bergen", "is", "a", "Norwegian", "coal", "-", "mining", "settlement", "." ], "ids": [ 46361, 18848, 55054, 10124, 169, 24783, 39145, 118, 32802, 23931, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "only", "other", "community", "is", "in", "the", "Russian", "village", "of", "Bare", "##nts", "##burg", "." ], "ids": [ 10117, 10893, 10684, 13354, 10124, 10106, 10105, 13463, 11607, 10108, 104412, 14073, 12248, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 5, 9 ] }, { "tokens": [ "Russia", "and", "Norway", "share", "the", "island", "'", "s", "resources", "under", "a", "treaty", "dating", "back", "to", "the", "1920s", "." ], "ids": [ 14664, 10111, 22582, 23867, 10105, 17354, 112, 187, 25744, 10571, 169, 56353, 33573, 12014, 10114, 10105, 44126, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Gale", "##force", "winds", "and", "heavy", "rain", "##s", "bat", "##ter", "Belgium", "." ], "ids": [ 61016, 39910, 63782, 10111, 18296, 50939, 10107, 11519, 10877, 26519, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "BR", "##US", "##SE", "##LS", "1996", "-", "08", "-", "29" ], "ids": [ 49351, 32612, 39039, 66934, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Torre", "##ntial", "rain", "##s", "and", "gal", "##ef", "##orce", "winds", "bat", "##tere", "##d", "Belgium", "on", "Thursday", "causing", "widespread", "damage", "as", "some", "areas", "had", "more", "rainfall", "in", "24", "hours", "than", "they", "normally", "get", "in", "a", "month", ",", "the", "met", "##eo", "##rol", "##ogical", "office", "said", "." ], "ids": [ 20630, 109902, 50939, 10107, 10111, 79332, 16822, 50561, 63782, 11519, 45417, 10162, 26519, 10135, 67067, 34705, 48675, 26115, 10146, 11152, 14544, 10374, 10798, 91549, 10106, 10233, 19573, 11084, 10689, 48252, 15329, 10106, 169, 14064, 117, 10105, 10428, 15998, 22698, 77720, 14301, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cell", "##ars", "were", "flood", "##ed", ",", "trees", "up", "##ro", "##ote", "##d", "and", "roof", "##s", "damaged", ",", "but", "there", "were", "no", "reports", "of", "any", "injuries", ",", "an", "interior", "affairs", "ministry", "spoke", "##sman", "said", "." ], "ids": [ 29494, 21087, 10309, 71027, 10336, 117, 28675, 10741, 10567, 24831, 10162, 10111, 33347, 10107, 39034, 117, 10473, 11155, 10309, 10192, 26610, 10108, 11178, 49718, 117, 10151, 14806, 43417, 65338, 50005, 24305, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "trains", "were", "delayed", "as", "fallen", "trees", "blocked", "lines", "." ], "ids": [ 13885, 22679, 10309, 67058, 10146, 40055, 28675, 98935, 19515, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Brussels", "received", "5", ".", "6", "cm", "(", "2", ".", "24", "inches", ")", "of", "water", "in", "the", "past", "24", "hours", "-", "-", "compared", "to", "an", "average", "7", ".", "4", "cm", "(", "2", ".", "96", "inches", ")", "per", "month", "-", "-", "but", "in", "several", "communes", "in", "the", "south", "of", "the", "country", "up", "to", "8", "cm", "(", "3", ".", "2", "inches", ")", "fell", ",", "the", "Royal", "Meteor", "##ological", "Institute", "(", "RM", "##T", ")", "said", "." ], "ids": [ 41239, 12296, 126, 119, 127, 11207, 113, 123, 119, 10233, 42211, 114, 10108, 12286, 10106, 10105, 17781, 10233, 19573, 118, 118, 25626, 10114, 10151, 13551, 128, 119, 125, 11207, 113, 123, 119, 12308, 42211, 114, 10178, 14064, 118, 118, 10473, 10106, 11736, 13831, 10106, 10105, 13144, 10108, 10105, 12723, 10741, 10114, 129, 11207, 113, 124, 119, 123, 42211, 114, 25194, 117, 10105, 11596, 104433, 30975, 12031, 113, 61778, 11090, 114, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "The", "RM", "##T", "spoke", "##sman", "said", "that", "near", "the", "eastern", "city", "of", "Turn", "##hout", ",", "a", "group", "of", "boy", "s", "##cout", "##s", "camping", "in", "a", "low", "-", "lying", "me", "##adow", "had", "to", "be", "eva", "##cua", "##ted", "as", "water", "flood", "##ed", "their", "ten", "##ts", "." ], "ids": [ 10117, 61778, 11090, 50005, 24305, 12415, 10189, 12883, 10105, 18677, 11584, 10108, 36750, 45238, 117, 169, 11795, 10108, 26905, 187, 108449, 10107, 106492, 10106, 169, 15626, 118, 74730, 10911, 96580, 10374, 10114, 10347, 103730, 75545, 11912, 10146, 12286, 71027, 10336, 10455, 11769, 10806, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rain", "also", "severely", "hin", "##dere", "##d", "Belgian", "in", "##vesti", "##gator", "##s", "'", "ex", "##cavations", "in", "the", "southern", "village", "of", "Ju", "##met", ",", "where", "they", "are", "looking", "for", "bodies", "in", "one", "of", "the", "houses", "of", "the", "main", "character", "in", "a", "pa", "##edo", "##phile", "sex", "-", "and", "-", "murder", "scandal", "." ], "ids": [ 10117, 50939, 10379, 77464, 19911, 20861, 10162, 36652, 10106, 63996, 75791, 10107, 112, 11419, 108875, 10106, 10105, 17156, 11607, 10108, 45031, 13349, 117, 10940, 10689, 10301, 34279, 10142, 34106, 10106, 10464, 10108, 10105, 21174, 10108, 10105, 12126, 15092, 10106, 169, 10931, 32435, 86247, 18549, 118, 10111, 118, 29448, 83458, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "the", "coastal", "towns", "got", "off", "light", "##ly", "as", "the", "flooding", "that", "had", "been", "expected", "due", "to", "a", "combination", "of", "spring", "tid", "##es", "and", "high", "winds", "failed", "to", "materiali", "##se", "." ], "ids": [ 16976, 10105, 41328, 26656, 19556, 11898, 15765, 10454, 10146, 10105, 91565, 10189, 10374, 10590, 25973, 10850, 10114, 169, 35103, 10108, 26053, 15201, 10171, 10111, 11846, 63782, 20775, 10114, 66407, 10341, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rep", "##sol", "shares", "up", "65", "pese", "##tas", "on", "H", "##1", "results", "." ], "ids": [ 72337, 43115, 45751, 10741, 10843, 95553, 11390, 10135, 145, 10759, 17466, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MA", "##D", "##RI", "##D", "1996", "-", "08", "-", "29" ], "ids": [ 27277, 11490, 46876, 11490, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "in", "Spanish", "oil", "and", "chemical", "##s", "group", "Rep", "##sol", "were", "up", "65", "pese", "##tas", "to", "4", ",", "150", "after", "the", "company", "announced", "net", "first", "half", "profits", "fell", "1", ".", "1", "percent", "to", "61", ".", "45", "billion", "pese", "##tas", "on", "the", "previous", "year", "." ], "ids": [ 106583, 11234, 10106, 14661, 21073, 10111, 29677, 10107, 11795, 72337, 43115, 10309, 10741, 10843, 95553, 11390, 10114, 125, 117, 11766, 10662, 10105, 12100, 13854, 11988, 10422, 13877, 100106, 25194, 122, 119, 122, 22362, 10114, 12314, 119, 10827, 25848, 95553, 11390, 10135, 10105, 16741, 10924, 119 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "This", "was", "close", "to", "the", "market", "'", "s", "for", "##eca", "##st", "of", "net", "profits", "of", "61", ".", "94", "billion", "." ], "ids": [ 10747, 10134, 16065, 10114, 10105, 17313, 112, 187, 10142, 33588, 10562, 10108, 11988, 100106, 10108, 12314, 119, 12749, 25848, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sha", "##res", "in", "Rep", "##sol", "shot", "up", "100", "pese", "##tas", "to", "4", ",", "175", "shortly", "after", "the", "figures", ",", "having", "traded", "down", "10", "pese", "##tas", "before", "the", "figures", "were", "released", "." ], "ids": [ 106583, 11234, 10106, 72337, 43115, 19508, 10741, 10407, 95553, 11390, 10114, 125, 117, 18101, 31555, 10662, 10105, 21068, 117, 13677, 52696, 12935, 10150, 95553, 11390, 11360, 10105, 21068, 10309, 11539, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "ma", "##dne", "##ss", ",", "\"", "said", "an", "anal", "##yst", "at", "a", "Madrid", "broke", "##rage", ",", "adding", "that", "the", "market", "had", "over", "##rea", "##cted", "to", "the", "news", ".", "\"" ], "ids": [ 107, 10377, 112, 187, 10824, 20714, 13420, 117, 107, 12415, 10151, 106615, 62769, 10160, 169, 11727, 30500, 40696, 117, 44841, 10189, 10105, 17313, 10374, 10491, 13236, 27756, 10114, 10105, 14424, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "People", "were", "waiting", "for", "the", "results", "to", "come", "out", "before", "buy", "##ing", "." ], "ids": [ 14235, 10309, 62052, 10142, 10105, 17466, 10114, 10678, 10950, 11360, 47715, 10230, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rise", "has", "been", "very", "quick", "and", "very", "c", "##raz", "##y", ".", "\"" ], "ids": [ 10117, 28710, 10393, 10590, 12558, 69609, 10111, 12558, 171, 29948, 10157, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "predicted", "a", "correct", "##ion", ",", "perhaps", "as", "early", "as", "this", "session", "." ], "ids": [ 10357, 98075, 169, 49148, 11046, 117, 36981, 10146, 11732, 10146, 10531, 30066, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Madrid", "News", "##room", "+", "34", "1", "585", "216", "##1" ], "ids": [ 118, 118, 11727, 12219, 25525, 116, 11069, 122, 51270, 23677, 10759 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Algeria", "forces", "kill", "guerrilla", "##s", "-", "papers", "." ], "ids": [ 43776, 13729, 32099, 106552, 10107, 118, 34546, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "29" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Algeria", "##n", "security", "forces", "killed", "four", "Mo", "##sle", "##m", "guerrilla", "##s", "on", "Tuesday", "in", "a", "village", "south", "of", "the", "capital", "Al", "##giers", ",", "an", "Algeria", "##n", "newspaper", "said", "on", "Thursday", "." ], "ids": [ 43776, 10115, 21849, 13729, 15875, 11598, 34987, 42176, 10147, 106552, 10107, 10135, 70245, 10106, 169, 11607, 13144, 10108, 10105, 12185, 10883, 92894, 117, 10151, 43776, 10115, 22047, 12415, 10135, 67067, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 2, 6, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "armed", "militants", "were", "shot", "dead", "in", "Na", "##har", "village", "90", "km", "(", "56", "miles", ")", "south", "of", "Al", "##giers", ",", "Liber", "##te", "newspaper", "said", "." ], "ids": [ 10117, 34174, 73829, 10309, 19508, 23457, 10106, 10685, 18387, 11607, 10919, 10204, 113, 11628, 14148, 114, 13144, 10108, 10883, 92894, 117, 50679, 10216, 22047, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "Security", "forces", "also", "killed", "an", "uns", "##pec", "##ified", "number", "of", "members", "of", "a", "rebel", "gang", "on", "Wednesday", "in", "the", "Lev", "##eil", "##ly", "suburb", "of", "Al", "##giers", ",", "Le", "Mat", "##in", "newspaper", "reported", "." ], "ids": [ 20924, 13729, 10379, 15875, 10151, 15826, 53625, 31825, 11487, 10108, 12464, 10108, 169, 56696, 16330, 10135, 57611, 10106, 10105, 51644, 41420, 10454, 54824, 10108, 10883, 92894, 117, 10281, 57471, 10245, 22047, 15943, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 5, 9, 3, 7, 7, 9, 9, 9 ] }, { "tokens": [ "An", "estimated", "50", ",", "000", "people", ",", "mostly", "Mo", "##sle", "##m", "militants", "and", "security", "forces", "members", ",", "have", "been", "killed", "in", "violence", "pit", "##ting", "Mo", "##sle", "##m", "guerrilla", "##s", "against", "government", "forces", "since", "early", "1992", ",", "when", "authorities", "cancelled", "a", "general", "election", "in", "which", "Islam", "##ists", "had", "taken", "a", "commanding", "lead", "." ], "ids": [ 10313, 25267, 10462, 117, 10259, 11426, 117, 19774, 34987, 42176, 10147, 73829, 10111, 21849, 13729, 12464, 117, 10529, 10590, 15875, 10106, 26342, 55277, 12141, 34987, 42176, 10147, 106552, 10107, 11327, 12047, 13729, 11764, 11732, 10450, 117, 10841, 28308, 60557, 169, 11389, 13685, 10106, 10319, 14727, 18206, 10374, 15109, 169, 93644, 14107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finn", "##s", "hold", "two", "men", "on", "child", "sex", "-", "abuse", "charges", "." ], "ids": [ 37051, 10107, 18500, 10551, 10588, 10135, 18048, 18549, 118, 51401, 31128, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##EL", "##SI", "##NK", "##I", "1996", "-", "08", "-", "29" ], "ids": [ 145, 68999, 44802, 78043, 11281, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Finnish", "police", "said", "on", "Thursday", "they", "had", "arrested", "two", "men", "suspected", "of", "sexual", "##ly", "abu", "##sing", "a", "cap", "##tive", "13", "-", "year", "-", "old", "girl", ",", "but", "did", "not", "believe", "the", "case", "was", "linked", "to", "others", "in", "Europe", "." ], "ids": [ 37268, 15034, 12415, 10135, 67067, 10689, 10374, 29479, 10551, 10588, 80337, 10108, 19616, 10454, 104735, 16357, 169, 13337, 14079, 10249, 118, 10924, 118, 12898, 24699, 117, 10473, 12172, 10472, 30587, 10105, 13474, 10134, 37947, 10114, 14633, 10106, 11767, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "men", ",", "both", "Finn", "##s", "aged", "about", "40", ",", "were", "arrested", "last", "Saturday", "in", "the", "western", "town", "of", "Tampere", "in", "a", "raid", "on", "a", "luxury", "boat", "owned", "by", "one", "of", "them", "." ], "ids": [ 10117, 10588, 117, 11408, 37051, 10107, 30262, 10978, 10533, 117, 10309, 29479, 12469, 24848, 10106, 10105, 16672, 12221, 10108, 63886, 10106, 169, 52152, 10135, 169, 105156, 30418, 17012, 10155, 10464, 10108, 11345, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "girl", "was", "being", "held", "on", "the", "boat", "and", "had", "sought", "help", "from", "a", "passer", "-", "by", ",", "police", "chief", "inspector", "Il", "##kka", "La", "##ason", "##en", "said", "." ], "ids": [ 10117, 24699, 10134, 11223, 11991, 10135, 10105, 30418, 10111, 10374, 32570, 15217, 10188, 169, 34650, 118, 10155, 117, 15034, 19421, 104701, 10282, 20878, 10159, 64064, 10136, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "This", "is", "an", "individual", "case", "and", "I", "do", "n", "'", "t", "have", "any", "evidence", "linking", "the", "suspect", "##s", "to", "any", "other", "cases", ",", "\"", "La", "##ason", "##en", "said", "." ], "ids": [ 107, 10747, 10124, 10151, 16080, 13474, 10111, 146, 10149, 182, 112, 188, 10529, 11178, 18713, 109784, 10105, 97881, 10107, 10114, 11178, 10684, 16480, 117, 107, 10159, 64064, 10136, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "The", "girl", "was", "taken", "to", "hospital", "." ], "ids": [ 10117, 24699, 10134, 15109, 10114, 18141, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "men", "could", "face", "charges", "carrying", "up", "to", "six", "to", "10", "years", "in", "prison", ",", "he", "said", "." ], "ids": [ 10117, 10588, 12174, 13295, 31128, 39157, 10741, 10114, 12449, 10114, 10150, 10855, 10106, 20538, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Witness", "##es", "had", "reported", "seeing", "many", "young", "women", "and", "some", "girls", "who", "looked", "clearly", "under", "##age", "at", "parties", "around", "the", "boat", "in", "recent", "weeks", ",", "the", "daily", "newspaper", "Il", "##tale", "##hti", "said", "." ], "ids": [ 103594, 10171, 10374, 15943, 57039, 11299, 14739, 13190, 10111, 11152, 27833, 10479, 59822, 52340, 10571, 12276, 10160, 18708, 12166, 10105, 30418, 10106, 19037, 20750, 117, 10105, 27636, 22047, 10282, 32748, 31270, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "Audi", "CEO", "says", "ex", "##pects", "no", "96", "currency", "impact", "." ], "ids": [ 36397, 24556, 22153, 11419, 92385, 10192, 12308, 83759, 21316, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##GO", "##LS", "##TA", "##D", "##T", "1996", "-", "08", "-", "29" ], "ids": [ 36351, 83821, 66934, 24951, 11490, 11090, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Audi", "AG", "management", "board", "chairman", "Herbert", "Dem", "##el", "said", "on", "Thursday", "that", "the", "German", "luxury", "car", "##maker", ",", "a", "unit", "of", "Volkswagen", "AG", ",", "did", "not", "ex", "##pect", "any", "bu", "##rden", "on", "its", "1996", "results", "from", "currency", "market", "vol", "##ati", "##lity", "." ], "ids": [ 36397, 17935, 17150, 17936, 27627, 16861, 37312, 10570, 12415, 10135, 67067, 10189, 10105, 12026, 105156, 13000, 32295, 117, 169, 16511, 10108, 37787, 17935, 117, 12172, 10472, 11419, 51511, 11178, 11499, 26505, 10135, 10474, 10389, 17466, 10188, 83759, 17313, 12714, 13259, 82968, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "do", "not", "ex", "##pect", "any", "bu", "##rden", "on", "our", "1996", "results", "from", "currency", "markets", ",", "\"", "Dem", "##el", "told", "Reuters", "in", "an", "interview", "." ], "ids": [ 107, 12865, 10149, 10472, 11419, 51511, 11178, 11499, 26505, 10135, 17446, 10389, 17466, 10188, 83759, 42893, 117, 107, 37312, 10570, 21937, 46617, 10106, 10151, 21213, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 3, 9, 9, 9, 9 ] }, { "tokens": [ "Audi", "would", "have", "been", "able", "to", "report", "a", "profit", "300", "million", "marks", "higher", "in", "1995", "if", "exchange", "rates", "had", "stayed", "the", "same", "as", "in", "1994", ",", "Dem", "##el", "had", "told", "a", "share", "##holder", "meeting", "last", "April", "." ], "ids": [ 36397, 10894, 10529, 10590, 16197, 10114, 17553, 169, 25081, 11093, 12473, 55112, 17981, 10106, 10436, 12277, 27714, 38200, 10374, 42296, 10105, 11561, 10146, 10106, 10444, 117, 37312, 10570, 10374, 21937, 169, 23867, 54535, 19822, 12469, 10780, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Dem", "##el", "said", "the", "car", "##maker", "had", "hed", "##ged", "about", "half", "of", "its", "currency", "risk", "for", "1996", "." ], "ids": [ 37312, 10570, 12415, 10105, 13000, 32295, 10374, 68012, 18832, 10978, 13877, 10108, 10474, 83759, 24179, 10142, 10389, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "John", "Gil", "##ardi", ",", "Frankfurt", "News", "##room", ",", "+", "49", "69", "756", "##52", "##5" ], "ids": [ 118, 118, 10421, 26463, 96666, 117, 15226, 12219, 25525, 117, 116, 11580, 12573, 65821, 92161, 11166 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##E", "##K", "##KI", "##LA", "SE", "##ES", "F", "##UL", "##L", "-", "Y", "##R", "1996", "PR", "##O", "##F", "##IT", "VS", "L", "##OS", "##S", "." ], "ids": [ 148, 11259, 11733, 59879, 44376, 23056, 25054, 143, 100673, 11369, 118, 162, 11273, 10389, 23837, 11403, 11565, 37611, 36358, 149, 21793, 10731, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "H", "##EL", "##SI", "##NK", "##I", "1996", "-", "08", "-", "29" ], "ids": [ 145, 68999, 44802, 78043, 11281, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fe", "##rti", "##lise", "##rs", "and", "sap", "##lings", "maker", "Ke", "##kki", "##la", "Oy", "said", "on", "Thursday", "in", "a", "statement", "it", "expected", "a", "falling", "result", "trend", "in", "the", "latter", "half", "of", "the", "year", ",", "but", "a", "full", "-", "year", "profit", "was", "never", "##theless", "likely", "." ], "ids": [ 20187, 28304, 36376, 10943, 10111, 82427, 65705, 94038, 47124, 30859, 10330, 35978, 12415, 10135, 67067, 10106, 169, 33311, 10271, 25973, 169, 54756, 14493, 54963, 10106, 10105, 21692, 13877, 10108, 10105, 10924, 117, 10473, 169, 13375, 118, 10924, 25081, 10134, 14794, 60251, 22497, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Due", "to", "natural", "season", "##al", "fl", "##uc", "##tua", "##tions", "in", "operations", ",", "the", "end", "-", "year", "result", "trend", "will", "be", "falling", ",", "but", "based", "on", "the", "early", "year", "result", "trend", "a", "profit", "##able", "result", "is", "likely", "to", "be", "achieved", ",", "\"", "Ke", "##kki", "##la", "said", "in", "its", "January", "-", "June", "interim", "report", "." ], "ids": [ 107, 20896, 10114, 13409, 11226, 10415, 58768, 43805, 17942, 15024, 10106, 18356, 117, 10105, 11572, 118, 10924, 14493, 54963, 11337, 10347, 54756, 117, 10473, 11610, 10135, 10105, 11732, 10924, 14493, 54963, 169, 25081, 13096, 14493, 10124, 22497, 10114, 10347, 28294, 117, 107, 47124, 30859, 10330, 12415, 10106, 10474, 11238, 118, 11120, 63313, 17553, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "1995", ",", "Ke", "##kki", "##la", "reported", "a", "5", ".", "6", "million", "mark", "##ka", "loss", "before", "extraordinary", "items", "and", "tax", "." ], "ids": [ 10167, 10436, 117, 47124, 30859, 10330, 15943, 169, 126, 119, 127, 12473, 29221, 10371, 18576, 11360, 105509, 34109, 10111, 25468, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "the", "first", "half", ",", "Ke", "##kki", "##la", "posted", "a", "6", ".", "1", "million", "mark", "##ka", "profit", ",", "up", "from", "0", ".", "7", "million", "." ], "ids": [ 10167, 10105, 10422, 13877, 117, 47124, 30859, 10330, 51232, 169, 127, 119, 122, 12473, 29221, 10371, 25081, 117, 10741, 10188, 121, 119, 128, 12473, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Helsinki", "News", "##room", "+", "358", "-", "0", "-", "680", "50", "245" ], "ids": [ 118, 118, 18179, 12219, 25525, 116, 37702, 118, 121, 118, 35922, 10462, 25853 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##TER", "##VI", "##E", "##W", "-", "T", "&", "N", "un", "##tro", "##ub", "##led", "by", "margin", "pressure", "." ], "ids": [ 36351, 99552, 90939, 11259, 13034, 118, 157, 111, 151, 10119, 14239, 20664, 16376, 10155, 53388, 23460, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "chairman", "of", "British", "-", "based", "components", "and", "engineering", "group", "T", "&", "N", "Pl", "##c", "said", "on", "Thursday", "the", "firm", "remained", "con", "##fi", "##dent", "about", "the", "general", "pro", "##spects", "for", "its", "operating", "margin", "##s", "despite", "pressure", "from", "uns", "##ett", "##led", "markets", "." ], "ids": [ 10117, 27627, 10108, 11160, 118, 11610, 34378, 10111, 25008, 11795, 157, 111, 151, 48932, 10350, 12415, 10135, 67067, 10105, 23410, 15980, 10173, 14403, 21029, 10978, 10105, 11389, 11284, 105335, 10142, 10474, 24210, 53388, 10107, 22087, 23460, 10188, 15826, 13985, 16376, 42893, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "In", "an", "interview", "following", "its", "first", "-", "half", "results", ",", "which", "included", "a", "less", "op", "##timi", "##stic", "for", "##eca", "##st", "for", "the", "second", "half", "of", "this", "year", "than", "it", "had", "made", "in", "the", "past", ",", "Sir", "Colin", "Hope", "said", "T", "&", "N", "had", "taken", "defensive", "action", "to", "protect", "it", "from", "patch", "##y", "markets", "." ], "ids": [ 10167, 10151, 21213, 11901, 10474, 10422, 118, 13877, 17466, 117, 10319, 12742, 169, 15306, 10303, 82064, 26666, 10142, 33588, 10562, 10142, 10105, 11132, 13877, 10108, 10531, 10924, 11084, 10271, 10374, 11019, 10106, 10105, 17781, 117, 12852, 20766, 22091, 12415, 157, 111, 151, 10374, 15109, 38385, 14204, 10114, 32949, 10271, 10188, 105741, 10157, 42893, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Looking", "at", "market", "pro", "##spects", ",", "he", "said", ":", "\"", "I", "think", "our", "best", "judgment", "at", "this", "stage", "is", "that", "it", "will", "probably", "bu", "##mble", "along", "in", "the", "rather", "mixed", "way", "it", "'", "s", "been", "in", "the", "first", "half", ".", "\"" ], "ids": [ 57451, 10160, 17313, 11284, 105335, 117, 10261, 12415, 131, 107, 146, 27874, 17446, 12504, 104118, 10160, 10531, 15365, 10124, 10189, 10271, 11337, 23282, 11499, 48272, 12400, 10106, 10105, 16863, 23742, 13170, 10271, 112, 187, 10590, 10106, 10105, 10422, 13877, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "'", "s", "very", "difficult", "to", "pred", "##ict", "the", "market", "(", "trend", ")", "this", "year", "." ], "ids": [ 107, 10377, 112, 187, 12558, 25232, 10114, 18283, 106788, 10105, 17313, 113, 54963, 114, 10531, 10924, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "could", "be", "better", ",", "or", "it", "could", "be", "worse", ",", "\"", "Hope", "added", ",", "e", "##cho", "##ing", "the", "demand", "uncertain", "##ty", "across", "auto", "##motive", "industries", "." ], "ids": [ 10377, 12174, 10347, 18322, 117, 10345, 10271, 12174, 10347, 110353, 117, 107, 22091, 16288, 117, 173, 16575, 10230, 10105, 34394, 108308, 11195, 15130, 18257, 75557, 43605, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "You", "can", "see", "an", "##xie", "##ties", "in", "Germany", "and", "France", ",", "in", "particular", ",", "beginning", "to", "grow", "and", "develop", "." ], "ids": [ 107, 11065, 10944, 12888, 10151, 50536, 14197, 10106, 12775, 10111, 10688, 117, 10106, 15018, 117, 17967, 10114, 42254, 10111, 26800, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "America", ",", "however", ",", "is", "looking", "a", "little", "better", ",", "\"", "he", "said", "." ], "ids": [ 11440, 117, 13800, 117, 10124, 34279, 169, 16745, 18322, 117, 107, 10261, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Com", "##pare", "##d", "with", "the", "end", "of", "last", "year", ",", "when", "T", "&", "N", "predicted", "a", "sl", "##ug", "##gis", "##h", "first", "half", "and", "a", "re", "##bound", "later", "in", "1996", ",", "Hope", "said", ":", "\"", "I", "think", "the", "difference", "(", "now", ")", "is", "the", "first", "half", "has", "not", "actually", "been", "as", "bad", "as", "some", "felt", "it", "was", "going", "to", "be", ",", "but", "equally", "we", "'", "re", "certainly", "not", "pred", "##ict", "##ing", "a", "recovery", "in", "the", "second", "half", ".", "\"" ], "ids": [ 16680, 28927, 10162, 10169, 10105, 11572, 10108, 12469, 10924, 117, 10841, 157, 111, 151, 98075, 169, 38523, 19951, 22725, 10237, 10422, 13877, 10111, 169, 11639, 47755, 10873, 10106, 10389, 117, 22091, 12415, 131, 107, 146, 27874, 10105, 30856, 113, 11858, 114, 10124, 10105, 10422, 13877, 10393, 10472, 24376, 10590, 10146, 15838, 10146, 11152, 24666, 10271, 10134, 19090, 10114, 10347, 117, 10473, 85509, 11951, 112, 11639, 88134, 10472, 18283, 106788, 10230, 169, 61958, 10106, 10105, 11132, 13877, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Against", "this", "background", ",", "Hope", "said", "the", "group", "was", "g", "##lad", "it", "had", "ratio", "##nalis", "##ed", "and", "des", "##tock", "##ed", "even", "though", "this", "had", "presse", "##d", "margin", "##s", ",", "which", "had", "sl", "##ip", "##ped", "to", "9", ".", "5", "percent", "from", "11", ".", "3", "percent", "a", "year", "ago", "." ], "ids": [ 29809, 10531, 25903, 117, 22091, 12415, 10105, 11795, 10134, 175, 19505, 10271, 10374, 26755, 96488, 10336, 10111, 10139, 60458, 10336, 13246, 15102, 10531, 10374, 33834, 10162, 53388, 10107, 117, 10319, 10374, 38523, 17437, 16898, 10114, 130, 119, 126, 22362, 10188, 10193, 119, 124, 22362, 169, 10924, 36390, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "think", "the", "figure", "of", "9", ".", "5", "percent", "on", "the", "first", "half", ",", "when", "you", "consider", "the", "fact", "that", "we", "'", "ve", "been", "des", "##tock", "##ing", ",", "the", "fairly", "mixed", "customer", "demand", ",", "and", "the", "fact", "that", "we", "sold", "the", "(", "southern", "African", ")", "mines", "actually", "is", "not", "bad", "." ], "ids": [ 107, 146, 27874, 10105, 17527, 10108, 130, 119, 126, 22362, 10135, 10105, 10422, 13877, 117, 10841, 13028, 44856, 10105, 18638, 10189, 11951, 112, 10323, 10590, 10139, 60458, 10230, 117, 10105, 76281, 23742, 72378, 34394, 117, 10111, 10105, 18638, 10189, 11951, 15337, 10105, 113, 17156, 13839, 114, 33601, 24376, 10124, 10472, 15838, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "It", "does", "show", "how", "easily", "we", "should", "be", "able", "to", "bou", "##nce", "back", "over", "10", "percent", "again", ",", "\"", "he", "added", ",", "saying", ":", "\"", "We", "continue", "to", "feel", "very", "re", "##lax", "##ed", "about", "our", "general", "view", "that", "we", "would", "average", "10", "percent", "profit", "margin", "##s", "over", "the", "cycle", ".", "\"" ], "ids": [ 107, 10377, 15107, 11897, 14796, 35024, 11951, 14819, 10347, 16197, 10114, 94335, 12150, 12014, 10491, 10150, 22362, 13123, 117, 107, 10261, 16288, 117, 22807, 131, 107, 12865, 17734, 10114, 38008, 12558, 11639, 90001, 10336, 10978, 17446, 11389, 17904, 10189, 11951, 10894, 13551, 10150, 22362, 25081, 53388, 10107, 10491, 10105, 25850, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "'", "ve", "always", "taken", "the", "view", "that", "we", "are", "the", "sort", "of", "company", "that", "'", "s", "quite", "capable", "of", "working", "in", "difficult", "circumstances", "-", "-", "we", "'", "re", "rather", "used", "to", "it", "." ], "ids": [ 107, 12865, 112, 10323, 19540, 15109, 10105, 17904, 10189, 11951, 10301, 10105, 20363, 10108, 12100, 10189, 112, 187, 31324, 29298, 10108, 14616, 10106, 25232, 54186, 118, 118, 11951, 112, 11639, 16863, 11031, 10114, 10271, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "And", "we", "feel", "very", "con", "##fi", "##dent", "that", "we", "'", "re", "doing", "all", "the", "right", "things", ",", "\"", "Hope", "said", "." ], "ids": [ 12689, 11951, 38008, 12558, 10173, 14403, 21029, 10189, 11951, 112, 11639, 30918, 10435, 10105, 13448, 24682, 117, 107, 22091, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "\"", "When", "the", "(", "profit", ")", "figures", "will", "bou", "##nce", "back", "up", "again", "is", "just", "a", "function", "of", "markets", "recover", "##ing", "just", "a", "fraction", ",", "\"", "he", "added", "." ], "ids": [ 107, 12242, 10105, 113, 25081, 114, 21068, 11337, 94335, 12150, 12014, 10741, 13123, 10124, 12820, 169, 19367, 10108, 42893, 94962, 10230, 12820, 169, 107433, 117, 107, 10261, 16288, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Comment", "##ing", "on", "the", "continued", "struggle", "to", "get", "control", "of", "German", "pis", "##ton", "maker", "Ko", "##lben", "##sch", "##mid", "##t", ",", "which", "has", "been", "ham", "##pere", "##d", "by", "regulatory", "obstacles", ",", "Hope", "said", "T", "&", "N", "'", "s", "confidence", "\"", "continues", "to", "improve", "\"", "that", "it", "may", "eventually", "be", "able", "to", "pro", "##ceed", "." ], "ids": [ 105415, 10230, 10135, 10105, 14278, 48919, 10114, 15329, 12608, 10108, 12026, 55488, 11183, 94038, 30186, 100166, 12044, 59881, 10123, 117, 10319, 10393, 10590, 15128, 62443, 10162, 10155, 102026, 101014, 117, 22091, 12415, 157, 111, 151, 112, 187, 74187, 107, 25266, 10114, 33992, 107, 10189, 10271, 11387, 16328, 10347, 16197, 10114, 11284, 66390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Andrew", "Hu", "##dda", "##rt", ",", "London", "News", "##room", ",", "+", "44", "171", "542", "871", "##6" ], "ids": [ 118, 118, 13999, 43707, 36611, 10976, 117, 10829, 12219, 25525, 117, 116, 11126, 22478, 51620, 72511, 11211 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Earth", "##qua", "##ke", "jo", "##lts", "New", "Zealand", "##s", "South", "Island", "." ], "ids": [ 11012, 32973, 10550, 12541, 72847, 10287, 14451, 10107, 11056, 11848, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 6, 1, 5, 9 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "earthquake", "measuring", "5", ".", "5", "on", "the", "Richter", "scale", "sh", "##ook", "New", "Zealand", "##s", "upper", "South", "Island", "on", "Thursday", "but", "there", "were", "no", "reports", "of", "injuries", ",", "Television", "New", "Zealand", "said", "." ], "ids": [ 10313, 63406, 92267, 126, 119, 126, 10135, 10105, 26888, 19707, 48201, 46921, 10287, 14451, 10107, 24172, 11056, 11848, 10135, 67067, 10473, 11155, 10309, 10192, 26610, 10108, 49718, 117, 18535, 10287, 14451, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 2, 6, 6, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9 ] }, { "tokens": [ "It", "said", "the", "qua", "##ke", ",", "centre", "##d", "near", "the", "small", "town", "of", "W", "##aia", "##u", ",", "was", "strongly", "felt", "in", "the", "cities", "of", "Nelson", "and", "Christchurch", "." ], "ids": [ 10377, 12415, 10105, 14517, 10550, 117, 12672, 10162, 12883, 10105, 12474, 12221, 10108, 160, 103418, 10138, 117, 10134, 44125, 24666, 10106, 10105, 19838, 10108, 15962, 10111, 90380, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Some", "minor", "damage", "had", "been", "reported", "in", "the", "sp", "##a", "town", "of", "Han", "##mer", "." ], "ids": [ 13885, 17746, 26115, 10374, 10590, 15943, 10106, 10105, 32650, 10113, 12221, 10108, 10818, 12371, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9 ] }, { "tokens": [ "New", "Zealand", "is", "pro", "##ne", "to", "frequent", "earthquake", "##s", "but", "they", "rarely", "cause", "major", "damage", "." ], "ids": [ 10287, 14451, 10124, 11284, 10238, 10114, 49975, 63406, 10107, 10473, 10689, 57879, 15311, 11922, 26115, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "country", "has", "only", "3", ".", "5", "million", "people", "in", "an", "area", "about", "the", "size", "of", "Britain", "or", "Japan", "." ], "ids": [ 10117, 12723, 10393, 10893, 124, 119, 126, 12473, 11426, 10106, 10151, 11168, 10978, 10105, 15851, 10108, 16032, 10345, 11891, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9 ] }, { "tokens": [ "Hong", "Kong", "'", "s", "T", "##sang", "sees", "growth", ",", "smooth", "transition", "." ], "ids": [ 15078, 14577, 112, 187, 157, 45952, 41369, 14609, 117, 67601, 35959, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mark", "Tre", "##vel", "##yan" ], "ids": [ 11997, 30932, 13128, 15976 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8, 8 ] }, { "tokens": [ "W", "##EL", "##L", "##ING", "##TO", "##N", "1996", "-", "08", "-", "29" ], "ids": [ 160, 68999, 11369, 50183, 60493, 11537, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", "Financial", "Secretary", "Donald", "T", "##sang", "said", "on", "Thursday", "he", "expected", "the", "territory", "'", "s", "economy", "to", "keep", "growing", "at", "around", "five", "percent", "but", "with", "some", "fl", "##uc", "##tua", "##tions", "from", "year", "to", "year", "." ], "ids": [ 15078, 14577, 30738, 19382, 16437, 157, 45952, 12415, 10135, 67067, 10261, 25973, 10105, 24399, 112, 187, 27570, 10114, 23819, 25566, 10160, 12166, 12403, 22362, 10473, 10169, 11152, 58768, 43805, 17942, 15024, 10188, 10924, 10114, 10924, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##sang", ",", "who", "made", "the", "re", "##marks", "during", "a", "visit", "to", "New", "Zealand", ",", "also", "spoke", "strongly", "in", "favour", "of", "keeping", "the", "Hong", "Kong", "dollar", "pe", "##gged", "to", "its", "U", ".", "S", ".", "counter", "##part", ",", "and", "said", "negotiations", "with", "China", "on", "next", "year", "'", "s", "budget", "were", "going", "smooth", "##ly", "." ], "ids": [ 157, 45952, 117, 10479, 11019, 10105, 11639, 64711, 10939, 169, 27541, 10114, 10287, 14451, 117, 10379, 50005, 44125, 10106, 61264, 10108, 51318, 10105, 15078, 14577, 34807, 11161, 91518, 10114, 10474, 158, 119, 156, 119, 46298, 48433, 117, 10111, 12415, 61946, 10169, 11593, 10135, 13451, 10924, 112, 187, 25293, 10309, 19090, 67601, 10454, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", "'", "s", "economy", "grew", "by", "only", "3", ".", "1", "percent", "in", "the", "first", "quarter", ",", "down", "from", "5", ".", "9", "percent", "a", "year", "earlier", ",", "and", "some", "private", "sector", "e", "##cono", "##mist", "##s", "have", "revised", "down", "##wards", "their", "prediction", "##s", "for", "the", "1996", "year", "." ], "ids": [ 15078, 14577, 112, 187, 27570, 23616, 10155, 10893, 124, 119, 122, 22362, 10106, 10105, 10422, 28330, 117, 12935, 10188, 126, 119, 130, 22362, 169, 10924, 18905, 117, 10111, 11152, 14591, 17417, 173, 27447, 24987, 10107, 10529, 41226, 12935, 30086, 10455, 78089, 10107, 10142, 10105, 10389, 10924, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Second", "quarter", "growth", "estimates", "will", "be", "released", "when", "the", "Hong", "Kong", "government", "issues", "its", "half", "-", "year", "##ly", "economic", "report", "on", "Friday", "." ], "ids": [ 14181, 28330, 14609, 45870, 11337, 10347, 11539, 10841, 10105, 15078, 14577, 12047, 17850, 10474, 13877, 118, 10924, 10454, 13925, 17553, 10135, 30767, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Our", "trend", "growth", "rate", "of", "five", "percent", "in", "real", "terms", "is", "pretty", "solid", ",", "\"", "T", "##sang", "told", "a", "news", "conference", "after", "meeting", "New", "Zealand", "Finance", "Minister", "Bill", "Birch", "." ], "ids": [ 107, 18465, 54963, 14609, 18344, 10108, 12403, 22362, 10106, 13486, 18873, 10124, 108361, 37751, 117, 107, 157, 45952, 21937, 169, 14424, 25029, 10662, 19822, 10287, 14451, 38533, 14355, 13160, 100806, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "B-PER", "I-PER", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 4, 8, 9 ] }, { "tokens": [ "\"", "There", "will", "be", "fl", "##uc", "##tua", "##tions", "in", "individual", "years", ",", "but", "it", "wo", "n", "'", "t", "be", "a", "big", "margin", ",", "\"", "he", "said", "." ], "ids": [ 107, 11723, 11337, 10347, 58768, 43805, 17942, 15024, 10106, 16080, 10855, 117, 10473, 10271, 12796, 182, 112, 188, 10347, 169, 22185, 53388, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "inflation", "was", "under", "control", "and", "the", "Hong", "Kong", "dollar", "was", "\"", "rock", "solid", "\"", "." ], "ids": [ 10357, 12415, 105888, 10134, 10571, 12608, 10111, 10105, 15078, 14577, 34807, 10134, 107, 12249, 37751, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Its", "link", "to", "the", "U", ".", "S", ".", "dollar", "had", "proved", "an", "engine", "of", "growth", "for", "the", "past", "12", "years", "." ], "ids": [ 14864, 26192, 10114, 10105, 158, 119, 156, 119, 34807, 10374, 33213, 10151, 18240, 10108, 14609, 10142, 10105, 17781, 10186, 10855, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "'", "s", "absolute", "##ly", "no", "economic", "or", "financial", "or", "political", "reason", "for", "us", "to", "change", "." ], "ids": [ 107, 11723, 112, 187, 48573, 10454, 10192, 13925, 10345, 20570, 10345, 13736, 27949, 10142, 19626, 10114, 15453, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "lot", "of", "investment", "in", "Hong", "Kong", ",", "some", "of", "which", "(", "is", ")", "by", "China", ",", "is", "pred", "##icate", "##d", "on", "the", "link", "continuing", ".", "\"" ], "ids": [ 138, 19826, 10108, 37933, 10106, 15078, 14577, 117, 11152, 10108, 10319, 113, 10124, 114, 10155, 11593, 117, 10124, 18283, 58621, 10162, 10135, 10105, 26192, 47635, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Britain", "will", "hand", "over", "Hong", "Kong", "to", "Chinese", "so", "##vereignty", "at", "mid", "##night", "on", "June", "30", ",", "1997", "." ], "ids": [ 16032, 11337, 15230, 10491, 15078, 14577, 10114, 13299, 10380, 104831, 10160, 15607, 45217, 10135, 11120, 10244, 117, 10391, 119 ], "entity": [ "B-LOC", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 1, 5, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##sang", "said", "three", "sets", "of", "meetings", "with", "Chinese", "authorities", "on", "Hong", "Kong", "'", "s", "1997", "-", "98", "budget", ",", "which", "will", "span", "the", "transition", "period", ",", "had", "gone", "smooth", "##ly", ".", "\"" ], "ids": [ 157, 45952, 12415, 11003, 23597, 10108, 47307, 10169, 13299, 28308, 10135, 15078, 14577, 112, 187, 10391, 118, 12327, 25293, 117, 10319, 11337, 51551, 10105, 35959, 13127, 117, 10374, 45041, 67601, 10454, 119, 107 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "None", "of", "our", "basic", "pre", "##cept", "##s", "have", "been", "challenged", ".", "\"" ], "ids": [ 86481, 10108, 17446, 25090, 12229, 97782, 10107, 10529, 10590, 72921, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", "will", "retain", "its", "own", "currency", "after", "the", "hand", "##over", ",", "run", "its", "own", "financial", "and", "monet", "##ary", "policy", "and", "have", "control", "over", "its", "own", "foreign", "exchange", "reserves", "." ], "ids": [ 15078, 14577, 11337, 76863, 10474, 12542, 83759, 10662, 10105, 15230, 16666, 117, 14095, 10474, 12542, 20570, 10111, 79139, 14926, 14368, 10111, 10529, 12608, 10491, 10474, 12542, 20796, 27714, 60405, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "will", "have", "no", "duty", "to", "contribute", "any", "taxes", "to", "Beijing", ",", "T", "##sang", "said", "." ], "ids": [ 10377, 11337, 10529, 10192, 34238, 10114, 72484, 11178, 49870, 10114, 23824, 117, 157, 45952, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 4, 8, 9, 9 ] }, { "tokens": [ "He", "described", "the", "condition", "of", "the", "property", "market", "as", "\"", "very", "good", "indeed", "\"", "." ], "ids": [ 10357, 13010, 10105, 24713, 10108, 10105, 18381, 17313, 10146, 107, 12558, 15198, 69815, 107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "You", "know", ",", "we", "went", "through", "a", "little", "climb", "and", "a", "little", "tro", "##ugh", "over", "the", "last", "few", "years", "." ], "ids": [ 107, 11065, 21852, 117, 11951, 13446, 11222, 169, 16745, 93274, 10111, 169, 16745, 42169, 25905, 10491, 10105, 12469, 13824, 10855, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Because", "of", "sp", "##ecu", "##lation", "in", "the", "market", "we", "introduced", "certain", "measures", ",", "but", "they", "are", "not", "dra", "##conia", "##n", "measures", ",", "and", "we", "brought", "it", "down", "to", "earth", ".", "\"" ], "ids": [ 24153, 10108, 32650, 97038, 19718, 10106, 10105, 17313, 11951, 17037, 16620, 38606, 117, 10473, 10689, 10301, 10472, 68507, 108483, 10115, 38606, 117, 10111, 11951, 17327, 10271, 12935, 10114, 39189, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##sang", "said", "the", "market", "would", "continue", "to", "app", "##rec", "##iate", "because", "property", "and", "land", "were", "s", "##car", "##ce", "." ], "ids": [ 157, 45952, 12415, 10105, 17313, 10894, 17734, 10114, 72894, 74755, 45788, 12373, 18381, 10111, 11773, 10309, 187, 15983, 10419, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "government", "would", "put", "land", "on", "the", "market", "to", "stop", "renta", "##ls", "\"", "going", "through", "the", "roof", "\"", ",", "but", "this", "would", "mean", "re", "##clamation", ",", "with", "possible", "environmental", "problems", "." ], "ids": [ 10117, 12047, 10894, 14499, 11773, 10135, 10105, 17313, 10114, 20517, 79105, 11747, 107, 19090, 11222, 10105, 33347, 107, 117, 10473, 10531, 10894, 36110, 11639, 106026, 117, 10169, 14128, 32704, 20390, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "There", "will", "be", "on", "the", "whole", "a", "slightly", "up", "##ward", "climb", ",", "consistent", "with", "our", "economic", "growth", "rate", ",", "\"", "he", "said", "in", "reference", "to", "the", "property", "market", "." ], "ids": [ 107, 11723, 11337, 10347, 10135, 10105, 21047, 169, 31603, 10741, 16988, 93274, 117, 54787, 10169, 17446, 13925, 14609, 18344, 117, 107, 10261, 12415, 10106, 21457, 10114, 10105, 18381, 17313, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "T", "##sang", ",", "the", "third", "senior", "figure", "in", "the", "government", "after", "the", "governor", "and", "chief", "secretary", ",", "said", "his", "stated", "aim", "was", "to", "serve", "as", "financial", "secretary", "for", "two", "years", "under", "British", "rule", "and", "three", "years", "under", "China", "." ], "ids": [ 157, 45952, 117, 10105, 12628, 17843, 17527, 10106, 10105, 12047, 10662, 10105, 28795, 10111, 19421, 37664, 117, 12415, 10226, 17067, 56048, 10134, 10114, 19430, 10146, 20570, 37664, 10142, 10551, 10855, 10571, 11160, 21983, 10111, 11003, 10855, 10571, 11593, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Taiwan", "dollar", "ends", "higher", ",", "narrow", "trade", "seen", "." ], "ids": [ 19449, 34807, 29047, 17981, 117, 41444, 18908, 15652, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TA", "##IP", "##E", "##I", "1996", "-", "08", "-", "29" ], "ids": [ 91075, 30331, 11259, 11281, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Taiwan", "dollar", "closed", "slightly", "firme", "##r", "on", "Thursday", "ami", "##d", "tight", "Taiwan", "dollar", "liquid", "##ity", "in", "the", "banking", "system", ",", "and", "deal", "##ers", "said", "the", "rate", "was", "likely", "to", "move", "narrow", "##ly", "in", "the", "near", "term", "." ], "ids": [ 10117, 19449, 34807, 18440, 31603, 33563, 10129, 10135, 67067, 16992, 10162, 85202, 19449, 34807, 58538, 11949, 10106, 10105, 75703, 11787, 117, 10111, 19918, 10901, 12415, 10105, 18344, 10134, 22497, 10114, 18577, 41444, 10454, 10106, 10105, 12883, 13719, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Taiwan", "dollar", "fell", "in", "early", "trade", "on", "month", "-", "end", "U", ".", "S", ".", "dollar", "demand", ",", "but", "the", "down", "##tren", "##d", "was", "later", "reverse", "##d", "as", "Taiwan", "dollar", "liquid", "##ity", "tight", "##ened", ".", "\"" ], "ids": [ 10117, 19449, 34807, 25194, 10106, 11732, 18908, 10135, 14064, 118, 11572, 158, 119, 156, 119, 34807, 34394, 117, 10473, 10105, 12935, 67137, 10162, 10134, 10873, 60971, 10162, 10146, 19449, 34807, 58538, 11949, 85202, 27867, 119, 107 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Banks", "do", "not", "want", "to", "hold", "big", "U", ".", "S", ".", "dollar", "positions", "at", "this", "moment", ",", "\"", "said", "one", "deal", "##er", ",", "adding", "that", "the", "rate", "was", "likely", "to", "ho", "##ver", "around", "current", "levels", "." ], "ids": [ 26421, 10149, 10472, 21528, 10114, 18500, 22185, 158, 119, 156, 119, 34807, 23188, 10160, 10531, 14316, 117, 107, 12415, 10464, 19918, 10165, 117, 44841, 10189, 10105, 18344, 10134, 22497, 10114, 13173, 12563, 12166, 14978, 21559, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "rate", "closed", "at", "T", "$", "27", ".", "482", "against", "Wednesday", "'", "s", "T", "$", "27", ".", "495", "." ], "ids": [ 10117, 18344, 18440, 10160, 157, 109, 10365, 119, 46810, 11327, 57611, 112, 187, 157, 109, 10365, 119, 44309, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "Turn", "##over", "was", "US", "$", "275", "million", "." ], "ids": [ 36750, 16666, 10134, 10808, 109, 23896, 12473, 119 ], "entity": [ "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Joyce", "Liu", "(", "2", "-", "508", "##0", "##8", "##15", ")" ], "ids": [ 118, 118, 35088, 23456, 113, 123, 118, 40003, 10929, 11396, 37462, 114 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SI", "##ME", "##X", "Ni", "##kke", "##i", "ends", "down", "but", "off", "low", "##s", "." ], "ids": [ 39675, 42424, 12674, 30409, 25389, 10116, 29047, 12935, 10473, 11898, 15626, 10107, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SI", "##NG", "##AP", "##OR", "##E", "1996", "-", "08", "-", "29" ], "ids": [ 39675, 34065, 38423, 42622, 11259, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sim", "##ex", "Ni", "##kke", "##i", "future", "##s", "ended", "easier", "but", "off", "the", "day", "'", "s", "low", "##s", "on", "Thursday", "." ], "ids": [ 103695, 28580, 30409, 25389, 10116, 16711, 10107, 18428, 81853, 10473, 11898, 10105, 11940, 112, 187, 15626, 10107, 10135, 67067, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "said", "selling", "in", "the", "session", "was", "a", "follow", "-", "through", "from", "Wednesday", "'", "s", "g", "##lo", "##omy", "Tank", "##an", "corporate", "report", "by", "the", "Bank", "of", "Japan", "." ], "ids": [ 54521, 10901, 12415, 30870, 10106, 10105, 30066, 10134, 169, 28086, 118, 11222, 10188, 57611, 112, 187, 175, 10715, 98877, 45010, 10206, 46666, 17553, 10155, 10105, 13533, 10108, 11891, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 3, 7, 7, 9 ] }, { "tokens": [ "\"", "The", "Ni", "##kke", "##i", "is", "testing", "support", "at", "the", "20", ",", "500", "level", "." ], "ids": [ 107, 10117, 30409, 25389, 10116, 10124, 38306, 13145, 10160, 10105, 10197, 117, 10757, 13277, 119 ], "entity": [ "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sent", "##iment", "is", "a", "bit", "g", "##lo", "##omy", "because", "people", "are", "focusing", "on", "the", "weak", "recovery", "in", "the", "economy", "at", "the", "moment", ",", "\"", "said", "a", "deal", "##er", "with", "a", "European", "bank", "." ], "ids": [ 53417, 28011, 10124, 169, 17684, 175, 10715, 98877, 12373, 11426, 10301, 74117, 10135, 10105, 61285, 61958, 10106, 10105, 27570, 10160, 10105, 14316, 117, 107, 12415, 169, 19918, 10165, 10169, 169, 11914, 19423, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "September", "Ni", "##kke", "##i", "settled", "at", "20", ",", "605", "after", "touch", "##ing", "an", "intra", "##day", "low", "of", "20", ",", "530", "against", "its", "previous", "close", "of", "20", ",", "725", "." ], "ids": [ 10596, 30409, 25389, 10116, 29014, 10160, 10197, 117, 48141, 10662, 54981, 10230, 10151, 69617, 24558, 15626, 10108, 10197, 117, 31977, 11327, 10474, 16741, 16065, 10108, 10197, 117, 47318, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Volume", "was", "19", ",", "560", "contracts", "." ], "ids": [ 15239, 10134, 10270, 117, 29524, 69690, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Deal", "##ers", "said", "technical", "##ly", ",", "the", "index", "should", "see", "good", "support", "at", "20", ",", "300", "and", "the", "ups", "##ide", "should", "be", "cap", "##ped", "at", "21", ",", "000", "." ], "ids": [ 54521, 10901, 12415, 29914, 10454, 117, 10105, 19776, 14819, 12888, 15198, 13145, 10160, 10197, 117, 11093, 10111, 10105, 107717, 13315, 14819, 10347, 13337, 16898, 10160, 10296, 117, 10259, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Dor", "##een", "Si", "##ow", "65", "-", "870", "##30", "##9", "##2" ], "ids": [ 118, 118, 65987, 13129, 11741, 16602, 10843, 118, 44472, 32792, 11373, 10729 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Siam", "Commercial", "wins", "agency", "bond", "auction", "##s", "." ], "ids": [ 75294, 51204, 27279, 34649, 55185, 106733, 10107, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##NG", "##KO", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 39999, 34065, 57277, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "A", "con", "##sort", "##ium", "led", "by", "Thailand", "'", "s", "Siam", "Commercial", "Bank", "Pl", "##c", "has", "secured", "at", "auction", "the", "right", "to", "sell", "two", "state", "agency", "bond", "issues", "worth", "a", "combined", "3", ".", "73", "billion", "ba", "##ht", ",", "an", "official", "at", "the", "bank", "said", "on", "Thursday", "." ], "ids": [ 138, 10173, 30490, 12454, 12857, 10155, 19621, 112, 187, 75294, 51204, 13533, 48932, 10350, 10393, 57202, 10160, 106733, 10105, 13448, 10114, 36300, 10551, 11388, 34649, 55185, 17850, 43509, 169, 25302, 124, 119, 12545, 25848, 15688, 13599, 117, 10151, 14731, 10160, 10105, 19423, 12415, 10135, 67067, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Government", "Housing", "Bank", "will", "issue", "bonds", "worth", "three", "billion", "ba", "##ht", "and", "the", "metropolitan", "Water", "##works", "Authority", "will", "issue", "bonds", "worth", "730", "million", ",", "an", "investment", "bank", "##er", "at", "Siam", "Commercial", "Bank", "told", "Reuters", "." ], "ids": [ 10117, 14581, 52229, 13533, 11337, 15557, 93163, 43509, 11003, 25848, 15688, 13599, 10111, 10105, 51721, 17702, 51778, 26553, 11337, 15557, 93163, 43509, 45177, 12473, 117, 10151, 37933, 19423, 10165, 10160, 75294, 51204, 13533, 21937, 46617, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 9 ] }, { "tokens": [ "The", "con", "##sort", "##ium", ",", "made", "up", "of", "eight", "financial", "institutions", ",", "offered", "an", "annual", "interest", "rate", "of", "8", ".", "46", "percent", "for", "both", "issues", ",", "he", "said", "." ], "ids": [ 10117, 10173, 30490, 12454, 117, 11019, 10741, 10108, 16222, 20570, 24671, 117, 20841, 10151, 19246, 17644, 18344, 10108, 129, 119, 11528, 22362, 10142, 11408, 17850, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Both", "state", "agency", "bonds", "will", "have", "seven", "-", "year", "mat", "##uri", "##ty", "and", "will", "be", "issued", "on", "September", "5", ",", "he", "said", "." ], "ids": [ 20973, 11388, 34649, 93163, 11337, 10529, 15767, 118, 10924, 17255, 13091, 11195, 10111, 11337, 10347, 21694, 10135, 10596, 126, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "-", "Bangkok", "news", "##room", "(", "662", ")", "652", "-", "06", "##42" ], "ids": [ 118, 118, 34793, 14424, 25525, 113, 66942, 114, 63974, 118, 10719, 91147 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M", "'", "bis", "##hi", "Gas", "sets", "terms", "on", "7", "-", "year", "straight", "." ], "ids": [ 150, 112, 10467, 11924, 34874, 23597, 18873, 10135, 128, 118, 10924, 31214, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "29" ], "ids": [ 76531, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "B", "##OR", "##RO", "##W", "##ER", "-", "Mitsubishi", "Gas", "Chemical", "Co", "Ltd" ], "ids": [ 139, 42622, 35066, 13034, 24093, 118, 44296, 34874, 25660, 13098, 15129 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7 ] }, { "tokens": [ "LE", "##AD", "MG", "##R", "-", "Nom", "##ura", "Sec", "##urities", "Co", "Ltd" ], "ids": [ 84977, 55538, 38668, 11273, 118, 107732, 11465, 109754, 82073, 13098, 15129 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7 ] }, { "tokens": [ "FIS", "##CA", "##L", "AG", "##EN", "##T", "-", "Tokyo", "-", "Mitsubishi", "Bank" ], "ids": [ 63392, 46900, 11369, 17935, 50655, 11090, 118, 15308, 118, 44296, 13533 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7 ] }, { "tokens": [ "T", "##YP", "##E", "straight", "bond", "ISS", "##UE", "NO", "13", "AM", "##T", "10", "bl", "##n", "ye", "##n" ], "ids": [ 157, 98904, 11259, 31214, 55185, 58915, 62674, 49307, 10249, 24339, 11090, 10150, 21484, 10115, 11023, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CO", "##UP", "##ON", "2", ".", "95", "%", "ISS", "PR", "##IC", "##E", "MA", "##T", "##UR", "##IT", "##Y", "5", "." ], "ids": [ 32992, 57487, 30118, 123, 119, 11978, 110, 58915, 23837, 30889, 11259, 27277, 11090, 98348, 37611, 14703, 126, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sep", ".", "03" ], "ids": [ 67281, 119, 10907 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "LA", "##ST", "MO", "##OD", "##Y", "'", "S", "PA", "##Y", "DA", "##TE", "5", "." ], "ids": [ 29079, 32995, 102059, 77836, 14703, 112, 156, 32349, 14703, 47855, 29833, 126, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sep", ".", "96" ], "ids": [ 67281, 119, 12308 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "F", "##IR", "##ST", "IN", "##T", "PA", "##Y", "5", "." ], "ids": [ 143, 73522, 32995, 36351, 11090, 32349, 14703, 126, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mar", ".", "97", "IN", "##T", "PA", "##Y", "5", "." ], "ids": [ 15734, 119, 12328, 36351, 11090, 32349, 14703, 126, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Mar", "/", "Sep" ], "ids": [ 15734, 120, 67281 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "LA", "##ST", "S", "&", "P", "SI", "##G", "##N", "DA", "##TE", "SU", "##B", "DA", "##TE", "5", "." ], "ids": [ 29079, 32995, 156, 111, 153, 39675, 11447, 11537, 47855, 29833, 86643, 11274, 47855, 29833, 126, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Jul", "-", "18", ".", "Jul" ], "ids": [ 65855, 118, 10218, 119, 65855 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##ST", "JC", "##R", "LA", "##ST", "JB", "##RI", "A", "LA", "##ST", "N", "##IS" ], "ids": [ 29079, 32995, 76199, 11273, 29079, 32995, 69437, 46876, 138, 29079, 32995, 151, 19088 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "S", ".", "Korea", "Da", "##ew", "##oo", ",", "Da", "##com", "units", "in", "Polish", "tele", "##com", "J", "##V", "." ], "ids": [ 156, 119, 14096, 11818, 26127, 22659, 117, 11818, 22530, 17163, 10106, 19870, 56142, 22530, 147, 11779, 119 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 3, 7, 7, 9, 3, 7, 9, 9, 2, 9, 9, 9, 9, 9 ] }, { "tokens": [ "SE", "##O", "##UL", "1996", "-", "08", "-", "29" ], "ids": [ 23056, 11403, 100673, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "South", "Korea", "'", "s", "Da", "##ew", "##oo", "Corp", ",", "un", "##liste", "##d", "Da", "##ew", "##oo", "Information", "Systems", "Co", "Ltd", ",", "Da", "##com", "Corp", "and", "Da", "##com", "International", "have", "set", "up", "a", "joint", "venture", "to", "offer", "tele", "##communications", "services", "in", "Poland", "." ], "ids": [ 11056, 14096, 112, 187, 11818, 26127, 22659, 44687, 117, 10119, 26719, 10162, 11818, 26127, 22659, 12145, 18953, 13098, 15129, 117, 11818, 22530, 44687, 10111, 11818, 22530, 10771, 10529, 11847, 10741, 169, 25680, 48709, 10114, 24443, 56142, 100856, 12639, 10106, 17879, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 5, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 9, 3, 7, 7, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "Da", "##ew", "##oo", "Da", "##com", "Communications", "(", "Poland", ")", "Ltd", ",", "which", "was", "set", "up", "with", "an", "initial", "investment", "of", "$", "1", ".", "0", "million", ",", "is", "expected", "to", "have", "sales", "of", "$", "60", "million", "by", "the", "year", "2000", ",", "a", "Da", "##ew", "##oo", "statement", "said", "on", "Thursday", ".", "." ], "ids": [ 11818, 26127, 22659, 11818, 22530, 27428, 113, 17879, 114, 15129, 117, 10319, 10134, 11847, 10741, 10169, 10151, 21713, 37933, 10108, 109, 122, 119, 121, 12473, 117, 10124, 25973, 10114, 10529, 23857, 10108, 109, 10709, 12473, 10155, 10105, 10924, 10180, 117, 169, 11818, 26127, 22659, 33311, 12415, 10135, 67067, 119, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 9, 1, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Da", "##ew", "##oo", "Corp", "will", "take", "a", "31", "percent", "stake", "in", "the", "venture", ",", "Da", "##com", "International", "25", "percent", ",", "Da", "##com", "24", "percent", ",", "and", "Da", "##ew", "##oo", "Information", "20", "percent", ",", "the", "statement", "said", "." ], "ids": [ 11818, 26127, 22659, 44687, 11337, 13574, 169, 10413, 22362, 90081, 10106, 10105, 48709, 117, 11818, 22530, 10771, 10258, 22362, 117, 11818, 22530, 10233, 22362, 117, 10111, 11818, 26127, 22659, 12145, 10197, 22362, 117, 10105, 33311, 12415, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 3, 7, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Da", "##ew", "##oo", "Corp", "and", "Da", "##ew", "##oo", "Information", "are", "units", "of", "Da", "##ew", "##oo", "Group", "." ], "ids": [ 11818, 26127, 22659, 44687, 10111, 11818, 26127, 22659, 12145, 10301, 17163, 10108, 11818, 26127, 22659, 12054, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 3, 7, 7, 7, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "-", "-", "Seoul", "News", "##room", "(", "822", ")", "727", "564", "##4" ], "ids": [ 118, 118, 26335, 12219, 25525, 113, 61200, 114, 46036, 61846, 11011 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Salomon", "&", "Taylor", "-", "96", "/", "97", "div", "for", "##eca", "##st", "." ], "ids": [ 54801, 111, 13399, 118, 12308, 120, 12328, 76486, 10142, 33588, 10562, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "29" ], "ids": [ 76531, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Year", "to", "March", "31", ",", "1997" ], "ids": [ 13567, 10114, 11144, 10413, 117, 10391 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "billion", "##s", "of", "ye", "##n", "unless", "specified", ")" ], "ids": [ 113, 10106, 25848, 10107, 10108, 11023, 10115, 60015, 64561, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##TE", "##ST", "ACT", "##U", "##AL" ], "ids": [ 29079, 29833, 32995, 90119, 12022, 32002 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Par", "##ent", ")", "FOR", "##EC", "##AS", "##T", "Y", "##EA", "##R", "-", "AG", "##O" ], "ids": [ 113, 17434, 11405, 114, 109544, 35826, 38025, 11090, 162, 36789, 11273, 118, 17935, 11403 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Or", "##d", "div", "10", ".", "00", "ye", "##n", "8", ".", "00", "ye", "##n" ], "ids": [ 19372, 10162, 76486, 10150, 119, 11025, 11023, 10115, 129, 119, 11025, 11023, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "-", "Comme", "##m", "div", "-", "2", ".", "00", "ye", "##n" ], "ids": [ 118, 27113, 10147, 76486, 118, 123, 119, 11025, 11023, 10115 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Salomon", "&", "Taylor", "Made", "Co", "Ltd", "manufacture", "##s", "golf", "clubs", "and", "sell", "##s", "ski", "equipment", "." ], "ids": [ 49307, 29833, 118, 54801, 111, 13399, 29968, 13098, 15129, 72022, 10107, 32288, 16707, 10111, 36300, 10107, 40122, 24518, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indonesia", "plays", "down", "U", ".", "S", ".", "consul", "##ate", "attack", "." ], "ids": [ 11658, 17724, 12935, 158, 119, 156, 119, 53704, 12436, 16342, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9 ] }, { "tokens": [ "JA", "##KA", "##RT", "##A", "1996", "-", "08", "-", "29" ], "ids": [ 53399, 67813, 46935, 10738, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Indonesia", "sought", "on", "Thursday", "to", "play", "down", "a", "fire", "bomb", "attack", "on", "a", "U", ".", "S", ".", "consul", "##ate", "earlier", "this", "week", ",", "saying", "it", "was", "being", "treated", "as", "a", "criminal", "rather", "than", "a", "political", "act", ",", "the", "official", "Antara", "news", "agency", "said", "." ], "ids": [ 11658, 32570, 10135, 67067, 10114, 12253, 12935, 169, 13559, 41654, 16342, 10135, 169, 158, 119, 156, 119, 53704, 12436, 18905, 10531, 16118, 117, 22807, 10271, 10134, 11223, 45369, 10146, 169, 30931, 16863, 11084, 169, 13736, 19833, 117, 10105, 14731, 83677, 14424, 34649, 12415, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "The", "police", "are", "still", "in", "##vesti", "##gating", "the", "incident", "." ], "ids": [ 10117, 15034, 10301, 12647, 10106, 63996, 91045, 10105, 28005, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "is", "evident", "the", "happen", "##ing", "is", "not", "politically", "motiv", "##ated", "but", "just", "an", "ordinary", "criminal", "act", ",", "the", "news", "agency", "quoted", "East", "Java", "military", "commander", "Major", "-", "General", "Ut", "##omo", "as", "saying", "." ], "ids": [ 10377, 10124, 75940, 10105, 84630, 10230, 10124, 10472, 99972, 63598, 22525, 10473, 12820, 10151, 64481, 30931, 19833, 117, 10105, 14424, 34649, 70676, 11830, 18507, 14041, 27703, 14988, 118, 11220, 83189, 25653, 10146, 22807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9 ] }, { "tokens": [ "The", "Tuesday", "morning", "attack", "on", "the", "consul", "##ate", "in", "Indonesia", "##s", "second", "largest", "city", "of", "Surabaya", ",", "caused", "sl", "##ight", "damage", "to", "a", "guard", "house", "before", "being", "quickly", "ex", "##ting", "##uis", "##hed", ",", "a", "spoke", "##sman", "at", "the", "U", ".", "S", ".", "em", "##bas", "##sy", "in", "Jakarta", ",", "700", "km", "(", "430", "miles", ")", "west", "of", "Surabaya", ",", "said", "on", "Wednesday", "." ], "ids": [ 10117, 70245, 28757, 16342, 10135, 10105, 53704, 12436, 10106, 11658, 10107, 11132, 15363, 11584, 10108, 55805, 117, 19513, 38523, 27521, 26115, 10114, 169, 42842, 13215, 11360, 11223, 23590, 11419, 12141, 31466, 16081, 117, 169, 50005, 24305, 10160, 10105, 158, 119, 156, 119, 10266, 21322, 16105, 10106, 14164, 117, 12367, 10204, 113, 26262, 14148, 114, 13735, 10108, 55805, 117, 12415, 10135, 57611, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "No", "one", "was", "in", "##jur", "##es", ",", "he", "said", "." ], "ids": [ 10657, 10464, 10134, 10106, 56671, 10171, 117, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Nobody", "should", "try", "and", "ex", "##agg", "##erate", "it", "by", "calling", "it", "a", "bomb", "because", "it", "was", "just", "a", "mol", "##otov", "co", "##ckt", "##ail", ",", "Ut", "##omo", "said", "." ], "ids": [ 63118, 14819, 31638, 10111, 11419, 99274, 64474, 10271, 10155, 37023, 10271, 169, 41654, 12373, 10271, 10134, 12820, 169, 39520, 106933, 11170, 25028, 35240, 117, 83189, 25653, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9 ] }, { "tokens": [ "He", "said", "police", "were", "in", "##vesti", "##gating", "the", "incident", "and", "patrol", "##s", "around", "diplomatic", "offices", "in", "Surabaya", "would", "be", "stepped", "up", "." ], "ids": [ 10357, 12415, 15034, 10309, 10106, 63996, 91045, 10105, 28005, 10111, 62976, 10107, 12166, 64838, 29918, 10106, 55805, 10894, 10347, 99116, 10741, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Airport", "Fa", "##cili", "##ties", "-", "6", "##mt", "##h", "parent", "for", "##eca", "##st", "." ], "ids": [ 13962, 44271, 55262, 14197, 118, 127, 18193, 10237, 43045, 10142, 33588, 10562, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TOKYO", "1996", "-", "08", "-", "29" ], "ids": [ 76531, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Six", "months", "to", "September", "30", ",", "1996" ], "ids": [ 20615, 15555, 10114, 10596, 10244, 117, 10389 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "billion", "##s", "of", "ye", "##n", "unless", "specified", ")" ], "ids": [ 113, 10106, 25848, 10107, 10108, 11023, 10115, 60015, 64561, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "LA", "##TE", "##ST", "PR", "##E", "##VI", "##O", "##US", "ACT", "##U", "##AL" ], "ids": [ 29079, 29833, 32995, 23837, 11259, 90939, 11403, 32612, 90119, 12022, 32002 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "Par", "##ent", ")", "FOR", "##EC", "##AS", "##T", "FOR", "##EC", "##AS", "##T", "Y", "##EA", "##R", "-", "AG", "##O" ], "ids": [ 113, 17434, 11405, 114, 109544, 35826, 38025, 11090, 109544, 35826, 38025, 11090, 162, 36789, 11273, 118, 17935, 11403 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sales", "11", ".", "38", "11", ".", "38", "11", ".", "45" ], "ids": [ 48514, 10193, 119, 11171, 10193, 119, 11171, 10193, 119, 10827 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Current", "1", ".", "09", "1", ".", "09", "918", "million" ], "ids": [ 37293, 122, 119, 11035, 122, 119, 11035, 74185, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "934", "million", "490", "million", "538", "million" ], "ids": [ 32577, 81765, 12473, 32441, 12473, 45677, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "-", "Airport", "Fa", "##cili", "##ties", "Co", "Ltd", "manages", "and", "rent", "##s", "facilities", "at", "Han", "##eda", "(", "Tokyo", ")", "and", "It", "##ami", "(", "Osaka", ")", "airport", "##s", "." ], "ids": [ 49307, 29833, 118, 13962, 44271, 55262, 14197, 13098, 15129, 75923, 10111, 60727, 10107, 24302, 10160, 10818, 20244, 113, 15308, 114, 10111, 10377, 13311, 113, 30703, 114, 28460, 10107, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "B-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 1, 5, 9, 1, 9, 9, 1, 5, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "HK", "civil", "servant", "##s", "contest", "ban", "on", "China", "panel", "." ], "ids": [ 33150, 14161, 53211, 10107, 37596, 11915, 10135, 11593, 36387, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 1, 9, 9 ] }, { "tokens": [ "H", "##ON", "##G", "KO", "##NG", "1996", "-", "08", "-", "29" ], "ids": [ 145, 30118, 11447, 67422, 34065, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Senior", "Hong", "Kong", "civil", "servant", "##s", "were", "given", "the", "go", "-", "ahead", "on", "Thursday", "to", "challenge", "a", "government", "ban", "on", "them", "standing", "for", "the", "Beijing", "-", "backed", "panel", "to", "choose", "the", "territory", "'", "s", "first", "post", "-", "hand", "##over", "leader", "and", "law", "##makers", "." ], "ids": [ 22902, 15078, 14577, 14161, 53211, 10107, 10309, 13507, 10105, 11783, 118, 35629, 10135, 67067, 10114, 36040, 169, 12047, 11915, 10135, 11345, 32173, 10142, 10105, 23824, 118, 61010, 36387, 10114, 48089, 10105, 24399, 112, 187, 10422, 11841, 118, 15230, 16666, 15014, 10111, 13255, 65744, 119 ], "entity": [ "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Supreme", "Court", "ruled", "that", "a", "judicial", "hearing", "contest", "##ing", "the", "ban", "would", "be", "heard", "on", "September", "11", ",", "three", "days", "before", "the", "nomination", "period", "for", "the", "Selection", "Committee", "close", "##s", "." ], "ids": [ 10117, 22872, 14100, 34920, 10189, 169, 41809, 51191, 37596, 10230, 10105, 11915, 10894, 10347, 32240, 10135, 10596, 10193, 117, 11003, 13990, 11360, 10105, 30807, 13127, 10142, 10105, 77604, 14481, 16065, 10107, 119 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "The", "government", "maintains", "the", "ban", ",", "announced", "earlier", "this", "month", ",", "is", "necessary", "to", "avoid", "a", "possible", "conflict", "of", "interest", "because", "civil", "servant", "##s", "are", "involved", "in", "det", "##erm", "##ining", "government", "policy", "." ], "ids": [ 10117, 12047, 74905, 10105, 11915, 117, 13854, 18905, 10531, 14064, 117, 10124, 27039, 10114, 33253, 169, 14128, 24620, 10108, 17644, 12373, 14161, 53211, 10107, 10301, 16247, 10106, 10349, 91724, 23025, 12047, 14368, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Civil", "servant", "##s", "argue", "the", "ban", "st", "##ymi", "##es", "their", "political", "rights", "." ], "ids": [ 14906, 53211, 10107, 93517, 10105, 11915, 28780, 44918, 10171, 10455, 13736, 16691, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "400", "-", "strong", "Selection", "Committee", "will", "select", "Hong", "Kong", "'", "s", "future", "chief", "executive", "to", "replace", "the", "British", "governor", "and", "a", "provisional", "legislature", "to", "take", "over", "from", "the", "elected", "chamber", "which", "Beijing", "plans", "to", "disso", "##lve", "." ], "ids": [ 10117, 11176, 118, 18093, 77604, 14481, 11337, 47054, 15078, 14577, 112, 187, 16711, 19421, 22676, 10114, 37156, 10105, 11160, 28795, 10111, 169, 59086, 62879, 10114, 13574, 10491, 10188, 10105, 14254, 51773, 10319, 23824, 18195, 10114, 32375, 49992, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Hong", "Kong", ",", "a", "British", "colony", "for", "more", "than", "150", "years", ",", "will", "be", "handed", "back", "to", "China", "at", "mid", "##night", "on", "June", "30", "next", "year", "." ], "ids": [ 15078, 14577, 117, 169, 11160, 48968, 10142, 10798, 11084, 11766, 10855, 117, 11337, 10347, 44040, 12014, 10114, 11593, 10160, 15607, 45217, 10135, 11120, 10244, 13451, 10924, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "China", "inte", "##nds", "to", "dis", "##mant", "##le", "the", "territory", "'", "s", "first", "fully", "-", "elected", "legislature", "because", "it", "oppose", "##s", "Britain", "'", "s", "recent", "electoral", "reforms", "and", "instal", "##l", "an", "interim", "appointed", "chamber", ",", "a", "decision", "that", "has", "generated", "considerable", "controversy", "." ], "ids": [ 11593, 14168, 27090, 10114, 27920, 38837, 10284, 10105, 24399, 112, 187, 10422, 27217, 118, 14254, 62879, 12373, 10271, 53037, 10107, 16032, 112, 187, 19037, 29125, 71856, 10111, 50562, 10161, 10151, 63313, 14896, 51773, 117, 169, 19231, 10189, 10393, 48918, 31116, 46373, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "judicial", "review", "sought", "by", "directora", "##te", "-", "grade", "bureau", "##crat", "##s", "will", "apply", "to", "only", "about", "1", ",", "000", "of", "the", "approximately", "33", ",", "000", "civil", "servant", "##s", "affected", "." ], "ids": [ 10117, 41809, 17030, 32570, 10155, 93154, 10216, 118, 21958, 32340, 79203, 10107, 11337, 48515, 10114, 10893, 10978, 122, 117, 10259, 10108, 10105, 17384, 11000, 117, 10259, 14161, 53211, 10107, 36276, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Police", "unions", "are", "not", "contest", "##ing", "the", "ban", ",", "which", "affect", "##s", "all", "27", ",", "000", "officers", ",", "and", "nor", "are", "the", "very", "top", "tier", "of", "Hong", "Kong", "'", "s", "mand", "##arin", "class", ",", "the", "policy", "secretari", "##es", "." ], "ids": [ 18051, 76841, 10301, 10472, 37596, 10230, 10105, 11915, 117, 10319, 60600, 10107, 10435, 10365, 117, 10259, 23579, 117, 10111, 31515, 10301, 10105, 12558, 12364, 60704, 10108, 15078, 14577, 112, 187, 63790, 50667, 13596, 117, 10105, 14368, 109342, 10171, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "More", "than", "16", ",", "000", "application", "forms", "for", "places", "on", "the", "Selection", "Committee", "have", "been", "handed", "out", "since", "the", "nomination", "period", "opened", "." ], "ids": [ 15946, 11084, 10250, 117, 10259, 19800, 19639, 10142, 19261, 10135, 10105, 77604, 14481, 10529, 10590, 44040, 10950, 11764, 10105, 30807, 13127, 14377, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "It", "close", "##s", "on", "September", "14", "." ], "ids": [ 10377, 16065, 10107, 10135, 10596, 10247, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Singapore", "Re", "##fini", "##ng", "Company", "expected", "to", "shut", "CDU", "3", "." ], "ids": [ 19437, 20304, 46607, 10376, 11739, 25973, 10114, 70323, 27529, 124, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-ORG", "I-ORG", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 9, 9, 3, 7, 9 ] }, { "tokens": [ "SI", "##NG", "##AP", "##OR", "##E", "1996", "-", "08", "-", "29" ], "ids": [ 39675, 34065, 38423, 42622, 11259, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Singapore", "Re", "##fini", "##ng", "Company", "(", "SR", "##C", ")", "is", "expected", "to", "shut", "##down", "its", "60", ",", "000", "barrel", "-", "per", "-", "day", "(", "b", "##p", "##d", ")", "c", "##rude", "dis", "##til", "##lation", "unit", "(", "CDU", ")", "in", "September", ",", "an", "industry", "source", "said", "on", "Thursday", "." ], "ids": [ 19437, 20304, 46607, 10376, 11739, 113, 23032, 10858, 114, 10124, 25973, 10114, 70323, 27160, 10474, 10709, 117, 10259, 93397, 118, 10178, 118, 11940, 113, 170, 10410, 10162, 114, 171, 97417, 27920, 19156, 19718, 16511, 113, 27529, 114, 10106, 10596, 117, 10151, 17425, 15247, 12415, 10135, 67067, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "They", "think", "something", "is", "st", "##uck", ",", "\"", "the", "source", "said", ".", "\"" ], "ids": [ 107, 11696, 27874, 26133, 10124, 28780, 31746, 117, 107, 10105, 15247, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "nothing", "has", "been", "decided", "as", "they", "are", "still", "waiting", "for", "an", "X", "-", "ray", "machine", "to", "determine", "the", "problem", ".", "\"" ], "ids": [ 16976, 33338, 10393, 10590, 17270, 10146, 10689, 10301, 12647, 62052, 10142, 10151, 161, 118, 27212, 21432, 10114, 37284, 10105, 18077, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "source", "said", "the", "problem", "was", "discovered", "during", "the", "past", "month", "during", "which", "time", "CDU", "No", ".", "3", "'", "s", "production", "has", "varied", "from", "maximum", "capacity", "of", "60", ",", "000", "b", "##p", "##d", "to", "as", "low", "as", "40", ",", "000", "b", "##p", "##d", ",", "depending", "on", "the", "c", "##rude", "being", "run", "." ], "ids": [ 10117, 15247, 12415, 10105, 18077, 10134, 21756, 10939, 10105, 17781, 14064, 10939, 10319, 10635, 27529, 10657, 119, 124, 112, 187, 12116, 10393, 79354, 10188, 22393, 23095, 10108, 10709, 117, 10259, 170, 10410, 10162, 10114, 10146, 15626, 10146, 10533, 117, 10259, 170, 10410, 10162, 117, 45812, 10135, 10105, 171, 97417, 11223, 14095, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "We", "are", "having", "a", "lot", "of", "problems", ",", "\"", "said", "a", "source", "." ], "ids": [ 107, 12865, 10301, 13677, 169, 19826, 10108, 20390, 117, 107, 12415, 169, 15247, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "earlier", "problem", "with", "CDU", "No", "." ], "ids": [ 10313, 18905, 18077, 10169, 27529, 10657, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7 ] }, { "tokens": [ "3", "arose", "on", "July", "24", "when", "an", "industry", "source", "said", "the", "CDU", "would", "be", "closed", "down", "briefly", "in", "August", "for", "repairs", "to", "a", "heat", "exchange", "##r", "." ], "ids": [ 124, 99736, 10135, 11112, 10233, 10841, 10151, 17425, 15247, 12415, 10105, 27529, 10894, 10347, 18440, 12935, 36327, 10106, 10735, 10142, 98543, 10114, 169, 33955, 27714, 10129, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "But", "by", "mid", "-", "August", ",", "a", "company", "spoke", "##sman", "said", "repairs", "had", "been", "carried", "out", "without", "any", "shut", "##down", "." ], "ids": [ 16976, 10155, 15607, 118, 10735, 117, 169, 12100, 50005, 24305, 12415, 98543, 10374, 10590, 21086, 10950, 13663, 11178, 70323, 27160, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "285", ",", "000", "b", "##p", "##d", "SR", "##C", "ref", "##iner", "##y", "is", "co", "-", "owned", "by", "the", "Singapore", "Petroleum", "Company", ",", "British", "Petro", "##lem", "and", "Cal", "##tex", ",", "the", "joint", "-", "venture", "of", "U", ".", "S", ".", "majors", "Che", "##vro", "##n", "Corp", "and", "Tex", "##aco", "Inc", "." ], "ids": [ 10117, 27485, 117, 10259, 170, 10410, 10162, 23032, 10858, 48056, 33488, 10157, 10124, 11170, 118, 17012, 10155, 10105, 19437, 89589, 11739, 117, 11160, 82470, 19343, 10111, 41280, 85656, 117, 10105, 25680, 118, 48709, 10108, 158, 119, 156, 119, 86611, 44131, 99959, 10115, 44687, 10111, 109048, 28558, 13604, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 9, 3, 7, 7, 9, 3, 7, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 3, 7, 7, 7, 9, 3, 7, 7, 9 ] }, { "tokens": [ "-", "-", "Singapore", "News", "##room", "(", "+", "65", "-", "870", "##30", "##86", ")" ], "ids": [ 118, 118, 19437, 12219, 25525, 113, 116, 10843, 118, 44472, 32792, 103450, 114 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Lo", "##x", "##ley", "H", "##1", "net", "rises", "to", "332", ".", "66", "mln", "ba", "##ht", "." ], "ids": [ 13069, 10686, 12105, 145, 10759, 11988, 91144, 10114, 31965, 119, 12215, 35198, 15688, 13599, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##NG", "##KO", "##K", "1996", "-", "08", "-", "29" ], "ids": [ 39999, 34065, 57277, 11733, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Review", "##ed", "financial", "results", "for", "the", "first", "six", "months", "ended", "June", "30", ",", "1996", "." ], "ids": [ 14696, 10336, 20570, 17466, 10142, 10105, 10422, 12449, 15555, 18428, 11120, 10244, 117, 10389, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "in", "millions", "of", "ba", "##ht", "unless", "stated", ")" ], "ids": [ 113, 10106, 18123, 10108, 15688, 13599, 60015, 17067, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Six", "months" ], "ids": [ 20615, 15555 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "1996", "1995" ], "ids": [ 10389, 10436 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "S", "##hr", "(", "ba", "##ht", ")", "8", ".", "32", "vs", "6", ".", "66" ], "ids": [ 156, 16757, 113, 15688, 13599, 114, 129, 119, 10842, 14987, 127, 119, 12215 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Net", "332", ".", "66", "vs", "266", ".", "37" ], "ids": [ 32577, 31965, 119, 12215, 14987, 28477, 119, 11204 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "##S", ":", "Second", "quarter", "figures", "not", "available", "." ], "ids": [ 49307, 29833, 10731, 131, 14181, 28330, 21068, 10472, 14579, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Full", "name", "of", "company", "is", "Lo", "##x", "##ley", "Publications", "Pl", "##c", "." ], "ids": [ 23651, 11324, 10108, 12100, 10124, 13069, 10686, 12105, 19898, 48932, 10350, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "-", "-", "Bangkok", "news", "##room", "662", "-", "252", "-", "995", "##0" ], "ids": [ 118, 118, 34793, 14424, 25525, 66942, 118, 21581, 118, 66164, 10929 ], "entity": [ "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##DI", "##CA", "##TO", "##RS", "-", "Spain", "-", "updated", "August", "29", "." ], "ids": [ 36351, 58730, 46900, 60493, 39469, 118, 16149, 118, 13973, 10735, 10386, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##DI", "##CA", "##TO", "##RS", "-", "monthly", "MT", "##H", "/", "MT", "##H", "PV", "##S", "Y", "##R", "-", "AG", "##O", "IN", "##DE", "##X", "TO", "##TA", "##L" ], "ids": [ 36351, 58730, 46900, 60493, 39469, 118, 61673, 74649, 12396, 120, 74649, 12396, 77621, 10731, 162, 11273, 118, 17935, 11403, 36351, 60675, 12674, 58573, 24951, 11369 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "CP", "##I", "(", "%", ")", "Jul", "+", "0", ".", "1", "-", "0", ".", "1", "+", "0", ".", "0", "119", ".", "3", "*", "*", "-" ], "ids": [ 40070, 11281, 113, 110, 114, 65855, 116, 121, 119, 122, 118, 121, 119, 122, 116, 121, 119, 121, 17963, 119, 124, 115, 115, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yr", "/", "yr", "Inf", "##lation", "(", "%", ")", "+", "3", ".", "7", "+", "3", ".", "6", "+", "4", ".", "7", "119", ".", "3", "-" ], "ids": [ 65756, 120, 12590, 74479, 19718, 113, 110, 114, 116, 124, 119, 128, 116, 124, 119, 127, 116, 125, 119, 128, 17963, 119, 124, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Core", "Inf", "##lation", "+", "0", ".", "1", "+", "0", ",", "2", "+", "0", ",", "2", "-", "-" ], "ids": [ 38634, 74479, 19718, 116, 121, 119, 122, 116, 121, 117, 123, 116, 121, 117, 123, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yr", "/", "yr", "rise", "+", "3", ".", "5", "+", "3", ".", "6", "+", "5", ".", "2", "-", "-" ], "ids": [ 65756, 120, 12590, 28710, 116, 124, 119, 126, 116, 124, 119, 127, 116, 126, 119, 123, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "J", "##O", "##BL", "##ESS", "(", "INE", "##M", ")", "Jul", "-", "63", ",", "913", "-", "33", ",", "149", "-", "65", ",", "345", "-", "2", ".", "17", "##M" ], "ids": [ 147, 11403, 94701, 76505, 113, 32086, 11517, 114, 65855, 118, 12256, 117, 75316, 118, 11000, 117, 19438, 118, 10843, 117, 30287, 118, 123, 119, 10273, 11517 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rate", "(", "%", ")", "13", ".", "67", "14", ".", "15", "15", ".", "19", "-", "-" ], "ids": [ 105299, 113, 110, 114, 10249, 119, 12316, 10247, 119, 10208, 10208, 119, 10270, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##LA", "##NC", "##E", "OF", "PA", "##Y", "##ME", "##NT", "##S" ], "ids": [ 39999, 44376, 100230, 11259, 23240, 32349, 14703, 42424, 77261, 10731 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "(", "bl", "##n", "pt", "##s", ")", "May", "-", "196", ".", "8", "-", "180", ".", "6", "-", "279", ".", "9", "-", "-" ], "ids": [ 15006, 113, 21484, 10115, 28756, 10107, 114, 10725, 118, 23674, 119, 129, 118, 13912, 119, 127, 118, 30463, 119, 130, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Cu", "##r", "A", "##cc", "(", "bl", "##n", "pt", "##s", ")", "May", "-", "9", ".", "5", "-", "42", ".", "0", "-", "110", ".", "4", "-", "-" ], "ids": [ 34387, 10129, 138, 28044, 113, 21484, 10115, 28756, 10107, 114, 10725, 118, 130, 119, 126, 118, 11276, 119, 121, 118, 13057, 119, 125, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "RE", "##SE", "##R", "##VE", "##S", "(", "$", "ML", "##N", ")", "Jul", "+", "1", ",", "161", "+", "400", ".", "9", "+", "310", ".", "4", "-", "54", ",", "703", ".", "0" ], "ids": [ 71033, 39039, 11273, 68560, 10731, 113, 109, 75920, 11537, 114, 65855, 116, 122, 117, 21163, 116, 11176, 119, 130, 116, 23993, 119, 125, 118, 11653, 117, 62437, 119, 121 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##OD", "##UC", "##ER", "PR", "##IC", "##ES", "(", "%", ")", "Jun", "-", "0", ".", "2", "+", "0", ".", "1", "+", "0", ".", "2", "119", ".", "6", "*", "*", "-" ], "ids": [ 23837, 77836, 93089, 24093, 23837, 30889, 25054, 113, 110, 114, 26187, 118, 121, 119, 123, 116, 121, 119, 122, 116, 121, 119, 123, 17963, 119, 127, 115, 115, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yr", "/", "yr", "rise", "(", "%", ")", "+", "1", ".", "2", "+", "1", ".", "5", "+", "7", ".", "1", "119", ".", "6", "-" ], "ids": [ 65756, 120, 12590, 28710, 113, 110, 114, 116, 122, 119, 123, 116, 122, 119, 126, 116, 128, 119, 122, 17963, 119, 127, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##D", "##US", "##T", "##RI", "##AL", "PR", "##OD", "." ], "ids": [ 36351, 11490, 32612, 11090, 46876, 32002, 23837, 77836, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "May", "-", "-", "-", "-", "-" ], "ids": [ 10725, 118, 118, 118, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Yr", "/", "yr", "figures", "(", "%", ")", "-", "3", ".", "2", "+", "1", ".", "0", "+", "9", ".", "8", "108", ".", "4", "*", "*", "-" ], "ids": [ 65756, 120, 12590, 21068, 113, 110, 114, 118, 124, 119, 123, 116, 122, 119, 121, 116, 130, 119, 129, 15845, 119, 125, 115, 115, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "M4", "MO", "##NE", "##Y", "SU", "##P", "##P", "##L", "##Y", "(", "%", ")", "Jul", "+", "2", ".", "6", "+", "4", ".", "2", "##R", "+", "10", ".", "8", "-", "-" ], "ids": [ 92340, 102059, 93280, 14703, 86643, 11127, 11127, 11369, 14703, 113, 110, 114, 65855, 116, 123, 119, 127, 116, 125, 119, 123, 11273, 116, 10150, 119, 129, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Total", "M4", "ad", "##j", "." ], "ids": [ 25220, 92340, 10840, 10418, 119 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "(", "tr", "##ln", "pt", "##s", ")", "-", "-", "-", "-", "75", ".", "912" ], "ids": [ 113, 32221, 23377, 28756, 10107, 114, 118, 118, 118, 118, 11417, 119, 60559 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "TR", "##AD", "##E", "BA", "##LA", "##NC", "##E" ], "ids": [ 80047, 55538, 11259, 39999, 44376, 100230, 11259 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Export", "##s", "(", "bl", "##n", "pt", "##s", ")", "Jun", "1", ",", "100", ".", "7", "1", ",", "164", ".", "1", "988", ".", "2", "-", "-" ], "ids": [ 108268, 10107, 113, 21484, 10115, 28756, 10107, 114, 26187, 122, 117, 10407, 119, 128, 122, 117, 21575, 119, 122, 70946, 119, 123, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Im", "##ports", "(", "bl", "##n", "pt", "##s", ")", "May", "1", ",", "315", ".", "7", "1", ",", "433", ".", "4", "1", ",", "236", ".", "5", "-", "-" ], "ids": [ 10796, 60036, 113, 21484, 10115, 28756, 10107, 114, 10725, 122, 117, 27727, 119, 128, 122, 117, 43384, 119, 125, 122, 117, 26318, 119, 126, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Def", "##ici", "##t", "/", "sur", "##plus", "May", "-", "215", ".", "0", "-", "269", ".", "3", "-", "248", ".", "3", "-", "-" ], "ids": [ 77955, 13439, 10123, 120, 10326, 70413, 10725, 118, 22050, 119, 121, 118, 29745, 119, 124, 118, 24889, 119, 124, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Def", "##ici", "##t", "yr", "to", "date", "-", "1", ",", "334", ".", "0", "-", "1", ",", "119", ".", "0", "-", "1", ",", "420", ".", "9", "-", "-" ], "ids": [ 77955, 13439, 10123, 12590, 10114, 13664, 118, 122, 117, 33956, 119, 121, 118, 122, 117, 17963, 119, 121, 118, 122, 117, 24253, 119, 130, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##V", "##T", ".", "B", "##UD", "##GE", "##T", "(", "bl", "##n", "pt", "##s", ")", "Go", "##vt", ".", "F", "##cast", "96" ], "ids": [ 41525, 11779, 11090, 119, 139, 86888, 58719, 11090, 113, 21484, 10115, 28756, 10107, 114, 14439, 36220, 119, 143, 31419, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Def", "##ici", "##t", "/", "sur", "##plus", "Jul", "+", "282", ".", "1", "-", "380", ".", "6", "+", "230", ".", "4", "-" ], "ids": [ 77955, 13439, 10123, 120, 10326, 70413, 65855, 116, 28805, 119, 122, 118, 22296, 119, 127, 116, 16888, 119, 125, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Def", "." ], "ids": [ 77955, 119 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "/", "sur", "##plus", "to", "date", "-", "1", ",", "184", ".", "0", "-", "1", ",", "466", ".", "1", "-", "1", ",", "456", ".", "7", "-", "2", ".", "6", "tr", "##ln" ], "ids": [ 120, 10326, 70413, 10114, 13664, 118, 122, 117, 22662, 119, 121, 118, 122, 117, 48443, 119, 122, 118, 122, 117, 36380, 119, 128, 118, 123, 119, 127, 32221, 23377 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##DI", "##CA", "##TO", "##RS", "-", "quarter", "##ly", "Q", "##U", "##AR", "##TER", "PV", "##S", "Q", "##T", "##R", "Y", "##R", "-", "AG", "##O", "-", "-" ], "ids": [ 36351, 58730, 46900, 60493, 39469, 118, 28330, 10454, 154, 12022, 52188, 99552, 77621, 10731, 154, 11090, 11273, 162, 11273, 118, 17935, 11403, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EPA", "Q", "##2", "+", "168", ",", "130", "+", "31", ",", "230", "+", "167", ",", "330", "12", ".", "3", "million" ], "ids": [ 92296, 154, 10729, 116, 20436, 117, 13389, 116, 10413, 117, 16888, 116, 20905, 117, 20564, 10186, 119, 124, 12473 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GDP" ], "ids": [ 47832 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Yr", "-", "yr", "(", "%", ")", "Q", "##1", "+", "1", ".", "9", "+", "2", ".", "3", "##R", "+", "3", ".", "4", "-", "-" ], "ids": [ 65756, 118, 12590, 113, 110, 114, 154, 10759, 116, 122, 119, 130, 116, 123, 119, 124, 11273, 116, 124, 119, 125, 118, 118 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Absolute", "amount", "(", "tr", "##ln", "pt", "##s", ")", "18", ".", "1", "17", ".", "8", "16", ".", "9", "-", "69", ".", "7" ], "ids": [ 108394, 24074, 113, 32221, 23377, 28756, 10107, 114, 10218, 119, 122, 10273, 119, 129, 10250, 119, 130, 118, 12573, 119, 128 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IN", "##TER", "##ES", "##T", "RA", "##TE", "##S", "Late", "##st", "rate", "P", "##vs", "rate", "Date", "changed" ], "ids": [ 36351, 99552, 25054, 11090, 64007, 29833, 10731, 25139, 10562, 18344, 153, 30168, 18344, 29897, 17695 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Key", "rate", "(", "%", ")", "7", ".", "25", "7", ".", "50", "04", "/", "06", "/", "96" ], "ids": [ 21663, 18344, 113, 110, 114, 128, 119, 10258, 128, 119, 10462, 10814, 120, 10719, 120, 12308 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##TE", "##S", "-", "Bank", "of", "Spain", "anno", "##unces", "balance", "of", "payments", "." ], "ids": [ 49307, 29833, 10731, 118, 13533, 10108, 16149, 11671, 79603, 40162, 10108, 99417, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Job", "##less", "figures", "are", "registered", "une", "##mp", "##lo", "##yed", "at", "labour", "ministry", "." ], "ids": [ 48955, 14985, 21068, 10301, 33712, 10231, 18573, 10715, 68159, 10160, 40763, 65338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Trade", "data", "are", "customs", "-", "cleared", ",", "published", "by", "economy", "ministry", "." ], "ids": [ 15006, 11165, 10301, 89907, 118, 90076, 117, 12304, 10155, 27570, 65338, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Late", "##st", "M4", ",", "currency", "reserves", ",", "industrial", "production", "data", "are", "provisional", "." ], "ids": [ 25139, 10562, 92340, 117, 83759, 60405, 117, 18138, 12116, 11165, 10301, 59086, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GDP", "figures", "are", "quarter", "##ly", "on", "annual", "##ised", "basis", "." ], "ids": [ 47832, 21068, 10301, 28330, 10454, 10135, 19246, 20666, 17172, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EPA", "-", "Quarterly", "survey", "of", "employment", "levels", "(", "INE", ")", "." ], "ids": [ 92296, 118, 55268, 35035, 10108, 48264, 21559, 113, 32086, 114, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Data", "give", "variation", "in", "employed", "persons", ",", "in", "thousands", "." ], "ids": [ 12159, 18090, 45871, 10106, 29682, 34759, 117, 10106, 39966, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Last", "column", "-", "TO", "##TA", "##L", "-", "is", "latest", "for", "job", "##less", "and", "ac", "##cum", "##ulated", "for", "the", "rest", "(", "GDP", "total", "amount", "correspond", "##s", "to", "1995", ")", "." ], "ids": [ 14812, 41278, 118, 58573, 24951, 11369, 118, 10124, 50908, 10142, 23627, 14985, 10111, 13621, 23722, 37725, 10142, 10105, 17333, 113, 47832, 11339, 24074, 42996, 10107, 10114, 10436, 114, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Government", "budget", "figures", "relate", "to", "central", "government", "finances", "only", "." ], "ids": [ 14581, 25293, 21068, 110205, 10114, 12397, 12047, 71361, 10893, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*", "*", "General", "Consumer", "Price", "Index", "(", "100", "=", "1992", ")", ",", "Producer", "Price", "##s", "Index", "and", "Industrial", "Production", "Index", "(", "100", "=", "1990", ")", "." ], "ids": [ 115, 115, 11220, 82375, 23002, 12135, 113, 10407, 134, 10450, 114, 117, 46020, 23002, 10107, 12135, 10111, 24319, 20769, 12135, 113, 10407, 134, 10420, 114, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "PR", "##ESS", "DI", "##GE", "##ST", "-", "Spain", "-", "Aug", "29", "." ], "ids": [ 23837, 76505, 110014, 58719, 32995, 118, 16149, 118, 53012, 10386, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Head", "##lines", "from", "major", "national", "newspapers", "." ], "ids": [ 16830, 31782, 10188, 11922, 11844, 48473, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Reuters", "has", "not", "veri", "##fied", "these", "stories", "and", "does", "not", "vo", "##uch", "for", "their", "accuracy", "." ], "ids": [ 46617, 10393, 10472, 55011, 19907, 11762, 21158, 10111, 15107, 10472, 12556, 20591, 10142, 10455, 100139, 119 ], "entity": [ "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "EL", "PA", "##IS" ], "ids": [ 69765, 32349, 19088 ], "entity": [ "B-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7 ] }, { "tokens": [ "-", "Judge", "accuse", "##s", "government", "of", "ob", "##stru", "##cting", "investigation", "into", "Las", "##a", "-", "Za", "##bala", "(", "two", "of", "GA", "##L", "victims", ")", "case" ], "ids": [ 118, 31617, 93413, 10107, 12047, 10108, 17339, 42461, 64716, 32719, 10708, 11518, 10113, 118, 14074, 64247, 113, 10551, 10108, 74212, 11369, 41205, 114, 13474 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 3, 7, 9, 9, 9 ] }, { "tokens": [ "EL", "M", "##UN", "##DO" ], "ids": [ 69765, 150, 69849, 104847 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Government", "wants", "to", "charge", "for", "pre", "##scription", "##s", "and", "some", "medical", "services" ], "ids": [ 118, 14581, 45769, 10114, 18163, 10142, 12229, 55785, 10107, 10111, 11152, 19436, 12639 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "DI", "##AR", "##IO", "16" ], "ids": [ 110014, 52188, 37174, 10250 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Judge", "Javier", "Gomez", "de", "Li", "##ano", "says", "government", "is", "ob", "##stru", "##cting", "justice" ], "ids": [ 118, 31617, 22856, 52956, 10104, 13258, 12301, 22153, 12047, 10124, 17339, 42461, 64716, 25791 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "ABC" ], "ids": [ 16052 ], "entity": [ "B-ORG" ], "entity_ids": [ 3 ] }, { "tokens": [ "-", "Prime", "Minister", "Jose", "Maria", "Az", "##nar", ",", "positive", "assessment" ], "ids": [ 118, 19924, 14355, 23029, 11066, 11122, 14582, 117, 19737, 62492 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 8, 9, 9, 9 ] }, { "tokens": [ "C", "##IN", "##CO", "DI", "##AS" ], "ids": [ 140, 27128, 82272, 110014, 38025 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7 ] }, { "tokens": [ "-", "BC", "##H", "in", "the", "hi", "##ve", "of", "Chilean", "pension", "##s" ], "ids": [ 118, 19376, 12396, 10106, 10105, 11520, 10612, 10108, 87067, 70838, 10107 ], "entity": [ "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 3, 7, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "EX", "##PA", "##NS", "##ION" ], "ids": [ 80426, 52099, 69196, 52980 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7 ] }, { "tokens": [ "-", "Cooper", "##s", "and", "L", "##y", "##brand", "em", "##ig", "##rates", "to", "Basque", "Country", "for", "fiscal", "reasons" ], "ids": [ 118, 18889, 10107, 10111, 149, 10157, 55520, 10266, 11142, 32406, 10114, 74950, 14966, 10142, 43645, 31725 ], "entity": [ "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 3, 7, 7, 7, 7, 7, 9, 9, 9, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "GA", "##CE", "##TA", "DE", "L", "##OS", "NE", "##GO", "##CI", "##OS" ], "ids": [ 74212, 43161, 24951, 25067, 149, 21793, 86607, 83821, 89955, 21793 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7 ] }, { "tokens": [ "-", "Government", "and", "Catalan", "nationalist", "##s", "set", "the", "scene", "for", "budget", "negotiations" ], "ids": [ 118, 14581, 10111, 81164, 99451, 10107, 11847, 10105, 18167, 10142, 25293, 61946 ], "entity": [ "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Len", "##zing", "ex", "##pects", "negative", "results", "in", "H", "##2", "." ], "ids": [ 97413, 19308, 11419, 92385, 25785, 17466, 10106, 145, 10729, 119 ], "entity": [ "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "VI", "##EN", "##NA", "1996", "-", "08", "-", "29" ], "ids": [ 12262, 50655, 36742, 10389, 118, 11052, 118, 10386 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Austrian", "vis", "##cos", "##e", "fibre", "maker", "Len", "##zing", "AG", "said", "on", "Thursday", "it", "expected", "to", "post", "negative", "group", "results", "in", "the", "second", "half", "of", "the", "year", "after", "posti", "##ng", "losses", "in", "the", "first", "six", "months", "." ], "ids": [ 32201, 23447, 15023, 10112, 92557, 94038, 97413, 19308, 17935, 12415, 10135, 67067, 10271, 25973, 10114, 11841, 25785, 11795, 17466, 10106, 10105, 11132, 13877, 10108, 10105, 10924, 10662, 45020, 10376, 45353, 10106, 10105, 10422, 12449, 15555, 119 ], "entity": [ "B-MISC", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "A", "pre", "##view", "of", "the", "second", "half", "of", "1996", "does", "not", "reveal", "any", "signs", "of", "a", "significant", "improvement", "in", "market", "conditions", ",", "\"", "Len", "##zing", "said", "in", "a", "statement", "released", "ahead", "of", "its", "earning", "##s", "conference", "." ], "ids": [ 107, 138, 12229, 30512, 10108, 10105, 11132, 13877, 10108, 10389, 15107, 10472, 75790, 11178, 45033, 10108, 169, 17912, 70010, 10106, 17313, 17315, 117, 107, 97413, 19308, 12415, 10106, 169, 33311, 11539, 35629, 10108, 10474, 56981, 10107, 25029, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "For", "the", "first", "six", "months", "of", "the", "year", ",", "Len", "##zing", "said", "it", "posted", "a", "group", "pre", "-", "tax", "loss", "of", "84", ".", "5", "million", "s", "##chi", "##lling", "##s", "from", "a", "profit", "of", "160", "million", "in", "the", "year", "-", "ago", "period", "." ], "ids": [ 11399, 10105, 10422, 12449, 15555, 10108, 10105, 10924, 117, 97413, 19308, 12415, 10271, 51232, 169, 11795, 12229, 118, 25468, 18576, 10108, 11761, 119, 126, 12473, 187, 12806, 30295, 10107, 10188, 169, 25081, 10108, 13849, 12473, 10106, 10105, 10924, 118, 36390, 13127, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "group", "attributed", "the", "first", "-", "half", "losses", "to", "weak", "demand", "and", "falling", "prices", "of", "vis", "##cos", "##e", "fibre", "##s", ",", "as", "well", "as", "sl", "##ug", "##gis", "##h", "economie", "##s", "in", "the", "West", "." ], "ids": [ 10117, 11795, 50199, 10105, 10422, 118, 13877, 45353, 10114, 61285, 34394, 10111, 54756, 57476, 10108, 23447, 15023, 10112, 92557, 10107, 117, 10146, 11206, 10146, 38523, 19951, 22725, 10237, 100091, 10107, 10106, 10105, 11164, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "-", "-", "Julia", "Ferguson", ",", "Vienna", "news", "##room", ",", "+", "431", "531", "##12", "274" ], "ids": [ 118, 118, 19332, 36401, 117, 20590, 14424, 25525, 117, 116, 36191, 49041, 24747, 28925 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Algeria", "fault", "##s", "Britain", "over", "Islam", "##ists", "gathering", "." ], "ids": [ 43776, 110640, 10107, 16032, 10491, 14727, 18206, 88666, 119 ], "entity": [ "B-LOC", "O", "O", "B-LOC", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 1, 9, 2, 6, 9, 9 ] }, { "tokens": [ "PA", "##RI", "##S", "1996", "-", "08", "-", "28" ], "ids": [ 32349, 46876, 10731, 10389, 118, 11052, 118, 10348 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Algeria", ",", "fighting", "a", "vi", "##cious", "war", "against", "Mo", "##sle", "##m", "fundamental", "##ist", "guerrilla", "##s", ",", "attacked", "Britain", "on", "Wednesday", "for", "allowing", "Islam", "##ist", "groups", "to", "meet", "in", "London", "." ], "ids": [ 43776, 117, 27535, 169, 13956, 45376, 10338, 11327, 34987, 42176, 10147, 27971, 11293, 106552, 10107, 117, 30272, 16032, 10135, 57611, 10142, 28357, 14727, 11293, 15647, 10114, 23267, 10106, 10829, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "The", "Islam", "##ist", "gathering", ",", "due", "to", "be", "held", "in", "London", "on", "September", "8", ",", "has", "tri", "##ggere", "##d", "concern", "and", "anger", "in", "several", "other", "Arab", "countries", "like", "Egypt", "which", "is", "also", "fighting", "armed", "Mo", "##sle", "##m", "fundamental", "##ists", "." ], "ids": [ 10117, 14727, 11293, 88666, 117, 10850, 10114, 10347, 11991, 10106, 10829, 10135, 10596, 129, 117, 10393, 15633, 79581, 10162, 43607, 10111, 46464, 10106, 11736, 10684, 17365, 15911, 11850, 20440, 10319, 10124, 10379, 27535, 34174, 34987, 42176, 10147, 27971, 18206, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "British", "Jewish", "groups", "have", "also", "voiced", "protest", "because", "they", "said", "Palestinian", "Islam", "##ist", "Hamas", "as", "well", "as", "the", "banned", "Algeria", "##n", "Islamic", "Sal", "##vation", "Front", "(", "FIS", ")", "are", "among", "those", "radical", "Islam", "##ists", "attending", "the", "conference", "." ], "ids": [ 11160, 17119, 15647, 10529, 10379, 59900, 36627, 12373, 10689, 12415, 56119, 14727, 11293, 83152, 10146, 11206, 10146, 10105, 58587, 43776, 10115, 22150, 64831, 39784, 19241, 113, 63392, 114, 10301, 13328, 12676, 31991, 14727, 18206, 54234, 10105, 25029, 119 ], "entity": [ "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 3, 9, 9, 9, 9, 9, 2, 6, 3, 7, 7, 7, 9, 3, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9 ] }, { "tokens": [ "A", "foreign", "ministry", "spoke", "##sman", "said", "in", "a", "statement", "read", "on", "Algeria", "##n", "television", "that", "Algeria", "\"", "has", "received", "with", "concern", "the", "information", "over", "a", "meeting", "of", "terrorist", "groups", "working", "against", "the", "interests", "of", "the", "Arab", "and", "Islamic", "world", ".", "\"" ], "ids": [ 138, 20796, 65338, 50005, 24305, 12415, 10106, 169, 33311, 24944, 10135, 43776, 10115, 14162, 10189, 43776, 107, 10393, 12296, 10169, 43607, 10105, 12929, 10491, 169, 19822, 10108, 76482, 15647, 14616, 11327, 10105, 36026, 10108, 10105, 17365, 10111, 22150, 11356, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "B-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 2, 9, 9, 9 ] }, { "tokens": [ "\"", "Algeria", "express", "##es", "its", "sharp", "re", "##ject", "##ion", "of", "a", "meeting", "putting", "together", "master", "##min", "##ds", "and", "ide", "##ologists", "and", "finance", "##rs", "of", "terrorism", ",", "\"", "the", "spoke", "##sman", "said", ",", "adding", "the", "Algeria", "##n", "government", "has", "asked", "the", "British", "em", "##bas", "##sy", "in", "Al", "##giers", "for", "clar", "##ification", "##s", "." ], "ids": [ 107, 43776, 47620, 10171, 10474, 77348, 11639, 56617, 11046, 10108, 169, 19822, 71028, 14229, 22013, 14956, 13268, 10111, 38938, 97603, 10111, 48053, 10943, 10108, 96969, 117, 107, 10105, 50005, 24305, 12415, 117, 44841, 10105, 43776, 10115, 12047, 10393, 22151, 10105, 11160, 10266, 21322, 16105, 10106, 10883, 92894, 10142, 96149, 29748, 10107, 119 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 2, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "Algeria", "##n", "ambassador", "in", "London", "has", "also", "asked", "for", "clar", "##ification", "from", "the", "Foreign", "Office", "over", "the", "meeting", "of", "Islam", "##ist", "groups", "." ], "ids": [ 10117, 43776, 10115, 74853, 10106, 10829, 10393, 10379, 22151, 10142, 96149, 29748, 10188, 10105, 20277, 13348, 10491, 10105, 19822, 10108, 14727, 11293, 15647, 119 ], "entity": [ "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O" ], "entity_ids": [ 9, 2, 6, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 2, 6, 9, 9 ] }, { "tokens": [ "Algeria", "said", "\"", "they", "are", "clearly", "working", "to", "under", "##mine", "the", "stability", "\"", "of", "Arab", "countries", "." ], "ids": [ 43776, 12415, 107, 10689, 10301, 52340, 14616, 10114, 10571, 18333, 10105, 69884, 107, 10108, 17365, 15911, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9 ] }, { "tokens": [ "British", "Foreign", "Secretary", "Malcolm", "R", "##if", "##kind", "said", "on", "Tuesday", "from", "Pakistan", "his", "government", "would", "only", "take", "action", "against", "the", "planned", "Islam", "##ists", "gathering", "in", "London", "if", "British", "law", "was", "broken", "." ], "ids": [ 11160, 20277, 19382, 26572, 155, 13918, 62891, 12415, 10135, 70245, 10188, 15437, 10226, 12047, 10894, 10893, 13574, 14204, 11327, 10105, 24292, 14727, 18206, 88666, 10106, 10829, 12277, 11160, 13255, 10134, 36197, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "B-LOC", "O", "B-MISC", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 1, 9, 2, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "People", "who", "wish", "to", "hold", "conferences", "of", "course", "do", "n", "'", "t", "need", "to", "seek", "permission", "from", "the", "government", "in", "Britain", ",", "\"", "he", "said", "." ], "ids": [ 107, 14235, 10479, 66069, 10114, 18500, 83881, 10108, 15348, 10149, 182, 112, 188, 17367, 10114, 48394, 52389, 10188, 10105, 12047, 10106, 16032, 117, 107, 10261, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "An", "estimated", "50", ",", "000", "people", ",", "including", "more", "than", "110", "foreign", "##ers", ",", "have", "been", "killed", "in", "Algeria", "'", "s", "violence", "pit", "##ting", "Mo", "##sle", "##m", "rebels", "against", "government", "forces", "since", "early", "1992", "when", "authorities", "in", "Algeria", "cancelled", "a", "general", "election", "in", "which", "FIS", "had", "taken", "a", "commanding", "lead", "." ], "ids": [ 10313, 25267, 10462, 117, 10259, 11426, 117, 11198, 10798, 11084, 13057, 20796, 10901, 117, 10529, 10590, 15875, 10106, 43776, 112, 187, 26342, 55277, 12141, 34987, 42176, 10147, 57545, 11327, 12047, 13729, 11764, 11732, 10450, 10841, 28308, 10106, 43776, 60557, 169, 11389, 13685, 10106, 10319, 63392, 10374, 15109, 169, 93644, 14107, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "OF", "##F", "##IC", "##IA", "##L", "J", "##O", "##UR", "##NA", "##L", "CO", "##NT", "##EN", "##TS", "-", "O", "##J", "L", "218", "OF", "AU", "##G", "##US", "##T", "28", ",", "1996", "." ], "ids": [ 23240, 11565, 30889, 35976, 11369, 147, 11403, 98348, 36742, 11369, 32992, 77261, 50655, 36545, 118, 152, 15417, 149, 24599, 23240, 29088, 11447, 32612, 11090, 10348, 117, 10389, 119 ], "entity": [ "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "*" ], "ids": [ 115 ], "entity": [ "O" ], "entity_ids": [ 9 ] }, { "tokens": [ "Commission", "Reg", "##ulation", "(", "EC", ")", "No", "1676", "/", "96", "of", "30", "July", "1996", "am", "##ending", "Reg", "##ulation", "(", "EE", "##C", ")", "No", "245", "##4", "/", "93", "lay", "##ing", "down", "provisions", "for", "the", "implementation", "of", "Council", "Reg", "##ulation", "(", "EE", "##C", ")", "No", "291", "##3", "/", "92", "establishing", "the", "Community", "Custom", "##s", "Code", "EN", "##D", "OF", "DO", "##C", "##UM", "##EN", "##T", "." ], "ids": [ 14941, 107990, 27894, 113, 27364, 114, 10657, 41108, 120, 12308, 10108, 10244, 11112, 10389, 10392, 107292, 107990, 27894, 113, 36502, 10858, 114, 10657, 25853, 11011, 120, 12479, 47413, 10230, 12935, 67623, 10142, 10105, 53187, 10108, 12821, 107990, 27894, 113, 36502, 10858, 114, 10657, 31240, 10884, 120, 12458, 55258, 10105, 18553, 101590, 10107, 16277, 31278, 11490, 23240, 99843, 10858, 72679, 50655, 11090, 119 ], "entity": [ "B-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "B-ORG", "I-ORG", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 6, 6, 9, 3, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 2, 6, 9, 3, 7, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 9, 3, 7, 9, 2, 6, 6, 6, 6, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wall", "Street", "pond", "##ers", "Rubin", "'", "s", "role", "if", "Clinton", "wins", "." ], "ids": [ 19523, 11962, 107161, 10901, 61045, 112, 187, 12971, 12277, 24139, 27279, 119 ], "entity": [ "B-LOC", "I-LOC", "O", "O", "B-PER", "O", "O", "O", "O", "B-PER", "O", "O" ], "entity_ids": [ 1, 5, 9, 9, 4, 9, 9, 9, 9, 4, 9, 9 ] }, { "tokens": [ "Donna", "Se", "##lls" ], "ids": [ 33747, 11045, 22881 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "NE", "##W", "Y", "##OR", "##K" ], "ids": [ 86607, 13034, 162, 42622, 11733 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC" ], "entity_ids": [ 1, 5, 5, 5, 5 ] }, { "tokens": [ "The", "outcome", "of", "the", "November", "elections", "emerged", "as", "a", "hot", "topic", "on", "Wall", "Street", "this", "week", "as", "financial", "pun", "##dits", "debate", "##d", "whether", "Robert", "Rubin", "might", "for", "##go", "a", "second", "term", "as", "Treasury", "secretary", "if", "President", "Clinton", "is", "re", "-", "elected", "." ], "ids": [ 10117, 89097, 10108, 10105, 10819, 22054, 50658, 10146, 169, 29698, 57680, 10135, 19523, 11962, 10531, 16118, 10146, 20570, 32310, 75766, 29632, 10162, 21883, 10820, 61045, 20970, 10142, 10797, 169, 11132, 13719, 10146, 77201, 37664, 12277, 12811, 24139, 10124, 11639, 118, 14254, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 4, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Con", "##cer", "##n", "centre", "##d", "on", "the", "currency", "markets", "since", "Rubin", "'", "s", "tour", "de", "force", "has", "been", "his", "un", "##f", "##lag", "##ging", "support", "of", "the", "dollar", "." ], "ids": [ 12845, 17505, 10115, 12672, 10162, 10135, 10105, 83759, 42893, 11764, 61045, 112, 187, 12842, 10104, 15031, 10393, 10590, 10226, 10119, 10575, 14954, 13808, 13145, 10108, 10105, 34807, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Sp", "##ecu", "##lation", "that", "Rubin", "might", "not", "stay", "in", "his", "post", "grew", "after", "he", "sides", "##te", "##pped", "questions", "about", "any", "future", "Cabinet", "post", "during", "television", "interviews", "at", "the", "Democratic", "convention", "in", "Chicago", "this", "week", "." ], "ids": [ 46361, 97038, 19718, 10189, 61045, 20970, 10472, 29597, 10106, 10226, 11841, 23616, 10662, 10261, 27263, 10216, 44357, 26686, 10978, 11178, 16711, 49855, 11841, 10939, 14162, 47619, 10160, 10105, 19281, 37812, 10106, 12317, 10531, 16118, 119 ], "entity": [ "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 2, 9, 9, 1, 9, 9, 9 ] }, { "tokens": [ "Should", "Rubin", "leave", ",", "Wall", "Street", "would", "wo", "##rry", "that", "he", "might", "take", "his", "strong", "-", "dollar", "policy", "with", "him", "." ], "ids": [ 71426, 61045, 21964, 117, 19523, 11962, 10894, 12796, 31862, 10189, 10261, 20970, 13574, 10226, 18093, 118, 34807, 14368, 10169, 10957, 119 ], "entity": [ "O", "B-PER", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rubin", "'", "s", "predecessor", "at", "the", "Treasury", ",", "Lloyd", "Bent", "##sen", ",", "was", "viewed", "with", "sus", "##pic", "##ion", "by", "some", "in", "the", "financial", "markets", "who", "thought", "he", "had", "tried", "to", "push", "down", "the", "dollar", "to", "gain", "an", "edge", "in", "trade", "negotiations", "with", "Japan", "." ], "ids": [ 61045, 112, 187, 58875, 10160, 10105, 77201, 117, 19345, 93331, 10917, 117, 10134, 51371, 10169, 10846, 34891, 11046, 10155, 11152, 10106, 10105, 20570, 42893, 10479, 18957, 10261, 10374, 27156, 10114, 68052, 12935, 10105, 34807, 10114, 25881, 10151, 30599, 10106, 18908, 61946, 10169, 11891, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "B-ORG", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 3, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "Ob", "##vio", "##usly", ",", "under", "the", "Clinton", "administration", ",", "we", "'", "ve", "seen", "two", "distinctive", "##ly", "different", "dollar", "policies", ",", "\"", "said", "Chris", "Wi", "##dne", "##ss", ",", "an", "international", "e", "##cono", "##mist", "at", "Chase", "Sec", "##urities", "Inc", ".", "\"", "Under", "Rubin", ",", "the", "U", ".", "S", ".", "has", "certainly", "looked", "for", "a", "strong", "dollar", ".", "\"" ], "ids": [ 107, 43019, 18574, 61289, 117, 10571, 10105, 24139, 17941, 117, 11951, 112, 10323, 15652, 10551, 62791, 10454, 12902, 34807, 38572, 117, 107, 12415, 13151, 52742, 20714, 13420, 117, 10151, 12533, 173, 27447, 24987, 10160, 27866, 109754, 82073, 13604, 119, 107, 12594, 61045, 117, 10105, 158, 119, 156, 119, 10393, 88134, 59822, 10142, 169, 18093, 34807, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "B-PER", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 9, 9, 4, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", "strategy", ",", "backed", "up", "by", "time", "##ly", "instances", "of", "joint", "central", "bank", "intervention", ",", "helped", "the", "dollar", "battle", "back", "from", "post", "-", "Second", "World", "War", "low", "##s", "of", "1", ".", "343", "##8", "German", "marks", "on", "March", "8", ",", "1995", ",", "and", "79", ".", "75", "Japanese", "ye", "##n", "on", "April", "19", ",", "1995", "." ], "ids": [ 13646, 40919, 117, 61010, 10741, 10155, 10635, 10454, 89403, 10108, 25680, 12397, 19423, 40152, 117, 20890, 10105, 34807, 18758, 12014, 10188, 11841, 118, 14181, 10315, 11277, 15626, 10107, 10108, 122, 119, 32007, 11396, 12026, 55112, 10135, 11144, 129, 117, 10436, 117, 10111, 12791, 119, 11417, 13847, 11023, 10115, 10135, 10780, 10270, 117, 10436, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Currently", ",", "the", "dollar", "stands", "at", "about", "1", ".", "48", "marks", "and", "109", "ye", "##n", "." ], "ids": [ 55972, 117, 10105, 34807, 34268, 10160, 10978, 122, 119, 11300, 55112, 10111, 16296, 11023, 10115, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Rubin", "was", "widely", "hai", "##led", "as", "the", "architect", "of", "the", "dollar", "'", "s", "comeback", ",", "using", "skills", "and", "expertise", "gained", "in", "26", "years", "on", "Wall", "Street", ",", "part", "of", "which", "were", "spent", "as", "co", "-", "chairman", "of", "Goldman", ",", "Sachs", "and", "Co", "." ], "ids": [ 61045, 10134, 24300, 13080, 16376, 10146, 10105, 26370, 10108, 10105, 34807, 112, 187, 80800, 117, 13382, 34302, 10111, 85681, 25222, 10106, 10314, 10855, 10135, 19523, 11962, 117, 10668, 10108, 10319, 10309, 18571, 10146, 11170, 118, 27627, 10108, 57886, 117, 65631, 10111, 13098, 119 ], "entity": [ "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG" ], "entity_ids": [ 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7 ] }, { "tokens": [ "Inc", "." ], "ids": [ 13604, 119 ], "entity": [ "B-ORG", "O" ], "entity_ids": [ 3, 9 ] }, { "tokens": [ "\"", "Rubin", "has", "done", "a", "fine", "job", "in", "that", "position", ",", "\"", "said", "Michael", "Faust", ",", "a", "portfolio", "manager", "at", "Bai", "##lard", ",", "Bi", "##eh", "##l", "and", "Kaiser", ",", "which", "manages", "just", "under", "$", "1", "billion", "in", "global", "stock", "##s", "and", "bonds", "." ], "ids": [ 107, 61045, 10393, 20378, 169, 13435, 23627, 10106, 10189, 12956, 117, 107, 12415, 10631, 48730, 117, 169, 101816, 16935, 10160, 85172, 62477, 117, 31156, 25723, 10161, 10111, 20021, 117, 10319, 75923, 12820, 10571, 109, 122, 25848, 10106, 18331, 20511, 10107, 10111, 93163, 119 ], "entity": [ "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "Any", "##one", "who", "would", "come", "in", "there", "to", "replace", "him", "would", "have", "aw", "##fully", "big", "sh", "##oes", "to", "fill", ".", "\"" ], "ids": [ 107, 47336, 12926, 10479, 10894, 10678, 10106, 11155, 10114, 37156, 10957, 10894, 10529, 56237, 42920, 22185, 48201, 47125, 10114, 20241, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fear", "that", "a", "new", "Treasury", "secretary", "might", "favour", "a", "return", "to", "Bent", "##sen", "-", "era", "policy", "could", "spell", "trouble", "for", "financial", "markets", "." ], "ids": [ 36912, 10189, 169, 10751, 77201, 37664, 20970, 61264, 169, 15079, 10114, 93331, 10917, 118, 10411, 14368, 12174, 76738, 58285, 10142, 20570, 42893, 119 ], "entity": [ "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Some", "overseas", "investors", "might", "sh", "##y", "away", "from", "buy", "##ing", "U", ".", "S", ".", "stock", "##s", "and", "bonds", "or", "even", "sell", "them", "when", "the", "dollar", "is", "weak", "##ening", "." ], "ids": [ 13885, 59391, 83795, 20970, 48201, 10157, 14942, 10188, 47715, 10230, 158, 119, 156, 119, 20511, 10107, 10111, 93163, 10345, 13246, 36300, 11345, 10841, 10105, 34807, 10124, 61285, 24428, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "As", "for", "U", ".", "S", ".", "Treasury", "sec", "##urities", ",", "Wi", "##dne", "##ss", "explained", "that", "Alan", "Green", "##sp", "##an", "'", "s", "re", "##app", "##oint", "##ment", "as", "chairman", "of", "the", "Federal", "Reserve", "and", "the", "out", "##lo", "##ok", "for", "the", "federal", "budget", "were", "more", "important", "than", "whether", "Rubin", "continues", "at", "the", "Treasury", "." ], "ids": [ 10882, 10142, 158, 119, 156, 119, 77201, 37913, 82073, 117, 52742, 20714, 13420, 44191, 10189, 14309, 13068, 54609, 10206, 112, 187, 11639, 102295, 94453, 10426, 10146, 27627, 10108, 10105, 14492, 23120, 10111, 10105, 10950, 10715, 11140, 10142, 10105, 16293, 25293, 10309, 10798, 12452, 11084, 21883, 61045, 25266, 10160, 10105, 77201, 119 ], "entity": [ "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-ORG", "O" ], "entity_ids": [ 9, 9, 3, 7, 7, 7, 7, 9, 9, 9, 4, 8, 8, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 7, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 3, 9 ] }, { "tokens": [ "\"", "Although", ",", "if", "we", "did", "get", "someone", "that", "was", "seen", "as", "looking", "for", "a", "dollar", "de", "##pre", "##ciation", ",", "it", "would", "probably", "hur", "##t", "capital", "flows", "to", "the", "United", "States", ",", "\"", "said", "Wi", "##dne", "##ss", ",", "adding", "that", "could", "hur", "##t", "U", ".", "S", ".", "stock", "##s", "and", ",", "to", "a", "lesser", "degree", ",", "bonds", "." ], "ids": [ 107, 15785, 117, 12277, 11951, 12172, 15329, 30455, 10189, 10134, 15652, 10146, 34279, 10142, 169, 34807, 10104, 30619, 94958, 117, 10271, 10894, 23282, 52824, 10123, 12185, 41271, 10114, 10105, 10609, 10859, 117, 107, 12415, 52742, 20714, 13420, 117, 44841, 10189, 12174, 52824, 10123, 158, 119, 156, 119, 20511, 10107, 10111, 117, 10114, 169, 93282, 16455, 117, 93163, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Still", ",", "markets", "may", "have", "little", "to", "fear", "from", "any", "Rubin", "successor", "because", "the", "firm", "dollar", "policy", "has", "yield", "##ed", "positive", "results", "." ], "ids": [ 27567, 117, 42893, 11387, 10529, 16745, 10114, 44929, 10188, 11178, 61045, 33095, 12373, 10105, 23410, 34807, 14368, 10393, 95757, 10336, 19737, 17466, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "If", "that", "is", "true", ",", "then", "any", "new", "Treasury", "chief", "would", "need", "to", "be", "as", "effective", "as", "Rubin", "in", "con", "##vin", "##cing", "markets", "that", "the", "White", "House", "does", "indeed", "want", "a", "strong", "currency", "." ], "ids": [ 14535, 10189, 10124, 22024, 117, 11059, 11178, 10751, 77201, 19421, 10894, 17367, 10114, 10347, 10146, 26874, 10146, 61045, 10106, 10173, 15478, 19113, 42893, 10189, 10105, 12136, 11545, 15107, 69815, 21528, 169, 18093, 83759, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "If", "he", "left", ",", "the", "first", "question", "people", "would", "ask", "the", "next", "gu", "##y", "is", ",", "'", "What", "'", "s", "your", "view", "on", "the", "dollar", "?", "'" ], "ids": [ 107, 14535, 10261, 12153, 117, 10105, 10422, 20210, 11426, 10894, 63001, 10105, 13451, 75980, 10157, 10124, 117, 112, 12489, 112, 187, 20442, 17904, 10135, 10105, 34807, 136, 112 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "said", "Michael", "Pere", "##lst", "##ein", ",", "portfolio", "manager", "of", "Main", "##S", "##tay", "International", "Fund", "##s", "." ], "ids": [ 107, 12415, 10631, 33511, 55533, 17892, 117, 101816, 16935, 10108, 14883, 10731, 47134, 10771, 26762, 10107, 119 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 7, 7, 9 ] }, { "tokens": [ "\"", "And", "all", "I", "can", "say", "as", "a", "piece", "of", "advice", "is", "that", "they", "'", "d", "better", "say", "exactly", "the", "same", "thing", "(", "as", "Rubin", ")", ",", "if", "not", "stronger", ",", "\"", "Pere", "##lst", "##ein", "said", ".", "\"" ], "ids": [ 107, 12689, 10435, 146, 10944, 23763, 10146, 169, 26767, 10108, 53426, 10124, 10189, 10689, 112, 172, 18322, 23763, 62136, 10105, 11561, 40414, 113, 10146, 61045, 114, 117, 12277, 10472, 85688, 117, 107, 33511, 55533, 17892, 12415, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "Other", "##wise", ",", "you", "get", "selling", "out", "of", "Tokyo", "and", "Frankfurt", "again", ".", "\"" ], "ids": [ 14490, 48339, 117, 13028, 15329, 30870, 10950, 10108, 15308, 10111, 15226, 13123, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 1, 9, 1, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "AU", "##ST", "##RI", "##A", "BE", "##AT", "SC", "##OT", "##LA", "##ND", "4", "-", "0", "IN", "EU", "##RO", "##P", "##EA", "##N", "UN", "##DE", "##R", "-", "21", "MA", "##TC", "##H", "." ], "ids": [ 71020, 65622, 24093, 118, 29088, 32995, 46876, 10738, 46291, 32071, 18137, 62146, 44376, 58521, 125, 118, 121, 36351, 17751, 35066, 11127, 36789, 11537, 26578, 60675, 11273, 118, 10296, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 5, 9, 9, 1, 5, 5, 5, 9, 9, 9, 9, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "AM", "##ST", "##ET", "##TE", "##N", ",", "Austria", "1996", "-", "08", "-", "30" ], "ids": [ 24339, 32995, 52338, 29833, 11537, 117, 14479, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Austria", "beat", "Scotland", "4", "-", "0", "(", "half", "##time", "3", "-", "0", ")", "in", "a", "European", "under", "-", "21", "championship", "match", "on", "Friday", "." ], "ids": [ 14479, 27868, 16901, 125, 118, 121, 113, 13877, 18086, 124, 118, 121, 114, 10106, 169, 11914, 10571, 118, 10296, 20755, 12356, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":", "Ewa", "##ld", "Brenner", "(", "5th", "minute", ")", ",", "Mario", "St", "##ie", "##gl", "##mai", "##r", "(", "42", "##nd", ")", ",", "Ronald", "Brun", "##may", "##r", "(", "43", "##rd", "and", "56", "##th", ")", "." ], "ids": [ 66875, 10943, 131, 98194, 12620, 109922, 113, 23255, 21760, 114, 117, 14011, 10838, 10400, 46066, 23611, 10129, 113, 11276, 11534, 114, 117, 21474, 102877, 77913, 10129, 113, 11370, 12023, 10111, 11628, 11143, 114, 119 ], "entity": [ "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "800" ], "ids": [ 46080, 131, 11900 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "W", "##AL", "##ES", "BE", "##AT", "SA", "##N", "MA", "##RI", "##NO", "4", "-", "0", "IN", "UN", "##DE", "##R", "-", "21", "MA", "##TC", "##H", "." ], "ids": [ 71020, 65622, 24093, 118, 160, 32002, 25054, 46291, 32071, 21318, 11537, 27277, 46876, 67292, 125, 118, 121, 36351, 26578, 60675, 11273, 118, 10296, 27277, 55671, 12396, 119 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 5, 9, 9, 1, 5, 5, 5, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "BA", "##R", "##R", "##Y", ",", "Wales", "1996", "-", "08", "-", "30" ], "ids": [ 39999, 11273, 11273, 14703, 117, 14137, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Wales", "beat", "San", "Marino", "4", "-", "0", "(", "half", "##time", "2", "-", "0", ")", "in", "a", "European", "under", "-", "21", "soccer", "match", "on", "Friday", "." ], "ids": [ 14137, 27868, 10469, 29719, 125, 118, 121, 113, 13877, 18086, 123, 118, 121, 114, 10106, 169, 11914, 10571, 118, 10296, 41356, 12356, 10135, 30767, 119 ], "entity": [ "B-LOC", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 1, 5, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Score", "##rs", ":" ], "ids": [ 66875, 10943, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Wales", "-", "John", "Hart", "##son", "(", "12th", ",", "56", "##th", "and", "83", "##rd", "minutes", ")", ",", "Scott", "Young", "(", "24", "##th", ")" ], "ids": [ 14137, 118, 10421, 22346, 11599, 113, 34505, 117, 11628, 11143, 10111, 12408, 12023, 15304, 114, 117, 12812, 12478, 113, 10233, 11143, 114 ], "entity": [ "B-LOC", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Attendance", ":", "1", ",", "800" ], "ids": [ 46080, 131, 122, 117, 11900 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "BA", "##LL", "##AN", "##GE", "##R", "K", "##EE", "##PS", "SP", "##RI", "##NT", "T", "##IT", "##LE", "IN", "ST", "##Y", "##LE", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 39999, 82834, 41275, 58719, 11273, 148, 95825, 46983, 22570, 46876, 77261, 157, 37611, 51036, 36351, 53317, 14703, 51036, 119 ], "entity": [ "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "Ay", "##res" ], "ids": [ 11235, 77603, 11234 ], "entity": [ "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 4, 8, 8 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "30" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fel", "##icia", "Ball", "##anger", "of", "France", "confirmed", "her", "status", "as", "the", "world", "'", "s", "number", "one", "woman", "sprint", "##er", "when", "she", "retained", "her", "title", "at", "the", "world", "c", "##ycling", "championships", "on", "Friday", "." ], "ids": [ 72493, 38016, 19479, 83224, 10108, 10688, 27347, 10485, 14042, 10146, 10105, 11356, 112, 187, 11487, 10464, 18299, 42707, 10165, 10841, 10833, 39886, 10485, 12887, 10160, 10105, 11356, 171, 87497, 47211, 10135, 30767, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ball", "##anger", "beat", "Germany", "'", "s", "Anne", "##tt", "Neumann", "2", "-", "0", "in", "the", "best", "-", "of", "-", "three", "matches", "final", "to", "add", "the", "world", "title", "to", "the", "Olympic", "gold", "medal", "she", "won", "in", "July", "." ], "ids": [ 19479, 83224, 27868, 12775, 112, 187, 13490, 11527, 43081, 123, 118, 121, 10106, 10105, 12504, 118, 10108, 118, 11003, 18258, 11070, 10114, 42852, 10105, 11356, 12887, 10114, 10105, 17952, 18128, 16531, 10833, 11367, 10106, 11112, 119 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "France", "also", "took", "third", "place", "in", "the", "sprint", ",", "Mag", "##ali", "Fa", "##ure", "defeating", "ex", "-", "world", "champion", "Tan", "##ya", "Dub", "##nico", "##ff", "of", "Canada", "2", "-", "0", "." ], "ids": [ 10688, 10379, 12149, 12628, 11192, 10106, 10105, 42707, 117, 63672, 13133, 44271, 12101, 42385, 11419, 118, 11356, 17689, 30594, 10679, 51536, 32665, 13820, 10108, 11635, 123, 118, 121, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "Ball", "##anger", ",", "25", ",", "will", "be", "aim", "##ing", "to", "complete", "a", "track", "double", "when", "she", "defend", "##s", "her", "500", "metres", "time", "trial", "title", "on", "Saturday", "." ], "ids": [ 19479, 83224, 117, 10258, 117, 11337, 10347, 56048, 10230, 10114, 17876, 169, 14310, 15790, 10841, 10833, 60041, 10107, 10485, 10757, 16393, 10635, 23626, 12887, 10135, 24848, 119 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "other", "final", "of", "the", "night", ",", "the", "women", "'", "s", "24", "-", "km", "##s", "points", "race", ",", "also", "ended", "in", "success", "for", "the", "reign", "##ing", "champion", "." ], "ids": [ 10117, 10684, 11070, 10108, 10105, 16903, 117, 10105, 13190, 112, 187, 10233, 118, 10204, 10107, 12789, 14025, 117, 10379, 18428, 10106, 17001, 10142, 10105, 38587, 10230, 17689, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russia", "'", "s", "Svetlana", "Samo", "##kha", "##lova", "fought", "off", "a", "spirit", "##ed", "challenge", "from", "American", "Jane", "Qui", "##gle", "##y", "to", "take", "the", "title", "for", "a", "second", "year", "." ], "ids": [ 14664, 112, 187, 105062, 88646, 77639, 44674, 29766, 11898, 169, 41576, 10336, 36040, 10188, 10536, 15549, 35921, 23239, 10157, 10114, 13574, 10105, 12887, 10142, 169, 11132, 10924, 119 ], "entity": [ "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 2, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Russia", ",", "the", "only", "nation", "to", "have", "two", "riders", "in", "the", "field", ",", "made", "full", "use", "of", "their", "numeri", "##cal", "superiori", "##ty", "." ], "ids": [ 14664, 117, 10105, 10893, 22274, 10114, 10529, 10551, 93076, 10106, 10105, 13939, 117, 11019, 13375, 11760, 10108, 10455, 67800, 15794, 71577, 11195, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Go", "##ul", "##nara", "Fat", "##kou", "##llin", "##a", "helped", "Samo", "##kha", "##lova", "to", "build", "an", "un", "##beat", "##able", "points", "lead", "before", "sna", "##tch", "##ing", "the", "bronze", "medal", "." ], "ids": [ 14439, 10604, 96729, 48803, 14530, 85129, 10113, 20890, 88646, 77639, 44674, 10114, 23332, 10151, 10119, 68939, 13096, 12789, 14107, 11360, 62541, 38732, 10230, 10105, 17930, 16531, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 8, 8, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Qui", "##gle", "##y", ",", "a", "former", "medal", "##list", "in", "the", "points", "event", ",", "led", "the", "race", "at", "half", "distance", ".", "\"" ], "ids": [ 35921, 23239, 10157, 117, 169, 11775, 16531, 21476, 10106, 10105, 12789, 14416, 117, 12857, 10105, 14025, 10160, 13877, 18527, 119, 107 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "I", "went", "so", "close", "this", "time", ",", "but", "having", "two", "riders", "certainly", "gave", "the", "Russian", "##s", "an", "advantage", ",", "\"", "she", "said", "." ], "ids": [ 146, 13446, 10380, 16065, 10531, 10635, 117, 10473, 13677, 10551, 93076, 88134, 15362, 10105, 13463, 10107, 10151, 38119, 117, 107, 10833, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "first", "six", "riders", "lap", "##ped", "the", "field", ",", "which", "left", "former", "world", "champion", "Ingrid", "Hari", "##nga", "of", "the", "Netherlands", "down", "in", "seventh", "place", "despite", "having", "the", "second", "highest", "points", "score", "." ], "ids": [ 10117, 10422, 12449, 93076, 38553, 16898, 10105, 13939, 117, 10319, 12153, 11775, 11356, 17689, 30576, 39769, 18161, 10108, 10105, 22043, 12935, 10106, 37192, 11192, 22087, 13677, 10105, 11132, 18134, 12789, 17704, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Olympic", "champion", "Nathalie", "Lan", "##cie", "##n", "of", "France", "also", "missed", "the", "winning", "attack", "and", "finished", "a", "disa", "##ppo", "##inti", "##ng", "10th", "." ], "ids": [ 17952, 17689, 64682, 19670, 12097, 10115, 10108, 10688, 10379, 55233, 10105, 16542, 16342, 10111, 15972, 169, 36474, 45565, 49886, 10376, 31004, 119 ], "entity": [ "B-MISC", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "C", "##Y", "##CL", "##ING", "-", "WORLD", "TR", "##AC", "##K", "CH", "##AM", "##P", "##ION", "##SH", "##IP", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 140, 14703, 100886, 50183, 118, 67376, 80047, 30340, 11733, 39774, 36535, 11127, 52980, 64091, 30331, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "MAN", "##CH", "##ES", "##TER", ",", "England", "1996", "-", "08", "-", "30" ], "ids": [ 73020, 86448, 25054, 99552, 117, 11701, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "at", "the", "world", "track", "c", "##ycling", "championships", "on", "Friday", ":" ], "ids": [ 33036, 10160, 10105, 11356, 14310, 171, 87497, 47211, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "sprint", "semifinals", "(", "best", "of", "three", ")", ":" ], "ids": [ 13536, 112, 187, 42707, 82726, 113, 12504, 10108, 11003, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Anne", "##tt", "Neumann", "(", "Germany", ")", "beat", "Mag", "##ali", "Fa", "##ure", "(", "France", ")", "2", "-", "0", "(", "12", ".", "341", "and", "12", ".", "348", "seconds", "for", "the", "last", "200", "metres", ")" ], "ids": [ 13490, 11527, 43081, 113, 12775, 114, 27868, 63672, 13133, 44271, 12101, 113, 10688, 114, 123, 118, 121, 113, 10186, 119, 35957, 10111, 10186, 119, 36721, 34290, 10142, 10105, 12469, 10777, 16393, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fel", "##icia", "Ball", "##anger", "(", "France", ")", "beat", "Tan", "##ya", "Dub", "##nico", "##ff", "(", "Canada", ")", "2", "-", "0", ",", "(", "12", ".", "130", "/", "12", ".", "124", ")" ], "ids": [ 72493, 38016, 19479, 83224, 113, 10688, 114, 27868, 30594, 10679, 51536, 32665, 13820, 113, 11635, 114, 123, 118, 121, 117, 113, 10186, 119, 13389, 120, 10186, 119, 17944, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 8, 9, 1, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Ride", "for", "third", "place", ":" ], "ids": [ 38028, 10142, 12628, 11192, 131 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "Fa", "##ure", "beat", "Dub", "##nico", "##ff", "2", "-", "0", "(", "12", ".", "112", "/", "12", ".", "246", ")" ], "ids": [ 44271, 12101, 27868, 51536, 32665, 13820, 123, 118, 121, 113, 10186, 119, 16129, 120, 10186, 119, 26439, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Final", ":" ], "ids": [ 14924, 131 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Ball", "##anger", "beat", "Neumann", "2", "-", "0", "(", "11", ".", "959", "/", "12", ".", "225", ")" ], "ids": [ 19479, 83224, 27868, 43081, 123, 118, 121, 113, 10193, 119, 73586, 120, 10186, 119, 20843, 114 ], "entity": [ "B-PER", "I-PER", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Women", "'", "s", "world", "points", "race", "championship", "(", "24", "-", "km", ")", ":" ], "ids": [ 13536, 112, 187, 11356, 12789, 14025, 20755, 113, 10233, 118, 10204, 114, 131 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "1", ".", "Svetlana", "Samo", "##kha", "##lova", "(", "Russia", ")", "28", "points", "(", "in", "32" ], "ids": [ 122, 119, 105062, 88646, 77639, 44674, 113, 14664, 114, 10348, 12789, 113, 10106, 10842 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "minutes", "31", ".", "08", "##1", "seconds", ")" ], "ids": [ 15304, 10413, 119, 11052, 10759, 34290, 114 ], "entity": [ "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Jane", "Qui", "##gle", "##y", "(", "U", ".", "S", ".", ")", "18", "points" ], "ids": [ 123, 119, 15549, 35921, 23239, 10157, 113, 158, 119, 156, 119, 114, 10218, 12789 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 5, 5, 5, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Go", "##ul", "##nara", "Fat", "##kou", "##llin", "##a", "(", "Russia", ")", "16" ], "ids": [ 124, 119, 14439, 10604, 96729, 48803, 14530, 85129, 10113, 113, 14664, 114, 10250 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "4", ".", "Tatiana", "St", "##ia", "##jk", "##ina", "(", "Ukraine", ")", "11" ], "ids": [ 125, 119, 87693, 10838, 10280, 26960, 11067, 113, 19883, 114, 10193 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "5", ".", "Judith", "Ar", "##ndt", "(", "Germany", ")", "11" ], "ids": [ 126, 119, 35043, 18484, 33096, 113, 12775, 114, 10193 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "6", ".", "Tea", "Vi", "##kst", "##edt", "-", "Ny", "##man", "(", "Finland", ")", "5" ], "ids": [ 127, 119, 58537, 31826, 91996, 45160, 118, 11459, 10589, 113, 15497, 114, 126 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "One", "lap", "behind", ":" ], "ids": [ 11340, 38553, 17155, 131 ], "entity": [ "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Ingrid", "Hari", "##nga", "(", "Netherlands", ")", "20" ], "ids": [ 128, 119, 30576, 39769, 18161, 113, 22043, 114, 10197 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "8", ".", "Sally", "Boyd", "##en", "(", "Britain", ")", "9" ], "ids": [ 129, 119, 33636, 46088, 10136, 113, 16032, 114, 130 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "9", ".", "Agnieszka", "God", "##ras", "(", "Poland", ")", "8" ], "ids": [ 130, 119, 99413, 14015, 12783, 113, 17879, 114, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "10", ".", "Nathalie", "Lan", "##cie", "##n", "(", "France", ")", "8" ], "ids": [ 10150, 119, 64682, 19670, 12097, 10115, 113, 10688, 114, 129 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "FR", "##EN", "##CH", "DE", "##F", "##EN", "##DE", "##R", "KO", "##M", "##B", "##O", "##U", "##AR", "##E", "J", "##O", "##IN", "##S", "AB", "##ER", "##DE", "##EN", "." ], "ids": [ 71020, 65622, 24093, 118, 64655, 50655, 86448, 25067, 11565, 50655, 60675, 11273, 67422, 11517, 11274, 11403, 12022, 52188, 11259, 147, 11403, 27128, 10731, 21644, 24093, 60675, 50655, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "I-ORG", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 9, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 3, 7, 7, 7, 9 ] }, { "tokens": [ "ABD", "##ER", "##DE", "##EN", ",", "Scotland", "1996", "-", "08", "-", "30" ], "ids": [ 30915, 24093, 60675, 50655, 117, 16901, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "French", "central", "defender", "Antoine", "Kom", "##bou", "##are", "has", "completed", "a", "300", ",", "000", "pounds", "ster", "##ling", "(", "$", "467", ",", "000", ")", "move", "to", "Aberdeen", "from", "Swiss", "club", "Sion", ",", "the", "Scottish", "premier", "division", "club", "said", "on", "Friday", "." ], "ids": [ 11894, 12397, 36426, 17926, 106306, 23723, 11591, 10393, 15782, 169, 11093, 117, 10259, 61982, 78342, 11945, 113, 109, 47763, 117, 10259, 114, 18577, 10114, 49317, 10188, 22984, 11111, 82683, 117, 10105, 18879, 11913, 13751, 11111, 12415, 10135, 30767, 119 ], "entity": [ "B-MISC", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "B-MISC", "O", "B-ORG", "O", "O", "B-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 2, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 2, 9, 3, 9, 9, 2, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Kom", "##bou", "##are", "has", "signed", "a", "two", "-", "year", "contract", "and", "will", "make", "his", "debut", "against", "Morton", "in", "the", "Scottish", "League", "Cup", "on", "Tuesday", "." ], "ids": [ 106306, 23723, 11591, 10393, 14775, 169, 10551, 118, 10924, 16108, 10111, 11337, 13086, 10226, 13424, 11327, 38429, 10106, 10105, 18879, 11074, 11544, 10135, 70245, 119 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "B-MISC", "I-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 2, 6, 6, 9, 9, 9 ] }, { "tokens": [ "But", "he", "will", "be", "in", "##elig", "##ible", "for", "the", "rest", "of", "Aberdeen", "'", "s", "UEFA", "Cup", "campaign", "as", "he", "has", "already", "played", "for", "Sion", "in", "this", "season", "'", "s", "Cup", "Winners", "'", "Cup", "." ], "ids": [ 16976, 10261, 11337, 10347, 10106, 44134, 22529, 10142, 10105, 17333, 10108, 49317, 112, 187, 13528, 11544, 17323, 10146, 10261, 10393, 19034, 11553, 10142, 82683, 10106, 10531, 11226, 112, 187, 11544, 34686, 112, 11544, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "B-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 2, 6, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 2, 6, 6, 6, 9 ] }, { "tokens": [ "Aberdeen", "manager", "Roy", "Ai", "##tke", "##n", "said", ":", "\"", "It", "'", "s", "un", "##fort", "##una", "##te", "for", "us", "that", "Antoine", "cannot", "play", "in", "Europe", "but", "he", "will", "help", "us", "achieve", "things", "in", "domestic", "competition", "." ], "ids": [ 49317, 16935, 14521, 19672, 61877, 10115, 12415, 131, 107, 10377, 112, 187, 10119, 23044, 14212, 10216, 10142, 19626, 10189, 17926, 25259, 12253, 10106, 11767, 10473, 10261, 11337, 15217, 19626, 43250, 24682, 10106, 31084, 16622, 119 ], "entity": [ "B-ORG", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "B-LOC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 3, 9, 4, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 1, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "\"", "I", "have", "been", "watching", "him", "for", "several", "weeks", "now", "and", "have", "no", "doubt", "##s", "he", "brings", "real", "quality", "to", "the", "side", "." ], "ids": [ 107, 146, 10529, 10590, 84532, 10957, 10142, 11736, 20750, 11858, 10111, 10529, 10192, 86697, 10107, 10261, 69315, 13486, 21905, 10114, 10105, 12250, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "He", "has", "a", "great", "deal", "of", "experience", "and", "I", "'", "m", "sure", "he", "will", "quickly", "establish", "himself", "in", "both", "the", "team", "and", "the", "affect", "##ion", "of", "our", "fans", ".", "\"" ], "ids": [ 10357, 10393, 169, 14772, 19918, 10108, 20627, 10111, 146, 112, 181, 62452, 10261, 11337, 23590, 33623, 14764, 10106, 11408, 10105, 11121, 10111, 10105, 60600, 11046, 10108, 17446, 20950, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "The", "32", "-", "year", "-", "old", "defender", "played", "seven", "seasons", "with", "Nantes", "and", "was", "with", "Paris", "St", "Germain", "for", "five", "seasons", "." ], "ids": [ 10117, 10842, 118, 10924, 118, 12898, 36426, 11553, 15767, 21396, 10169, 32134, 10111, 10134, 10169, 10728, 10838, 26289, 10142, 12403, 21396, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "B-ORG", "I-ORG", "I-ORG", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 3, 7, 7, 9, 9, 9, 9 ] }, { "tokens": [ "He", "said", "former", "PS", "##G", "team", "mate", "David", "Gino", "##la", ",", "who", "now", "plays", "for", "English", "premier", "league", "Newcastle", ",", "was", "influential", "in", "his", "move", "to", "Scotland", "." ], "ids": [ 10357, 12415, 11775, 21290, 11447, 11121, 43465, 10804, 23936, 10330, 117, 10479, 11858, 17724, 10142, 11616, 11913, 15616, 28060, 117, 10134, 43626, 10106, 10226, 18577, 10114, 16901, 119 ], "entity": [ "O", "O", "O", "B-ORG", "I-ORG", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "O", "B-MISC", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "B-LOC", "O" ], "entity_ids": [ 9, 9, 9, 3, 7, 9, 9, 4, 8, 8, 9, 9, 9, 9, 9, 2, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 1, 9 ] }, { "tokens": [ "\"", "I", "'", "m", "a", "very", "good", "friend", "of", "David", "and", "spoke", "to", "him", "recently", "about", "coming", "to", "Aberdeen", "and", "he", "was", "very", "positive", "about", "it", ",", "\"", "Kom", "##bou", "##are", "said", "." ], "ids": [ 107, 146, 112, 181, 169, 12558, 15198, 20104, 10108, 10804, 10111, 50005, 10114, 10957, 23746, 10978, 23959, 10114, 49317, 10111, 10261, 10134, 12558, 19737, 10978, 10271, 117, 107, 106306, 23723, 11591, 12415, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9, 9, 9, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9 ] }, { "tokens": [ "\"", "He", "said", "I", "would", "really", "enjoy", "life", "there", "and", "that", "I", "would", "settle", "in", "in", "terms", "of", "football", "as", "well", "." ], "ids": [ 107, 10357, 12415, 146, 10894, 30181, 84874, 12103, 11155, 10111, 10189, 146, 10894, 90424, 10106, 10106, 18873, 10108, 12485, 10146, 11206, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "That", ",", "and", "the", "fact", "he", "is", "only", "a", "few", "hours", "drive", "away", ",", "influenced", "my", "decision", "to", "come", "to", "Aberdeen", ".", "\"" ], "ids": [ 13646, 117, 10111, 10105, 18638, 10261, 10124, 10893, 169, 13824, 19573, 23806, 14942, 117, 31377, 15127, 19231, 10114, 10678, 10114, 49317, 119, 107 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "B-ORG", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 3, 9, 9 ] }, { "tokens": [ "MO", "##TO", "##RC", "##Y", "##CL", "##ING", "-", "SA", "##N", "MA", "##RI", "##NO", "GR", "##AN", "##D", "PR", "##IX", "PR", "##AC", "##TI", "##CE", "TIME", "##S", "." ], "ids": [ 102059, 60493, 52932, 14703, 100886, 50183, 118, 21318, 11537, 27277, 46876, 67292, 58787, 41275, 11490, 23837, 67403, 23837, 30340, 72286, 43161, 89275, 10731, 119 ], "entity": [ "O", "O", "O", "O", "O", "O", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 9, 9, 1, 5, 5, 5, 5, 2, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "IM", "##OL", "##A", ",", "Italy", "1996", "-", "08", "-", "30" ], "ids": [ 97126, 39272, 10738, 117, 11619, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Practice", "times", "set", "on", "Friday" ], "ids": [ 46184, 13465, 11847, 10135, 30767 ], "entity": [ "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9 ] }, { "tokens": [ "for", "Sunday", "'", "s", "San", "Marino", "500", "##cc", "motor", "##cy", "##clin", "##g", "Grand", "Prix", ":" ], "ids": [ 10142, 19731, 112, 187, 10469, 29719, 10757, 28044, 15257, 11710, 86257, 10240, 11319, 12835, 131 ], "entity": [ "O", "O", "O", "O", "B-LOC", "I-LOC", "O", "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O" ], "entity_ids": [ 9, 9, 9, 9, 1, 5, 9, 9, 9, 9, 9, 9, 2, 6, 9 ] }, { "tokens": [ "1", ".", "Michael", "Doo", "##han", "(", "Australia", ")", "Honda", "one", "minute", "50", ".", "250" ], "ids": [ 122, 119, 10631, 59048, 11781, 113, 11729, 114, 25290, 10464, 21760, 10462, 119, 12214 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "2", ".", "Jean", "-", "Michel", "Bay", "##le", "(", "France", ")", "Yamaha", "1", ":", "50", ".", "727" ], "ids": [ 123, 119, 10766, 118, 13273, 13146, 10284, 113, 10688, 114, 56988, 122, 131, 10462, 119, 46036 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "3", ".", "Nor", "##ifu", "##mi", "Abe", "(", "Japan", ")", "Yamaha", "1", ":", "50", ".", "858" ], "ids": [ 124, 119, 98837, 109747, 10500, 58298, 113, 11891, 114, 56988, 122, 131, 10462, 119, 78390 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "4", ".", "Luca", "Cada", "##lora", "(", "Italy", ")", "Honda", "1", ":", "51", ".", "006" ], "ids": [ 125, 119, 26001, 29001, 61465, 113, 11619, 114, 25290, 122, 131, 11524, 119, 52076 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "5", ".", "Alex", "C", "##ri", "##ville", "(", "Spain", ")", "Honda", "1", ":", "51", ".", "07", "##5" ], "ids": [ 126, 119, 14728, 140, 10401, 12043, 113, 16149, 114, 25290, 122, 131, 11524, 119, 10878, 11166 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "6", ".", "Scott", "Russell", "(", "United", "States", ")", "Suzuki", "1", ":", "51", ".", "287" ], "ids": [ 127, 119, 12812, 13481, 113, 10609, 10859, 114, 31698, 122, 131, 11524, 119, 29268 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 5, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "7", ".", "Tada", "##yuki", "Ok", "##ada", "(", "Japan", ")", "Honda", "1", ":", "51", ".", "528" ], "ids": [ 128, 119, 76284, 62159, 84591, 11153, 113, 11891, 114, 25290, 122, 131, 11524, 119, 36711 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "8", ".", "Carlos", "Checa", "(", "Spain", ")", "Honda", "1", ":", "51", ".", "588" ], "ids": [ 129, 119, 12050, 79518, 113, 16149, 114, 25290, 122, 131, 11524, 119, 57531 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "9", ".", "Alexandre", "Barros", "(", "Brazil", ")", "Honda", "1", ":", "51", ".", "784" ], "ids": [ 130, 119, 18009, 73465, 113, 16765, 114, 25290, 122, 131, 11524, 119, 68658 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "10", ".", "Shin", "##ichi", "Ito", "##h", "(", "Japan", ")", "Honda", "1", ":", "51", ".", "857" ], "ids": [ 10150, 119, 35862, 35230, 38934, 10237, 113, 11891, 114, 25290, 122, 131, 11524, 119, 73898 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "B-ORG", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 3, 9, 9, 9, 9, 9 ] }, { "tokens": [ "GO", "##L", "##F", "-", "BR", "##IT", "##IS", "##H", "MA", "##ST", "##ER", "##S", "T", "##HI", "##RD", "R", "##O", "##UN", "##D", "SC", "##OR", "##ES", "." ], "ids": [ 41525, 11369, 11565, 118, 49351, 37611, 19088, 12396, 27277, 32995, 24093, 10731, 157, 108880, 84444, 155, 11403, 69849, 11490, 18137, 42622, 25054, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "NO", "##RT", "##HA", "##MP", "##TO", "##N", ",", "England", "1996", "-", "08", "-", "30" ], "ids": [ 49307, 46935, 58132, 79936, 60493, 11537, 117, 11701, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 5, 5, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Leading", "scores", "after" ], "ids": [ 100085, 49931, 10662 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "the", "third", "round", "of", "the", "British", "Masters", "on", "Friday", ":" ], "ids": [ 10105, 12628, 13569, 10108, 10105, 11160, 20622, 10135, 30767, 131 ], "entity": [ "O", "O", "O", "O", "O", "B-MISC", "I-MISC", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 9, 2, 6, 9, 9, 9 ] }, { "tokens": [ "211", "Robert", "Allen", "##by", "(", "Australia", ")", "69", "71", "71" ], "ids": [ 22448, 10820, 15101, 11530, 113, 11729, 114, 12573, 12513, 12513 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "212", "Pedro", "Linha", "##rt", "(", "Spain", ")", "72", "73", "67" ], "ids": [ 22023, 12849, 85861, 10976, 113, 16149, 114, 12120, 12545, 12316 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "216", "Miguel", "Angel", "Martin", "(", "Spain", ")", "75", "70", "71", ",", "Costa", "##ntino", "Rocca" ], "ids": [ 23677, 13905, 17567, 11235, 113, 16149, 114, 11417, 10923, 12513, 117, 13902, 44878, 63718 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER" ], "entity_ids": [ 9, 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8 ] }, { "tokens": [ "(", "Italy", ")", "71", "73", "72" ], "ids": [ 113, 11619, 114, 12513, 12545, 12120 ], "entity": [ "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "217", "Antoine", "Le", "##bou", "##c", "(", "France", ")", "74", "73", "70", ",", "Ian", "Woo", "##sna", "##m", "70", "76", "71", "," ], "ids": [ 21651, 17926, 10281, 23723, 10350, 113, 10688, 114, 12535, 12545, 10923, 117, 16582, 84270, 45981, 10147, 10923, 12428, 12513, 117 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "Francisco", "Cea", "(", "Spain", ")", "70", "71", "76", ",", "Gavin", "Lev", "##ens", "##on", "(", "South" ], "ids": [ 11798, 109435, 113, 16149, 114, 10923, 12513, 12428, 117, 57112, 51644, 12457, 10263, 113, 11056 ], "entity": [ "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC" ], "entity_ids": [ 4, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1 ] }, { "tokens": [ "Africa", ")", "66", "75", "76" ], "ids": [ 12880, 114, 12215, 11417, 12428 ], "entity": [ "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9 ] }, { "tokens": [ "218", "Stephen", "M", "##c", "##A", "##llis", "##ter", "73", "76", "69", ",", "Jo", "##aki", "##m", "Ha", "##egg", "##man", "(", "S", "##we", ")", "71", "77" ], "ids": [ 24599, 13866, 150, 10350, 10738, 44417, 10877, 12545, 12428, 12573, 117, 20977, 22471, 10147, 13740, 91600, 10589, 113, 156, 12577, 114, 12513, 12527 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "I-LOC", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 8, 9, 1, 5, 9, 9, 9 ] }, { "tokens": [ "70", ",", "Jose", "Co", "##cere", "##s", "(", "Argentina", ")", "69", "78", "71", ",", "Paul", "Ea", "##les", "75", "71", "72", "," ], "ids": [ 10923, 117, 23029, 13098, 51159, 10107, 113, 12853, 114, 12573, 12492, 12513, 117, 10772, 47132, 11268, 11417, 12513, 12120, 117 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "K", "##las", "Eriksson", "(", "Sweden", ")", "71", "75", "72", ",", "Mike", "Clayton", "(", "Australia", ")" ], "ids": [ 148, 13983, 70145, 113, 20937, 114, 12513, 11417, 12120, 117, 13270, 43687, 113, 11729, 114 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O" ], "entity_ids": [ 4, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 9, 1, 9 ] }, { "tokens": [ "69", "76", "73", ",", "Mark", "R", "##oe", "69", "71", "78" ], "ids": [ 12573, 12428, 12545, 117, 11997, 155, 20085, 12573, 12513, 12492 ], "entity": [ "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 4, 8, 8, 9, 9, 9 ] }, { "tokens": [ "219", "Ea", "##mon", "##n", "Dar", "##cy", "(", "Ireland", ")", "74", "76", "69", ",", "Bob", "May", "(", "U", ".", "S", ".", ")", "74", "75", "70", "," ], "ids": [ 25874, 47132, 16278, 10115, 35368, 11710, 113, 14637, 114, 12535, 12428, 12573, 117, 13583, 10725, 113, 158, 119, 156, 119, 114, 12535, 11417, 10923, 117 ], "entity": [ "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 9, 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Paul", "Law", "##rie", "72", "75", "72", ",", "Miguel", "Angel", "Jim", "##ene", "##z", "(", "Spain", ")", "74", "72" ], "ids": [ 10772, 13216, 12904, 12120, 11417, 12120, 117, 13905, 17567, 14178, 12061, 10305, 113, 16149, 114, 12535, 12120 ], "entity": [ "B-PER", "I-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 4, 8, 8, 9, 9, 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "73", ",", "Peter", "Mitchell", "74", "71", "75", ",", "Philip", "Walton", "(", "Ireland", ")", "71", "74" ], "ids": [ 12545, 117, 10979, 19906, 12535, 12513, 11417, 117, 13324, 56487, 113, 14637, 114, 12513, 12535 ], "entity": [ "O", "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9 ] }, { "tokens": [ "74", ",", "Peter", "O", "'", "Mall", "##ey", "(", "Australia", ")", "71", "73", "75" ], "ids": [ 12535, 117, 10979, 152, 112, 48719, 13005, 113, 11729, 114, 12513, 12545, 11417 ], "entity": [ "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9 ] }, { "tokens": [ "220", "Barry", "Lane", "73", "77", "70", ",", "Wayne", "Riley", "(", "Australia", ")", "71", "78", "71", "," ], "ids": [ 15817, 18120, 20845, 12545, 12527, 10923, 117, 18547, 35643, 113, 11729, 114, 12513, 12492, 12513, 117 ], "entity": [ "O", "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 4, 8, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Martin", "Gates", "71", "77", "72", ",", "Bradley", "Hughes", "(", "Australia", ")", "73", "75", "72", "," ], "ids": [ 11235, 39000, 12513, 12527, 12120, 117, 29308, 20014, 113, 11729, 114, 12545, 11417, 12120, 117 ], "entity": [ "B-PER", "I-PER", "O", "O", "O", "O", "B-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 4, 8, 9, 9, 9, 9, 4, 8, 9, 1, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Peter", "He", "##d", "##blo", "##m", "(", "Sweden", ")", "70", "75", "75", ",", "Re", "##tief", "Goose", "##n", "(", "South" ], "ids": [ 10979, 10357, 10162, 71933, 10147, 113, 20937, 114, 10923, 11417, 11417, 117, 20304, 108386, 106354, 10115, 113, 11056 ], "entity": [ "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "I-PER", "O", "B-LOC" ], "entity_ids": [ 4, 8, 8, 8, 8, 9, 1, 9, 9, 9, 9, 9, 4, 8, 8, 8, 9, 1 ] }, { "tokens": [ "Africa", ")", "71", "74", "75", ",", "David", "Gil", "##ford", "69", "74", "77", "." ], "ids": [ 12880, 114, 12513, 12535, 11417, 117, 10804, 26463, 13387, 12573, 12535, 12527, 119 ], "entity": [ "B-LOC", "O", "O", "O", "O", "O", "B-PER", "I-PER", "I-PER", "O", "O", "O", "O" ], "entity_ids": [ 1, 9, 9, 9, 9, 9, 4, 8, 8, 9, 9, 9, 9 ] }, { "tokens": [ "SO", "##CC", "##ER", "-", "EN", "##GL", "##IS", "##H", "SO", "##CC", "##ER", "RE", "##SU", "##L", "##TS", "." ], "ids": [ 71020, 65622, 24093, 118, 31278, 104780, 19088, 12396, 71020, 65622, 24093, 71033, 88592, 11369, 36545, 119 ], "entity": [ "O", "O", "O", "O", "B-MISC", "I-MISC", "I-MISC", "I-MISC", "O", "O", "O", "O", "O", "O", "O", "O" ], "entity_ids": [ 9, 9, 9, 9, 2, 6, 6, 6, 9, 9, 9, 9, 9, 9, 9, 9 ] }, { "tokens": [ "L", "##ON", "##DO", "##N", "1996", "-", "08", "-", "30" ], "ids": [ 149, 30118, 104847, 11537, 10389, 118, 11052, 118, 10244 ], "entity": [ "B-LOC", "I-LOC", "I-LOC", "I-LOC", "O", "O", "O", "O", "O" ], "entity_ids": [ 1, 5, 5, 5, 9, 9, 9, 9, 9 ] }, { "tokens": [ "Results", "of", "English", "league", "matches" ], "ids": [ 33036, 10108, 11616, 15616, 18258 ], "entity": [ "O", "O", "B-MISC", "O", "O" ], "entity_ids": [ 9, 9, 2, 9, 9 ] }, { "tokens": [ "on", "Friday", ":" ], "ids": [ 10135, 30767, 131 ], "entity": [ "O", "O", "O" ], "entity_ids": [ 9, 9, 9 ] }, { "tokens": [ "Division", "two" ], "ids": [ 11987, 10551 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Plymouth", "2", "Preston", "1" ], "ids": [ 40814, 123, 35119, 122 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] }, { "tokens": [ "Division", "three" ], "ids": [ 11987, 11003 ], "entity": [ "O", "O" ], "entity_ids": [ 9, 9 ] }, { "tokens": [ "Swansea", "1", "Lincoln", "2" ], "ids": [ 73425, 122, 16944, 123 ], "entity": [ "B-ORG", "O", "B-ORG", "O" ], "entity_ids": [ 3, 9, 3, 9 ] } ]