Performance optimization of Tokenizer

Reduces string allocations and removes std::vector from Tokenizer Most processing now happens on-demand.
2020-06-11 00:16:46 -04:00
parent 71d3827cce
commit 81d937ee97
9 changed files with 145 additions and 95 deletions
--- a/unittest/utils/test_tokenizer.cpp
+++ b/unittest/utils/test_tokenizer.cpp
@ -50,25 +50,21 @@ TEST(Tokenizer, postfix_seperators) {

 TEST(Tokenizer, iterate_words) {
    Tokenizer t("  test word   ", " ");
-    ASSERT_THAT(t[0], Eq("test"));
-    ASSERT_THAT(t[1], Eq("word"));
+    ASSERT_THAT(t.next(), Eq("test"));
+    ASSERT_THAT(t.next(), Eq("word"));
    ASSERT_EQ(t.count(), 2);
 }

 TEST(Tokenizer, default_seperators) {
    Tokenizer t(" \r\n test \t word \f");
-    ASSERT_THAT(t[0], Eq("test"));
-    ASSERT_THAT(t[1], Eq("word"));
+    ASSERT_THAT(t.next(), Eq("test"));
+    ASSERT_THAT(t.next(), Eq("word"));
    ASSERT_EQ(t.count(), 2);
 }

-TEST(Tokenizer, for_loop) {
+TEST(Tokenizer, as_vector) {
    Tokenizer t(" \r\n test \t word \f");
-    std::vector<std::string> list;
-
-    for(auto word : t) {
-        list.push_back(word);
-    }
+    std::vector<std::string> list = t.as_vector();
    ASSERT_THAT(list[0], Eq("test"));
    ASSERT_THAT(list[1], Eq("word"));
 }