more tests

kevmo314 · Jan 17, 2024 · 04e72ed · 04e72ed
1 parent 2b9420b
commit 04e72ed
Show file tree

Hide file tree

Showing 2 changed files with 128 additions and 0 deletions.
diff --git a/pkg/appendable/csv_handler.go b/pkg/appendable/csv_handler.go
@@ -94,6 +94,7 @@ func fieldRankCsvField(fieldValue any) int {
 func inferCSVField(fieldValue string) (interface{}, protocol.FieldType) {
 
 	if fieldValue == "" {
+		fmt.Printf("sir this is empty")
 		return nil, protocol.FieldTypeNull
 	}
 

diff --git a/pkg/appendable/index_file_csv_test.go b/pkg/appendable/index_file_csv_test.go
@@ -4,6 +4,8 @@ import (
 	"bytes"
 	"strings"
 	"testing"
+
+	"github.com/kevmo314/appendable/pkg/protocol"
 )
 
 func TestAppendDataRowCSV(t *testing.T) {
@@ -102,6 +104,44 @@ func TestAppendDataRowCSV(t *testing.T) {
 		}
 	})
 
+	t.Run("multiple headers", func(t *testing.T) {
+
+		i, err := NewIndexFile(CSVHandler{ReadSeeker: strings.NewReader("name,move\nmica,coyote\n")})
+		if err != nil {
+			t.Fatal(err)
+		}
+
+		buf := &bytes.Buffer{}
+
+		if err := i.Serialize(buf); err != nil {
+			t.Fatal(err)
+		}
+
+		j, err := ReadIndexFile(buf, CSVHandler{ReadSeeker: strings.NewReader("name,move\nmica,coyote\ngalvao,mount\n")})
+		if err != nil {
+			t.Fatal(err)
+		}
+
+		// check that the index file now has the additional data ranges but same number of indices
+		if len(j.Indexes) != 2 {
+			t.Errorf("got len(i.Indexes) = %d, want 2", len(i.Indexes))
+		}
+
+		if len(j.EndByteOffsets) != 2 {
+			t.Errorf("got len(i.DataRanges) = %d, want 2", len(i.EndByteOffsets))
+		}
+
+		// check that the first data range is untouched despite being incorrect
+		if j.EndByteOffsets[0] != uint64(len("name,move\nmica,coyote\n")) {
+			t.Errorf("got i.DataRanges[0].EndByteOffset = %d, want %d", j.EndByteOffsets[0], uint64(len("name,move\nmica,coyote\n")))
+		}
+
+		// check that the second data range has properly set offsets
+		if j.EndByteOffsets[1] != uint64(len("name,move\nmica,coyote\ngalvao,mount\n")) {
+			t.Errorf("got i.DataRanges[1].EndByteOffset = %d, want %d", j.EndByteOffsets[1], uint64(len("name,move\nmica,coyote\ngalvao,mount\n")))
+		}
+	})
+
 	t.Run("generate index file", func(t *testing.T) {
 		i, err := NewIndexFile(CSVHandler{ReadSeeker: strings.NewReader("")})
 
@@ -122,4 +162,91 @@ func TestAppendDataRowCSV(t *testing.T) {
 
 	})
 
+	// this test case fails due to the way we measure checksums
+	// since CSV's are column-based appending new columns, cause checksums and endbyteoffsets to be mismatched
+	t.Run("new index", func(t *testing.T) {
+		i, err := NewIndexFile(CSVHandler{ReadSeeker: strings.NewReader(mockCsv)})
+		if err != nil {
+			t.Fatal(err)
+		}
+
+		buf := &bytes.Buffer{}
+
+		if err := i.Serialize(buf); err != nil {
+			t.Fatal(err)
+		}
+
+		j, err := ReadIndexFile(buf, CSVHandler{ReadSeeker: strings.NewReader("header1,header2\ntest1,test2\n")})
+		if err != nil {
+			t.Fatal(err)
+		}
+
+		// check that the index file now has the additional index
+		if len(j.Indexes) != 2 {
+			t.Errorf("got len(i.Indexes) = %d, want 2", len(j.Indexes))
+		}
+
+		if j.Indexes[1].FieldName != "test2" {
+			t.Errorf("got i.Indexes[1].FieldName = %s, want \"test2\"", j.Indexes[1].FieldName)
+		}
+
+		if j.Indexes[1].FieldType != protocol.FieldTypeString {
+			t.Errorf("got i.Indexes[1].FieldType = %+v, want protocol.FieldTypeString", j.Indexes[1].FieldType)
+		}
+	})
+
+	t.Run("existing index but different type", func(t *testing.T) {
+		i, err := NewIndexFile(CSVHandler{ReadSeeker: strings.NewReader("test\ntest1\n")})
+		if err != nil {
+			t.Fatal(err)
+		}
+
+		buf := &bytes.Buffer{}
+
+		if err := i.Serialize(buf); err != nil {
+			t.Fatal(err)
+		}
+
+		j, err := ReadIndexFile(buf, CSVHandler{ReadSeeker: strings.NewReader("test\ntest1\n123\n")})
+		if err != nil {
+			t.Fatal(err)
+		}
+
+		// check that the index file now has the additional data ranges but same number of indices
+		if len(j.Indexes) != 1 {
+			t.Errorf("got len(i.Indexes) = %d, want 1", len(j.Indexes))
+		}
+
+		if j.Indexes[0].FieldType != protocol.FieldTypeString|protocol.FieldTypeNumber {
+			t.Errorf("got i.Indexes[0].FieldType = %#v, want protocol.FieldTypeUnknown", j.Indexes[0].FieldType)
+		}
+	})
+
+	t.Run("existing index but nullable type", func(t *testing.T) {
+		i, err := NewIndexFile(CSVHandler{ReadSeeker: strings.NewReader("test,test2\nomoplata,armbar\n")})
+		if err != nil {
+			t.Fatal(err)
+		}
+
+		buf := &bytes.Buffer{}
+
+		if err := i.Serialize(buf); err != nil {
+			t.Fatal(err)
+		}
+
+		j, err := ReadIndexFile(buf, CSVHandler{ReadSeeker: strings.NewReader("test,test2\nomoplata,armbar\n,singlelegx\n")})
+		if err != nil {
+			t.Fatal(err)
+		}
+
+		// check that the index file now has the additional data ranges but same number of indices
+		if len(j.Indexes) != 2 {
+			t.Errorf("got len(i.Indexes) = %d, want 2", len(j.Indexes))
+		}
+
+		if j.Indexes[0].FieldType != protocol.FieldTypeNull|protocol.FieldTypeString {
+			t.Errorf("got i.Indexes[0].FieldType = %#v, want protocol.FieldTypeNullableString", j.Indexes[0].FieldType)
+		}
+	})
+
 }