From 4c67f39c999af35e0c10fd6347a4125574922485 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Tue, 18 Jul 2017 02:03:15 +0000
Subject: [PATCH 01/16] Implemented new consumer interface as well as example
 consumer: 'batchconsumer'

---
 Makefile                                      |  11 +-
 batchconsumer.properties                      |  83 ++
 batchconsumer/batcher/message_batcher.go      | 165 ++++
 batchconsumer/batcher/message_batcher_test.go | 212 +++++
 batchconsumer/consumer.go                     | 117 +++
 batchconsumer/sender.go                       |  30 +
 batchconsumer/sync.go                         |  11 +
 batchconsumer/writer.go                       | 250 ++++++
 circle.yml                                    |   2 +-
 cmd/batchconsumer/main.go                     |  64 ++
 decode/decode.go                              | 477 ++++++++++
 decode/decode_test.go                         | 834 ++++++++++++++++++
 glide.lock                                    |  53 ++
 glide.yaml                                    |  20 +
 splitter/README.md                            |  10 +
 splitter/splitter.go                          | 113 +++
 splitter/splitter_test.go                     | 182 ++++
 17 files changed, 2631 insertions(+), 3 deletions(-)
 create mode 100644 batchconsumer.properties
 create mode 100644 batchconsumer/batcher/message_batcher.go
 create mode 100644 batchconsumer/batcher/message_batcher_test.go
 create mode 100644 batchconsumer/consumer.go
 create mode 100644 batchconsumer/sender.go
 create mode 100644 batchconsumer/sync.go
 create mode 100644 batchconsumer/writer.go
 create mode 100644 cmd/batchconsumer/main.go
 create mode 100644 decode/decode.go
 create mode 100644 decode/decode_test.go
 create mode 100644 glide.lock
 create mode 100644 glide.yaml
 create mode 100644 splitter/README.md
 create mode 100644 splitter/splitter.go
 create mode 100644 splitter/splitter_test.go

diff --git a/Makefile b/Makefile
index 082db71..42d8f1d 100644
--- a/Makefile
+++ b/Makefile
@@ -30,6 +30,8 @@ EMPTY :=
 SPACE := $(EMPTY) $(EMPTY)
 JAVA_CLASS_PATH := $(subst $(SPACE),:,$(JARS_TO_DOWNLOAD))
 
+CONSUMER ?= consumer
+
 $(JARS_TO_DOWNLOAD):
 	mkdir -p `dirname $@`
 	curl -s -L -o $@ -O $(URL_PREFIX)`echo $@ | sed 's/$(JAR_DIR)\///g'`
@@ -37,8 +39,13 @@ $(JARS_TO_DOWNLOAD):
 download_jars: $(JARS_TO_DOWNLOAD)
 
 build:
-	CGO_ENABLED=0 go build -installsuffix cgo -o build/consumer $(PKG)/cmd/consumer
+	CGO_ENABLED=0 go build -installsuffix cgo -o build/$(CONSUMER) $(PKG)/cmd/$(CONSUMER)
 
 run: build download_jars
 	command -v java >/dev/null 2>&1 || { echo >&2 "Java not installed. Install java!"; exit 1; }
-	java -cp $(JAVA_CLASS_PATH) com.amazonaws.services.kinesis.multilang.MultiLangDaemon consumer.properties
+	java -cp $(JAVA_CLASS_PATH) \
+	com.amazonaws.services.kinesis.multilang.MultiLangDaemon \
+	$(CONSUMER).properties
+
+bench:
+	go test -bench=. github.com/Clever/amazon-kinesis-client-go/decode/
diff --git a/batchconsumer.properties b/batchconsumer.properties
new file mode 100644
index 0000000..8e718b8
--- /dev/null
+++ b/batchconsumer.properties
@@ -0,0 +1,83 @@
+# The script that abides by the multi-language protocol. This script will
+# be executed by the MultiLangDaemon, which will communicate with this script
+# over STDIN and STDOUT according to the multi-language protocol.
+executableName = build/batchconsumer
+
+# The name of an Amazon Kinesis stream to process.
+streamName = test-stream
+
+# Used by the KCL as the name of this application. Will be used as the name
+# of an Amazon DynamoDB table which will store the lease and checkpoint
+# information for workers with this application name
+applicationName = KCLGoExample
+
+# Users can change the credentials provider the KCL will use to retrieve credentials.
+# The DefaultAWSCredentialsProviderChain checks several other providers, which is
+# described here:
+# http://docs.aws.amazon.com/AWSJavaSDK/latest/javadoc/com/amazonaws/auth/DefaultAWSCredentialsProviderChain.html
+AWSCredentialsProvider = DefaultAWSCredentialsProviderChain
+
+# Appended to the user agent of the KCL. Does not impact the functionality of the
+# KCL in any other way.
+processingLanguage = golang
+
+# Valid options at TRIM_HORIZON or LATEST.
+# See http://docs.aws.amazon.com/kinesis/latest/APIReference/API_GetShardIterator.html#API_GetShardIterator_RequestSyntax
+initialPositionInStream = TRIM_HORIZON
+
+# The following properties are also available for configuring the KCL Worker that is created
+# by the MultiLangDaemon.
+
+# The KCL defaults to us-east-1
+regionName = us-west-1
+
+# Fail over time in milliseconds. A worker which does not renew it's lease within this time interval
+# will be regarded as having problems and it's shards will be assigned to other workers.
+# For applications that have a large number of shards, this msy be set to a higher number to reduce
+# the number of DynamoDB IOPS required for tracking leases
+#failoverTimeMillis = 10000
+
+# A worker id that uniquely identifies this worker among all workers using the same applicationName
+# If this isn't provided a MultiLangDaemon instance will assign a unique workerId to itself.
+#workerId = 
+
+# Shard sync interval in milliseconds - e.g. wait for this long between shard sync tasks.
+#shardSyncIntervalMillis = 60000
+
+# Max records to fetch from Kinesis in a single GetRecords call.
+#maxRecords = 10000
+
+# Idle time between record reads in milliseconds.
+#idleTimeBetweenReadsInMillis = 1000
+
+# Enables applications flush/checkpoint (if they have some data "in progress", but don't get new data for while)
+#callProcessRecordsEvenForEmptyRecordList = false
+
+# Interval in milliseconds between polling to check for parent shard completion.
+# Polling frequently will take up more DynamoDB IOPS (when there are leases for shards waiting on
+# completion of parent shards).
+#parentShardPollIntervalMillis = 10000
+
+# Cleanup leases upon shards completion (don't wait until they expire in Kinesis).
+# Keeping leases takes some tracking/resources (e.g. they need to be renewed, assigned), so by default we try
+# to delete the ones we don't need any longer.
+#cleanupLeasesUponShardCompletion = true
+
+# Backoff time in milliseconds for Amazon Kinesis Client Library tasks (in the event of failures).
+#taskBackoffTimeMillis = 500
+
+# Buffer metrics for at most this long before publishing to CloudWatch.
+#metricsBufferTimeMillis = 10000
+
+# Buffer at most this many metrics before publishing to CloudWatch.
+#metricsMaxQueueSize = 10000
+
+# KCL will validate client provided sequence numbers with a call to Amazon Kinesis before checkpointing for calls
+# to RecordProcessorCheckpointer#checkpoint(String) by default.
+#validateSequenceNumberBeforeCheckpointing = true
+
+# The maximum number of active threads for the MultiLangDaemon to permit.
+# If a value is provided then a FixedThreadPool is used with the maximum
+# active threads set to the provided value. If a non-positive integer or no
+# value is provided a CachedThreadPool is used.
+#maxActiveThreads = 0
diff --git a/batchconsumer/batcher/message_batcher.go b/batchconsumer/batcher/message_batcher.go
new file mode 100644
index 0000000..6aa9a64
--- /dev/null
+++ b/batchconsumer/batcher/message_batcher.go
@@ -0,0 +1,165 @@
+package batcher
+
+import (
+	"fmt"
+	"math/big"
+	"sync"
+	"time"
+)
+
+type SequencePair struct {
+	Sequence    *big.Int
+	SubSequence int
+}
+
+// Sync is used to allow a writer to syncronize with the batcher.
+// The writer declares how to write messages (via its `SendBatch` method), while the batcher
+// keeps track of messages written
+type Sync interface {
+	SendBatch(batch [][]byte)
+}
+
+// Batcher interface
+type Batcher interface {
+	// AddMesage to the batch
+	AddMessage(msg []byte, sequencePair SequencePair) error
+	// Flush all messages from the batch
+	Flush()
+	// SmallestSeqPair returns the smallest SequenceNumber and SubSequence number in
+	// the current batch
+	SmallestSequencePair() SequencePair
+}
+
+type msgPack struct {
+	msg          []byte
+	sequencePair SequencePair
+}
+
+type batcher struct {
+	mux sync.Mutex
+
+	flushInterval time.Duration
+	flushCount    int
+	flushSize     int
+
+	// smallestSeq and smallestSubSeq are used to track the highest sequence number
+	// of any record in the batch. This is used for checkpointing.
+	smallestSeq SequencePair
+
+	sync      Sync
+	msgChan   chan<- msgPack
+	flushChan chan<- struct{}
+}
+
+// New creates a new Batcher
+// - sync - synchronizes batcher with writer
+// - flushInterval - how often accumulated messages should be flushed (default 1 second).
+// - flushCount - number of messages that trigger a flush (default 10).
+// - flushSize - size of batch that triggers a flush (default 1024 * 1024 = 1 mb)
+func New(sync Sync, flushInterval time.Duration, flushCount int, flushSize int) Batcher {
+	msgChan := make(chan msgPack, 100)
+	flushChan := make(chan struct{})
+
+	b := &batcher{
+		flushCount:    flushCount,
+		flushInterval: flushInterval,
+		flushSize:     flushSize,
+		sync:          sync,
+		msgChan:       msgChan,
+		flushChan:     flushChan,
+	}
+
+	go b.startBatcher(msgChan, flushChan)
+
+	return b
+}
+
+func (b *batcher) SmallestSequencePair() SequencePair {
+	b.mux.Lock()
+	defer b.mux.Unlock()
+
+	return b.smallestSeq
+}
+
+func (b *batcher) SetFlushInterval(dur time.Duration) {
+	b.flushInterval = dur
+}
+
+func (b *batcher) SetFlushCount(count int) {
+	b.flushCount = count
+}
+
+func (b *batcher) SetFlushSize(size int) {
+	b.flushSize = size
+}
+
+func (b *batcher) AddMessage(msg []byte, pair SequencePair) error {
+	if len(msg) <= 0 {
+		return fmt.Errorf("Empty messages can't be sent")
+	}
+
+	b.msgChan <- msgPack{msg, pair}
+	return nil
+}
+
+// updateSequenceNumbers is used to track the smallest sequenceNumber of any record in the batch.
+// When flush() is called, the batcher sends the sequence number to the writer. When the writer
+// checkpoints, it does so up to the latest message that was flushed successfully.
+func (b *batcher) updateSequenceNumbers(pair SequencePair) {
+	b.mux.Lock()
+	defer b.mux.Unlock()
+
+	isSmaller := b.smallestSeq.Sequence == nil ||
+		pair.Sequence.Cmp(b.smallestSeq.Sequence) == -1 ||
+		(pair.Sequence.Cmp(b.smallestSeq.Sequence) == 0 &&
+			pair.SubSequence < b.smallestSeq.SubSequence)
+	if isSmaller {
+		b.smallestSeq = SequencePair{pair.Sequence, pair.SubSequence}
+	}
+}
+
+func (b *batcher) Flush() {
+	b.flushChan <- struct{}{}
+}
+
+func (b *batcher) batchSize(batch [][]byte) int {
+	total := 0
+	for _, msg := range batch {
+		total += len(msg)
+	}
+
+	return total
+}
+
+func (b *batcher) flush(batch [][]byte) [][]byte {
+	if len(batch) > 0 {
+		b.sync.SendBatch(batch)
+		b.smallestSeq = SequencePair{nil, 0}
+	}
+	return [][]byte{}
+}
+
+func (b *batcher) startBatcher(msgChan <-chan msgPack, flushChan <-chan struct{}) {
+	batch := [][]byte{}
+
+	for {
+		select {
+		case <-time.After(b.flushInterval):
+			batch = b.flush(batch)
+		case <-flushChan:
+			batch = b.flush(batch)
+		case pack := <-msgChan:
+			size := b.batchSize(batch)
+			if b.flushSize < size+len(pack.msg) {
+				batch = b.flush(batch)
+			}
+
+			batch = append(batch, pack.msg)
+			b.updateSequenceNumbers(pack.sequencePair)
+
+			if b.flushCount <= len(batch) || b.flushSize <= b.batchSize(batch) {
+				batch = b.flush(batch)
+			}
+		}
+	}
+}
diff --git a/batchconsumer/batcher/message_batcher_test.go b/batchconsumer/batcher/message_batcher_test.go
new file mode 100644
index 0000000..488310d
--- /dev/null
+++ b/batchconsumer/batcher/message_batcher_test.go
@@ -0,0 +1,212 @@
+package batcher
+
+import (
+	"fmt"
+	"math/big"
+	"testing"
+	"time"
+
+	"github.com/stretchr/testify/assert"
+)
+
+type batch [][]byte
+
+type MockSync struct {
+	flushChan chan struct{}
+	batches   []batch
+}
+
+func NewMockSync() *MockSync {
+	return &MockSync{
+		flushChan: make(chan struct{}, 1),
+		batches:   []batch{},
+	}
+}
+
+func (m *MockSync) SendBatch(b [][]byte) {
+	m.batches = append(m.batches, batch(b))
+	m.flushChan <- struct{}{}
+}
+
+func (m *MockSync) waitForFlush(timeout time.Duration) error {
+	select {
+	case <-m.flushChan:
+		return nil
+	case <-time.After(timeout):
+		return fmt.Errorf("timed out before flush (waited %s)", timeout.String())
+	}
+}
+
+const mockSequenceNumber = "99999"
+const mockSubSequenceNumber = 12345
+
+func TestBatchingByCount(t *testing.T) {
+	var err error
+	assert := assert.New(t)
+
+	sync := NewMockSync()
+	batcher := New(sync, time.Hour, 2, 1024*1024)
+
+	t.Log("Batcher respect count limit")
+	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("hmmhmm"), mockSequenceNumber, mockSubSequenceNumber))
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.NoError(err)
+
+	assert.Equal(1, len(sync.batches))
+	assert.Equal(2, len(sync.batches[0]))
+	assert.Equal("hihi", string(sync.batches[0][0]))
+	assert.Equal("heyhey", string(sync.batches[0][1]))
+
+	t.Log("Batcher doesn't send partial batches")
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.Error(err)
+}
+
+func TestBatchingByTime(t *testing.T) {
+	var err error
+	assert := assert.New(t)
+
+	sync := NewMockSync()
+	batcher := New(sync, time.Millisecond, 2000000, 1024*1024)
+
+	t.Log("Batcher sends partial batches when time expires")
+	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequenceNumber, mockSubSequenceNumber))
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.NoError(err)
+
+	assert.Equal(1, len(sync.batches))
+	assert.Equal(1, len(sync.batches[0]))
+	assert.Equal("hihi", string(sync.batches[0][0]))
+
+	t.Log("Batcher sends all messsages in partial batches when time expires")
+	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("yoyo"), mockSequenceNumber, mockSubSequenceNumber))
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.NoError(err)
+
+	assert.Equal(2, len(sync.batches))
+	assert.Equal(2, len(sync.batches[1]))
+	assert.Equal("heyhey", string(sync.batches[1][0]))
+	assert.Equal("yoyo", string(sync.batches[1][1]))
+
+	t.Log("Batcher doesn't send empty batches")
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.Error(err)
+}
+
+func TestBatchingBySize(t *testing.T) {
+	var err error
+	assert := assert.New(t)
+
+	sync := NewMockSync()
+	batcher := New(sync, time.Hour, 2000000, 8)
+
+	t.Log("Large messages are sent immediately")
+	assert.NoError(batcher.AddMessage([]byte("hellohello"), mockSequenceNumber, mockSubSequenceNumber))
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.NoError(err)
+
+	assert.Equal(1, len(sync.batches))
+	assert.Equal(1, len(sync.batches[0]))
+	assert.Equal("hellohello", string(sync.batches[0][0]))
+
+	t.Log("Batcher tries not to exceed size limit")
+	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequenceNumber, mockSubSequenceNumber))
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.NoError(err)
+
+	assert.Equal(2, len(sync.batches))
+	assert.Equal(1, len(sync.batches[1]))
+	assert.Equal("heyhey", string(sync.batches[1][0]))
+
+	t.Log("Batcher sends messages that didn't fit in previous batch")
+	assert.NoError(batcher.AddMessage([]byte("yoyo"), mockSequenceNumber, mockSubSequenceNumber)) // At this point "hihi" is in the batch
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.NoError(err)
+
+	assert.Equal(3, len(sync.batches))
+	assert.Equal(2, len(sync.batches[2]))
+	assert.Equal("hihi", string(sync.batches[2][0]))
+	assert.Equal("yoyo", string(sync.batches[2][1]))
+
+	t.Log("Batcher doesn't send partial batches")
+	assert.NoError(batcher.AddMessage([]byte("okok"), mockSequenceNumber, mockSubSequenceNumber))
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.Error(err)
+}
+
+func TestFlushing(t *testing.T) {
+	var err error
+	assert := assert.New(t)
+
+	sync := NewMockSync()
+	batcher := New(sync, time.Hour, 2000000, 1024*1024)
+
+	t.Log("Calling flush sends pending messages")
+	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequenceNumber, mockSubSequenceNumber))
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.Error(err)
+
+	batcher.Flush()
+
+	err = sync.waitForFlush(time.Millisecond * 10)
+	assert.NoError(err)
+
+	assert.Equal(1, len(sync.batches))
+	assert.Equal(1, len(sync.batches[0]))
+	assert.Equal("hihi", string(sync.batches[0][0]))
+}
+
+func TestSendingEmpty(t *testing.T) {
+	var err error
+	assert := assert.New(t)
+
+	sync := NewMockSync()
+	batcher := New(sync, time.Second, 10, 1024*1024)
+
+	t.Log("An error is returned when an empty message is sent")
+	err = batcher.AddMessage([]byte{}, mockSequenceNumber, mockSubSequenceNumber)
+	assert.Error(err)
+}
+
+func TestUpdatingSequence(t *testing.T) {
+	assert := assert.New(t)
+
+	sync := NewMockSync()
+	batcher := New(sync, time.Second, 10, 1024*1024).(*batcher)
+
+	t.Log("Initally, smallestSeq is undefined")
+	expected := new(big.Int)
+	assert.Nil(batcher.smallestSeq.Sequence)
+
+	t.Log("After AddMessage (seq=1), smallestSeq = 1")
+	assert.NoError(batcher.AddMessage([]byte("abab"), "1", mockSubSequenceNumber))
+	sync.waitForFlush(time.Minute)
+	expected.SetInt64(1)
+	seq := batcher.SmallestSequencePair()
+	assert.True(expected.Cmp(seq.Sequence) == 0)
+
+	t.Log("After AddMessage (seq=2), smallestSeq = 1 -- not updated because higher")
+	assert.NoError(batcher.AddMessage([]byte("cdcd"), "2", mockSubSequenceNumber))
+	sync.waitForFlush(time.Minute)
+	seq = batcher.SmallestSequencePair()
+	assert.True(expected.Cmp(seq.Sequence) == 0)
+
+	t.Log("After AddMessage (seq=1), smallestSeq = 0")
+	assert.NoError(batcher.AddMessage([]byte("efef"), "0", mockSubSequenceNumber))
+	sync.waitForFlush(time.Minute)
+	expected.SetInt64(0)
+	seq = batcher.SmallestSequencePair()
+	assert.True(expected.Cmp(seq.Sequence) == 0)
+}
diff --git a/batchconsumer/consumer.go b/batchconsumer/consumer.go
new file mode 100644
index 0000000..5b47a2a
--- /dev/null
+++ b/batchconsumer/consumer.go
@@ -0,0 +1,117 @@
+package batchconsumer
+
+import (
+	"io"
+	"log"
+	"os"
+	"time"
+
+	"gopkg.in/Clever/kayvee-go.v6/logger"
+
+	"github.com/Clever/amazon-kinesis-client-go/kcl"
+)
+
+type Config struct {
+	// LogFile where consumer errors and failed log lines are saved
+	LogFile string
+	// FlushInterval is how often accumulated messages should be bulk put to firehose
+	FlushInterval time.Duration
+	// FlushCount is the number of messages that triggers a push to firehose. Max batch size is 500, see: http://docs.aws.amazon.com/firehose/latest/dev/limits.html
+	FlushCount int
+	// FlushSize is the size of a batch in bytes that triggers a push to firehose. Max batch size is 4Mb (4*1024*1024), see: http://docs.aws.amazon.com/firehose/latest/dev/limits.html
+	FlushSize int
+
+	// DeployEnv the name of the deployment enviornment
+	DeployEnv string
+
+	// ReadRateLimit the number of records read per seconds
+	ReadRateLimit int
+	// ReadBurstLimit the max number of tokens allowed by rate limiter
+	ReadBurstLimit int
+
+	// CheckpointFreq the frequence in which a checkpoint is saved
+	CheckpointFreq time.Duration
+	// CheckpointRetries the number of times the consumer will try to save a checkpoint
+	CheckpointRetries int
+	// CheckpointRetrySleep the amount of time between checkpoint save attempts
+	CheckpointRetrySleep time.Duration
+
+	logOutput io.Writer
+}
+
+type BatchConsumer struct {
+	kclProcess *kcl.KCLProcess
+}
+
+func withDefaults(config Config) Config {
+	if config.LogFile == "" {
+		config.LogFile = "/tmp/kcl-" + time.Now().Format(time.RFC3339)
+	}
+
+	if config.FlushInterval == 0 {
+		config.FlushInterval = 10 * time.Second
+	}
+	if config.FlushCount == 0 {
+		config.FlushCount = 500
+	}
+	if config.FlushSize == 0 {
+		config.FlushSize = 4 * 1024 * 1024
+	}
+
+	if config.DeployEnv == "" {
+		config.DeployEnv = "unknown-env"
+	}
+
+	if config.ReadRateLimit == 0 {
+		config.ReadRateLimit = 300
+	}
+	if config.ReadRateLimit == 0 {
+		config.ReadRateLimit = int(300 * 1.2)
+	}
+
+	if config.CheckpointFreq == 0 {
+		config.CheckpointFreq = 60 * time.Second
+	}
+	if config.CheckpointRetries == 0 {
+		config.CheckpointRetries = 5
+	}
+	if config.CheckpointRetrySleep == 0 {
+		config.CheckpointRetrySleep = 5 * time.Second
+	}
+
+	return config
+}
+
+func NewBatchConsumerFromFiles(
+	config Config, sender Sender, input io.Reader, output, errFile io.Writer,
+) *BatchConsumer {
+	config = withDefaults(config)
+
+	file, err := os.OpenFile(config.LogFile, os.O_RDWR|os.O_CREATE|os.O_APPEND, 0666)
+	if err != nil {
+		log.Fatalf("Unable to create log file: %s", err.Error())
+	}
+	defer file.Close()
+
+	kvlog := logger.New("amazon-kinesis-client-go")
+	kvlog.SetOutput(file)
+
+	wrt := &BatchedWriter{
+		config: config,
+		log:    kvlog,
+		sender: sender,
+	}
+	kclProcess := kcl.New(input, output, errFile, wrt)
+
+	return &BatchConsumer{
+		kclProcess: kclProcess,
+	}
+}
+
+func NewBatchConsumer(config Config, sender Sender) *BatchConsumer {
+	return NewBatchConsumerFromFiles(config, sender, os.Stdin, os.Stdout, os.Stderr)
+}
+
+func (b *BatchConsumer) Start() {
+	b.kclProcess.Run()
+}
diff --git a/batchconsumer/sender.go b/batchconsumer/sender.go
new file mode 100644
index 0000000..5ab6f53
--- /dev/null
+++ b/batchconsumer/sender.go
@@ -0,0 +1,30 @@
+package batchconsumer
+
+import (
+	"errors"
+	"fmt"
+)
+
+var ErrLogIgnored = errors.New("Log intentionally skipped by sender")
+
+type Sender interface {
+	EncodeLog(rawlog []byte) (log []byte, tags []string, err error)
+	SendBatch(batch [][]byte, tag string) error
+}
+
+type PartialOutputError struct {
+	Message string
+	Logs    [][]byte
+}
+
+func (c PartialOutputError) Error() string {
+	return fmt.Sprintf("%d failed logs. %s", len(c.Logs), c.Message)
+}
+
+type CatastrophicOutputError struct {
+	Message string
+}
+
+func (c CatastrophicOutputError) Error() string {
+	return c.Message
+}
diff --git a/batchconsumer/sync.go b/batchconsumer/sync.go
new file mode 100644
index 0000000..cd77a59
--- /dev/null
+++ b/batchconsumer/sync.go
@@ -0,0 +1,11 @@
+package batchconsumer
+
+type BatcherSync struct {
+	tag    string
+	writer *BatchedWriter
+}
+
+func (b *BatcherSync) SendBatch(batch [][]byte) {
+	b.writer.SendBatch(batch, b.tag)
+	b.writer.CheckPointBatch(b.tag)
+}
diff --git a/batchconsumer/writer.go b/batchconsumer/writer.go
new file mode 100644
index 0000000..17c129f
--- /dev/null
+++ b/batchconsumer/writer.go
@@ -0,0 +1,250 @@
+package batchconsumer
+
+import (
+	"context"
+	"encoding/base64"
+	"fmt"
+	"math/big"
+	"os"
+	"time"
+
+	"golang.org/x/time/rate"
+	kv "gopkg.in/Clever/kayvee-go.v6/logger"
+
+	"github.com/Clever/amazon-kinesis-client-go/batchconsumer/batcher"
+	"github.com/Clever/amazon-kinesis-client-go/kcl"
+	"github.com/Clever/amazon-kinesis-client-go/splitter"
+)
+
+type BatchedWriter struct {
+	config Config
+	sender Sender
+	log    kv.KayveeLogger
+
+	shardID        string
+	checkpointChan chan batcher.SequencePair
+
+	// Limits the number of records read from the stream
+	rateLimiter *rate.Limiter
+
+	batchers         map[string]batcher.Batcher
+	lastProcessedSeq batcher.SequencePair
+}
+
+func (b *BatchedWriter) Initialize(shardID string, checkpointer *kcl.Checkpointer) error {
+	b.batchers = map[string]batcher.Batcher{}
+	b.shardID = shardID
+	b.checkpointChan = make(chan batcher.SequencePair)
+	b.rateLimiter = rate.NewLimiter(rate.Limit(b.config.ReadRateLimit), b.config.ReadBurstLimit)
+
+	b.startCheckpointListener(checkpointer, b.checkpointChan)
+
+	return nil
+}
+
+// handleCheckpointError returns true if checkout should be tried again.  Returns false otherwise.
+func (b *BatchedWriter) handleCheckpointError(err error) bool {
+	if err == nil {
+		return false
+	}
+
+	cperr, ok := err.(kcl.CheckpointError)
+	if !ok {
+		b.log.ErrorD("unknown-checkpoint-error", kv.M{"msg": err.Error(), "shard-id": b.shardID})
+		return true
+	}
+
+	switch cperr.Error() {
+	case "ShutdownException": // Skips checkpointing
+		b.log.ErrorD("shutdown-checkpoint-exception", kv.M{
+			"msg": err.Error(), "shard-id": b.shardID,
+		})
+		return false
+	case "ThrottlingException":
+		b.log.ErrorD("checkpoint-throttle", kv.M{"shard-id": b.shardID})
+	case "InvalidStateException":
+		b.log.ErrorD("invalid-checkpoint-state", kv.M{"shard-id": b.shardID})
+	default:
+		b.log.ErrorD("checkpoint-error", kv.M{"shard-id": b.shardID, "msg": err})
+	}
+
+	return true
+}
+
+func (b *BatchedWriter) startCheckpointListener(
+	checkpointer *kcl.Checkpointer, checkpointChan <-chan batcher.SequencePair,
+) {
+	lastCheckpoint := time.Now()
+
+	go func() {
+		for {
+			seq := <-checkpointChan
+
+			// This is a write throttle to ensure we don't checkpoint faster than
+			// b.config.CheckpointFreq.  The latest seq number is always used.
+			for time.Now().Sub(lastCheckpoint) < b.config.CheckpointFreq {
+				select {
+				case seq = <-checkpointChan: // Keep updating checkpoint seq while waiting
+				case <-time.NewTimer(b.config.CheckpointFreq - time.Now().Sub(lastCheckpoint)).C:
+				}
+			}
+
+			retry := true
+			for n := 0; retry && n < b.config.CheckpointRetries+1; n++ {
+				str := seq.Sequence.String()
+				err := checkpointer.Checkpoint(&str, &seq.SubSequence)
+				if err == nil { // Successfully checkpointed!
+					lastCheckpoint = time.Now()
+					break
+				}
+
+				retry = b.handleCheckpointError(err)
+
+				if n == b.config.CheckpointRetries {
+					b.log.ErrorD("checkpoint-retries", kv.M{"attempts": b.config.CheckpointRetries})
+					retry = false
+				}
+
+				if retry {
+					time.Sleep(b.config.CheckpointRetrySleep)
+				}
+			}
+		}
+	}()
+}
+
+func (b *BatchedWriter) createBatcher(tag string) batcher.Batcher {
+	sync := &BatcherSync{
+		tag:    tag,
+		writer: b,
+	}
+	return batcher.New(sync, b.config.FlushInterval, b.config.FlushCount, b.config.FlushSize)
+}
+
+func (b *BatchedWriter) splitMessageIfNecessary(record []byte) ([][]byte, error) {
+	// We handle two types of records:
+	// - records emitted from CWLogs Subscription
+	// - records emiited from KPL
+	if !splitter.IsGzipped(record) {
+		// Process a single message, from KPL
+		return [][]byte{record}, nil
+	}
+
+	// Process a batch of messages from a CWLogs Subscription
+	return splitter.GetMessagesFromGzippedInput(record, b.config.DeployEnv == "production")
+}
+
+func (b *BatchedWriter) ProcessRecords(records []kcl.Record) error {
+	curSequence := b.lastProcessedSeq
+
+	for _, record := range records {
+		// Wait until rate limiter permits one more record to be processed
+		b.rateLimiter.Wait(context.Background())
+
+		seq := new(big.Int)
+		if _, ok := seq.SetString(record.SequenceNumber, 10); !ok { // Validating sequence
+			return fmt.Errorf("could not parse sequence number '%s'", record.SequenceNumber)
+		}
+
+		b.lastProcessedSeq = curSequence // Updated with the value from the previous iteration
+		curSequence = batcher.SequencePair{seq, record.SubSequenceNumber}
+
+		data, err := base64.StdEncoding.DecodeString(record.Data)
+		if err != nil {
+			return err
+		}
+
+		rawlogs, err := b.splitMessageIfNecessary(data)
+		if err != nil {
+			return err
+		}
+		for _, rawlog := range rawlogs {
+			log, tags, err := b.sender.EncodeLog(rawlog)
+			if err == ErrLogIgnored {
+				continue // Skip message
+			} else if err != nil {
+				return err
+			}
+
+			if len(tags) == 0 {
+				return fmt.Errorf("No tags provided by consumer for log: %s", string(rawlog))
+			}
+
+			for _, tag := range tags {
+				batcher, ok := b.batchers[tag]
+				if !ok {
+					batcher = b.createBatcher(tag)
+					b.batchers[tag] = batcher
+				}
+
+				// Use second to last sequence number to ensure we don't checkpoint a message before
+				// it's been sent.  When batches are sent, conceptually we first find the smallest
+				// sequence number amount all the batch (let's call it A).  We then checkpoint at
+				// the A-1 sequence number.
+				err = batcher.AddMessage(log, b.lastProcessedSeq)
+				if err != nil {
+					return err
+				}
+			}
+		}
+	}
+
+	b.lastProcessedSeq = curSequence
+
+	return nil
+}
+
+func (b *BatchedWriter) CheckPointBatch(tag string) {
+	smallest := b.lastProcessedSeq
+
+	for name, batch := range b.batchers {
+		if tag == name {
+			continue
+		}
+
+		pair := batch.SmallestSequencePair()
+		if pair.Sequence == nil { // Occurs when batch has no items
+			continue
+		}
+
+		isSmaller := smallest.Sequence == nil || // smallest.Sequence means batch just flushed
+			pair.Sequence.Cmp(smallest.Sequence) == -1 ||
+			(pair.Sequence.Cmp(smallest.Sequence) == 0 && pair.SubSequence < smallest.SubSequence)
+		if isSmaller {
+			smallest = pair
+		}
+	}
+
+	b.checkpointChan <- smallest
+}
+
+func (b *BatchedWriter) SendBatch(batch [][]byte, tag string) {
+	b.log.Info("sent-batch")
+	err := b.sender.SendBatch(batch, tag)
+	switch e := err.(type) {
+	case nil: // Do nothing
+	case PartialOutputError:
+		b.log.ErrorD("send-batch", kv.M{"msg": e.Error()})
+		for _, line := range e.Logs {
+			b.log.ErrorD("failed-log", kv.M{"log": line})
+		}
+	case CatastrophicOutputError:
+		b.log.CriticalD("send-batch", kv.M{"msg": e.Error()})
+		os.Exit(1)
+	default:
+		b.log.CriticalD("send-batch", kv.M{"msg": e.Error()})
+		os.Exit(1)
+	}
+}
+
+func (b *BatchedWriter) Shutdown(reason string) error {
+	if reason == "TERMINATE" {
+		b.log.InfoD("terminate-signal", kv.M{"shard-id": b.shardID})
+		for _, batch := range b.batchers {
+			batch.Flush()
+		}
+	} else {
+		b.log.ErrorD("shutdown-failover", kv.M{"shard-id": b.shardID, "reason": reason})
+	}
+	return nil
+}
diff --git a/circle.yml b/circle.yml
index 26fbe3f..8f15e2b 100644
--- a/circle.yml
+++ b/circle.yml
@@ -12,6 +12,6 @@ compile:
   - make build
 test:
   override:
-  - echo TODO
+  - make test
 general:
   build_dir: ../.go_workspace/src/github.com/$CIRCLE_PROJECT_USERNAME/$CIRCLE_PROJECT_REPONAME
diff --git a/cmd/batchconsumer/main.go b/cmd/batchconsumer/main.go
new file mode 100644
index 0000000..0d91b1f
--- /dev/null
+++ b/cmd/batchconsumer/main.go
@@ -0,0 +1,64 @@
+package main
+
+import (
+	"fmt"
+	"log"
+	"os"
+	"time"
+
+	"gopkg.in/Clever/kayvee-go.v6/logger"
+
+	kbc "github.com/Clever/amazon-kinesis-client-go/batchconsumer"
+)
+
+func createDummyOutput() (logger.KayveeLogger, *os.File) {
+	file, err := os.OpenFile("/tmp/example-kcl-output", os.O_RDWR|os.O_CREATE|os.O_APPEND, 0666)
+	if err != nil {
+		log.Fatalf("Unable to create log file: %s", err.Error())
+	}
+
+	kvlog := logger.New("amazon-kinesis-client-go")
+	kvlog.SetOutput(file)
+
+	return kvlog, file
+}
+
+func main() {
+	config := kbc.Config{
+		FlushInterval: 10 * time.Second,
+		FlushCount:    500,
+		FlushSize:     4 * 1024 * 1024, // 4Mb
+		LogFile:       "/tmp/example-kcl-consumer",
+		DeployEnv:     "test-env",
+	}
+
+	output, file := createDummyOutput()
+	defer file.Close()
+
+	wrt := &ExampleWriter{output: output}
+	consumer := kbc.NewBatchConsumer(config, wrt)
+	consumer.Start()
+}
+
+type ExampleWriter struct {
+	output logger.KayveeLogger
+}
+
+func (e *ExampleWriter) EncodeLog(rawlog []byte) ([]byte, []string, error) {
+	if len(rawlog)%5 == 2 {
+		return nil, nil, kbc.ErrLogIgnored
+	}
+
+	tag1 := fmt.Sprintf("tag-%d", len(rawlog)%5)
+	line := tag1 + ": " + string(rawlog)
+
+	return []byte(line), []string{tag1}, nil
+}
+
+func (e *ExampleWriter) SendBatch(batch [][]byte, tag string) error {
+	for idx, line := range batch {
+		e.output.InfoD(tag, logger.M{"idx": idx, "line": string(line)})
+	}
+
+	return nil
+}
diff --git a/decode/decode.go b/decode/decode.go
new file mode 100644
index 0000000..cfacd9d
--- /dev/null
+++ b/decode/decode.go
@@ -0,0 +1,477 @@
+package decode
+
+import (
+	"encoding/json"
+	"fmt"
+	"regexp"
+	"strings"
+	"time"
+
+	"github.com/Clever/syslogparser/rfc3164"
+)
+
+// reservedFields are automatically set during decoding.
+// no field written by a user (e.g. contained in the Kayvee JSON) should overwrite them.
+var reservedFields = []string{
+	"prefix",
+	"postfix",
+	"Type",
+}
+
+func stringInSlice(s string, slice []string) bool {
+	for _, item := range slice {
+		if s == item {
+			return true
+		}
+	}
+	return false
+}
+
+// remapSyslog3164Keys renames fields to match our expecations from heka's syslog parser
+// see: https://github.com/mozilla-services/heka/blob/278dd3d5961b9b6e47bb7a912b63ce3faaf8d8bd/sandbox/lua/decoders/rsyslog.lua
+var remapSyslog3164Keys = map[string]string{
+	"hostname":  "hostname",
+	"timestamp": "timestamp",
+	"tag":       "programname",
+	"content":   "rawlog",
+}
+
+// FieldsFromSyslog takes an RSyslog formatted log line and extracts fields from it
+//
+// Supports two log lines formats:
+// - RSYSLOG_TraditionalFileFormat - the "old style" default log file format with low-precision timestamps (RFC3164)
+// - RSYSLOG_FileFormat - a modern-style logfile format similar to TraditionalFileFormat, but with high-precision timestamps and timezone information
+//
+// For more details on Rsylog formats: https://rsyslog-5-8-6-doc.neocities.org/rsyslog_conf_templates.html
+func FieldsFromSyslog(line string) (map[string]interface{}, error) {
+	// rfc3164 includes a severity number in front of the Syslog line, but we don't use that
+	fakeSeverity := "<12>"
+	p3164 := rfc3164.NewParser([]byte(fakeSeverity + line))
+	err := p3164.Parse()
+	if err != nil {
+		return map[string]interface{}{}, err
+	}
+
+	out := map[string]interface{}{}
+	for k, v := range p3164.Dump() {
+		if newKey, ok := remapSyslog3164Keys[k]; ok {
+			out[newKey] = v
+		}
+	}
+	return out, nil
+}
+
+// NonKayveeError occurs when the log line is not Kayvee
+type NonKayveeError struct{}
+
+func (e NonKayveeError) Error() string {
+	return fmt.Sprint("Log line is not Kayvee (doesn't have JSON payload)")
+}
+
+// FieldsFromKayvee takes a log line and extracts fields from the Kayvee (JSON) part
+func FieldsFromKayvee(line string) (map[string]interface{}, error) {
+	m := map[string]interface{}{}
+
+	firstIdx := strings.Index(line, "{")
+	lastIdx := strings.LastIndex(line, "}")
+	if firstIdx == -1 || lastIdx == -1 || firstIdx > lastIdx {
+		return map[string]interface{}{}, &NonKayveeError{}
+	}
+	m["prefix"] = line[:firstIdx]
+	m["postfix"] = line[lastIdx+1:]
+
+	possibleJSON := line[firstIdx : lastIdx+1]
+	var fields map[string]interface{}
+	if err := json.Unmarshal([]byte(possibleJSON), &fields); err != nil {
+		return map[string]interface{}{}, err
+	}
+	for k, v := range fields {
+		if !stringInSlice(k, reservedFields) {
+			m[k] = v
+		}
+	}
+
+	m["type"] = "Kayvee"
+
+	return m, nil
+}
+
+// MetricsRoute represents a metrics kv log route
+type MetricsRoute struct {
+	Series     string
+	Dimensions []string
+	ValueField string
+	RuleName   string
+}
+
+// AnalyticsRoute represents an analytics kv log route
+type AnalyticsRoute struct {
+	Series   string
+	RuleName string
+}
+
+// NotificationRoute represents a notification kv log route
+type NotificationRoute struct {
+	Channel  string
+	Icon     string
+	Message  string
+	User     string
+	RuleName string
+}
+
+// AlertRoute represents an alert kv log route
+type AlertRoute struct {
+	Series     string
+	Dimensions []string
+	StatType   string
+	ValueField string
+	RuleName   string
+}
+
+func getStringValue(json map[string]interface{}, key string) string {
+	val, ok := json[key]
+	if !ok {
+		return ""
+	}
+
+	str, ok := val.(string)
+	if !ok {
+		return ""
+	}
+
+	return str
+}
+
+func getStringArray(json map[string]interface{}, key string) []string {
+	val, ok := json[key]
+	if !ok {
+		return []string{}
+	}
+
+	strArray, ok := val.([]string)
+	if !ok {
+		return []string{}
+	}
+
+	return strArray
+}
+
+// LogRoutes a type alias to make it easier to add route specific filter functions
+type LogRoutes []map[string]interface{}
+
+// MetricsRoutes filters the LogRoutes and returns a list of MetricsRoutes structs
+func (l LogRoutes) MetricsRoutes() []MetricsRoute {
+	routes := []MetricsRoute{}
+
+	for _, route := range l {
+		tipe := getStringValue(route, "type")
+		if tipe != "metrics" {
+			continue
+		}
+
+		series := getStringValue(route, "series")
+		dimensions := getStringArray(route, "dimensions")
+		valueField := getStringValue(route, "value_field")
+		ruleName := getStringValue(route, "rule")
+
+		if series == "" { // TODO: log error
+			continue
+		}
+		if valueField == "" {
+			valueField = "value"
+		}
+
+		routes = append(routes, MetricsRoute{
+			Series:     series,
+			Dimensions: dimensions,
+			ValueField: valueField,
+			RuleName:   ruleName,
+		})
+	}
+
+	return routes
+}
+
+// AnalyticsRoutes filters the LogRoutes and returns a list of AnalyticsRoutes structs
+func (l LogRoutes) AnalyticsRoutes() []AnalyticsRoute {
+	routes := []AnalyticsRoute{}
+
+	for _, route := range l {
+		tipe := getStringValue(route, "type")
+		if tipe != "analytics" {
+			continue
+		}
+
+		series := getStringValue(route, "series")
+		ruleName := getStringValue(route, "rule")
+
+		if series == "" { // TODO: log error
+			continue
+		}
+
+		routes = append(routes, AnalyticsRoute{
+			Series:   series,
+			RuleName: ruleName,
+		})
+	}
+
+	return routes
+}
+
+// NotificationRoutes filters the LogRoutes and returns a list of NotificationRoutes structs
+func (l LogRoutes) NotificationRoutes() []NotificationRoute {
+	routes := []NotificationRoute{}
+
+	for _, route := range l {
+		tipe := getStringValue(route, "type")
+		if tipe != "notifications" {
+			continue
+		}
+
+		channel := getStringValue(route, "channel")
+		icon := getStringValue(route, "icon")
+		message := getStringValue(route, "message")
+		user := getStringValue(route, "user")
+		rule := getStringValue(route, "rule")
+
+		if channel == "" || message == "" { // TODO: log error
+			continue
+		}
+
+		if icon == "" {
+			icon = ":ghost:"
+		}
+		if user == "" {
+			user = "logging-pipeline"
+		}
+
+		routes = append(routes, NotificationRoute{
+			Channel:  channel,
+			Icon:     icon,
+			Message:  message,
+			User:     user,
+			RuleName: rule,
+		})
+	}
+
+	return routes
+}
+
+// AlertRoutes filters the LogRoutes and returns a list of AlertRoutes structs
+func (l LogRoutes) AlertRoutes() []AlertRoute {
+	routes := []AlertRoute{}
+
+	for _, route := range l {
+		tipe := getStringValue(route, "type")
+		if tipe != "alerts" {
+			continue
+		}
+
+		series := getStringValue(route, "series")
+		dimensions := getStringArray(route, "dimensions")
+		statType := getStringValue(route, "stat_type")
+		valueField := getStringValue(route, "value_field")
+		ruleName := getStringValue(route, "rule")
+
+		if series == "" { // TODO: log error
+			continue
+		}
+		if statType == "" {
+			statType = "counter"
+		}
+		if valueField == "" {
+			valueField = "value"
+		}
+
+		routes = append(routes, AlertRoute{
+			Series:     series,
+			Dimensions: dimensions,
+			StatType:   statType,
+			ValueField: valueField,
+			RuleName:   ruleName,
+		})
+	}
+
+	return routes
+}
+
+// KVMeta a struct that represents kv-meta data
+type KVMeta struct {
+	Team     string
+	Version  string
+	Language string
+	Routes   LogRoutes
+}
+
+// ExtractKVMeta returns a struct with available kv-meta data
+func ExtractKVMeta(kvlog map[string]interface{}) KVMeta {
+	tmp, ok := kvlog["_kvmeta"]
+	if !ok {
+		return KVMeta{}
+	}
+
+	kvmeta, ok := tmp.(map[string]interface{})
+	if !ok {
+		return KVMeta{}
+	}
+
+	kvRoutes := []map[string]interface{}{}
+
+	tmp, ok = kvmeta["routes"]
+	if ok {
+		routes, ok := tmp.([]map[string]interface{})
+		if ok {
+			kvRoutes = routes
+		}
+	}
+
+	return KVMeta{
+		Team:     getStringValue(kvmeta, "team"),
+		Version:  getStringValue(kvmeta, "kv_version"),
+		Language: getStringValue(kvmeta, "kv_language"),
+		Routes:   kvRoutes,
+	}
+}
+
+// ParseAndEnhance extracts fields from a log line, and does some post-processing to rename/add fields
+func ParseAndEnhance(line string, env string, stringifyNested bool, renameESReservedFields bool, minimumTimestamp time.Time) (map[string]interface{}, error) {
+	out := map[string]interface{}{}
+
+	syslogFields, err := FieldsFromSyslog(line)
+	if err != nil {
+		return map[string]interface{}{}, err
+	}
+	for k, v := range syslogFields {
+		out[k] = v
+	}
+	rawlog := syslogFields["rawlog"].(string)
+	programname := syslogFields["programname"].(string)
+
+	// Try pulling Kayvee fields out of message
+	kvFields, err := FieldsFromKayvee(rawlog)
+	if err != nil {
+		if _, ok := err.(*NonKayveeError); !ok {
+			return map[string]interface{}{}, err
+		}
+	} else {
+		for k, v := range kvFields {
+			out[k] = v
+		}
+	}
+
+	// Inject additional fields that are useful in log-searching and other business logic
+	out["env"] = env
+
+	// Sometimes its useful to force `container_{env,app,task}`. A specific use-case is writing Docker events.
+	// A separate container monitors for start/stop events, but we set the container values in such a way that
+	// the logs for these events will appear in context for the app that the user is looking at instead of the
+	// docker-events app.
+	forceEnv := ""
+	forceApp := ""
+	forceTask := ""
+	if cEnv, ok := out["container_env"]; ok {
+		forceEnv = cEnv.(string)
+	}
+	if cApp, ok := out["container_app"]; ok {
+		forceApp = cApp.(string)
+	}
+	if cTask, ok := out["container_task"]; ok {
+		forceTask = cTask.(string)
+	}
+	meta, err := getContainerMeta(programname, forceEnv, forceApp, forceTask)
+	if err == nil {
+		for k, v := range meta {
+			out[k] = v
+		}
+	}
+
+	// ES dynamic mappings get finnicky once you start sending nested objects.
+	// E.g., if one app sends a field for the first time as an object, then any log
+	// sent by another app containing that field /not/ as an object will fail.
+	// One solution is to decode nested objects as strings.
+	if stringifyNested {
+		for k, v := range out {
+			_, ismap := v.(map[string]interface{})
+			_, isarr := v.([]interface{})
+			if ismap || isarr {
+				bs, _ := json.Marshal(v)
+				out[k] = string(bs)
+			}
+		}
+	}
+
+	// ES doesn't like fields that start with underscores.
+	if renameESReservedFields {
+		for oldKey, renamedKey := range esFieldRenames {
+			if val, ok := out[oldKey]; ok {
+				out[renamedKey] = val
+				delete(out, oldKey)
+			}
+		}
+	}
+
+	msgTime, ok := out["timestamp"].(time.Time)
+	if ok && !msgTime.After(minimumTimestamp) {
+		return map[string]interface{}{}, fmt.Errorf("message's timestamp < minimumTimestamp")
+	}
+
+	return out, nil
+}
+
+var esFieldRenames = map[string]string{
+	"_index":       "kv__index",
+	"_uid":         "kv__uid",
+	"_type":        "kv__type",
+	"_id":          "kv__id",
+	"_source":      "kv__source",
+	"_size":        "kv__size",
+	"_all":         "kv__all",
+	"_field_names": "kv__field_names",
+	"_timestamp":   "kv__timestamp",
+	"_ttl":         "kv__ttl",
+	"_parent":      "kv__parent",
+	"_routing":     "kv__routing",
+	"_meta":        "kv__meta",
+}
+
+const containerMeta = `([a-z0-9-]+)--([a-z0-9-]+)\/` + // env--app
+	`arn%3Aaws%3Aecs%3Aus-(west|east)-[1-2]%3A[0-9]{12}%3Atask%2F` + // ARN cruft
+	`([0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12})` // task-id
+
+var containerMetaRegex = regexp.MustCompile(containerMeta)
+
+func getContainerMeta(programname, forceEnv, forceApp, forceTask string) (map[string]string, error) {
+	if programname == "" {
+		return map[string]string{}, fmt.Errorf("no programname")
+	}
+
+	env := ""
+	app := ""
+	task := ""
+	matches := containerMetaRegex.FindAllStringSubmatch(programname, 1)
+	if len(matches) == 1 {
+		env = matches[0][1]
+		app = matches[0][2]
+		task = matches[0][4]
+	}
+
+	if forceEnv != "" {
+		env = forceEnv
+	}
+	if forceApp != "" {
+		app = forceApp
+	}
+	if forceTask != "" {
+		task = forceTask
+	}
+
+	if env == "" || app == "" || task == "" {
+		return map[string]string{}, fmt.Errorf("unable to get one or more of env/app/task")
+	}
+
+	return map[string]string{
+		"container_env":  env,
+		"container_app":  app,
+		"container_task": task,
+	}, nil
+}
diff --git a/decode/decode_test.go b/decode/decode_test.go
new file mode 100644
index 0000000..9f7a123
--- /dev/null
+++ b/decode/decode_test.go
@@ -0,0 +1,834 @@
+package decode
+
+import (
+	"encoding/json"
+	"fmt"
+	"testing"
+	"time"
+
+	"github.com/Clever/syslogparser"
+	"github.com/stretchr/testify/assert"
+)
+
+const RFC3339Micro = "2006-01-02T15:04:05.999999-07:00"
+
+type Spec struct {
+	Title          string
+	Input          string
+	ExpectedOutput map[string]interface{}
+	ExpectedError  error
+}
+
+func TestKayveeDecoding(t *testing.T) {
+	specs := []Spec{
+		Spec{
+			Title: "handles just JSON",
+			Input: `{"a":"b"}`,
+			ExpectedOutput: map[string]interface{}{
+				"prefix":  "",
+				"postfix": "",
+				"a":       "b",
+				"type":    "Kayvee",
+			},
+			ExpectedError: nil,
+		},
+		Spec{
+			Title: "handles prefix + JSON",
+			Input: `prefix {"a":"b"}`,
+			ExpectedOutput: map[string]interface{}{
+				"prefix":  "prefix ",
+				"postfix": "",
+				"a":       "b",
+				"type":    "Kayvee",
+			},
+			ExpectedError: nil,
+		},
+		Spec{
+			Title: "handles JSON + postfix",
+			Input: `{"a":"b"} postfix`,
+			ExpectedOutput: map[string]interface{}{
+				"prefix":  "",
+				"postfix": " postfix",
+				"a":       "b",
+				"type":    "Kayvee",
+			},
+			ExpectedError: nil,
+		},
+		Spec{
+			Title: "handles prefix + JSON + postfix",
+			Input: `prefix {"a":"b"} postfix`,
+			ExpectedOutput: map[string]interface{}{
+				"prefix":  "prefix ",
+				"postfix": " postfix",
+				"a":       "b",
+				"type":    "Kayvee",
+			},
+			ExpectedError: nil,
+		},
+		Spec{
+			Title:          "Returns NonKayveeError if not JSON in body",
+			Input:          `prefix { postfix`,
+			ExpectedOutput: map[string]interface{}{},
+			ExpectedError:  &NonKayveeError{},
+		},
+		Spec{
+			Title:          "errors on invalid JSON (missing a quote)",
+			Input:          `prefix {"a:"b"} postfix`,
+			ExpectedOutput: map[string]interface{}{},
+			ExpectedError:  &json.SyntaxError{},
+		},
+	}
+
+	for _, spec := range specs {
+		t.Run(fmt.Sprintf(spec.Title), func(t *testing.T) {
+			assert := assert.New(t)
+			fields, err := FieldsFromKayvee(spec.Input)
+			if spec.ExpectedError != nil {
+				assert.Error(err)
+				assert.IsType(spec.ExpectedError, err)
+			} else {
+				assert.NoError(err)
+			}
+			assert.Equal(spec.ExpectedOutput, fields)
+		})
+	}
+}
+
+func TestSyslogDecoding(t *testing.T) {
+	// timestamps in Rsyslog_TraditionalFileFormat
+	logTime, err := time.Parse(time.Stamp, "Oct 25 10:20:37")
+	if err != nil {
+		t.Fatal(err)
+	}
+	// parsing assumes log is from the current year
+	logTime = logTime.AddDate(time.Now().Year(), 0, 0).UTC()
+
+	logTime2, err := time.Parse(time.Stamp, "Apr  5 21:45:54")
+	if err != nil {
+		t.Fatal(err)
+	}
+	logTime2 = logTime2.AddDate(time.Now().Year(), 0, 0).UTC()
+
+	// timestamp in Rsyslog_FileFormat
+	logTime3, err := time.Parse(RFC3339Micro, "2017-04-05T21:57:46.794862+00:00")
+	if err != nil {
+		t.Fatal(err)
+	}
+	logTime3 = logTime3.UTC()
+
+	specs := []Spec{
+		Spec{
+			Title: "Parses Rsyslog_TraditionalFileFormat with simple log body",
+			Input: `Oct 25 10:20:37 some-host docker/fa3a5e338a47[1294]: log body`,
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":   logTime,
+				"hostname":    "some-host",
+				"programname": "docker/fa3a5e338a47",
+				"rawlog":      "log body",
+			},
+			ExpectedError: nil,
+		},
+		Spec{
+			Title: "Parses Rsyslog_TraditionalFileFormat with haproxy access log body",
+			Input: `Apr  5 21:45:54 influx-service docker/0000aa112233[1234]: [httpd] 2017/04/05 21:45:54 172.17.42.1 - heka [05/Apr/2017:21:45:54 +0000] POST /write?db=foo&precision=ms HTTP/1.1 204 0 - Go 1.1 package http 123456-1234-1234-b11b-000000000000 13.688672ms`,
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":   logTime2,
+				"hostname":    "influx-service",
+				"programname": "docker/0000aa112233",
+				"rawlog":      "[httpd] 2017/04/05 21:45:54 172.17.42.1 - heka [05/Apr/2017:21:45:54 +0000] POST /write?db=foo&precision=ms HTTP/1.1 204 0 - Go 1.1 package http 123456-1234-1234-b11b-000000000000 13.688672ms",
+			},
+			ExpectedError: nil,
+		},
+		Spec{
+			Title: "Parses Rsyslog_TraditionalFileFormat",
+			Input: `Apr  5 21:45:54 mongodb-some-machine whackanop: 2017/04/05 21:46:11 found 0 ops`,
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":   logTime2,
+				"hostname":    "mongodb-some-machine",
+				"programname": "whackanop",
+				"rawlog":      "2017/04/05 21:46:11 found 0 ops",
+			},
+			ExpectedError: nil,
+		},
+		Spec{
+			Title: "Parses Rsyslog_ FileFormat with Kayvee payload",
+			Input: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished"}`,
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":   logTime3,
+				"hostname":    "ip-10-0-0-0",
+				"programname": `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":      `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished"}`,
+			},
+			ExpectedError: nil,
+		},
+		Spec{
+			Title:          "Fails to parse non-RSyslog log line",
+			Input:          `not rsyslog`,
+			ExpectedOutput: map[string]interface{}{},
+			ExpectedError:  &syslogparser.ParserError{},
+		},
+	}
+	for _, spec := range specs {
+		t.Run(fmt.Sprintf(spec.Title), func(t *testing.T) {
+			assert := assert.New(t)
+			fields, err := FieldsFromSyslog(spec.Input)
+			if spec.ExpectedError != nil {
+				assert.Error(err)
+				assert.IsType(spec.ExpectedError, err)
+			} else {
+				assert.NoError(err)
+			}
+			assert.Equal(spec.ExpectedOutput, fields)
+		})
+	}
+}
+
+type ParseAndEnhanceInput struct {
+	Line                   string
+	StringifyNested        bool
+	RenameESReservedFields bool
+	MinimumTimestamp       time.Time
+}
+
+type ParseAndEnhanceSpec struct {
+	Title          string
+	Input          ParseAndEnhanceInput
+	ExpectedOutput map[string]interface{}
+	ExpectedError  error
+}
+
+func TestParseAndEnhance(t *testing.T) {
+	// timestamp in Rsyslog_FileFormat
+	logTime3, err := time.Parse(RFC3339Micro, "2017-04-05T21:57:46.794862+00:00")
+	if err != nil {
+		t.Fatal(err)
+	}
+	logTime3 = logTime3.UTC()
+
+	specs := []ParseAndEnhanceSpec{
+		ParseAndEnhanceSpec{
+			Title: "Parses a Kayvee log line from an ECS app",
+			Input: ParseAndEnhanceInput{Line: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished"}`},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished"}`,
+				"title":          "request_finished",
+				"type":           "Kayvee",
+				"prefix":         "2017/04/05 21:57:46 some_file.go:10: ",
+				"postfix":        "",
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+			},
+			ExpectedError: nil,
+		},
+		ParseAndEnhanceSpec{
+			Title: "Parses a Kayvee log line from an ECS app, with override to container_app",
+			Input: ParseAndEnhanceInput{Line: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished","container_app":"force-app"}`},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished","container_app":"force-app"}`,
+				"title":          "request_finished",
+				"type":           "Kayvee",
+				"prefix":         "2017/04/05 21:57:46 some_file.go:10: ",
+				"postfix":        "",
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "force-app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+			},
+			ExpectedError: nil,
+		},
+		ParseAndEnhanceSpec{
+			Title: "Parses a non-Kayvee log line",
+			Input: ParseAndEnhanceInput{Line: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: some log`},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `some log`,
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+			},
+			ExpectedError: nil,
+		},
+		ParseAndEnhanceSpec{
+			Title:          "Fails to parse non-RSyslog log line",
+			Input:          ParseAndEnhanceInput{Line: `not rsyslog`},
+			ExpectedOutput: map[string]interface{}{},
+			ExpectedError:  &syslogparser.ParserError{},
+		},
+		ParseAndEnhanceSpec{
+			Title: "Parses JSON values",
+			Input: ParseAndEnhanceInput{Line: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "nested": {"a":"b"}}`},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "nested": {"a":"b"}}`,
+				"title":          "request_finished",
+				"type":           "Kayvee",
+				"prefix":         "2017/04/05 21:57:46 some_file.go:10: ",
+				"postfix":        "",
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+				"nested":         map[string]interface{}{"a": "b"},
+			},
+			ExpectedError: nil,
+		},
+		ParseAndEnhanceSpec{
+			Title: "Has the option to stringify object values",
+			Input: ParseAndEnhanceInput{
+				Line:            `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "nested": {"a":"b"}}`,
+				StringifyNested: true,
+			},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "nested": {"a":"b"}}`,
+				"title":          "request_finished",
+				"type":           "Kayvee",
+				"prefix":         "2017/04/05 21:57:46 some_file.go:10: ",
+				"postfix":        "",
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+				"nested":         `{"a":"b"}`,
+			},
+			ExpectedError: nil,
+		},
+		ParseAndEnhanceSpec{
+			Title: "Has the option to stringify array values",
+			Input: ParseAndEnhanceInput{
+				Line:            `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "nested": [{"a":"b"}]}`,
+				StringifyNested: true,
+			},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "nested": [{"a":"b"}]}`,
+				"title":          "request_finished",
+				"type":           "Kayvee",
+				"prefix":         "2017/04/05 21:57:46 some_file.go:10: ",
+				"postfix":        "",
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+				"nested":         `[{"a":"b"}]`,
+			},
+			ExpectedError: nil,
+		},
+		ParseAndEnhanceSpec{
+			Title: "Has the option to rename reserved ES fields",
+			Input: ParseAndEnhanceInput{
+				Line: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "_source": "a"}`,
+				RenameESReservedFields: true,
+			},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "_source": "a"}`,
+				"title":          "request_finished",
+				"type":           "Kayvee",
+				"prefix":         "2017/04/05 21:57:46 some_file.go:10: ",
+				"postfix":        "",
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+				"kv__source":     "a",
+			},
+			ExpectedError: nil,
+		},
+		ParseAndEnhanceSpec{
+			Title: "Errors if logTime < MinimumTimestamp",
+			Input: ParseAndEnhanceInput{
+				Line: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "_source": "a"}`,
+				RenameESReservedFields: true,
+				MinimumTimestamp:       time.Now().Add(100 * time.Hour * 24 * 365), // good thru year 2117
+			},
+			ExpectedOutput: map[string]interface{}{},
+			ExpectedError:  fmt.Errorf(""),
+		},
+		ParseAndEnhanceSpec{
+			Title: "Accepts logs if logTime > MinimumTimestamp",
+			Input: ParseAndEnhanceInput{
+				Line: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "_source": "a"}`,
+				RenameESReservedFields: true,
+				MinimumTimestamp:       time.Now().Add(-100 * time.Hour * 24 * 365), // good thru year 2117
+			},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "_source": "a"}`,
+				"title":          "request_finished",
+				"type":           "Kayvee",
+				"prefix":         "2017/04/05 21:57:46 some_file.go:10: ",
+				"postfix":        "",
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+				"kv__source":     "a",
+			},
+			ExpectedError: nil,
+		},
+		ParseAndEnhanceSpec{
+			Title: "Accepts logs if logTime > MinimumTimestamp",
+			Input: ParseAndEnhanceInput{
+				Line: `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "_source": "a"}`,
+				RenameESReservedFields: true,
+				MinimumTimestamp:       time.Now().Add(-100 * time.Hour * 24 * 365), // good thru year 2117
+			},
+			ExpectedOutput: map[string]interface{}{
+				"timestamp":      logTime3,
+				"hostname":       "ip-10-0-0-0",
+				"programname":    `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`,
+				"rawlog":         `2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished", "_source": "a"}`,
+				"title":          "request_finished",
+				"type":           "Kayvee",
+				"prefix":         "2017/04/05 21:57:46 some_file.go:10: ",
+				"postfix":        "",
+				"env":            "deploy-env",
+				"container_env":  "env",
+				"container_app":  "app",
+				"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+				"kv__source":     "a",
+			},
+			ExpectedError: nil,
+		},
+	}
+	for _, spec := range specs {
+		t.Run(fmt.Sprintf(spec.Title), func(t *testing.T) {
+			assert := assert.New(t)
+			fields, err := ParseAndEnhance(spec.Input.Line, "deploy-env", spec.Input.StringifyNested, spec.Input.RenameESReservedFields, spec.Input.MinimumTimestamp)
+			if spec.ExpectedError != nil {
+				assert.Error(err)
+				assert.IsType(spec.ExpectedError, err)
+			} else {
+				assert.NoError(err)
+			}
+			assert.Equal(spec.ExpectedOutput, fields)
+		})
+	}
+}
+
+func TestGetContainerMeta(t *testing.T) {
+	assert := assert.New(t)
+
+	t.Log("Must have a programname to get container meta")
+	programname := ""
+	_, err := getContainerMeta(programname, "", "", "")
+	assert.Error(err)
+
+	t.Log("Can parse a programname")
+	programname = `env1--app2/arn%3Aaws%3Aecs%3Aus-west-1%3A589690932525%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`
+	meta, err := getContainerMeta(programname, "", "", "")
+	assert.NoError(err)
+	assert.Equal(map[string]string{
+		"container_env":  "env1",
+		"container_app":  "app2",
+		"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+	}, meta)
+
+	t.Log("Can override just 'env'")
+	overrideEnv := "force-env"
+	meta, err = getContainerMeta(programname, overrideEnv, "", "")
+	assert.NoError(err)
+	assert.Equal(map[string]string{
+		"container_env":  overrideEnv,
+		"container_app":  "app2",
+		"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+	}, meta)
+
+	t.Log("Can override just 'app'")
+	overrideApp := "force-app"
+	meta, err = getContainerMeta(programname, "", overrideApp, "")
+	assert.NoError(err)
+	assert.Equal(map[string]string{
+		"container_env":  "env1",
+		"container_app":  overrideApp,
+		"container_task": "abcd1234-1a3b-1a3b-1234-d76552f4b7ef",
+	}, meta)
+
+	t.Log("Can override just 'task'")
+	overrideTask := "force-task"
+	meta, err = getContainerMeta(programname, "", "", overrideTask)
+	assert.NoError(err)
+	assert.Equal(map[string]string{
+		"container_env":  "env1",
+		"container_app":  "app2",
+		"container_task": overrideTask,
+	}, meta)
+
+	t.Log("Can override all fields")
+	programname = `env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef`
+	meta, err = getContainerMeta(programname, overrideEnv, overrideApp, overrideTask)
+	assert.NoError(err)
+	assert.Equal(map[string]string{
+		"container_env":  overrideEnv,
+		"container_app":  overrideApp,
+		"container_task": overrideTask,
+	}, meta)
+}
+
+func TestExtractKVMeta(t *testing.T) {
+	assert := assert.New(t)
+
+	tests := []struct {
+		Description                string
+		Log                        map[string]interface{}
+		Team                       string
+		Language                   string
+		Version                    string
+		ExpectedMetricsRoutes      []MetricsRoute
+		ExpectedAnalyticsRoutes    []AnalyticsRoute
+		ExpectedNotificationRoutes []NotificationRoute
+		ExpectedAlertRoutes        []AlertRoute
+	}{
+		{
+			Description: "log line with no routes",
+			Log:         map[string]interface{}{"hi": "hello!"},
+		},
+		{
+			Description: "empty _kvmeta",
+			Log: map[string]interface{}{
+				"hi":      "hello!",
+				"_kvmeta": map[string]interface{}{},
+			},
+		},
+		{
+			Description: "_kvmeta with no routes",
+			Team:        "green",
+			Version:     "three",
+			Language:    "tree",
+			Log: map[string]interface{}{
+				"hi": "hello!",
+				"_kvmeta": map[string]interface{}{
+					"team":        "green",
+					"kv_version":  "three",
+					"kv_language": "tree",
+				},
+			},
+		},
+		{
+			Description: "_kvmeta with metric routes",
+			Team:        "green",
+			Version:     "three",
+			Language:    "tree",
+			ExpectedMetricsRoutes: []MetricsRoute{
+				{
+					Series:     "1,1,2,3,5,8,13",
+					Dimensions: []string{"app", "district"},
+					ValueField: "value",
+					RuleName:   "cool",
+				},
+				{
+					Series:     "1,1,2,6,24,120,720,5040",
+					Dimensions: []string{"app", "district"},
+					ValueField: "value",
+					RuleName:   "cool2",
+				},
+			},
+			Log: map[string]interface{}{
+				"hi": "hello!",
+				"_kvmeta": map[string]interface{}{
+					"team":        "green",
+					"kv_version":  "three",
+					"kv_language": "tree",
+					"routes": []map[string]interface{}{
+						map[string]interface{}{
+							"type":        "metrics",
+							"rule":        "cool",
+							"series":      "1,1,2,3,5,8,13",
+							"value_field": "value",
+							"dimensions":  []string{"app", "district"},
+						},
+						map[string]interface{}{
+							"type":       "metrics",
+							"rule":       "cool2",
+							"series":     "1,1,2,6,24,120,720,5040",
+							"dimensions": []string{"app", "district"},
+						},
+					},
+				},
+			},
+		},
+		{
+			Description: "_kvmeta with analytic routes",
+			Team:        "green",
+			Version:     "christmas",
+			Language:    "tree",
+			ExpectedAnalyticsRoutes: []AnalyticsRoute{
+				{
+					Series:   "what-is-this",
+					RuleName: "what's-this?",
+				},
+				{
+					RuleName: "there's-app-invites-everywhere",
+					Series:   "there's-bts-in-the-air",
+				},
+			},
+			Log: map[string]interface{}{
+				"hi": "hello!",
+				"_kvmeta": map[string]interface{}{
+					"team":        "green",
+					"kv_version":  "christmas",
+					"kv_language": "tree",
+					"routes": []map[string]interface{}{
+						map[string]interface{}{
+							"type":   "analytics",
+							"rule":   "what's-this?",
+							"series": "what-is-this",
+						},
+						map[string]interface{}{
+							"type":   "analytics",
+							"rule":   "there's-app-invites-everywhere",
+							"series": "there's-bts-in-the-air",
+						},
+					},
+				},
+			},
+		},
+		{
+			Description: "_kvmeta with notification routes",
+			Team:        "slack",
+			Version:     "evergreen",
+			Language:    "markdown-ish",
+			ExpectedNotificationRoutes: []NotificationRoute{
+				{
+					RuleName: "did-you-know",
+					Channel:  "originally-slack",
+					Message:  "was a gaming company",
+					Icon:     ":video_game:",
+					User:     "og slack bronie",
+				},
+				{
+					RuleName: "what's-the-catch",
+					Channel:  "slack-is-built-with-php",
+					Message:  "just like farmville",
+					Icon:     ":ghost:",
+					User:     "logging-pipeline",
+				},
+			},
+			Log: map[string]interface{}{
+				"hi": "hello!",
+				"_kvmeta": map[string]interface{}{
+					"team":        "slack",
+					"kv_version":  "evergreen",
+					"kv_language": "markdown-ish",
+					"routes": []map[string]interface{}{
+						map[string]interface{}{
+							"type":    "notifications",
+							"rule":    "did-you-know",
+							"channel": "originally-slack",
+							"message": "was a gaming company",
+							"icon":    ":video_game:",
+							"user":    "og slack bronie",
+						},
+						map[string]interface{}{
+							"type":    "notifications",
+							"rule":    "what's-the-catch",
+							"channel": "slack-is-built-with-php",
+							"message": "just like farmville",
+						},
+					},
+				},
+			},
+		},
+		{
+			Description: "_kvmeta with alert routes",
+			Team:        "a-team",
+			Version:     "old",
+			Language:    "jive",
+			ExpectedAlertRoutes: []AlertRoute{
+				{
+					RuleName:   "last-call",
+					Series:     "doing-it-til-we-fall",
+					Dimensions: []string{"who", "where"},
+					StatType:   "guage",
+					ValueField: "status",
+				},
+				{
+					RuleName:   "watch-out-now",
+					Series:     "dem-gators-gonna-bite-ya",
+					Dimensions: []string{"how-fresh", "how-clean"},
+					StatType:   "counter",
+					ValueField: "value",
+				},
+			},
+			Log: map[string]interface{}{
+				"hi": "hello!",
+				"_kvmeta": map[string]interface{}{
+					"team":        "a-team",
+					"kv_version":  "old",
+					"kv_language": "jive",
+					"routes": []map[string]interface{}{
+						map[string]interface{}{
+							"type":        "alerts",
+							"rule":        "last-call",
+							"series":      "doing-it-til-we-fall",
+							"dimensions":  []string{"who", "where"},
+							"stat_type":   "guage",
+							"value_field": "status",
+						},
+						map[string]interface{}{
+							"type":       "alerts",
+							"rule":       "watch-out-now",
+							"series":     "dem-gators-gonna-bite-ya",
+							"dimensions": []string{"how-fresh", "how-clean"},
+						},
+					},
+				},
+			},
+		},
+		{
+			Description: "_kvmeta with all types of routes",
+			Team:        "diversity",
+			Version:     "kv-routes",
+			Language:    "understanding",
+			ExpectedMetricsRoutes: []MetricsRoute{
+				{
+					RuleName:   "all-combos",
+					Series:     "1,1,2,6,24,120,720,5040",
+					Dimensions: []string{"fact", "orial"},
+					ValueField: "value",
+				},
+			},
+			ExpectedAnalyticsRoutes: []AnalyticsRoute{
+				{
+					RuleName: "there's-app-invites-everywhere",
+					Series:   "there's-bts-in-the-air",
+				},
+			},
+			ExpectedNotificationRoutes: []NotificationRoute{
+				{
+					RuleName: "what's-the-catch",
+					Channel:  "slack-is-built-with-php",
+					Message:  "just like farmville",
+					Icon:     ":ghost:",
+					User:     "logging-pipeline",
+				},
+			},
+			ExpectedAlertRoutes: []AlertRoute{
+				{
+					RuleName:   "last-call",
+					Series:     "doing-it-til-we-fall",
+					Dimensions: []string{"who", "where"},
+					StatType:   "guage",
+					ValueField: "status",
+				},
+			},
+			Log: map[string]interface{}{
+				"hi": "hello!",
+				"_kvmeta": map[string]interface{}{
+					"team":        "diversity",
+					"kv_version":  "kv-routes",
+					"kv_language": "understanding",
+					"routes": []map[string]interface{}{
+						map[string]interface{}{
+							"type":       "metrics",
+							"rule":       "all-combos",
+							"series":     "1,1,2,6,24,120,720,5040",
+							"dimensions": []string{"fact", "orial"},
+						},
+						map[string]interface{}{
+							"type":   "analytics",
+							"rule":   "there's-app-invites-everywhere",
+							"series": "there's-bts-in-the-air",
+						},
+						map[string]interface{}{
+							"type":    "notifications",
+							"rule":    "what's-the-catch",
+							"channel": "slack-is-built-with-php",
+							"message": "just like farmville",
+						},
+						map[string]interface{}{
+							"type":        "alerts",
+							"rule":        "last-call",
+							"series":      "doing-it-til-we-fall",
+							"dimensions":  []string{"who", "where"},
+							"stat_type":   "guage",
+							"value_field": "status",
+						},
+					},
+				},
+			},
+		},
+	}
+
+	for _, test := range tests {
+		t.Log(test.Description)
+		kvmeta := ExtractKVMeta(test.Log)
+
+		assert.Equal(test.Team, kvmeta.Team)
+		assert.Equal(test.Language, kvmeta.Language)
+		assert.Equal(test.Version, kvmeta.Version)
+
+		assert.Equal(len(test.ExpectedMetricsRoutes), len(kvmeta.Routes.MetricsRoutes()))
+		for idx, route := range kvmeta.Routes.MetricsRoutes() {
+			expected := test.ExpectedMetricsRoutes[idx]
+			assert.Exactly(expected, route)
+		}
+		assert.Equal(len(test.ExpectedAnalyticsRoutes), len(kvmeta.Routes.AnalyticsRoutes()))
+		for idx, route := range kvmeta.Routes.AnalyticsRoutes() {
+			expected := test.ExpectedAnalyticsRoutes[idx]
+			assert.Exactly(expected, route)
+		}
+		assert.Equal(len(test.ExpectedNotificationRoutes), len(kvmeta.Routes.NotificationRoutes()))
+		for idx, route := range kvmeta.Routes.NotificationRoutes() {
+			expected := test.ExpectedNotificationRoutes[idx]
+			assert.Exactly(expected, route)
+		}
+		assert.Equal(len(test.ExpectedAlertRoutes), len(kvmeta.Routes.AlertRoutes()))
+		for idx, route := range kvmeta.Routes.AlertRoutes() {
+			expected := test.ExpectedAlertRoutes[idx]
+			assert.Exactly(expected, route)
+		}
+	}
+}
+
+// Benchmarks
+const benchmarkLine = `2017-04-05T21:57:46.794862+00:00 ip-10-0-0-0 env--app/arn%3Aaws%3Aecs%3Aus-west-1%3A999988887777%3Atask%2Fabcd1234-1a3b-1a3b-1234-d76552f4b7ef[3291]: 2017/04/05 21:57:46 some_file.go:10: {"title":"request_finished"}`
+
+func BenchmarkFieldsFromKayvee(b *testing.B) {
+	for n := 0; n < b.N; n++ {
+		_, err := FieldsFromKayvee(benchmarkLine)
+		if err != nil {
+			b.FailNow()
+		}
+	}
+}
+
+func BenchmarkFieldsFromSyslog(b *testing.B) {
+	for n := 0; n < b.N; n++ {
+		_, err := FieldsFromSyslog(benchmarkLine)
+		if err != nil {
+			b.FailNow()
+		}
+	}
+}
+
+func BenchmarkParseAndEnhance(b *testing.B) {
+	for n := 0; n < b.N; n++ {
+		_, err := ParseAndEnhance(benchmarkLine, "env", false, false, time.Time{})
+		if err != nil {
+			b.FailNow()
+		}
+	}
+}
diff --git a/glide.lock b/glide.lock
new file mode 100644
index 0000000..a8f507f
--- /dev/null
+++ b/glide.lock
@@ -0,0 +1,53 @@
+hash: 6da9731518797a7e339144f126af589f72f860bee154b0f2a552f91d2bc01bab
+updated: 2017-07-18T02:00:59.747262097Z
+imports:
+- name: github.com/aws/aws-sdk-go
+  version: b73b028e599fa9176687c70b8f9cafbe57c27d20
+  subpackages:
+  - aws
+  - aws/session
+  - service/firehose
+- name: github.com/Clever/kinesis-to-firehose
+  version: dca69c87e1662c7b1f55581399544d05fdcb09ab
+  subpackages:
+  - writer
+- name: github.com/Clever/syslogparser
+  version: 93ab95f7ff16c9ef1f2d09bc37c0a0c31bad98ea
+  subpackages:
+  - rfc3164
+- name: github.com/jeromer/syslogparser
+  version: 0e4ae46ea3f08de351074b643d649d5d00661a3c
+- name: github.com/xeipuuv/gojsonpointer
+  version: e0fe6f68307607d540ed8eac07a342c33fa1b54a
+- name: github.com/xeipuuv/gojsonreference
+  version: e02fc20de94c78484cd5ffb007f8af96be030a45
+- name: github.com/xeipuuv/gojsonschema
+  version: e18f0065e8c148fcf567ac43a3f8f5b66ac0720b
+- name: golang.org/x/net
+  version: a6577fac2d73be281a500b310739095313165611
+  subpackages:
+  - context
+- name: golang.org/x/time
+  version: f51c12702a4d776e4c1fa9b0fabab841babae631
+  subpackages:
+  - rate
+- name: gopkg.in/Clever/kayvee-go.v6
+  version: 096364e316a52652d3493be702d8105d8d01db84
+  subpackages:
+  - logger
+  - router
+- name: gopkg.in/yaml.v2
+  version: a5b47d31c556af34a302ce5d659e6fea44d90de0
+testImports:
+- name: github.com/davecgh/go-spew
+  version: 6d212800a42e8ab5c146b8ace3490ee17e5225f9
+  subpackages:
+  - spew
+- name: github.com/pmezard/go-difflib
+  version: d8ed2627bdf02c080bf22230dbb337003b7aba2d
+  subpackages:
+  - difflib
+- name: github.com/stretchr/testify
+  version: 69483b4bd14f5845b5a1e55bca19e954e827f1d0
+  subpackages:
+  - assert
diff --git a/glide.yaml b/glide.yaml
new file mode 100644
index 0000000..a96cd81
--- /dev/null
+++ b/glide.yaml
@@ -0,0 +1,20 @@
+package: github.com/Clever/amazon-kinesis-client-go
+import:
+- package: github.com/Clever/kinesis-to-firehose
+  subpackages:
+  - writer
+- package: github.com/Clever/syslogparser
+  subpackages:
+  - rfc3164
+- package: github.com/aws/aws-sdk-go
+  subpackages:
+  - aws
+  - aws/session
+  - service/firehose
+- package: golang.org/x/time
+  subpackages:
+  - rate
+testImport:
+- package: github.com/stretchr/testify
+  subpackages:
+  - assert
diff --git a/splitter/README.md b/splitter/README.md
new file mode 100644
index 0000000..bdc307e
--- /dev/null
+++ b/splitter/README.md
@@ -0,0 +1,10 @@
+splitter
+===
+
+This splitter allows ingesting logs from a CWLogs subscription.
+
+Splitter's expected input is batched logs from a CloudWatchLogs subscription to a Kinesis Stream.
+The CWLogs subscription has a special format which bundles several logs into a single record.
+The splitter takes this record and splits it into multiple logs.
+These logs are also modified to mimic the RSyslog format we expect from our other logs.
+This allows them to be decoded normally by the rest of the pipeline.
diff --git a/splitter/splitter.go b/splitter/splitter.go
new file mode 100644
index 0000000..d43bd93
--- /dev/null
+++ b/splitter/splitter.go
@@ -0,0 +1,113 @@
+package splitter
+
+import (
+	"bytes"
+	"compress/gzip"
+	"encoding/json"
+	"fmt"
+	"io/ioutil"
+	"regexp"
+	"time"
+)
+
+// LogEvent is a single log line within a LogEventBatch
+type LogEvent struct {
+	ID        string `json:"id"`
+	Timestamp int64  `json:"timestamp"`
+	Message   string `json:"message"`
+}
+
+// LogEventBatch is a batch of multiple log lines, read from a KinesisStream with a CWLogs subscription
+type LogEventBatch struct {
+	MessageType         string     `json:"messageType"`
+	Owner               string     `json:"owner"`
+	LogGroup            string     `json:"logGroup"`
+	LogStream           string     `json:"logStream"`
+	SubscriptionFilters []string   `json:"subscriptionFilters"`
+	LogEvents           []LogEvent `json:"logEvents"`
+}
+
+// IsGzipped returns whether or not a string is Gzipped (determined by looking for a Gzip byte prefix)
+func IsGzipped(b []byte) bool {
+	return b[0] == 0x1f && b[1] == 0x8b
+}
+
+// GetMessagesFromGzippedInput takes a gzipped record from a CWLogs Subscription and splits it into
+// a slice of messages.
+func GetMessagesFromGzippedInput(input []byte, prodEnv bool) ([][]byte, error) {
+	unpacked, err := unpack(input)
+	if err != nil {
+		return [][]byte{}, err
+	}
+	return Split(unpacked, prodEnv), nil
+}
+
+// Unpack expects a gzipped + json-stringified LogEventBatch
+func unpack(input []byte) (LogEventBatch, error) {
+	gzipReader, err := gzip.NewReader(bytes.NewReader(input))
+	if err != nil {
+		return LogEventBatch{}, err
+	}
+
+	byt, err := ioutil.ReadAll(gzipReader)
+	if err != nil {
+		return LogEventBatch{}, err
+	}
+
+	var dat LogEventBatch
+	if err := json.Unmarshal(byt, &dat); err != nil {
+		return LogEventBatch{}, err
+	}
+
+	return dat, nil
+}
+
+// RFC3339Micro is the RFC3339 format in microseconds
+const RFC3339Micro = "2006-01-02T15:04:05.999999-07:00"
+
+const taskMeta = `([a-z0-9-]+)--([a-z0-9-]+)\/` + // env--app
+	`([0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12})\/` + // task-id
+	`([0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12})` // container-id
+
+var taskRegex = regexp.MustCompile(taskMeta)
+
+// Split takes a LogEventBatch and separates into a slice of enriched log lines
+// Lines are enhanced by adding an Rsyslog prefix, which should be handled correctly by
+// the subsequent decoding logic.
+func Split(b LogEventBatch, prodEnv bool) [][]byte {
+	env := "unknown"
+	app := "unknown"
+	task := "00001111-2222-3333-4444-555566667777"
+	matches := taskRegex.FindAllStringSubmatch(b.LogStream, 1)
+	if len(matches) == 1 {
+		env = matches[0][1]
+		app = matches[0][2]
+		task = matches[0][3]
+	}
+
+	if (env == "production") != prodEnv {
+		// if there's a mis-match between the consumer's environment and the log's environment,
+		// throw away the log. (this is a workaround for coarse grained subscription filters.)
+		return [][]byte{}
+	}
+
+	rsyslogPrefix := `%s %s %s[%d]: %s`
+	// programName is a mocked ARN in the format expected by our log decoders
+	programName := env + "--" + app + `/arn%3Aaws%3Aecs%3Aus-east-1%3A999988887777%3Atask%2F` + task
+	mockPid := 1
+	hostname := "aws-batch"
+
+	out := [][]byte{}
+	for _, event := range b.LogEvents {
+		// Adding an extra Microsecond forces `Format` to include all 6 digits within the micorsecond format.
+		// Otherwise, time.Format omits trailing zeroes. (https://github.com/golang/go/issues/12472)
+		nsecs := event.Timestamp*int64(time.Millisecond) + int64(time.Microsecond)
+		logTime := time.Unix(0, nsecs).UTC().Format(RFC3339Micro)
+
+		// Fake an RSyslog prefix, expected by consumers
+		formatted := fmt.Sprintf(rsyslogPrefix, logTime, hostname, programName, mockPid, event.Message)
+		out = append(out, []byte(formatted))
+	}
+
+	return out
+}
diff --git a/splitter/splitter_test.go b/splitter/splitter_test.go
new file mode 100644
index 0000000..f85ebfa
--- /dev/null
+++ b/splitter/splitter_test.go
@@ -0,0 +1,182 @@
+package splitter
+
+import (
+	"bytes"
+	"compress/gzip"
+	b64 "encoding/base64"
+	"encoding/json"
+	"testing"
+
+	"github.com/stretchr/testify/assert"
+)
+
+func TestUnpacking(t *testing.T) {
+	input := "H4sIAAAAAAAAADWOTQuCQBRF/8ow6wj6ENRdhLXIClJoERKTvsZHOiPzxiLE/96YtTzcy72n4zUQCQnpuwEe8vXxkJ6O8XUfJclqG/EJ1y8FZkgq3RYvYfMy1pJcUGm5NbptXDZSYg2IekRqb5QbbCxqtcHKgiEeXrJvL3qCsgN2HIuxbtFpWFG7sdky8L1ZECwXc9+b/PUGgXPMfnrspxeydQn5A5VkJYjKlkzfWeGWUInhme1QASEx+qpNeZ/1H1PFPn3yAAAA"
+
+	decoded, err := b64.StdEncoding.DecodeString(input)
+	assert.NoError(t, err)
+
+	output, err := unpack(string(decoded))
+	assert.NoError(t, err)
+
+	expectedOutput := LogEventBatch{
+		MessageType:         "CONTROL_MESSAGE",
+		Owner:               "CloudwatchLogs",
+		LogGroup:            "",
+		LogStream:           "",
+		SubscriptionFilters: []string{},
+		LogEvents: []LogEvent{
+			{
+				ID:        "",
+				Timestamp: 1498519943285,
+				Message:   "CWL CONTROL MESSAGE: Checking health of destination Kinesis stream.",
+			},
+		},
+	}
+	assert.Equal(t, expectedOutput, output)
+}
+
+func pack(input LogEventBatch) (string, error) {
+	src, err := json.Marshal(input)
+	if err != nil {
+		return "", err
+	}
+
+	// Gzip
+	var b bytes.Buffer
+	gz := gzip.NewWriter(&b)
+	if _, err := gz.Write(src); err != nil {
+		return "", err
+	}
+	if err := gz.Flush(); err != nil {
+		panic(err)
+	}
+	if err := gz.Close(); err != nil {
+		return "", err
+	}
+
+	// Base64 Encode
+	return b64.StdEncoding.EncodeToString([]byte(b.String())), nil
+}
+
+func TestFullLoop(t *testing.T) {
+	input := `{
+  "messageType": "DATA_MESSAGE",
+  "owner": "123456789012",
+  "logGroup": "/aws/batch/job",
+  "logStream": "environment--app/11111111-2222-3333-4444-555566667777/88889999-0000-aaa-bbbb-ccccddddeeee",
+  "subscriptionFilters": [
+    "MySubscriptionFilter"
+  ],
+  "logEvents": [
+    {
+      "id": "33418742379011144044923130086453437181614530551221780480",
+      "timestamp": 1498548236012,
+      "message": "some log line"
+    },
+    {
+      "id": "33418742387663833181953011865369295871402094815542181889",
+      "timestamp": 1498548236400,
+      "message": "2017/06/27 07:23:56 Another log line"
+    }
+  ]
+}`
+
+	var leb LogEventBatch
+	err := json.Unmarshal([]byte(input), &leb)
+	assert.NoError(t, err)
+
+	packed, err := pack(leb)
+	assert.NoError(t, err)
+
+	decoded, err := b64.StdEncoding.DecodeString(packed)
+	assert.NoError(t, err)
+
+	output, err := unpack(string(decoded))
+	assert.NoError(t, err)
+
+	assert.Equal(t, leb, output)
+}
+
+func TestSplit(t *testing.T) {
+	input := LogEventBatch{
+		MessageType:         "DATA_MESSAGE",
+		Owner:               "123456789012",
+		LogGroup:            "/aws/batch/job",
+		LogStream:           "env--app/12345678-1234-1234-1234-555566667777/88889999-0000-aaaa-bbbb-ccccddddeeee",
+		SubscriptionFilters: []string{"MySubscriptionFilter"},
+		LogEvents: []LogEvent{
+			{
+				ID:        "99999992379011144044923130086453437181614530551221780480",
+				Timestamp: 1498519943285,
+				Message:   "some log line",
+			},
+			{
+				ID:        "99999992387663833181953011865369295871402094815542181889",
+				Timestamp: 1498519943285,
+				Message:   "another log line",
+			},
+		},
+	}
+	prodEnv := false
+	lines := Split(input, prodEnv)
+	expected := [][]byte{
+		"2017-06-26T23:32:23.285001+00:00 aws-batch env--app/arn%3Aaws%3Aecs%3Aus-east-1%3A999988887777%3Atask%2F12345678-1234-1234-1234-555566667777[1]: some log line",
+		"2017-06-26T23:32:23.285001+00:00 aws-batch env--app/arn%3Aaws%3Aecs%3Aus-east-1%3A999988887777%3Atask%2F12345678-1234-1234-1234-555566667777[1]: another log line",
+	}
+	assert.Equal(t, expected, lines)
+}
+
+func TestSplitFiltersByEnv(t *testing.T) {
+	t.Log("If Split is run with prodEnv == true, it should omit logs with env != production")
+	input := LogEventBatch{
+		MessageType: "DATA_MESSAGE",
+		Owner:       "123456789012",
+		LogGroup:    "/aws/batch/job",
+		LogStream:   "env--app/12345678-1234-1234-1234-555566667777/88889999-0000-aaaa-bbbb-ccccddddeeee",
+		// LogStream:           "environment--app",
+		SubscriptionFilters: []string{"MySubscriptionFilter"},
+		LogEvents: []LogEvent{
+			{
+				ID:        "99999992379011144044923130086453437181614530551221780480",
+				Timestamp: 1498519943285,
+				Message:   "some log line",
+			},
+			{
+				ID:        "99999992387663833181953011865369295871402094815542181889",
+				Timestamp: 1498519943285,
+				Message:   "another log line",
+			},
+		},
+	}
+	prodEnv := true
+	lines := Split(input, prodEnv)
+	expected := [][]byte{}
+	assert.Equal(t, expected, lines)
+
+	t.Log("If Split is run with prodEnv == false, it should omit logs with env == production")
+	input = LogEventBatch{
+		MessageType: "DATA_MESSAGE",
+		Owner:       "123456789012",
+		LogGroup:    "/aws/batch/job",
+		LogStream:   "production--app/12345678-1234-1234-1234-555566667777/88889999-0000-aaaa-bbbb-ccccddddeeee",
+		// LogStream:           "environment--app",
+		SubscriptionFilters: []string{"MySubscriptionFilter"},
+		LogEvents: []LogEvent{
+			{
+				ID:        "99999992379011144044923130086453437181614530551221780480",
+				Timestamp: 1498519943285,
+				Message:   "some log line",
+			},
+			{
+				ID:        "99999992387663833181953011865369295871402094815542181889",
+				Timestamp: 1498519943285,
+				Message:   "another log line",
+			},
+		},
+	}
+	prodEnv = false
+	lines = Split(input, prodEnv)
+	expected = [][]byte{}
+	assert.Equal(t, expected, lines)
+}

From 8bcef6cd91835aa627598d1c85b85a4f0b5f3e83 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Tue, 18 Jul 2017 19:12:46 +0000
Subject: [PATCH 02/16] Log file closed when kclProcessor is done running

---
 batchconsumer/consumer.go | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/batchconsumer/consumer.go b/batchconsumer/consumer.go
index 5b47a2a..1218ab4 100644
--- a/batchconsumer/consumer.go
+++ b/batchconsumer/consumer.go
@@ -35,12 +35,11 @@ type Config struct {
 	CheckpointRetries int
 	// CheckpointRetrySleep the amount of time between checkpoint save attempts
 	CheckpointRetrySleep time.Duration
-
-	logOutput io.Writer
 }
 
 type BatchConsumer struct {
 	kclProcess *kcl.KCLProcess
+	logfile    *os.File
 }
 
 func withDefaults(config Config) Config {
@@ -91,7 +90,6 @@ func NewBatchConsumerFromFiles(
 	if err != nil {
 		log.Fatalf("Unable to create log file: %s", err.Error())
 	}
-	defer file.Close()
 
 	kvlog := logger.New("amazon-kinesis-client-go")
 	kvlog.SetOutput(file)
@@ -105,6 +103,7 @@ func NewBatchConsumerFromFiles(
 
 	return &BatchConsumer{
 		kclProcess: kclProcess,
+		logfile:    file,
 	}
 }
 
@@ -114,4 +113,5 @@ func NewBatchConsumer(config Config, sender Sender) *BatchConsumer {
 
 func (b *BatchConsumer) Start() {
 	b.kclProcess.Run()
+	b.logfile.Close()
 }

From a329c406453c54ba21ba99f8e7d5f008b89343eb Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Tue, 18 Jul 2017 19:13:39 +0000
Subject: [PATCH 03/16] Fixed race condition

---
 batchconsumer/batcher/message_batcher.go | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/batchconsumer/batcher/message_batcher.go b/batchconsumer/batcher/message_batcher.go
index 6aa9a64..4ac1d54 100644
--- a/batchconsumer/batcher/message_batcher.go
+++ b/batchconsumer/batcher/message_batcher.go
@@ -133,8 +133,10 @@ func (b *batcher) batchSize(batch [][]byte) int {
 
 func (b *batcher) flush(batch [][]byte) [][]byte {
 	if len(batch) > 0 {
+		b.mux.Lock()
 		b.sync.SendBatch(batch)
 		b.smallestSeq = SequencePair{nil, 0}
+		b.mux.Unlock()
 	}
 	return [][]byte{}
 }

From 8d273d6a1e520f08c91bbdfa3e0d03e0c7569e32 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Tue, 18 Jul 2017 19:19:40 +0000
Subject: [PATCH 04/16] Fixed and added unit tests

---
 Makefile                                      |   8 +
 batchconsumer/batcher/message_batcher.go      |   1 +
 batchconsumer/batcher/message_batcher_test.go |  46 +++---
 batchconsumer/consumer.go                     |  17 ++-
 batchconsumer/sender.go                       |  18 ++-
 batchconsumer/sync.go                         |   6 +-
 batchconsumer/writer.go                       |  22 +--
 cmd/batchconsumer/main.go                     |  10 +-
 cmd/consumer/main.go                          |  16 +-
 golang.mk                                     | 142 ++++++++++++++++++
 splitter/splitter_test.go                     |   8 +-
 11 files changed, 235 insertions(+), 59 deletions(-)
 create mode 100644 golang.mk

diff --git a/Makefile b/Makefile
index 42d8f1d..50eb390 100644
--- a/Makefile
+++ b/Makefile
@@ -1,6 +1,10 @@
+include golang.mk
+.DEFAULT_GOAL := test # override default goal set in library makefile
+
 SHELL := /bin/bash
 JAR_DIR := jars
 PKG := github.com/Clever/amazon-kinesis-client-go
+PKGS := $(shell go list ./... | grep -v /vendor )
 .PHONY: download_jars run build
 
 URL_PREFIX := http://search.maven.org/remotecontent?filepath=
@@ -49,3 +53,7 @@ run: build download_jars
 
 bench:
 	go test -bench=. github.com/Clever/amazon-kinesis-client-go/decode/
+
+test: $(PKGS)
+$(PKGS): golang-test-all-deps
+	$(call golang-test-all,$@)
diff --git a/batchconsumer/batcher/message_batcher.go b/batchconsumer/batcher/message_batcher.go
index 4ac1d54..244dbc3 100644
--- a/batchconsumer/batcher/message_batcher.go
+++ b/batchconsumer/batcher/message_batcher.go
@@ -7,6 +7,7 @@ import (
 	"time"
 )
 
+// SequencePair a convience way to pass around a Sequence / SubSequence pair
 type SequencePair struct {
 	Sequence    *big.Int
 	SubSequence int
diff --git a/batchconsumer/batcher/message_batcher_test.go b/batchconsumer/batcher/message_batcher_test.go
index 488310d..5f804c0 100644
--- a/batchconsumer/batcher/message_batcher_test.go
+++ b/batchconsumer/batcher/message_batcher_test.go
@@ -37,8 +37,7 @@ func (m *MockSync) waitForFlush(timeout time.Duration) error {
 	}
 }
 
-const mockSequenceNumber = "99999"
-const mockSubSequenceNumber = 12345
+var mockSequence = SequencePair{big.NewInt(99999), 12345}
 
 func TestBatchingByCount(t *testing.T) {
 	var err error
@@ -48,9 +47,9 @@ func TestBatchingByCount(t *testing.T) {
 	batcher := New(sync, time.Hour, 2, 1024*1024)
 
 	t.Log("Batcher respect count limit")
-	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequenceNumber, mockSubSequenceNumber))
-	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequenceNumber, mockSubSequenceNumber))
-	assert.NoError(batcher.AddMessage([]byte("hmmhmm"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequence))
+	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequence))
+	assert.NoError(batcher.AddMessage([]byte("hmmhmm"), mockSequence))
 
 	err = sync.waitForFlush(time.Millisecond * 10)
 	assert.NoError(err)
@@ -73,7 +72,7 @@ func TestBatchingByTime(t *testing.T) {
 	batcher := New(sync, time.Millisecond, 2000000, 1024*1024)
 
 	t.Log("Batcher sends partial batches when time expires")
-	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequence))
 
 	err = sync.waitForFlush(time.Millisecond * 10)
 	assert.NoError(err)
@@ -83,8 +82,8 @@ func TestBatchingByTime(t *testing.T) {
 	assert.Equal("hihi", string(sync.batches[0][0]))
 
 	t.Log("Batcher sends all messsages in partial batches when time expires")
-	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequenceNumber, mockSubSequenceNumber))
-	assert.NoError(batcher.AddMessage([]byte("yoyo"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequence))
+	assert.NoError(batcher.AddMessage([]byte("yoyo"), mockSequence))
 
 	err = sync.waitForFlush(time.Millisecond * 10)
 	assert.NoError(err)
@@ -107,7 +106,7 @@ func TestBatchingBySize(t *testing.T) {
 	batcher := New(sync, time.Hour, 2000000, 8)
 
 	t.Log("Large messages are sent immediately")
-	assert.NoError(batcher.AddMessage([]byte("hellohello"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("hellohello"), mockSequence))
 
 	err = sync.waitForFlush(time.Millisecond * 10)
 	assert.NoError(err)
@@ -117,8 +116,8 @@ func TestBatchingBySize(t *testing.T) {
 	assert.Equal("hellohello", string(sync.batches[0][0]))
 
 	t.Log("Batcher tries not to exceed size limit")
-	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequenceNumber, mockSubSequenceNumber))
-	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("heyhey"), mockSequence))
+	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequence))
 
 	err = sync.waitForFlush(time.Millisecond * 10)
 	assert.NoError(err)
@@ -128,7 +127,7 @@ func TestBatchingBySize(t *testing.T) {
 	assert.Equal("heyhey", string(sync.batches[1][0]))
 
 	t.Log("Batcher sends messages that didn't fit in previous batch")
-	assert.NoError(batcher.AddMessage([]byte("yoyo"), mockSequenceNumber, mockSubSequenceNumber)) // At this point "hihi" is in the batch
+	assert.NoError(batcher.AddMessage([]byte("yoyo"), mockSequence)) // At this point "hihi" is in the batch
 
 	err = sync.waitForFlush(time.Millisecond * 10)
 	assert.NoError(err)
@@ -139,7 +138,7 @@ func TestBatchingBySize(t *testing.T) {
 	assert.Equal("yoyo", string(sync.batches[2][1]))
 
 	t.Log("Batcher doesn't send partial batches")
-	assert.NoError(batcher.AddMessage([]byte("okok"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("okok"), mockSequence))
 
 	err = sync.waitForFlush(time.Millisecond * 10)
 	assert.Error(err)
@@ -153,7 +152,7 @@ func TestFlushing(t *testing.T) {
 	batcher := New(sync, time.Hour, 2000000, 1024*1024)
 
 	t.Log("Calling flush sends pending messages")
-	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequenceNumber, mockSubSequenceNumber))
+	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequence))
 
 	err = sync.waitForFlush(time.Millisecond * 10)
 	assert.Error(err)
@@ -176,7 +175,7 @@ func TestSendingEmpty(t *testing.T) {
 	batcher := New(sync, time.Second, 10, 1024*1024)
 
 	t.Log("An error is returned when an empty message is sent")
-	err = batcher.AddMessage([]byte{}, mockSequenceNumber, mockSubSequenceNumber)
+	err = batcher.AddMessage([]byte{}, mockSequence)
 	assert.Error(err)
 }
 
@@ -187,26 +186,29 @@ func TestUpdatingSequence(t *testing.T) {
 	batcher := New(sync, time.Second, 10, 1024*1024).(*batcher)
 
 	t.Log("Initally, smallestSeq is undefined")
+	assert.Nil(batcher.SmallestSequencePair().Sequence)
+
 	expected := new(big.Int)
-	assert.Nil(batcher.smallestSeq.Sequence)
 
 	t.Log("After AddMessage (seq=1), smallestSeq = 1")
-	assert.NoError(batcher.AddMessage([]byte("abab"), "1", mockSubSequenceNumber))
-	sync.waitForFlush(time.Minute)
+	batcher.updateSequenceNumbers(SequencePair{big.NewInt(1), 1234})
 	expected.SetInt64(1)
 	seq := batcher.SmallestSequencePair()
 	assert.True(expected.Cmp(seq.Sequence) == 0)
 
 	t.Log("After AddMessage (seq=2), smallestSeq = 1 -- not updated because higher")
-	assert.NoError(batcher.AddMessage([]byte("cdcd"), "2", mockSubSequenceNumber))
-	sync.waitForFlush(time.Minute)
+	batcher.updateSequenceNumbers(SequencePair{big.NewInt(2), 1234})
 	seq = batcher.SmallestSequencePair()
 	assert.True(expected.Cmp(seq.Sequence) == 0)
 
 	t.Log("After AddMessage (seq=1), smallestSeq = 0")
-	assert.NoError(batcher.AddMessage([]byte("efef"), "0", mockSubSequenceNumber))
-	sync.waitForFlush(time.Minute)
+	batcher.updateSequenceNumbers(SequencePair{big.NewInt(0), 1234})
 	expected.SetInt64(0)
 	seq = batcher.SmallestSequencePair()
 	assert.True(expected.Cmp(seq.Sequence) == 0)
+
+	t.Log("Flushing batch clears smallest sequence pair")
+	assert.NoError(batcher.AddMessage([]byte("cdcd"), SequencePair{big.NewInt(2), 1234}))
+	sync.waitForFlush(time.Minute)
+	assert.Nil(batcher.SmallestSequencePair().Sequence)
 }
diff --git a/batchconsumer/consumer.go b/batchconsumer/consumer.go
index 1218ab4..650f422 100644
--- a/batchconsumer/consumer.go
+++ b/batchconsumer/consumer.go
@@ -11,7 +11,11 @@ import (
 	"github.com/Clever/amazon-kinesis-client-go/kcl"
 )
 
+// Config used for BatchConsumer constructor.  Any empty fields are populated with defaults.
 type Config struct {
+	// DeployEnv the name of the deployment environment
+	DeployEnv string
+
 	// LogFile where consumer errors and failed log lines are saved
 	LogFile string
 	// FlushInterval is how often accumulated messages should be bulk put to firehose
@@ -21,15 +25,12 @@ type Config struct {
 	// FlushSize is the size of a batch in bytes that triggers a push to firehose. Max batch size is 4Mb (4*1024*1024), see: http://docs.aws.amazon.com/firehose/latest/dev/limits.html
 	FlushSize int
 
-	// DeployEnv the name of the deployment enviornment
-	DeployEnv string
-
 	// ReadRateLimit the number of records read per seconds
 	ReadRateLimit int
 	// ReadBurstLimit the max number of tokens allowed by rate limiter
 	ReadBurstLimit int
 
-	// CheckpointFreq the frequence in which a checkpoint is saved
+	// CheckpointFreq the frequency in which a checkpoint is saved
 	CheckpointFreq time.Duration
 	// CheckpointRetries the number of times the consumer will try to save a checkpoint
 	CheckpointRetries int
@@ -37,6 +38,7 @@ type Config struct {
 	CheckpointRetrySleep time.Duration
 }
 
+// BatchConsumer is responsible for marshalling
 type BatchConsumer struct {
 	kclProcess *kcl.KCLProcess
 	logfile    *os.File
@@ -81,6 +83,8 @@ func withDefaults(config Config) Config {
 	return config
 }
 
+// NewBatchConsumerFromFiles creates a batch consumer.  Readers/writers provided are used for
+// interprocess communication.
 func NewBatchConsumerFromFiles(
 	config Config, sender Sender, input io.Reader, output, errFile io.Writer,
 ) *BatchConsumer {
@@ -94,7 +98,7 @@ func NewBatchConsumerFromFiles(
 	kvlog := logger.New("amazon-kinesis-client-go")
 	kvlog.SetOutput(file)
 
-	wrt := &BatchedWriter{
+	wrt := &batchedWriter{
 		config: config,
 		log:    kvlog,
 		sender: sender,
@@ -107,10 +111,13 @@ func NewBatchConsumerFromFiles(
 	}
 }
 
+// NewBatchConsumer creates batch consumer.  Stdin, Stdout, and Stderr are used for interprocess
+// communication.
 func NewBatchConsumer(config Config, sender Sender) *BatchConsumer {
 	return NewBatchConsumerFromFiles(config, sender, os.Stdin, os.Stdout, os.Stderr)
 }
 
+// Start when called, the consumer begins ingesting messages.  This function blocks.
 func (b *BatchConsumer) Start() {
 	b.kclProcess.Run()
 	b.logfile.Close()
diff --git a/batchconsumer/sender.go b/batchconsumer/sender.go
index 5ab6f53..c26be76 100644
--- a/batchconsumer/sender.go
+++ b/batchconsumer/sender.go
@@ -5,22 +5,38 @@ import (
 	"fmt"
 )
 
+// ErrLogIgnored should be returned by EncodeLog when it encounters a log line that will not be
+// consumed
 var ErrLogIgnored = errors.New("Log intentionally skipped by sender")
 
+// Sender an interface needed for batch consumer implementations
 type Sender interface {
+	// EncodeLog receives a raw log line.  It's expected to return an appropriately formated log
+	// as well as a list of tags for that log line.  A tag corresponds to a batch that it'll be
+	// put into.  Typically tags are series names.
+	// If a log line will not be consumed, EncodeLog should return a ErrLogIgnored error.
 	EncodeLog(rawlog []byte) (log []byte, tags []string, err error)
+	// SendBatch receives a batch of log lines.  All log lines were given the specified tag by
+	// EncodeLog
 	SendBatch(batch [][]byte, tag string) error
 }
 
+// PartialOutputError should be returned by SendBatch implementations when a handful of log lines
+// couldn't be sent to an output.  It's expected that SendBatch implementations do a "best effort"
+// before returning this error.
 type PartialOutputError struct {
+	// Message is a description of error that occurred
 	Message string
-	Logs    [][]byte
+	// Logs a list of logs that failed to be sent
+	Logs [][]byte
 }
 
 func (c PartialOutputError) Error() string {
 	return fmt.Sprintf("%d failed logs. %s", len(c.Logs), c.Message)
 }
 
+// CatastrophicOutputError should be returned by SendBatch implementations when the output is
+// unreachable.  Returning this error causes this container to exit without checkpointing.
 type CatastrophicOutputError struct {
 	Message string
 }
diff --git a/batchconsumer/sync.go b/batchconsumer/sync.go
index cd77a59..517a943 100644
--- a/batchconsumer/sync.go
+++ b/batchconsumer/sync.go
@@ -1,11 +1,11 @@
 package batchconsumer
 
-type BatcherSync struct {
+type batcherSync struct {
 	tag    string
-	writer *BatchedWriter
+	writer *batchedWriter
 }
 
-func (b *BatcherSync) SendBatch(batch [][]byte) {
+func (b *batcherSync) SendBatch(batch [][]byte) {
 	b.writer.SendBatch(batch, b.tag)
 	b.writer.CheckPointBatch(b.tag)
 }
diff --git a/batchconsumer/writer.go b/batchconsumer/writer.go
index 17c129f..95bb7da 100644
--- a/batchconsumer/writer.go
+++ b/batchconsumer/writer.go
@@ -16,7 +16,7 @@ import (
 	"github.com/Clever/amazon-kinesis-client-go/splitter"
 )
 
-type BatchedWriter struct {
+type batchedWriter struct {
 	config Config
 	sender Sender
 	log    kv.KayveeLogger
@@ -31,7 +31,7 @@ type BatchedWriter struct {
 	lastProcessedSeq batcher.SequencePair
 }
 
-func (b *BatchedWriter) Initialize(shardID string, checkpointer *kcl.Checkpointer) error {
+func (b *batchedWriter) Initialize(shardID string, checkpointer *kcl.Checkpointer) error {
 	b.batchers = map[string]batcher.Batcher{}
 	b.shardID = shardID
 	b.checkpointChan = make(chan batcher.SequencePair)
@@ -43,7 +43,7 @@ func (b *BatchedWriter) Initialize(shardID string, checkpointer *kcl.Checkpointe
 }
 
 // handleCheckpointError returns true if checkout should be tried again.  Returns false otherwise.
-func (b *BatchedWriter) handleCheckpointError(err error) bool {
+func (b *batchedWriter) handleCheckpointError(err error) bool {
 	if err == nil {
 		return false
 	}
@@ -71,7 +71,7 @@ func (b *BatchedWriter) handleCheckpointError(err error) bool {
 	return true
 }
 
-func (b *BatchedWriter) startCheckpointListener(
+func (b *batchedWriter) startCheckpointListener(
 	checkpointer *kcl.Checkpointer, checkpointChan <-chan batcher.SequencePair,
 ) {
 	lastCheckpoint := time.Now()
@@ -113,15 +113,15 @@ func (b *BatchedWriter) startCheckpointListener(
 	}()
 }
 
-func (b *BatchedWriter) createBatcher(tag string) batcher.Batcher {
-	sync := &BatcherSync{
+func (b *batchedWriter) createBatcher(tag string) batcher.Batcher {
+	sync := &batcherSync{
 		tag:    tag,
 		writer: b,
 	}
 	return batcher.New(sync, b.config.FlushInterval, b.config.FlushCount, b.config.FlushSize)
 }
 
-func (b *BatchedWriter) splitMessageIfNecessary(record []byte) ([][]byte, error) {
+func (b *batchedWriter) splitMessageIfNecessary(record []byte) ([][]byte, error) {
 	// We handle two types of records:
 	// - records emitted from CWLogs Subscription
 	// - records emiited from KPL
@@ -134,7 +134,7 @@ func (b *BatchedWriter) splitMessageIfNecessary(record []byte) ([][]byte, error)
 	return splitter.GetMessagesFromGzippedInput(record, b.config.DeployEnv == "production")
 }
 
-func (b *BatchedWriter) ProcessRecords(records []kcl.Record) error {
+func (b *batchedWriter) ProcessRecords(records []kcl.Record) error {
 	curSequence := b.lastProcessedSeq
 
 	for _, record := range records {
@@ -194,7 +194,7 @@ func (b *BatchedWriter) ProcessRecords(records []kcl.Record) error {
 	return nil
 }
 
-func (b *BatchedWriter) CheckPointBatch(tag string) {
+func (b *batchedWriter) CheckPointBatch(tag string) {
 	smallest := b.lastProcessedSeq
 
 	for name, batch := range b.batchers {
@@ -218,7 +218,7 @@ func (b *BatchedWriter) CheckPointBatch(tag string) {
 	b.checkpointChan <- smallest
 }
 
-func (b *BatchedWriter) SendBatch(batch [][]byte, tag string) {
+func (b *batchedWriter) SendBatch(batch [][]byte, tag string) {
 	b.log.Info("sent-batch")
 	err := b.sender.SendBatch(batch, tag)
 	switch e := err.(type) {
@@ -237,7 +237,7 @@ func (b *BatchedWriter) SendBatch(batch [][]byte, tag string) {
 	}
 }
 
-func (b *BatchedWriter) Shutdown(reason string) error {
+func (b *batchedWriter) Shutdown(reason string) error {
 	if reason == "TERMINATE" {
 		b.log.InfoD("terminate-signal", kv.M{"shard-id": b.shardID})
 		for _, batch := range b.batchers {
diff --git a/cmd/batchconsumer/main.go b/cmd/batchconsumer/main.go
index 0d91b1f..0285139 100644
--- a/cmd/batchconsumer/main.go
+++ b/cmd/batchconsumer/main.go
@@ -35,16 +35,16 @@ func main() {
 	output, file := createDummyOutput()
 	defer file.Close()
 
-	wrt := &ExampleWriter{output: output}
-	consumer := kbc.NewBatchConsumer(config, wrt)
+	sender := &exampleSender{output: output}
+	consumer := kbc.NewBatchConsumer(config, sender)
 	consumer.Start()
 }
 
-type ExampleWriter struct {
+type exampleSender struct {
 	output logger.KayveeLogger
 }
 
-func (e *ExampleWriter) EncodeLog(rawlog []byte) ([]byte, []string, error) {
+func (e *exampleSender) EncodeLog(rawlog []byte) ([]byte, []string, error) {
 	if len(rawlog)%5 == 2 {
 		return nil, nil, kbc.ErrLogIgnored
 	}
@@ -55,7 +55,7 @@ func (e *ExampleWriter) EncodeLog(rawlog []byte) ([]byte, []string, error) {
 	return []byte(line), []string{tag1}, nil
 }
 
-func (e *ExampleWriter) SendBatch(batch [][]byte, tag string) error {
+func (e *exampleSender) SendBatch(batch [][]byte, tag string) error {
 	for idx, line := range batch {
 		e.output.InfoD(tag, logger.M{"idx": idx, "line": string(line)})
 	}
diff --git a/cmd/consumer/main.go b/cmd/consumer/main.go
index 22f8ccc..77a75c9 100644
--- a/cmd/consumer/main.go
+++ b/cmd/consumer/main.go
@@ -9,7 +9,7 @@ import (
 	"github.com/Clever/amazon-kinesis-client-go/kcl"
 )
 
-type SampleRecordProcessor struct {
+type sampleRecordProcessor struct {
 	checkpointer      *kcl.Checkpointer
 	checkpointRetries int
 	checkpointFreq    time.Duration
@@ -18,25 +18,25 @@ type SampleRecordProcessor struct {
 	lastCheckpoint    time.Time
 }
 
-func New() *SampleRecordProcessor {
-	return &SampleRecordProcessor{
+func newSampleRecordProcessor() *sampleRecordProcessor {
+	return &sampleRecordProcessor{
 		checkpointRetries: 5,
 		checkpointFreq:    60 * time.Second,
 	}
 }
 
-func (srp *SampleRecordProcessor) Initialize(shardID string, checkpointer *kcl.Checkpointer) error {
+func (srp *sampleRecordProcessor) Initialize(shardID string, checkpointer *kcl.Checkpointer) error {
 	srp.lastCheckpoint = time.Now()
 	srp.checkpointer = checkpointer
 	return nil
 }
 
-func (srp *SampleRecordProcessor) shouldUpdateSequence(sequenceNumber *big.Int, subSequenceNumber int) bool {
+func (srp *sampleRecordProcessor) shouldUpdateSequence(sequenceNumber *big.Int, subSequenceNumber int) bool {
 	return srp.largestSeq == nil || sequenceNumber.Cmp(srp.largestSeq) == 1 ||
 		(sequenceNumber.Cmp(srp.largestSeq) == 0 && subSequenceNumber > srp.largestSubSeq)
 }
 
-func (srp *SampleRecordProcessor) ProcessRecords(records []kcl.Record) error {
+func (srp *sampleRecordProcessor) ProcessRecords(records []kcl.Record) error {
 	for _, record := range records {
 		seqNumber := new(big.Int)
 		if _, ok := seqNumber.SetString(record.SequenceNumber, 10); !ok {
@@ -56,7 +56,7 @@ func (srp *SampleRecordProcessor) ProcessRecords(records []kcl.Record) error {
 	return nil
 }
 
-func (srp *SampleRecordProcessor) Shutdown(reason string) error {
+func (srp *sampleRecordProcessor) Shutdown(reason string) error {
 	if reason == "TERMINATE" {
 		fmt.Fprintf(os.Stderr, "Was told to terminate, will attempt to checkpoint.\n")
 		srp.checkpointer.Shutdown()
@@ -72,6 +72,6 @@ func main() {
 		panic(err)
 	}
 	defer f.Close()
-	kclProcess := kcl.New(os.Stdin, os.Stdout, os.Stderr, New())
+	kclProcess := kcl.New(os.Stdin, os.Stdout, os.Stderr, newSampleRecordProcessor())
 	kclProcess.Run()
 }
diff --git a/golang.mk b/golang.mk
new file mode 100644
index 0000000..602c777
--- /dev/null
+++ b/golang.mk
@@ -0,0 +1,142 @@
+# This is the default Clever Golang Makefile.
+# It is stored in the dev-handbook repo, github.com/Clever/dev-handbook
+# Please do not alter this file directly.
+GOLANG_MK_VERSION := 0.1.4
+
+SHELL := /bin/bash
+.PHONY: golang-godep-vendor golang-test-deps $(GODEP)
+
+# if the gopath includes several directories, use only the first
+GOPATH=$(shell echo $$GOPATH | cut -d: -f1)
+
+# This block checks and confirms that the proper Go toolchain version is installed.
+# arg1: golang version
+define golang-version-check
+GOVERSION := $(shell go version | grep $(1))
+_ := $(if \
+	$(shell go version | grep $(1)), \
+	@echo "", \
+	$(error "must be running Go version $(1)"))
+endef
+
+export GO15VENDOREXPERIMENT=1
+
+# FGT is a utility that exits with 1 whenever any stderr/stdout output is recieved.
+FGT := $(GOPATH)/bin/fgt
+$(FGT):
+	go get github.com/GeertJohan/fgt
+
+# Godep is a tool used to manage Golang dependencies in the style of the Go 1.5
+# vendoring experiment.
+GODEP := $(GOPATH)/bin/godep
+$(GODEP):
+	go get -u github.com/tools/godep
+
+# Golint is a tool for linting Golang code for common errors.
+GOLINT := $(GOPATH)/bin/golint
+$(GOLINT):
+	go get github.com/golang/lint/golint
+
+# golang-vendor-deps installs all dependencies needed for different test cases.
+golang-godep-vendor-deps: $(GODEP)
+
+# golang-godep-vendor is a target for saving dependencies with the godep tool
+# to the vendor/ directory. All nested vendor/ directories are deleted as they
+# are not handled well by the Go toolchain.
+# arg1: pkg path
+define golang-godep-vendor
+$(GODEP) save $(1)
+@# remove any nested vendor directories
+find vendor/ -path '*/vendor' -type d | xargs -IX rm -r X
+endef
+
+# golang-fmt-deps requires the FGT tool for checking output
+golang-fmt-deps: $(FGT)
+
+# golang-fmt checks that all golang files in the pkg are formatted correctly.
+# arg1: pkg path
+define golang-fmt
+@echo "FORMATTING $(1)..."
+@$(FGT) gofmt -l=true $(GOPATH)/src/$(1)/*.go
+endef
+
+# golang-lint-deps requires the golint tool for golang linting.
+golang-lint-deps: $(GOLINT)
+
+# golang-lint calls golint on all golang files in the pkg.
+# arg1: pkg path
+define golang-lint
+@echo "LINTING $(1)..."
+@find $(GOPATH)/src/$(1)/*.go -type f | grep -v gen_ | xargs $(GOLINT)
+endef
+
+# golang-lint-deps-strict requires the golint tool for golang linting.
+golang-lint-deps-strict: $(GOLINT) $(FGT)
+
+# golang-lint-strict calls golint on all golang files in the pkg and fails if any lint
+# errors are found.
+# arg1: pkg path
+define golang-lint-strict
+@echo "LINTING $(1)..."
+@find $(GOPATH)/src/$(1)/*.go -type f | grep -v gen_ | xargs $(FGT) $(GOLINT)
+endef
+
+# golang-test-deps is here for consistency
+golang-test-deps:
+
+# golang-test uses the Go toolchain to run all tests in the pkg.
+# arg1: pkg path
+define golang-test
+@echo "TESTING $(1)..."
+@go test -v $(1)
+endef
+
+# golang-test-strict-deps is here for consistency
+golang-test-strict-deps:
+
+# golang-test-strict uses the Go toolchain to run all tests in the pkg with the race flag
+# arg1: pkg path
+define golang-test-strict
+@echo "TESTING $(1)..."
+@go test -v -race $(1)
+endef
+
+# golang-vet-deps is here for consistency
+golang-vet-deps:
+
+# golang-vet uses the Go toolchain to vet all the pkg for common mistakes.
+# arg1: pkg path
+define golang-vet
+@echo "VETTING $(1)..."
+@go vet $(GOPATH)/src/$(1)/*.go
+endef
+
+# golang-test-all-deps installs all dependencies needed for different test cases.
+golang-test-all-deps: golang-fmt-deps golang-lint-deps golang-test-deps golang-vet-deps
+
+# golang-test-all calls fmt, lint, vet and test on the specified pkg.
+# arg1: pkg path
+define golang-test-all
+$(call golang-fmt,$(1))
+$(call golang-lint,$(1))
+$(call golang-vet,$(1))
+$(call golang-test,$(1))
+endef
+
+# golang-test-all-strict-deps: installs all dependencies needed for different test cases.
+golang-test-all-strict-deps: golang-fmt-deps golang-lint-deps-strict golang-test-strict-deps golang-vet-deps
+
+# golang-test-all-strict calls fmt, lint, vet and test on the specified pkg with strict
+# requirements that no errors are thrown while linting.
+# arg1: pkg path
+define golang-test-all-strict
+$(call golang-fmt,$(1))
+$(call golang-lint-strict,$(1))
+$(call golang-vet,$(1))
+$(call golang-test-strict,$(1))
+endef
+
+# golang-update-makefile downloads latest version of golang.mk
+golang-update-makefile:
+	@wget https://raw.githubusercontent.com/Clever/dev-handbook/master/make/golang.mk -O /tmp/golang.mk 2>/dev/null
+	@if ! grep -q $(GOLANG_MK_VERSION) /tmp/golang.mk; then cp /tmp/golang.mk golang.mk && echo "golang.mk updated"; else echo "golang.mk is up-to-date"; fi
diff --git a/splitter/splitter_test.go b/splitter/splitter_test.go
index f85ebfa..d6c5cda 100644
--- a/splitter/splitter_test.go
+++ b/splitter/splitter_test.go
@@ -16,7 +16,7 @@ func TestUnpacking(t *testing.T) {
 	decoded, err := b64.StdEncoding.DecodeString(input)
 	assert.NoError(t, err)
 
-	output, err := unpack(string(decoded))
+	output, err := unpack(decoded)
 	assert.NoError(t, err)
 
 	expectedOutput := LogEventBatch{
@@ -92,7 +92,7 @@ func TestFullLoop(t *testing.T) {
 	decoded, err := b64.StdEncoding.DecodeString(packed)
 	assert.NoError(t, err)
 
-	output, err := unpack(string(decoded))
+	output, err := unpack(decoded)
 	assert.NoError(t, err)
 
 	assert.Equal(t, leb, output)
@@ -121,8 +121,8 @@ func TestSplit(t *testing.T) {
 	prodEnv := false
 	lines := Split(input, prodEnv)
 	expected := [][]byte{
-		"2017-06-26T23:32:23.285001+00:00 aws-batch env--app/arn%3Aaws%3Aecs%3Aus-east-1%3A999988887777%3Atask%2F12345678-1234-1234-1234-555566667777[1]: some log line",
-		"2017-06-26T23:32:23.285001+00:00 aws-batch env--app/arn%3Aaws%3Aecs%3Aus-east-1%3A999988887777%3Atask%2F12345678-1234-1234-1234-555566667777[1]: another log line",
+		[]byte("2017-06-26T23:32:23.285001+00:00 aws-batch env--app/arn%3Aaws%3Aecs%3Aus-east-1%3A999988887777%3Atask%2F12345678-1234-1234-1234-555566667777[1]: some log line"),
+		[]byte("2017-06-26T23:32:23.285001+00:00 aws-batch env--app/arn%3Aaws%3Aecs%3Aus-east-1%3A999988887777%3Atask%2F12345678-1234-1234-1234-555566667777[1]: another log line"),
 	}
 	assert.Equal(t, expected, lines)
 }

From 6d4df426a97f79328ed5c6ca417694de90bbc54b Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Tue, 18 Jul 2017 19:31:06 +0000
Subject: [PATCH 05/16] Added install deps step to circle yaml

---
 Makefile   | 6 ++++++
 circle.yml | 1 +
 glide.yaml | 2 ++
 3 files changed, 9 insertions(+)

diff --git a/Makefile b/Makefile
index 50eb390..7b6fb74 100644
--- a/Makefile
+++ b/Makefile
@@ -57,3 +57,9 @@ bench:
 test: $(PKGS)
 $(PKGS): golang-test-all-deps
 	$(call golang-test-all,$@)
+
+$(GOPATH)/bin/glide:
+	@go get github.com/Masterminds/glide
+
+install_deps: $(GOPATH)/bin/glide
+	@$(GOPATH)/bin/glide install
diff --git a/circle.yml b/circle.yml
index 8f15e2b..f6f470e 100644
--- a/circle.yml
+++ b/circle.yml
@@ -9,6 +9,7 @@ checkout:
   - $HOME/ci-scripts/circleci/golang-move-project
 compile:
   override:
+  - make install_deps
   - make build
 test:
   override:
diff --git a/glide.yaml b/glide.yaml
index a96cd81..312e7db 100644
--- a/glide.yaml
+++ b/glide.yaml
@@ -18,3 +18,5 @@ testImport:
 - package: github.com/stretchr/testify
   subpackages:
   - assert
+- package: gopkg.in/Clever/kayvee-go.v6
+  version: ^6.0.0

From 3f42cb5e4af4037e2007e135219bb873ba8f5167 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Tue, 18 Jul 2017 19:52:26 +0000
Subject: [PATCH 06/16] Created IsLessThan method to SequencePair to make code
 more readable

---
 batchconsumer/batcher/message_batcher.go | 25 +++++++++++++++++++-----
 batchconsumer/writer.go                  |  5 +----
 2 files changed, 21 insertions(+), 9 deletions(-)

diff --git a/batchconsumer/batcher/message_batcher.go b/batchconsumer/batcher/message_batcher.go
index 244dbc3..b57a6e5 100644
--- a/batchconsumer/batcher/message_batcher.go
+++ b/batchconsumer/batcher/message_batcher.go
@@ -13,6 +13,25 @@ type SequencePair struct {
 	SubSequence int
 }
 
+func (s SequencePair) IsLessThan(pair SequencePair) bool {
+	if s.Sequence == nil {
+		return false
+	}
+	if pair.Sequence == nil {
+		return true
+	}
+
+	cmp := s.Sequence.Cmp(pair.Sequence)
+	if cmp == -1 {
+		return true
+	}
+	if cmp == 1 {
+		return false
+	}
+
+	return s.SubSequence < pair.SubSequence
+}
+
 // Sync is used to allow a writer to syncronize with the batcher.
 // The writer declares how to write messages (via its `SendBatch` method), while the batcher
 // keeps track of messages written
@@ -110,11 +129,7 @@ func (b *batcher) updateSequenceNumbers(pair SequencePair) {
 	b.mux.Lock()
 	defer b.mux.Unlock()
 
-	isSmaller := b.smallestSeq.Sequence == nil ||
-		pair.Sequence.Cmp(b.smallestSeq.Sequence) == -1 ||
-		(pair.Sequence.Cmp(b.smallestSeq.Sequence) == 0 &&
-			pair.SubSequence < b.smallestSeq.SubSequence)
-	if isSmaller {
+	if pair.IsLessThan(b.smallestSeq) {
 		b.smallestSeq = SequencePair{pair.Sequence, pair.SubSequence}
 	}
 }
diff --git a/batchconsumer/writer.go b/batchconsumer/writer.go
index 95bb7da..a703880 100644
--- a/batchconsumer/writer.go
+++ b/batchconsumer/writer.go
@@ -207,10 +207,7 @@ func (b *batchedWriter) CheckPointBatch(tag string) {
 			continue
 		}
 
-		isSmaller := smallest.Sequence == nil || // smallest.Sequence means batch just flushed
-			pair.Sequence.Cmp(smallest.Sequence) == -1 ||
-			(pair.Sequence.Cmp(smallest.Sequence) == 0 && pair.SubSequence < smallest.SubSequence)
-		if isSmaller {
+		if pair.IsLessThan(smallest) {
 			smallest = pair
 		}
 	}

From 906f6b94fcdf4e8f94c36e2170bfda7e2f4e0439 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Tue, 18 Jul 2017 19:53:25 +0000
Subject: [PATCH 07/16] Made ReadBurstLimit relative to read rate limit

---
 batchconsumer/consumer.go | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/batchconsumer/consumer.go b/batchconsumer/consumer.go
index 650f422..4bac1e8 100644
--- a/batchconsumer/consumer.go
+++ b/batchconsumer/consumer.go
@@ -66,8 +66,8 @@ func withDefaults(config Config) Config {
 	if config.ReadRateLimit == 0 {
 		config.ReadRateLimit = 300
 	}
-	if config.ReadRateLimit == 0 {
-		config.ReadRateLimit = int(300 * 1.2)
+	if config.ReadBurstLimit == 0 {
+		config.ReadBurstLimit = int(float64(config.ReadRateLimit)*1.2 + 0.5)
 	}
 
 	if config.CheckpointFreq == 0 {

From f116c752f5269caedf250f27405fa3ce3529a564 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Wed, 19 Jul 2017 00:20:20 +0000
Subject: [PATCH 08/16] Added unit test to ensure correct error is returned

---
 batchconsumer/batcher/message_batcher_test.go | 1 +
 1 file changed, 1 insertion(+)

diff --git a/batchconsumer/batcher/message_batcher_test.go b/batchconsumer/batcher/message_batcher_test.go
index 5f804c0..fc9c6fe 100644
--- a/batchconsumer/batcher/message_batcher_test.go
+++ b/batchconsumer/batcher/message_batcher_test.go
@@ -177,6 +177,7 @@ func TestSendingEmpty(t *testing.T) {
 	t.Log("An error is returned when an empty message is sent")
 	err = batcher.AddMessage([]byte{}, mockSequence)
 	assert.Error(err)
+	assert.Equal(err.Error(), "Empty messages can't be sent")
 }
 
 func TestUpdatingSequence(t *testing.T) {

From 1b2afcafc0e56d6eaba9d38158702a68bac61e68 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Wed, 19 Jul 2017 00:21:31 +0000
Subject: [PATCH 09/16] Renamed methods to be more generic and to remove
 reference to logs

---
 batchconsumer/sender.go   | 46 +++++++++++++++++++--------------------
 batchconsumer/writer.go   | 10 ++++-----
 cmd/batchconsumer/main.go | 10 ++++-----
 3 files changed, 33 insertions(+), 33 deletions(-)

diff --git a/batchconsumer/sender.go b/batchconsumer/sender.go
index c26be76..03e0421 100644
--- a/batchconsumer/sender.go
+++ b/batchconsumer/sender.go
@@ -5,42 +5,42 @@ import (
 	"fmt"
 )
 
-// ErrLogIgnored should be returned by EncodeLog when it encounters a log line that will not be
-// consumed
-var ErrLogIgnored = errors.New("Log intentionally skipped by sender")
+// ErrMessageIgnored should be returned by ProcessMessage when it encounters a message that will
+// not be consumed
+var ErrMessageIgnored = errors.New("Message intentionally skipped by sender")
 
 // Sender an interface needed for batch consumer implementations
 type Sender interface {
-	// EncodeLog receives a raw log line.  It's expected to return an appropriately formated log
-	// as well as a list of tags for that log line.  A tag corresponds to a batch that it'll be
-	// put into.  Typically tags are series names.
-	// If a log line will not be consumed, EncodeLog should return a ErrLogIgnored error.
-	EncodeLog(rawlog []byte) (log []byte, tags []string, err error)
-	// SendBatch receives a batch of log lines.  All log lines were given the specified tag by
-	// EncodeLog
+	// ProcessMessage receives a raw message and is expected to return an appropriately formatted
+	// message as well as a list of tags for that log line.  A tag corresponds to a batch that
+	// it'll be put into.  Typically tags are series names.
+	// If a message will not be consumed, ProcessMessage should return a ErrMessageIgnored error.
+	ProcessMessage(rawmsg []byte) (msg []byte, tags []string, err error)
+	// SendBatch receives a batch of messages.  All messages were given the specified tag by
+	// ProcessMessage
 	SendBatch(batch [][]byte, tag string) error
 }
 
-// PartialOutputError should be returned by SendBatch implementations when a handful of log lines
+// PartialSendBatchError should be returned by SendBatch implementations when some messages
 // couldn't be sent to an output.  It's expected that SendBatch implementations do a "best effort"
 // before returning this error.
-type PartialOutputError struct {
-	// Message is a description of error that occurred
-	Message string
-	// Logs a list of logs that failed to be sent
-	Logs [][]byte
+type PartialSendBatchError struct {
+	// ErrMessage is a description of error that occurred
+	ErrMessage string
+	// FailedMessages a list of messages that failed to be sent
+	FailedMessages [][]byte
 }
 
-func (c PartialOutputError) Error() string {
-	return fmt.Sprintf("%d failed logs. %s", len(c.Logs), c.Message)
+func (c PartialSendBatchError) Error() string {
+	return fmt.Sprintf("%d failed logs. %s", len(c.FailedMessages), c.ErrMessage)
 }
 
-// CatastrophicOutputError should be returned by SendBatch implementations when the output is
+// CatastrophicSendBatchError should be returned by SendBatch implementations when the output is
 // unreachable.  Returning this error causes this container to exit without checkpointing.
-type CatastrophicOutputError struct {
-	Message string
+type CatastrophicSendBatchError struct {
+	ErrMessage string
 }
 
-func (c CatastrophicOutputError) Error() string {
-	return c.Message
+func (c CatastrophicSendBatchError) Error() string {
+	return fmt.Sprintf("catastrophic SendBatch error: %s", c.ErrMessage)
 }
diff --git a/batchconsumer/writer.go b/batchconsumer/writer.go
index a703880..6e3a3a7 100644
--- a/batchconsumer/writer.go
+++ b/batchconsumer/writer.go
@@ -159,8 +159,8 @@ func (b *batchedWriter) ProcessRecords(records []kcl.Record) error {
 			return err
 		}
 		for _, rawlog := range rawlogs {
-			log, tags, err := b.sender.EncodeLog(rawlog)
-			if err == ErrLogIgnored {
+			log, tags, err := b.sender.ProcessMessage(rawlog)
+			if err == ErrMessageIgnored {
 				continue // Skip message
 			} else if err != nil {
 				return err
@@ -220,12 +220,12 @@ func (b *batchedWriter) SendBatch(batch [][]byte, tag string) {
 	err := b.sender.SendBatch(batch, tag)
 	switch e := err.(type) {
 	case nil: // Do nothing
-	case PartialOutputError:
+	case PartialSendBatchError:
 		b.log.ErrorD("send-batch", kv.M{"msg": e.Error()})
-		for _, line := range e.Logs {
+		for _, line := range e.FailedMessages {
 			b.log.ErrorD("failed-log", kv.M{"log": line})
 		}
-	case CatastrophicOutputError:
+	case CatastrophicSendBatchError:
 		b.log.CriticalD("send-batch", kv.M{"msg": e.Error()})
 		os.Exit(1)
 	default:
diff --git a/cmd/batchconsumer/main.go b/cmd/batchconsumer/main.go
index 0285139..5d35924 100644
--- a/cmd/batchconsumer/main.go
+++ b/cmd/batchconsumer/main.go
@@ -44,13 +44,13 @@ type exampleSender struct {
 	output logger.KayveeLogger
 }
 
-func (e *exampleSender) EncodeLog(rawlog []byte) ([]byte, []string, error) {
-	if len(rawlog)%5 == 2 {
-		return nil, nil, kbc.ErrLogIgnored
+func (e *exampleSender) ProcessMessage(rawmsg []byte) ([]byte, []string, error) {
+	if len(rawmsg)%5 == 2 {
+		return nil, nil, kbc.ErrMessageIgnored
 	}
 
-	tag1 := fmt.Sprintf("tag-%d", len(rawlog)%5)
-	line := tag1 + ": " + string(rawlog)
+	tag1 := fmt.Sprintf("tag-%d", len(rawmsg)%5)
+	line := tag1 + ": " + string(rawmsg)
 
 	return []byte(line), []string{tag1}, nil
 }

From e8f40e607a37ad5de8651c0cd9f96c0df7ed1d90 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Wed, 19 Jul 2017 19:00:28 +0000
Subject: [PATCH 10/16] Added unit test for SequencePair IsLessThan function

---
 batchconsumer/batcher/message_batcher_test.go | 37 +++++++++++++++++++
 1 file changed, 37 insertions(+)

diff --git a/batchconsumer/batcher/message_batcher_test.go b/batchconsumer/batcher/message_batcher_test.go
index fc9c6fe..9215da7 100644
--- a/batchconsumer/batcher/message_batcher_test.go
+++ b/batchconsumer/batcher/message_batcher_test.go
@@ -213,3 +213,40 @@ func TestUpdatingSequence(t *testing.T) {
 	sync.waitForFlush(time.Minute)
 	assert.Nil(batcher.SmallestSequencePair().Sequence)
 }
+
+func TestSequencePairIsLessThan(t *testing.T) {
+	assert := assert.New(t)
+
+	big10 := big.NewInt(10)
+	big5 := big.NewInt(5)
+
+	tests := []struct {
+		left   SequencePair
+		right  SequencePair
+		isLess bool
+	}{
+		{left: SequencePair{nil, 0}, right: SequencePair{nil, 0}, isLess: false},
+		{left: SequencePair{nil, 0}, right: SequencePair{big10, 10}, isLess: false},
+
+		{left: SequencePair{big10, 0}, right: SequencePair{nil, 0}, isLess: true},
+
+		{left: SequencePair{big5, 0}, right: SequencePair{big10, 0}, isLess: true},
+		{left: SequencePair{big5, 0}, right: SequencePair{big5, 10}, isLess: true},
+
+		{left: SequencePair{big10, 0}, right: SequencePair{big5, 0}, isLess: false},
+		{left: SequencePair{big5, 10}, right: SequencePair{big5, 0}, isLess: false},
+	}
+
+	for _, test := range tests {
+		left := test.left
+		right := test.right
+		t.Logf(
+			"Is <%s, %d> less than <%s, %d>? %t",
+			left.Sequence.String(), left.SubSequence,
+			right.Sequence.String(), right.SubSequence,
+			test.isLess,
+		)
+
+		assert.Equal(test.isLess, left.IsLessThan(right))
+	}
+}

From 164b9923bebbc5a84b5a6d356c9dc3cb0175765c Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Wed, 19 Jul 2017 19:06:27 +0000
Subject: [PATCH 11/16] Reworded docs to remove references to firehose. 
 Renamed config variables to be clearer.

---
 batchconsumer/consumer.go | 24 ++++++++++++------------
 batchconsumer/writer.go   |  2 +-
 cmd/batchconsumer/main.go |  6 +++---
 3 files changed, 16 insertions(+), 16 deletions(-)

diff --git a/batchconsumer/consumer.go b/batchconsumer/consumer.go
index 4bac1e8..7d6eae5 100644
--- a/batchconsumer/consumer.go
+++ b/batchconsumer/consumer.go
@@ -18,12 +18,12 @@ type Config struct {
 
 	// LogFile where consumer errors and failed log lines are saved
 	LogFile string
-	// FlushInterval is how often accumulated messages should be bulk put to firehose
-	FlushInterval time.Duration
-	// FlushCount is the number of messages that triggers a push to firehose. Max batch size is 500, see: http://docs.aws.amazon.com/firehose/latest/dev/limits.html
-	FlushCount int
-	// FlushSize is the size of a batch in bytes that triggers a push to firehose. Max batch size is 4Mb (4*1024*1024), see: http://docs.aws.amazon.com/firehose/latest/dev/limits.html
-	FlushSize int
+	// BatchInterval the upper bound on how often SendBatch is called with accumulated messages
+	BatchInterval time.Duration
+	// BatchCount is the number of messages that triggers a SendBatch call
+	BatchCount int
+	// BatchSize is the size of a batch in bytes that triggers a SendBatch call
+	BatchSize int
 
 	// ReadRateLimit the number of records read per seconds
 	ReadRateLimit int
@@ -49,14 +49,14 @@ func withDefaults(config Config) Config {
 		config.LogFile = "/tmp/kcl-" + time.Now().Format(time.RFC3339)
 	}
 
-	if config.FlushInterval == 0 {
-		config.FlushInterval = 10 * time.Second
+	if config.BatchInterval == 0 {
+		config.BatchInterval = 10 * time.Second
 	}
-	if config.FlushCount == 0 {
-		config.FlushCount = 500
+	if config.BatchCount == 0 {
+		config.BatchCount = 500
 	}
-	if config.FlushSize == 0 {
-		config.FlushSize = 4 * 1024 * 1024
+	if config.BatchSize == 0 {
+		config.BatchSize = 4 * 1024 * 1024
 	}
 
 	if config.DeployEnv == "" {
diff --git a/batchconsumer/writer.go b/batchconsumer/writer.go
index 6e3a3a7..f78d217 100644
--- a/batchconsumer/writer.go
+++ b/batchconsumer/writer.go
@@ -118,7 +118,7 @@ func (b *batchedWriter) createBatcher(tag string) batcher.Batcher {
 		tag:    tag,
 		writer: b,
 	}
-	return batcher.New(sync, b.config.FlushInterval, b.config.FlushCount, b.config.FlushSize)
+	return batcher.New(sync, b.config.BatchInterval, b.config.BatchCount, b.config.BatchSize)
 }
 
 func (b *batchedWriter) splitMessageIfNecessary(record []byte) ([][]byte, error) {
diff --git a/cmd/batchconsumer/main.go b/cmd/batchconsumer/main.go
index 5d35924..f97e574 100644
--- a/cmd/batchconsumer/main.go
+++ b/cmd/batchconsumer/main.go
@@ -25,9 +25,9 @@ func createDummyOutput() (logger.KayveeLogger, *os.File) {
 
 func main() {
 	config := kbc.Config{
-		FlushInterval: 10 * time.Second,
-		FlushCount:    500,
-		FlushSize:     4 * 1024 * 1024, // 4Mb
+		BatchInterval: 10 * time.Second,
+		BatchCount:    500,
+		BatchSize:     4 * 1024 * 1024, // 4Mb
 		LogFile:       "/tmp/example-kcl-consumer",
 		DeployEnv:     "test-env",
 	}

From b0f769bfa7e03e2971f03858b8c3d2ec1342d342 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Fri, 21 Jul 2017 01:04:34 +0000
Subject: [PATCH 12/16] Breaking change to KCL.  Created Checkpointer interface
 to make testing easier.

---
 cmd/consumer/main.go |  4 ++--
 kcl/kcl.go           | 22 ++++++++++++++--------
 2 files changed, 16 insertions(+), 10 deletions(-)

diff --git a/cmd/consumer/main.go b/cmd/consumer/main.go
index 77a75c9..02281a9 100644
--- a/cmd/consumer/main.go
+++ b/cmd/consumer/main.go
@@ -10,7 +10,7 @@ import (
 )
 
 type sampleRecordProcessor struct {
-	checkpointer      *kcl.Checkpointer
+	checkpointer      kcl.Checkpointer
 	checkpointRetries int
 	checkpointFreq    time.Duration
 	largestSeq        *big.Int
@@ -25,7 +25,7 @@ func newSampleRecordProcessor() *sampleRecordProcessor {
 	}
 }
 
-func (srp *sampleRecordProcessor) Initialize(shardID string, checkpointer *kcl.Checkpointer) error {
+func (srp *sampleRecordProcessor) Initialize(shardID string, checkpointer kcl.Checkpointer) error {
 	srp.lastCheckpoint = time.Now()
 	srp.checkpointer = checkpointer
 	return nil
diff --git a/kcl/kcl.go b/kcl/kcl.go
index 1ccd333..b47347c 100644
--- a/kcl/kcl.go
+++ b/kcl/kcl.go
@@ -12,11 +12,17 @@ import (
 )
 
 type RecordProcessor interface {
-	Initialize(shardID string, checkpointer *Checkpointer) error
+	Initialize(shardID string, checkpointer Checkpointer) error
 	ProcessRecords(records []Record) error
 	Shutdown(reason string) error
 }
 
+type Checkpointer interface {
+	Checkpoint(sequenceNumber *string, subSequenceNumber *int) error
+	CheckpointWithRetry(sequenceNumber *string, subSequenceNumber *int, retryCount int) error
+	Shutdown()
+}
+
 type CheckpointError struct {
 	e string
 }
@@ -25,13 +31,13 @@ func (ce CheckpointError) Error() string {
 	return ce.e
 }
 
-type Checkpointer struct {
+type checkpointer struct {
 	mux sync.Mutex
 
 	ioHandler ioHandler
 }
 
-func (c *Checkpointer) getAction() (interface{}, error) {
+func (c *checkpointer) getAction() (interface{}, error) {
 	line, err := c.ioHandler.readLine()
 	if err != nil {
 		return nil, err
@@ -43,7 +49,7 @@ func (c *Checkpointer) getAction() (interface{}, error) {
 	return action, nil
 }
 
-func (c *Checkpointer) Checkpoint(sequenceNumber *string, subSequenceNumber *int) error {
+func (c *checkpointer) Checkpoint(sequenceNumber *string, subSequenceNumber *int) error {
 	c.mux.Lock()
 	defer c.mux.Unlock()
 
@@ -74,7 +80,7 @@ func (c *Checkpointer) Checkpoint(sequenceNumber *string, subSequenceNumber *int
 
 // CheckpointWithRetry tries to save a checkPoint up to `retryCount` + 1 times.
 // `retryCount` should be >= 0
-func (c *Checkpointer) CheckpointWithRetry(
+func (c *checkpointer) CheckpointWithRetry(
 	sequenceNumber *string, subSequenceNumber *int, retryCount int,
 ) error {
 	sleepDuration := 5 * time.Second
@@ -108,7 +114,7 @@ func (c *Checkpointer) CheckpointWithRetry(
 	return nil
 }
 
-func (c *Checkpointer) Shutdown() {
+func (c *checkpointer) Shutdown() {
 	c.CheckpointWithRetry(nil, nil, 5)
 }
 
@@ -225,7 +231,7 @@ func New(inputFile io.Reader, outputFile, errorFile io.Writer, recordProcessor R
 	}
 	return &KCLProcess{
 		ioHandler: i,
-		checkpointer: &Checkpointer{
+		checkpointer: &checkpointer{
 			ioHandler: i,
 		},
 		recordProcessor: recordProcessor,
@@ -234,7 +240,7 @@ func New(inputFile io.Reader, outputFile, errorFile io.Writer, recordProcessor R
 
 type KCLProcess struct {
 	ioHandler       ioHandler
-	checkpointer    *Checkpointer
+	checkpointer    Checkpointer
 	recordProcessor RecordProcessor
 }
 

From ae37b57e6132af226222c13e0dc7eaa200cc7456 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Fri, 21 Jul 2017 01:23:25 +0000
Subject: [PATCH 13/16] Added IsEmpty to SequencePair

---
 batchconsumer/batcher/message_batcher.go      | 16 ++++++++--------
 batchconsumer/batcher/message_batcher_test.go | 15 ++++++++++++---
 2 files changed, 20 insertions(+), 11 deletions(-)

diff --git a/batchconsumer/batcher/message_batcher.go b/batchconsumer/batcher/message_batcher.go
index b57a6e5..1cf93e5 100644
--- a/batchconsumer/batcher/message_batcher.go
+++ b/batchconsumer/batcher/message_batcher.go
@@ -13,13 +13,14 @@ type SequencePair struct {
 	SubSequence int
 }
 
+func (s SequencePair) IsEmpty() bool {
+	return s.Sequence == nil
+}
+
 func (s SequencePair) IsLessThan(pair SequencePair) bool {
-	if s.Sequence == nil {
+	if s.IsEmpty() || pair.IsEmpty() { // empty pairs are incomparable
 		return false
 	}
-	if pair.Sequence == nil {
-		return true
-	}
 
 	cmp := s.Sequence.Cmp(pair.Sequence)
 	if cmp == -1 {
@@ -62,8 +63,7 @@ type batcher struct {
 	flushCount    int
 	flushSize     int
 
-	// smallestSeq and smallestSubSeq are used to track the highest sequence number
-	// of any record in the batch. This is used for checkpointing.
+	// smallestSeq are used for checkpointing
 	smallestSeq SequencePair
 
 	sync      Sync
@@ -129,8 +129,8 @@ func (b *batcher) updateSequenceNumbers(pair SequencePair) {
 	b.mux.Lock()
 	defer b.mux.Unlock()
 
-	if pair.IsLessThan(b.smallestSeq) {
-		b.smallestSeq = SequencePair{pair.Sequence, pair.SubSequence}
+	if b.smallestSeq.IsEmpty() || pair.IsLessThan(b.smallestSeq) {
+		b.smallestSeq = pair
 	}
 }
 
diff --git a/batchconsumer/batcher/message_batcher_test.go b/batchconsumer/batcher/message_batcher_test.go
index 9215da7..23f24f9 100644
--- a/batchconsumer/batcher/message_batcher_test.go
+++ b/batchconsumer/batcher/message_batcher_test.go
@@ -226,9 +226,8 @@ func TestSequencePairIsLessThan(t *testing.T) {
 		isLess bool
 	}{
 		{left: SequencePair{nil, 0}, right: SequencePair{nil, 0}, isLess: false},
-		{left: SequencePair{nil, 0}, right: SequencePair{big10, 10}, isLess: false},
-
-		{left: SequencePair{big10, 0}, right: SequencePair{nil, 0}, isLess: true},
+		{left: SequencePair{nil, 0}, right: SequencePair{big10, 0}, isLess: false},
+		{left: SequencePair{big10, 0}, right: SequencePair{nil, 0}, isLess: false},
 
 		{left: SequencePair{big5, 0}, right: SequencePair{big10, 0}, isLess: true},
 		{left: SequencePair{big5, 0}, right: SequencePair{big5, 10}, isLess: true},
@@ -250,3 +249,13 @@ func TestSequencePairIsLessThan(t *testing.T) {
 		assert.Equal(test.isLess, left.IsLessThan(right))
 	}
 }
+
+func TestSequencePairEmpty(t *testing.T) {
+	assert := assert.New(t)
+
+	assert.True(SequencePair{nil, 0}.IsEmpty())
+	assert.True(SequencePair{nil, 10000}.IsEmpty())
+
+	assert.False(SequencePair{big.NewInt(10), 0}.IsEmpty())
+	assert.False(SequencePair{big.NewInt(0), 1000}.IsEmpty())
+}

From 0cb14948a3795f96de7662a1d566770c9c1a3cdb Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Fri, 21 Jul 2017 01:27:17 +0000
Subject: [PATCH 14/16] KCL more aggressively logs errors

---
 kcl/kcl.go | 12 +++++++++---
 1 file changed, 9 insertions(+), 3 deletions(-)

diff --git a/kcl/kcl.go b/kcl/kcl.go
index b47347c..950a92c 100644
--- a/kcl/kcl.go
+++ b/kcl/kcl.go
@@ -284,11 +284,17 @@ func (kclp *KCLProcess) Run() {
 	for {
 		line, err := kclp.ioHandler.readLine()
 		if err != nil {
-			kclp.ioHandler.writeError(err.Error())
+			kclp.ioHandler.writeError("Read line error: " + err.Error())
 			return
 		} else if line == nil {
-			break
+			kclp.ioHandler.writeError("Empty read line recieved")
+			return
+		}
+
+		err = kclp.handleLine(line.String())
+		if err != nil {
+			kclp.ioHandler.writeError("Handle line error: " + err.Error())
+			return
 		}
-		kclp.handleLine(line.String())
 	}
 }

From 939fc5406f14fbaa518ae66b9ceb7aa449c3fafc Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Fri, 21 Jul 2017 01:33:59 +0000
Subject: [PATCH 15/16] Batcher now returns error if bad config is provided

---
 batchconsumer/batcher/message_batcher.go      | 16 +++++++++---
 batchconsumer/batcher/message_batcher_test.go | 25 +++++++++++--------
 batchconsumer/writer.go                       |  7 +++++-
 3 files changed, 33 insertions(+), 15 deletions(-)

diff --git a/batchconsumer/batcher/message_batcher.go b/batchconsumer/batcher/message_batcher.go
index 1cf93e5..fbf25ba 100644
--- a/batchconsumer/batcher/message_batcher.go
+++ b/batchconsumer/batcher/message_batcher.go
@@ -76,8 +76,18 @@ type batcher struct {
 // - flushInterval - how often accumulated messages should be flushed (default 1 second).
 // - flushCount - number of messages that trigger a flush (default 10).
 // - flushSize - size of batch that triggers a flush (default 1024 * 1024 = 1 mb)
-func New(sync Sync, flushInterval time.Duration, flushCount int, flushSize int) Batcher {
-	msgChan := make(chan msgPack, 100)
+func New(sync Sync, flushInterval time.Duration, flushCount int, flushSize int) (Batcher, error) {
+	if flushSize == 0 {
+		return nil, fmt.Errorf("flush size must be non-zero")
+	}
+	if flushCount == 0 {
+		return nil, fmt.Errorf("flush count must be non-zero")
+	}
+	if flushInterval == 0 {
+		return nil, fmt.Errorf("flush interval must be non-zero")
+	}
+
+	msgChan := make(chan msgPack)
 	flushChan := make(chan struct{})
 
 	b := &batcher{
@@ -91,7 +101,7 @@ func New(sync Sync, flushInterval time.Duration, flushCount int, flushSize int)
 
 	go b.startBatcher(msgChan, flushChan)
 
-	return b
+	return b, nil
 }
 
 func (b *batcher) SmallestSequencePair() SequencePair {
diff --git a/batchconsumer/batcher/message_batcher_test.go b/batchconsumer/batcher/message_batcher_test.go
index 23f24f9..8ab9039 100644
--- a/batchconsumer/batcher/message_batcher_test.go
+++ b/batchconsumer/batcher/message_batcher_test.go
@@ -40,11 +40,11 @@ func (m *MockSync) waitForFlush(timeout time.Duration) error {
 var mockSequence = SequencePair{big.NewInt(99999), 12345}
 
 func TestBatchingByCount(t *testing.T) {
-	var err error
 	assert := assert.New(t)
 
 	sync := NewMockSync()
-	batcher := New(sync, time.Hour, 2, 1024*1024)
+	batcher, err := New(sync, time.Hour, 2, 1024*1024)
+	assert.NoError(err)
 
 	t.Log("Batcher respect count limit")
 	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequence))
@@ -65,11 +65,11 @@ func TestBatchingByCount(t *testing.T) {
 }
 
 func TestBatchingByTime(t *testing.T) {
-	var err error
 	assert := assert.New(t)
 
 	sync := NewMockSync()
-	batcher := New(sync, time.Millisecond, 2000000, 1024*1024)
+	batcher, err := New(sync, time.Millisecond, 2000000, 1024*1024)
+	assert.NoError(err)
 
 	t.Log("Batcher sends partial batches when time expires")
 	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequence))
@@ -99,11 +99,11 @@ func TestBatchingByTime(t *testing.T) {
 }
 
 func TestBatchingBySize(t *testing.T) {
-	var err error
 	assert := assert.New(t)
 
 	sync := NewMockSync()
-	batcher := New(sync, time.Hour, 2000000, 8)
+	batcher, err := New(sync, time.Hour, 2000000, 8)
+	assert.NoError(err)
 
 	t.Log("Large messages are sent immediately")
 	assert.NoError(batcher.AddMessage([]byte("hellohello"), mockSequence))
@@ -145,11 +145,11 @@ func TestBatchingBySize(t *testing.T) {
 }
 
 func TestFlushing(t *testing.T) {
-	var err error
 	assert := assert.New(t)
 
 	sync := NewMockSync()
-	batcher := New(sync, time.Hour, 2000000, 1024*1024)
+	batcher, err := New(sync, time.Hour, 2000000, 1024*1024)
+	assert.NoError(err)
 
 	t.Log("Calling flush sends pending messages")
 	assert.NoError(batcher.AddMessage([]byte("hihi"), mockSequence))
@@ -168,11 +168,11 @@ func TestFlushing(t *testing.T) {
 }
 
 func TestSendingEmpty(t *testing.T) {
-	var err error
 	assert := assert.New(t)
 
 	sync := NewMockSync()
-	batcher := New(sync, time.Second, 10, 1024*1024)
+	batcher, err := New(sync, time.Second, 10, 1024*1024)
+	assert.NoError(err)
 
 	t.Log("An error is returned when an empty message is sent")
 	err = batcher.AddMessage([]byte{}, mockSequence)
@@ -184,7 +184,10 @@ func TestUpdatingSequence(t *testing.T) {
 	assert := assert.New(t)
 
 	sync := NewMockSync()
-	batcher := New(sync, time.Second, 10, 1024*1024).(*batcher)
+	b, err := New(sync, time.Second, 10, 1024*1024)
+	assert.NoError(err)
+
+	batcher := b.(*batcher)
 
 	t.Log("Initally, smallestSeq is undefined")
 	assert.Nil(batcher.SmallestSequencePair().Sequence)
diff --git a/batchconsumer/writer.go b/batchconsumer/writer.go
index f78d217..a3100cd 100644
--- a/batchconsumer/writer.go
+++ b/batchconsumer/writer.go
@@ -118,7 +118,12 @@ func (b *batchedWriter) createBatcher(tag string) batcher.Batcher {
 		tag:    tag,
 		writer: b,
 	}
-	return batcher.New(sync, b.config.BatchInterval, b.config.BatchCount, b.config.BatchSize)
+	batch, err := batcher.New(sync, b.config.BatchInterval, b.config.BatchCount, b.config.BatchSize)
+	if err != nil {
+		b.log.ErrorD("create-batcher", kv.M{"msg": err.Error(), "tag": tag})
+	}
+
+	return batch
 }
 
 func (b *batchedWriter) splitMessageIfNecessary(record []byte) ([][]byte, error) {

From 212ec45d882bdc6f639c309f3455a88f07bf1c67 Mon Sep 17 00:00:00 2001
From: Xavi Ramirez <xavi.ramirez@clever.com>
Date: Fri, 21 Jul 2017 01:35:54 +0000
Subject: [PATCH 16/16] Added writter unit tests and fixed a slew of
 concurrency bugs

---
 batchconsumer/batcher/message_batcher.go |   3 +-
 batchconsumer/consumer.go                |   6 +-
 batchconsumer/sync.go                    |   1 -
 batchconsumer/writer.go                  | 187 ++++++++----
 batchconsumer/writer_test.go             | 372 +++++++++++++++++++++++
 5 files changed, 505 insertions(+), 64 deletions(-)
 create mode 100644 batchconsumer/writer_test.go

diff --git a/batchconsumer/batcher/message_batcher.go b/batchconsumer/batcher/message_batcher.go
index fbf25ba..82245e8 100644
--- a/batchconsumer/batcher/message_batcher.go
+++ b/batchconsumer/batcher/message_batcher.go
@@ -159,8 +159,9 @@ func (b *batcher) batchSize(batch [][]byte) int {
 
 func (b *batcher) flush(batch [][]byte) [][]byte {
 	if len(batch) > 0 {
-		b.mux.Lock()
 		b.sync.SendBatch(batch)
+
+		b.mux.Lock()
 		b.smallestSeq = SequencePair{nil, 0}
 		b.mux.Unlock()
 	}
diff --git a/batchconsumer/consumer.go b/batchconsumer/consumer.go
index 7d6eae5..f43ef05 100644
--- a/batchconsumer/consumer.go
+++ b/batchconsumer/consumer.go
@@ -98,11 +98,7 @@ func NewBatchConsumerFromFiles(
 	kvlog := logger.New("amazon-kinesis-client-go")
 	kvlog.SetOutput(file)
 
-	wrt := &batchedWriter{
-		config: config,
-		log:    kvlog,
-		sender: sender,
-	}
+	wrt := NewBatchedWriter(config, sender, kvlog)
 	kclProcess := kcl.New(input, output, errFile, wrt)
 
 	return &BatchConsumer{
diff --git a/batchconsumer/sync.go b/batchconsumer/sync.go
index 517a943..f50a703 100644
--- a/batchconsumer/sync.go
+++ b/batchconsumer/sync.go
@@ -7,5 +7,4 @@ type batcherSync struct {
 
 func (b *batcherSync) SendBatch(batch [][]byte) {
 	b.writer.SendBatch(batch, b.tag)
-	b.writer.CheckPointBatch(b.tag)
 }
diff --git a/batchconsumer/writer.go b/batchconsumer/writer.go
index a3100cd..f641f62 100644
--- a/batchconsumer/writer.go
+++ b/batchconsumer/writer.go
@@ -16,28 +16,51 @@ import (
 	"github.com/Clever/amazon-kinesis-client-go/splitter"
 )
 
+type tagMsgPair struct {
+	tag  string
+	msg  []byte
+	pair batcher.SequencePair
+}
+
 type batchedWriter struct {
 	config Config
 	sender Sender
 	log    kv.KayveeLogger
 
-	shardID        string
-	checkpointChan chan batcher.SequencePair
+	shardID string
+
+	checkpointMsg     chan batcher.SequencePair
+	checkpointTag     chan string
+	lastProcessedPair chan batcher.SequencePair
+	batchMsg          chan tagMsgPair
+	flushBatches      chan struct{}
 
 	// Limits the number of records read from the stream
 	rateLimiter *rate.Limiter
 
-	batchers         map[string]batcher.Batcher
 	lastProcessedSeq batcher.SequencePair
 }
 
-func (b *batchedWriter) Initialize(shardID string, checkpointer *kcl.Checkpointer) error {
-	b.batchers = map[string]batcher.Batcher{}
-	b.shardID = shardID
-	b.checkpointChan = make(chan batcher.SequencePair)
-	b.rateLimiter = rate.NewLimiter(rate.Limit(b.config.ReadRateLimit), b.config.ReadBurstLimit)
+func NewBatchedWriter(config Config, sender Sender, log kv.KayveeLogger) *batchedWriter {
+	return &batchedWriter{
+		config: config,
+		sender: sender,
+		log:    log,
 
-	b.startCheckpointListener(checkpointer, b.checkpointChan)
+		rateLimiter: rate.NewLimiter(rate.Limit(config.ReadRateLimit), config.ReadBurstLimit),
+	}
+}
+
+func (b *batchedWriter) Initialize(shardID string, checkpointer kcl.Checkpointer) error {
+	b.shardID = shardID
+	b.checkpointMsg = make(chan batcher.SequencePair)
+	b.startCheckpointListener(checkpointer, b.checkpointMsg)
+
+	b.checkpointTag = make(chan string)
+	b.batchMsg = make(chan tagMsgPair)
+	b.flushBatches = make(chan struct{})
+	b.lastProcessedPair = make(chan batcher.SequencePair)
+	b.startMessageHandler(b.batchMsg, b.checkpointTag, b.lastProcessedPair, b.flushBatches)
 
 	return nil
 }
@@ -72,19 +95,19 @@ func (b *batchedWriter) handleCheckpointError(err error) bool {
 }
 
 func (b *batchedWriter) startCheckpointListener(
-	checkpointer *kcl.Checkpointer, checkpointChan <-chan batcher.SequencePair,
+	checkpointer kcl.Checkpointer, checkpointMsg <-chan batcher.SequencePair,
 ) {
-	lastCheckpoint := time.Now()
-
 	go func() {
+		lastCheckpoint := time.Now()
+
 		for {
-			seq := <-checkpointChan
+			seq := <-checkpointMsg
 
 			// This is a write throttle to ensure we don't checkpoint faster than
 			// b.config.CheckpointFreq.  The latest seq number is always used.
 			for time.Now().Sub(lastCheckpoint) < b.config.CheckpointFreq {
 				select {
-				case seq = <-checkpointChan: // Keep updating checkpoint seq while waiting
+				case seq = <-checkpointMsg: // Keep updating checkpoint seq while waiting
 				case <-time.NewTimer(b.config.CheckpointFreq - time.Now().Sub(lastCheckpoint)).C:
 				}
 			}
@@ -126,6 +149,74 @@ func (b *batchedWriter) createBatcher(tag string) batcher.Batcher {
 	return batch
 }
 
+// startMessageDistributer starts a go-routine that routes messages to batches.  It's in uses a
+// go routine to avoid racey conditions.
+func (b *batchedWriter) startMessageHandler(
+	batchMsg <-chan tagMsgPair, checkpointTag <-chan string, lastPair <-chan batcher.SequencePair,
+	flushBatches <-chan struct{},
+) {
+	go func() {
+		var lastProcessedPair batcher.SequencePair
+		batchers := map[string]batcher.Batcher{}
+		areBatchersEmpty := true
+
+		for {
+			select {
+			case tmp := <-batchMsg:
+				batcher, ok := batchers[tmp.tag]
+				if !ok {
+					batcher = b.createBatcher(tmp.tag)
+					batchers[tmp.tag] = batcher
+				}
+
+				err := batcher.AddMessage(tmp.msg, tmp.pair)
+				if err != nil {
+					b.log.ErrorD("add-message", kv.M{
+						"err": err.Error(), "msg": string(tmp.msg), "tag": tmp.tag,
+					})
+				}
+				areBatchersEmpty = false
+			case tag := <-checkpointTag:
+				smallest := lastProcessedPair
+				isAllEmpty := true
+
+				for name, batch := range batchers {
+					if tag == name {
+						continue
+					}
+
+					pair := batch.SmallestSequencePair()
+					if pair.IsEmpty() { // Occurs when batch has no items
+						continue
+					}
+
+					if pair.IsLessThan(smallest) {
+						smallest = pair
+					}
+
+					isAllEmpty = false
+				}
+
+				if !smallest.IsEmpty() {
+					b.checkpointMsg <- smallest
+				}
+				areBatchersEmpty = isAllEmpty
+			case pair := <-lastPair:
+				if areBatchersEmpty {
+					b.checkpointMsg <- pair
+				}
+				lastProcessedPair = pair
+			case <-flushBatches:
+				for _, batch := range batchers {
+					batch.Flush()
+				}
+				b.checkpointMsg <- lastProcessedPair
+				areBatchersEmpty = true
+			}
+		}
+	}()
+}
+
 func (b *batchedWriter) splitMessageIfNecessary(record []byte) ([][]byte, error) {
 	// We handle two types of records:
 	// - records emitted from CWLogs Subscription
@@ -140,7 +231,8 @@ func (b *batchedWriter) splitMessageIfNecessary(record []byte) ([][]byte, error)
 }
 
 func (b *batchedWriter) ProcessRecords(records []kcl.Record) error {
-	curSequence := b.lastProcessedSeq
+	var pair batcher.SequencePair
+	prevPair := b.lastProcessedSeq
 
 	for _, record := range records {
 		// Wait until rate limiter permits one more record to be processed
@@ -151,77 +243,58 @@ func (b *batchedWriter) ProcessRecords(records []kcl.Record) error {
 			return fmt.Errorf("could not parse sequence number '%s'", record.SequenceNumber)
 		}
 
-		b.lastProcessedSeq = curSequence // Updated with the value from the previous iteration
-		curSequence = batcher.SequencePair{seq, record.SubSequenceNumber}
+		pair = batcher.SequencePair{seq, record.SubSequenceNumber}
+		if prevPair.IsEmpty() { // Handles on-start edge case where b.lastProcessSeq is empty
+			prevPair = pair
+		}
 
 		data, err := base64.StdEncoding.DecodeString(record.Data)
 		if err != nil {
 			return err
 		}
 
-		rawlogs, err := b.splitMessageIfNecessary(data)
+		messages, err := b.splitMessageIfNecessary(data)
 		if err != nil {
 			return err
 		}
-		for _, rawlog := range rawlogs {
-			log, tags, err := b.sender.ProcessMessage(rawlog)
+		for _, rawmsg := range messages {
+			msg, tags, err := b.sender.ProcessMessage(rawmsg)
+
 			if err == ErrMessageIgnored {
 				continue // Skip message
 			} else if err != nil {
-				return err
+				b.log.ErrorD("process-message", kv.M{"msg": err.Error(), "rawmsg": string(rawmsg)})
+				continue // Don't stop processing messages because of one bad message
 			}
 
 			if len(tags) == 0 {
-				return fmt.Errorf("No tags provided by consumer for log: %s", string(rawlog))
+				b.log.ErrorD("no-tags", kv.M{"rawmsg": string(rawmsg)})
+				return fmt.Errorf("No tags provided by consumer for log: %s", string(rawmsg))
 			}
 
 			for _, tag := range tags {
-				batcher, ok := b.batchers[tag]
-				if !ok {
-					batcher = b.createBatcher(tag)
-					b.batchers[tag] = batcher
+				if tag == "" {
+					b.log.ErrorD("blank-tag", kv.M{"rawmsg": string(rawmsg)})
+					return fmt.Errorf("Blank tag provided by consumer for log: %s", string(rawmsg))
 				}
 
 				// Use second to last sequence number to ensure we don't checkpoint a message before
 				// it's been sent.  When batches are sent, conceptually we first find the smallest
 				// sequence number amount all the batch (let's call it A).  We then checkpoint at
 				// the A-1 sequence number.
-				err = batcher.AddMessage(log, b.lastProcessedSeq)
-				if err != nil {
-					return err
-				}
+				b.batchMsg <- tagMsgPair{tag, msg, prevPair}
 			}
 		}
-	}
 
-	b.lastProcessedSeq = curSequence
+		prevPair = pair
+		b.lastProcessedPair <- pair
+	}
+	b.lastProcessedSeq = pair
 
 	return nil
 }
 
-func (b *batchedWriter) CheckPointBatch(tag string) {
-	smallest := b.lastProcessedSeq
-
-	for name, batch := range b.batchers {
-		if tag == name {
-			continue
-		}
-
-		pair := batch.SmallestSequencePair()
-		if pair.Sequence == nil { // Occurs when batch has no items
-			continue
-		}
-
-		if pair.IsLessThan(smallest) {
-			smallest = pair
-		}
-	}
-
-	b.checkpointChan <- smallest
-}
-
 func (b *batchedWriter) SendBatch(batch [][]byte, tag string) {
-	b.log.Info("sent-batch")
 	err := b.sender.SendBatch(batch, tag)
 	switch e := err.(type) {
 	case nil: // Do nothing
@@ -237,14 +310,14 @@ func (b *batchedWriter) SendBatch(batch [][]byte, tag string) {
 		b.log.CriticalD("send-batch", kv.M{"msg": e.Error()})
 		os.Exit(1)
 	}
+
+	b.checkpointTag <- tag
 }
 
 func (b *batchedWriter) Shutdown(reason string) error {
 	if reason == "TERMINATE" {
 		b.log.InfoD("terminate-signal", kv.M{"shard-id": b.shardID})
-		for _, batch := range b.batchers {
-			batch.Flush()
-		}
+		b.flushBatches <- struct{}{}
 	} else {
 		b.log.ErrorD("shutdown-failover", kv.M{"shard-id": b.shardID, "reason": reason})
 	}
diff --git a/batchconsumer/writer_test.go b/batchconsumer/writer_test.go
new file mode 100644
index 0000000..6622937
--- /dev/null
+++ b/batchconsumer/writer_test.go
@@ -0,0 +1,372 @@
+package batchconsumer
+
+import (
+	"encoding/base64"
+	"fmt"
+	"testing"
+	"time"
+
+	"github.com/stretchr/testify/assert"
+	"gopkg.in/Clever/kayvee-go.v6/logger"
+
+	"github.com/Clever/amazon-kinesis-client-go/kcl"
+)
+
+type ignoringSender struct{}
+
+func (i ignoringSender) ProcessMessage(rawmsg []byte) (msg []byte, tags []string, err error) {
+	return nil, nil, ErrMessageIgnored
+}
+
+func (i ignoringSender) SendBatch(batch [][]byte, tag string) error {
+	panic("SendBatch Should never be called.  ProcessMessage ignores all messasges.")
+}
+
+type tagBatch struct {
+	tag   string
+	batch [][]byte
+}
+type msgAsTagSender struct {
+	batches   map[string][][][]byte
+	saveBatch chan tagBatch
+	shutdown  chan struct{}
+}
+
+func NewMsgAsTagSender() *msgAsTagSender {
+	sender := &msgAsTagSender{
+		batches:   map[string][][][]byte{},
+		saveBatch: make(chan tagBatch),
+		shutdown:  make(chan struct{}),
+	}
+
+	sender.startBatchSaver(sender.saveBatch, sender.shutdown)
+
+	return sender
+}
+
+func (i *msgAsTagSender) startBatchSaver(saveBatch <-chan tagBatch, shutdown <-chan struct{}) {
+	go func() {
+		for {
+			select {
+			case tb := <-saveBatch:
+				batches, ok := i.batches[tb.tag]
+				if !ok {
+					batches = [][][]byte{}
+				}
+				i.batches[tb.tag] = append(batches, tb.batch)
+			case <-shutdown:
+				return
+			}
+		}
+	}()
+}
+
+func (i *msgAsTagSender) ProcessMessage(rawmsg []byte) (msg []byte, tags []string, err error) {
+	if "ignore" == string(rawmsg) {
+		return nil, nil, ErrMessageIgnored
+	}
+
+	return rawmsg, []string{string(rawmsg)}, nil
+}
+
+func (i *msgAsTagSender) SendBatch(batch [][]byte, tag string) error {
+	i.saveBatch <- tagBatch{tag, batch}
+	return nil
+}
+
+func (i *msgAsTagSender) Shutdown() {
+	i.shutdown <- struct{}{}
+}
+
+type mockCheckpointer struct {
+	recievedSequences []string
+	checkpoint        chan string
+	done              chan struct{}
+	timeout           chan struct{}
+	shutdown          chan struct{}
+}
+
+func NewMockCheckpointer(maxSeq string, timeout time.Duration) *mockCheckpointer {
+	mcp := &mockCheckpointer{
+		checkpoint: make(chan string),
+		done:       make(chan struct{}, 1),
+		timeout:    make(chan struct{}, 1),
+		shutdown:   make(chan struct{}),
+	}
+	mcp.startWaiter(maxSeq, timeout)
+
+	return mcp
+}
+
+func (m *mockCheckpointer) startWaiter(maxSeq string, timeout time.Duration) {
+	go func() {
+		for {
+			select {
+			case seq := <-m.checkpoint:
+				m.recievedSequences = append(m.recievedSequences, seq)
+				if seq == maxSeq {
+					m.done <- struct{}{}
+				}
+			case <-time.NewTimer(timeout).C:
+				m.timeout <- struct{}{}
+			case <-m.shutdown:
+				return
+			}
+		}
+	}()
+}
+func (m *mockCheckpointer) wait() error {
+	select {
+	case <-m.done:
+		return nil
+	case <-m.timeout:
+		return fmt.Errorf("timeout waiting for checkpoints")
+	}
+}
+func (m *mockCheckpointer) Shutdown() {
+	m.shutdown <- struct{}{}
+}
+func (m *mockCheckpointer) Checkpoint(sequenceNumber *string, subSequenceNumber *int) error {
+	m.checkpoint <- *sequenceNumber
+	return nil
+}
+func (m *mockCheckpointer) CheckpointWithRetry(
+	sequenceNumber *string, subSequenceNumber *int, retryCount int,
+) error {
+	return m.Checkpoint(sequenceNumber, subSequenceNumber)
+}
+
+func encode(str string) string {
+	return base64.StdEncoding.EncodeToString([]byte(str))
+}
+
+func TestProcessRecordsIgnoredMessages(t *testing.T) {
+	assert := assert.New(t)
+
+	mocklog := logger.New("testing")
+	mockconfig := withDefaults(Config{
+		BatchInterval:  10 * time.Millisecond,
+		CheckpointFreq: 20 * time.Millisecond,
+	})
+	mockcheckpointer := NewMockCheckpointer("4", 5*time.Second)
+
+	wrt := NewBatchedWriter(mockconfig, ignoringSender{}, mocklog)
+	wrt.Initialize("test-shard", mockcheckpointer)
+
+	err := wrt.ProcessRecords([]kcl.Record{
+		kcl.Record{SequenceNumber: "1", Data: encode("hi")},
+		kcl.Record{SequenceNumber: "2", Data: encode("hi")},
+		kcl.Record{SequenceNumber: "3", Data: encode("hi")},
+		kcl.Record{SequenceNumber: "4", Data: encode("hi")},
+	})
+	assert.NoError(err)
+
+	err = mockcheckpointer.wait()
+	assert.NoError(err)
+}
+
+func TestProcessRecordsMutliBatchBasic(t *testing.T) {
+	assert := assert.New(t)
+
+	mocklog := logger.New("testing")
+	mockconfig := withDefaults(Config{
+		BatchInterval:  100 * time.Millisecond,
+		CheckpointFreq: 200 * time.Millisecond,
+	})
+	mockcheckpointer := NewMockCheckpointer("8", 5*time.Second)
+	mocksender := NewMsgAsTagSender()
+
+	wrt := NewBatchedWriter(mockconfig, mocksender, mocklog)
+	wrt.Initialize("test-shard", mockcheckpointer)
+
+	err := wrt.ProcessRecords([]kcl.Record{
+		kcl.Record{SequenceNumber: "1", Data: encode("tag1")},
+		kcl.Record{SequenceNumber: "2", Data: encode("tag2")},
+		kcl.Record{SequenceNumber: "3", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "4", Data: encode("tag2")},
+	})
+	assert.NoError(err)
+	err = wrt.ProcessRecords([]kcl.Record{
+		kcl.Record{SequenceNumber: "5", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "6", Data: encode("tag2")},
+		kcl.Record{SequenceNumber: "7", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "8", Data: encode("tag1")},
+	})
+	assert.NoError(err)
+
+	time.Sleep(200 * time.Millisecond) // Sleep to ensure checkpoint get flushed at least once
+
+	err = wrt.Shutdown("TERMINATE")
+	assert.NoError(err)
+
+	err = mockcheckpointer.wait()
+	assert.NoError(err)
+
+	mocksender.Shutdown()
+
+	assert.Contains(mocksender.batches, "tag1")
+	assert.Equal(1, len(mocksender.batches["tag1"]))    // One batch
+	assert.Equal(2, len(mocksender.batches["tag1"][0])) // with two items
+	assert.Equal("tag1", string(mocksender.batches["tag1"][0][0]))
+	assert.Equal("tag1", string(mocksender.batches["tag1"][0][1]))
+
+	assert.Contains(mocksender.batches, "tag2")
+	assert.Equal(1, len(mocksender.batches["tag2"]))    // One batch
+	assert.Equal(3, len(mocksender.batches["tag2"][0])) // with three items
+	assert.Equal("tag2", string(mocksender.batches["tag2"][0][0]))
+	assert.Equal("tag2", string(mocksender.batches["tag2"][0][1]))
+	assert.Equal("tag2", string(mocksender.batches["tag2"][0][2]))
+
+	assert.Contains(mocksender.batches, "tag3")
+	assert.Equal(1, len(mocksender.batches["tag3"]))    // One batch
+	assert.Equal(3, len(mocksender.batches["tag3"][0])) // with three items
+	assert.Equal("tag3", string(mocksender.batches["tag3"][0][0]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][0][1]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][0][2]))
+}
+
+func TestProcessRecordsMutliBatchWithIgnores(t *testing.T) {
+	assert := assert.New(t)
+
+	mocklog := logger.New("testing")
+	mockconfig := withDefaults(Config{
+		BatchInterval:  100 * time.Millisecond,
+		CheckpointFreq: 200 * time.Millisecond,
+	})
+	mockcheckpointer := NewMockCheckpointer("26", 5*time.Second)
+	mocksender := NewMsgAsTagSender()
+
+	wrt := NewBatchedWriter(mockconfig, mocksender, mocklog)
+	wrt.Initialize("test-shard", mockcheckpointer)
+
+	err := wrt.ProcessRecords([]kcl.Record{
+		kcl.Record{SequenceNumber: "1", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "2", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "3", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "4", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "5", Data: encode("tag1")},
+		kcl.Record{SequenceNumber: "6", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "7", Data: encode("tag2")},
+		kcl.Record{SequenceNumber: "8", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "9", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "10", Data: encode("tag2")},
+		kcl.Record{SequenceNumber: "11", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "12", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "13", Data: encode("ignore")},
+	})
+	assert.NoError(err)
+	err = wrt.ProcessRecords([]kcl.Record{
+		kcl.Record{SequenceNumber: "14", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "15", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "16", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "17", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "18", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "19", Data: encode("tag2")},
+		kcl.Record{SequenceNumber: "20", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "21", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "22", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "23", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "24", Data: encode("ignore")},
+		kcl.Record{SequenceNumber: "25", Data: encode("tag1")},
+		kcl.Record{SequenceNumber: "26", Data: encode("ignore")},
+	})
+	assert.NoError(err)
+
+	time.Sleep(200 * time.Millisecond) // Sleep to ensure checkpoint get flushed at least once
+
+	err = wrt.Shutdown("TERMINATE")
+	assert.NoError(err)
+
+	err = mockcheckpointer.wait()
+	assert.NoError(err)
+
+	mocksender.Shutdown()
+
+	assert.Contains(mocksender.batches, "tag1")
+	assert.Equal(1, len(mocksender.batches["tag1"]))    // One batch
+	assert.Equal(2, len(mocksender.batches["tag1"][0])) // with two items
+	assert.Equal("tag1", string(mocksender.batches["tag1"][0][0]))
+	assert.Equal("tag1", string(mocksender.batches["tag1"][0][1]))
+
+	assert.Contains(mocksender.batches, "tag2")
+	assert.Equal(1, len(mocksender.batches["tag2"]))    // One batch
+	assert.Equal(3, len(mocksender.batches["tag2"][0])) // with three items
+	assert.Equal("tag2", string(mocksender.batches["tag2"][0][0]))
+	assert.Equal("tag2", string(mocksender.batches["tag2"][0][1]))
+	assert.Equal("tag2", string(mocksender.batches["tag2"][0][2]))
+
+	assert.Contains(mocksender.batches, "tag3")
+	assert.Equal(1, len(mocksender.batches["tag3"]))    // One batch
+	assert.Equal(3, len(mocksender.batches["tag3"][0])) // with three items
+	assert.Equal("tag3", string(mocksender.batches["tag3"][0][0]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][0][1]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][0][2]))
+}
+
+func TestStaggeredCheckpionting(t *testing.T) {
+	assert := assert.New(t)
+
+	mocklog := logger.New("testing")
+	mockconfig := withDefaults(Config{
+		BatchCount:     2,
+		BatchInterval:  100 * time.Millisecond,
+		CheckpointFreq: 200 * time.Nanosecond,
+	})
+	mockcheckpointer := NewMockCheckpointer("9", 5*time.Second)
+	mocksender := NewMsgAsTagSender()
+
+	wrt := NewBatchedWriter(mockconfig, mocksender, mocklog)
+	wrt.Initialize("test-shard", mockcheckpointer)
+
+	err := wrt.ProcessRecords([]kcl.Record{
+		kcl.Record{SequenceNumber: "1", Data: encode("tag1")},
+		kcl.Record{SequenceNumber: "2", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "3", Data: encode("tag1")},
+		kcl.Record{SequenceNumber: "4", Data: encode("tag3")},
+	})
+	assert.NoError(err)
+	err = wrt.ProcessRecords([]kcl.Record{
+		kcl.Record{SequenceNumber: "5", Data: encode("tag1")},
+		kcl.Record{SequenceNumber: "6", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "7", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "8", Data: encode("tag3")},
+		kcl.Record{SequenceNumber: "9", Data: encode("tag3")},
+	})
+	assert.NoError(err)
+
+	time.Sleep(200 * time.Millisecond) // Sleep to ensure checkpoint get flushed at least once
+
+	err = wrt.Shutdown("TERMINATE")
+	assert.NoError(err)
+
+	err = mockcheckpointer.wait()
+	assert.NoError(err)
+
+	mocksender.Shutdown()
+	mockcheckpointer.Shutdown()
+
+	// Test to make sure writer doesn't prematurely checkpoint messages
+	// Checkpoints 5,6,7,8 will never be submitted because the 3rd "tag1" is in a batch
+	// Checkpoint 9 is submitted on shutdown when everything is being flushed
+	assert.NotContains(mockcheckpointer.recievedSequences, "5")
+	assert.NotContains(mockcheckpointer.recievedSequences, "6")
+	assert.NotContains(mockcheckpointer.recievedSequences, "7")
+	assert.NotContains(mockcheckpointer.recievedSequences, "8")
+
+	assert.Contains(mocksender.batches, "tag1")
+	assert.Equal(2, len(mocksender.batches["tag1"]))    // One batch
+	assert.Equal(2, len(mocksender.batches["tag1"][0])) // with two items
+	assert.Equal("tag1", string(mocksender.batches["tag1"][0][0]))
+	assert.Equal("tag1", string(mocksender.batches["tag1"][0][1]))
+	assert.Equal("tag1", string(mocksender.batches["tag1"][1][0]))
+
+	assert.Contains(mocksender.batches, "tag3")
+	assert.Equal(3, len(mocksender.batches["tag3"]))    // One batch
+	assert.Equal(2, len(mocksender.batches["tag3"][0])) // with three items
+	assert.Equal("tag3", string(mocksender.batches["tag3"][0][0]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][0][1]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][1][0]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][1][1]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][2][0]))
+	assert.Equal("tag3", string(mocksender.batches["tag3"][2][1]))
+}