v.0.0.2 schema and sync changes (#1)v0.0.2

Change number json schema to anyOf with multipleOf; skip empty rows; move write_bookmark to end of sync.py
author: Jeff Huth <39202799+jeffhuth-bytecode@users.noreply.github.com> 2019-12-04 06:10:46 -0800
committer: Kyle Allan <KAllan357@gmail.com> 2019-12-04 09:10:46 -0500
commit: 5890b89c1aa7c554235b3cef156b5a5a2c594bec (patch)
tree: 2f553cda853991aedb1cec68dc6d06b87d6fe190 /tap_google_sheets/streams.py
parent: 075af7096d3c1b369702feba4076c25b954732dc (diff)
download: tap-google-sheets-5890b89c1aa7c554235b3cef156b5a5a2c594bec.tar.gz
tap-google-sheets-5890b89c1aa7c554235b3cef156b5a5a2c594bec.tar.zst
tap-google-sheets-5890b89c1aa7c554235b3cef156b5a5a2c594bec.zip
1 files changed, 9 insertions, 1 deletions
diff --git a/tap_google_sheets/streams.py b/tap_google_sheets/streams.py
index b8e3eff..ad5529f 100644
--- a/tap_google_sheets/streams.py
+++ b/tap_google_sheets/streams.py
@@ -13,6 +13,8 @@ from collections import OrderedDict
 #   data_key: JSON element containing the results list for the endpoint;
 #       default = root (no data_key)
+# file_metadata: Queries Google Drive API to get file information and see if file has been modified
+#    Provides audit info about who and when last changed the file.
 FILE_METADATA = {
    "api": "files",
    "path": "files/{spreadsheet_id}",
@@ -24,6 +26,7 @@ FILE_METADATA = {
    }
 }
+# spreadsheet_metadata: Queries spreadsheet to get basic information on spreadhsheet and sheets
 SPREADSHEET_METADATA = {
    "api": "sheets",
    "path": "spreadsheets/{spreadsheet_id}",
@@ -34,6 +37,9 @@ SPREADSHEET_METADATA = {
    }
 }
+# sheet_metadata: Get Header Row and 1st data row (Rows 1 & 2) from a Sheet on Spreadsheet.
+# This endpoint includes detailed metadata about each cell in the header and first data row
+#   incl. data type, formatting, etc.
 SHEET_METADATA = {
    "api": "sheets",
    "path": "spreadsheets/{spreadsheet_id}",
@@ -45,6 +51,8 @@ SHEET_METADATA = {
    }
 }
+# sheets_loaded: Queries a batch of Rows for each Sheet in the Spreadsheet.
+# Each query uses the `values` endpoint, to get data-only, w/out the formatting/type metadata.
 SHEETS_LOADED = {
    "api": "sheets",
    "path": "spreadsheets/{spreadsheet_id}/values/'{sheet_title}'!{range_rows}",
@@ -58,7 +66,7 @@ SHEETS_LOADED = {
    }
 }
-# Ensure streams are ordered logically
+# Ensure streams are ordered sequentially, logically.
 STREAMS = OrderedDict()
 STREAMS['file_metadata'] = FILE_METADATA
 STREAMS['spreadsheet_metadata'] = SPREADSHEET_METADATA
author	Jeff Huth <39202799+jeffhuth-bytecode@users.noreply.github.com>	2019-12-04 06:10:46 -0800
committer	Kyle Allan <KAllan357@gmail.com>	2019-12-04 09:10:46 -0500
commit	5890b89c1aa7c554235b3cef156b5a5a2c594bec (patch)
tree	2f553cda853991aedb1cec68dc6d06b87d6fe190 /tap_google_sheets/streams.py
parent	075af7096d3c1b369702feba4076c25b954732dc (diff)
download	tap-google-sheets-5890b89c1aa7c554235b3cef156b5a5a2c594bec.tar.gz tap-google-sheets-5890b89c1aa7c554235b3cef156b5a5a2c594bec.tar.zst tap-google-sheets-5890b89c1aa7c554235b3cef156b5a5a2c594bec.zip