v.1.0.3 Fix slashes and discovery errors (#15)v1.0.3

Fix issues: slashes `/` in sheet name 404 error; Discovery malformed sheet error when 2nd row final column value(s) are `NULL`.
author: Jeff Huth <39202799+jeffhuth-bytecode@users.noreply.github.com> 2020-04-29 11:29:42 -0700
committer: GitHub <noreply@github.com> 2020-04-29 14:29:42 -0400
commit: 5fc2ead55ea6a67c13e3caeec315454148be593d (patch)
tree: d85ed97e65f0de7807f3b58c09ab01e08625a26c /tap_google_sheets/schema.py
parent: ba9a302c2b1411ceca7753bd8b97f1944410f1ce (diff)
download: tap-google-sheets-5fc2ead55ea6a67c13e3caeec315454148be593d.tar.gz
tap-google-sheets-5fc2ead55ea6a67c13e3caeec315454148be593d.tar.zst
tap-google-sheets-5fc2ead55ea6a67c13e3caeec315454148be593d.zip
1 files changed, 13 insertions, 5 deletions
diff --git a/tap_google_sheets/schema.py b/tap_google_sheets/schema.py
index 3e63e75..fcaccf9 100644
--- a/tap_google_sheets/schema.py
+++ b/tap_google_sheets/schema.py
@@ -1,5 +1,7 @@
 import os
 import json
+import re
+import urllib.parse
 from collections import OrderedDict
 import singer
 from singer import metadata
@@ -74,8 +76,11 @@ def get_sheet_schema_columns(sheet):
            try:
                first_value = first_values[i]
            except IndexError as err:
-                raise Exception('NO VALUE IN 2ND ROW FOR HEADER ERROR. SHEET: {}, COL: {}, CELL: {}2. {}'.format(
+                LOGGER.info('NO VALUE IN 2ND ROW FOR HEADER. SHEET: {}, COL: {}, CELL: {}2. {}'.format(
                    sheet_title, column_name, column_letter, err))
+                first_value = {}
+                first_values.append(first_value)
+                pass
            column_effective_value = first_value.get('effectiveValue', {})
@@ -221,20 +226,23 @@ def get_sheet_metadata(sheet, spreadsheet_id, client):
    stream_metadata = STREAMS.get(stream_name)
    api = stream_metadata.get('api', 'sheets')
    params = stream_metadata.get('params', {})
+    sheet_title_encoded = urllib.parse.quote_plus(sheet_title)
+    sheet_title_escaped = re.escape(sheet_title)
    querystring = '&'.join(['%s=%s' % (key, value) for (key, value) in \
-        params.items()]).replace('{sheet_title}', sheet_title)
+        params.items()]).replace('{sheet_title}', sheet_title_encoded)
    path = '{}?{}'.format(stream_metadata.get('path').replace('{spreadsheet_id}', \
        spreadsheet_id), querystring)
-    sheet_md_results = client.get(path=path, api=api, endpoint=stream_name)
+    sheet_md_results = client.get(path=path, api=api, endpoint=sheet_title_escaped)
    # sheet_metadata: 1st `sheets` node in results
    sheet_metadata = sheet_md_results.get('sheets')[0]
    # Create sheet_json_schema (for discovery/catalog) and columns (for sheet_metadata results)
    try:
        sheet_json_schema, columns = get_sheet_schema_columns(sheet_metadata)
-    except:
+    except Exception as err:
-        LOGGER.info('SKIPPING Malformed sheet: {}'.format(sheet_title))
+        LOGGER.warning('{}'.format(err))
+        LOGGER.warning('SKIPPING Malformed sheet: {}'.format(sheet_title))
        sheet_json_schema, columns = None, None
    return sheet_json_schema, columns
author	Jeff Huth <39202799+jeffhuth-bytecode@users.noreply.github.com>	2020-04-29 11:29:42 -0700
committer	GitHub <noreply@github.com>	2020-04-29 14:29:42 -0400
commit	5fc2ead55ea6a67c13e3caeec315454148be593d (patch)
tree	d85ed97e65f0de7807f3b58c09ab01e08625a26c /tap_google_sheets/schema.py
parent	ba9a302c2b1411ceca7753bd8b97f1944410f1ce (diff)
download	tap-google-sheets-5fc2ead55ea6a67c13e3caeec315454148be593d.tar.gz tap-google-sheets-5fc2ead55ea6a67c13e3caeec315454148be593d.tar.zst tap-google-sheets-5fc2ead55ea6a67c13e3caeec315454148be593d.zip