]> git.immae.eu Git - github/wallabag/wallabag.git/blobdiff - inc/3rdparty/site_config/standard/zeit.de.txt
update zeit.de.txt for removal of inline ads
[github/wallabag/wallabag.git] / inc / 3rdparty / site_config / standard / zeit.de.txt
index 9815d478f06e3cd269e409ba8ac7f072d7404c28..8c9c1718cc70cf575653d4e7162fa2344787cccd 100755 (executable)
@@ -1,3 +1,4 @@
+# 2014-10-21 [Marmo] added stripping of inline ads and appropriate test_url
 # 2013.10.30 [rezor92] fixed single_page_link
 # 2012-12-23 [carlo@...] fixed half-assed headlines in articles, removed inline author profiles, adjusted picture captions
 # 2012-03-17 [dkless@...] Cut metadata parts in the beginning and the ends of the content block; copyright entries for pictures removed; Author fixed, not sure if old entries still valid (I left them); Weird problems with some pages addressed (see last section for removing hidden section)
@@ -16,6 +17,8 @@ author: substring-after(//li[@class='source first '], 'Quelle: ')
 
 strip_id_or_class: articleheader
 strip: //div[@id="comments"] | //div[@class="pagination block"] | //p[@class="ressortbacklink"] | //div[@id="relatedArticles"]  |  // div[@class="inline portrait"]
+#Remove inline ads
+strip: //div[@class="innerad"]
 
 #Removes author and date from the start
 strip: //ul[@class="tools"]
@@ -43,3 +46,4 @@ strip_id_or_class:"pagination"
 
 footnotes: no
 test_url: http://www.zeit.de/kultur/film/2012-12/Kurzfilmtag
+test_url: http://www.zeit.de/wissen/2014-10/ebola-nigeria-who