1 body: //span[@id='article_content' or @class='text16g']
4 strip: //div[.//div[contains(@id, 'ads.')]]
5 # related content heading
6 strip: //p[contains(., 'עוד בערוץ החדשות של ynet:')]
7 strip: //p[contains(., 'כותרות אחרונות מהעולם בחדשות ynet:')]
8 strip: //div[contains(., 'אינציקלופדיית ynet:')]
9 # related content links
10 strip: //a[@class='bluelink']
12 strip_image_src: ynet_manual_bullet.png
18 find_string: <script type='text/javascript'>
19 replace_string: <div style="display:none;">
20 find_string: </script>
21 replace_string: </div>
23 test_url: http://www.ynet.co.il/articles/0,7340,L-4354266,00.html
24 test_url: http://www.ynet.co.il/articles/0,7340,L-4354268,00.html
26 test_url: http://www.ynet.co.il/Integration/StoryRss2.xml