<html><body><div style="color:#000; background-color:#fff; font-family:times new roman, new york, times, serif;font-size:12pt"><div><span>Have yo</span>u looked at yql (http://developer.yahoo.com/yql/) ??  It creates a sql like interface for web scraping.  <br></div><div><br></div><div>So a you can do a yql query like:</div><div><span><span class="keyword">select</span><span> * </span><span class="keyword">from</span><span> search.web </span><span class="keyword">where</span><span> query=</span><span class="string">"linux cifs setup"</span><span><br></span></span></div><div><span><span><br></span></span></div><div><span><span>And the result is a parsable xml document.</span></span></div><div><span><span><br></span></span></div><div><span><span>(Note I work for Yahoo so I may be a bit biased but I still think YQL is cool :-) )<br></span></span></div><div><blockquote style="border-left: 2px solid rgb(16, 16, 255);
 margin-left: 5px; margin-top: 5px; padding-left: 5px;"><div style="font-family: times new roman, new york, times, serif; font-size: 12pt;"><div style="font-family: times new roman, new york, times, serif; font-size: 12pt;"><div dir="ltr"><font size="2" face="Arial"><hr size="1">  <b><span style="font-weight:bold;">From:</span></b> Rich Shepard <rshepard@appl-ecosys.com><br> <b><span style="font-weight: bold;">To:</span></b> plug-talk@pdxlinux.org <br> <b><span style="font-weight: bold;">Sent:</span></b> Saturday, January 28, 2012 12:18 PM<br> <b><span style="font-weight: bold;">Subject:</span></b> [PLUG-TALK] Google Search Grumbles<br> </font> </div> <br>
   Others have vented here about the poor quality of search results using<br>Google. My frustration with it is requesting linux-specific results and<br>having most hits for Windows, even when I specify '- Windows' in the search<br>term.<br><br>   I'm trying now to find a tool that will export .dbf table data in ASCII<br>format so I can modify the data prior to import into postgees and R. Even<br>some bold-text headlines that say 'linux' have only Windows content on the<br>referenced page.<br><br>   Off to find another search engine.<br><br>Rich<br>_______________________________________________<br>PLUG-talk mailing list<br><a ymailto="mailto:PLUG-talk@lists.pdxlinux.org" href="mailto:PLUG-talk@lists.pdxlinux.org">PLUG-talk@lists.pdxlinux.org</a><br><a href="http://lists.pdxlinux.org/mailman/listinfo/plug-talk" target="_blank">http://lists.pdxlinux.org/mailman/listinfo/plug-talk</a><br><br><br> </div> </div> </blockquote></div>  
 </div></body></html>