블로그 이미지
JEEN

서울에 사는 꽃청년의 IT찌질모험기

Rss feed Tistory
IT 2008.12.09 15:07

[ Firefox, Selenium ] 그림파일은 읽지 않게 해줘요.

  난관에 봉착하고 그 난관을 넘어섰을 때 어떤 짜릿함을 느낀다고 할까요. 끙끙 앓으면서 문제를 해결했을 때의 그 참맛이라고 할까요.
 
  Selenium 을 Mechanize 로 대신 쓰는 이유는 Mechanize 자체는 Java script 를 해석할 수 없기 때문이라고 했습니다. Selenium 자체는 브라우저에 의존하기 때문에 브라우저에서 JS 로 컨트롤할 수 있는 부분은 거의 모든 부분을 컨트롤 할 수 있죠.
 하지만 그만큼 쓸데없는 연결이 발생하게 마련입니다. 처리하는 중에 쓸데없이 그림 파일을 읽을 필요도 없거니와, 그거 읽는 데 소비할 시간이 아깝다는 것이죠.

그림1. Firefox 환경설정 - 내용


 물론 Firefox 설정화면에서 위의 "그림 자동으로 읽기"의 체크를 해제하면 그림은 읽지 않게 할 수 있습니다. 하지만 Selenium 은 매번 실행시에 임시 profile 을 만들고 그것을 사용하기 때문에 기존 브라우저 설정을 그대로 적용할 수는 없습니다.

2008/11/19 - [IT] - [ Selenium ] Selenium RC 를 사용해보자. II

 위의 포스트에서도 소개했듯이, 그럴때는 Selenium 의 독자적인 profile 을 준비해야합니다.  임시 profile 을 생성할 시에 이 profile 을 우선적용하는 것이지요. 그럼 "그림 자동으로 읽기"에 관한 설정 정보는 어떤 것일 까요?


  URL 입력창에 about:config 로 들어가서 image 라는 설정이름을 가진 것들 중에 그럴 듯한 것을 훑어봤습니다. 그리고 설정화면에서 "그림 자동으로 읽기"를 해제하면 permissions.default.image 가 2로 바뀌죠.
  그럼 이것을 user preference java script 에 추가합니다.

  user_pref("permissions.default.image", 2);


  하지만 문제가 생겼습니다. 대상이 되는 서비스는 img 태그에 그림만을 지정한 것이 아니라 어떤 백그라운드 처리를 위해서 몇가지 img 태그에 그림파일이 아닌 url 이 적혀 있었던 것이었습니다. 다행히 그림용 URL 과는 달리 이런 URL 은 domain 이름부터가 달랐습니다.
  이 경우는 <그림 1>의 "그림 자동으로 읽기" 의 "예외목록..." 버튼을 누르면 설정이 가능합니다.
하지만 이 설정의 경우에는 about:config 에서 아무리 찾아봐도 등장하지 않았습니다. 그래서 찾아본 결과, Firefox 의 Profile Folder 의 Hostperm.1 파일에서 관리하고 있다고 합니다. 아래의 URL 을 참고해주세요.

  Profile Folder : http://kb.mozillazine.org/Profile_folder
  Hostperm.1   : http://kb.mozillazine.org/Hostperm.1

  하지만 profile folder 를 뒤져봐도 hostperm.1 이라는 파일은 어디에 있는 지 안보입니다. 다시 찾아본 결과 이에 대한 설정은 profile folder 의 permissions.sqlite 에서 관리하고 있다고 합니다. 일반 텍스트 파일도 아니고 SQLite 라니... 일단 이 파일을 Selenium 의 Firefox Profile 디렉토리에 복사하고 내용을 보도록 하겠습니다.

  sqlite3 permissions.sqlite

  해서 내용을 보면, permissions.sqlite DB 에는 moz_hosts 라는 테이블 하나 뿐입니다. 테이블 구성은 id, host, type, permission 이 있는데요. 위의 Hostperm.1 을 참고해서 다음처럼 등록했습니다.

  INSERT INTO moz_hosts VALUES(1, 'image.blahblah.net', 'image', 2);
  INSERT INTO moz_hoss VALUES(1, 'image2.blahblah.net', 'image', 2);
 
  그리고 Selenium 을 돌려서 해당 사이트에서 확인한 결과 image.blahblah.net 과 image2.blahblah.net 이라는 도메인을 가진 그림파일은 읽어오지 않게 되었습니다.
  그림 파일을 읽어오지 않으니, Selenium 으로 하는 작업 시간도 어느정도 단축할 수 있습니다. 특별히 그림을 판독하는 기능도 없거니와, 그림이 이건지 저건지 알 필요도 없으니까요.

  여기서 대전제를 먼저 쓰는 것을 잊어버렸는데요. Selenium 은 disk cache 를 사용할 수 없습니다. cache 를 사용할 수 있다면 여러번의 작업시 매번 똑같은 사이트를 들락날락 거리는 데 이미지를 매번 읽을 필요는 없겠죠. 하지만 memory cache 는 사용할 수 있습니다. 한번의 작업에 같은 사이트를 들락날락 거릴때는 cache 를 사용할 수 있죠. 하지만 작업이 끝나면 그 cache 는 지워져버리지만요.

  Selenium 을 통해서 Firefox 의 세세한 부분까지 알게되니(라고 쓰고 '알아야 한다니' 라고 읽습니다) .. 참...
  아무튼 사실 Selenium의 이야기를 가장한 Firefox 의 이야기였습니다.
신고
TOTAL 473,926 TODAY 7

티스토리 툴바