Недавно Сибирское отделение РАН провело рейтинг сайтов научно-исследовательских организаций, библиотек, вузов. Сайт АлтГУ в этом рейтинге вошел в тройку лучших в Сибири. Рейтинг был определен методами вебометрики. Газета СО РАН «Наука в Сибири» N 44 за 2008 год опубликовала подробный материал об этом.
О РЕЙТИНГЕ САЙТОВ НАУЧНЫХ ОРГАНИЗАЦИЙ СО РАН
В настоящее время уже не обсуждается вопрос о необходимости существования сайта научной организации, все исследовательские центры имеют официальные сайты. И, конечно, возникает естественное желание их сравнить, а затем такое сравнение использовать при развитии сайтов.
Существуют разные методы определения полноты представления организации в сети Интернет. Мы проведем анализ сайтов научных организаций СО РАН методами вебометрики.
Вебометрика (webometrics) возникла после расширения понятия «библиометрика» на веб-пространство. Библиометрика представляет собой набор методов для изучения текстов и информации, методы библиометрики включают анализ цитирования и контентный анализ. Термин вебометрика ввели Т. Алминд и П. Игверсен в 1997 г. Ими дано определение вебометрики как науки о количественных аспектах создания и использования информационных ресурсов, структур и технологий в веб-пространстве, выросшей из библиометрики и информатики.
Веб-пространство — новый тип информационного ресурса без централизованного контроля, без координированного индексирования содержания. Однако веб-пространство не является хаотической системой, в нем происходит самоорганизация в группы. Веб-пространство организуется путем взаимодействия большого числа индивидуумов и групп. Связи между разными документами устанавливаются с помощью ссылок. Изучение этих ссылок с помощью методов вебометрики позволяет определять устройство веб-пространства.
Для исследования веб-сайта используются несколько количественных параметров. П. Игверсен ввел в 1998 г. понятие Web Impact Factor (WIF). WIF — это отношение числа входящих ссылок на сайт V к общему числу страниц сайта S. Однако для определения качества сайта бывает недостаточно использовать WIF. Параметр S определяется поисковыми системами и может существенно отличаться от реального числа страниц сайта, поэтому значение параметра WIF зависит от используемой поисковой системы, от языка сайта и других факторов.
Регулярные исследования университетской и академической среды ведутся лабораторией Cybermetrics Lab, которая принадлежит Consejio Superior Investigaciones Cienthficas — крупнейшему исследовательскому центру Испании. Первоначально проект Webometrics Ranking of World Universities (далее проект Webometrics) был направлен на стимулирование веб-публикаций. Рейтинг составлялся исходя не из числа визитов и дизайна сайта, а основывался на полноте представления университета в сети. Со временем рейтинг университетов приобрел популярность, а в число организаций, которые оцениваются, были включены академические институты и научные центры. В июле 2008 г. в рейтинг 1000 научных организаций вошли Портал СО РАН (66 место) и Портал РАН (91 место).
Предметом нашего анализа является официальный домен учреждения, поэтому в рейтинг включены только научные учреждения СО РАН, имеющие независимый домен. Если учреждение имеет более одного сетевого адреса, информация обо всех доменах используется в совокупности. Под доменом мы понимаем условное обозначение, служащее для индивидуализации информационных ресурсов, принадлежащих учреждению Российской академии наук в российской доменной зоне «ru» международной компьютерной сети Интернет.
Первое исследование сайтов СО РАН было проведено 8 апреля 2008 г. по формуле, которую предложили участники проекта Webometrics. Для оценки сайта измерялись четыре параметра S, V, R, Sc, где S — размер сайта, то есть количество страниц, определяемое поисковыми системами. Параметр V — видимость сайта — означает число внешних ссылок на ресурс, которое определяется поисковыми системами. Параметр R — число «мощных» файлов — означает суммарное количество файлов форматов Adobe Acrobat (.pdf), Microsoft Word (.doc) и Microsoft Powerpoint (.ppt), представленных на сайте. Параметр Sc — индекс цитирования — определялся путем суммирования документов, в которых приводятся цитаты из докладов, статей и других научных материалов. Участники проекта Webometrics использовали Google, Yahoo, Live Search и Exalead, мы же использовали Яндекс, Google, Yahoo, т.к. именно эти поисковые системы наиболее полно индексируют русскоязычную часть Интернета.
Было замечено, что определяющую роль в рейтинге играет индекс цитирования. Тогда были опробованы другие формулы, при их применении рейтинг менялся в средней части, лучшие и худшие сайты оставались на своих местах. После серии экспериментов остановились на формуле, в которой четыре параметра вносят примерно одинаковый вклад при определении места сайта в рейтинге. Рейтинг подсчитывался по формуле:
W = V + S + 2∙R + 1,5∙Sc,
где V = log10(V0), V0 = VЯндекс+VGoogle+VYahoo]/3, т.е. количество внешних ссылок на сайт определялось последовательно с помощью поисковых систем Яндекс, Google и Yahoo, а затем вычислялось среднее арифметическое;
S — среднее арифметическое количества страниц на сайте:
S = log10(S0), S0 = [SЯндекс+SGoogle+SYahoo]/3;
R — среднее арифметическое от количества PDF, DOC, PPT файлов (в сумме):
R = log10(R0), R0 = [RЯндекс+RGoogle+RYahoo]/3.
Sc — среднее арифметическое логарифмов индексов цитирования:
Sc = [log10(ScЯндекс)+log10(ScGoogle)]/2.
причем здесь использовались сведения из систем Индекс цитирования Яндекса и Google Scholar.
В таблице 1 представлены результаты анализа 30 сайтов из 80. Посмотреть рейтинг всех организаций можно на сайте ИВТ СО РАН по адресу http://www.ict.nsc.ru/ranking/.
Адреса сайтов организаций СО РАН были взяты из информационной системы «Организации и сотрудники СО РАН», размещенной на Портале СО РАН.
Легко подсчитать, что только 14 сайтов имеют число внешних ссылок более 1000. Большие сайты, у которых поисковики определяют 1000 страниц и более, у 23 организаций. Сайтов, на которых представлены документы, статьи, презентации в форматах PDF, DOC, PPT и их число более 100, — у 23 организаций. Индекс цитирования выше 1000 у 4 организаций, от 100 до 1000 у 34 организаций. В целом можно отметить, что широко известна в сети Интернет примерно одна треть научных организаций СО РАН.
Если сравнивать рейтинги от 8 апреля и 1 сентября, то можно отметить следующее. Первая десятка лучших сайтов СО РАН не изменилась. С 16-го места на 11-ое передвинулся сайт Института леса им. В.Н. Сукачева СО РАН. Произошло это за счет того, что поисковая система Яндекс стала индексировать этот сайт, возможно, сайт был зарегистрирован в Яндексе администратором. За последние месяцы на сайте появилось много новой информации, полезной для научной работы и учебы.
По параметрам, замеряемым для определения рейтинга всех учреждений, произошел рост. Для большинства сайтов рост монотонный. Поисковая система Google с апреля нашла 2 новых сайта, это сайт Института оптики атмосферы и сайт Института почвоведения и агрохимии. Только для 15 из 80 сайтов СО РАН Google определяет внешние ссылки.
Рост параметров, которые замерялись с помощью поисковой системы Яндекс, был существенней, чем у других систем. У 10 сайтов некоторые параметры выросли на порядок. Из этого следует, что администраторам необходимо прописывать сайты в поисковых системах, в различных справочниках и каталогах. Сайты ИЯФ СО РАН, ИЦиГ СО РАН, ИМ СО РАН, ИФП СО РАН и некоторых других институтов быстро развиваются, главным образом, за счет статей журналов, документов, проектов и другой информации, которая регулярно выкладывается на сайт.
Также был проведен рейтинг университетов Сибирского региона и некоторых библиотек (см. таб. 2 и 3).
Таблица 2. Итоговый рейтинг сайтов университетов Сибирского региона
от 7 июня и 1 сентября 2008 г.
№ |
Организация |
www |
7.06 |
1.09 |
1 | Новосибирский госуниверситет | http://www.nsu.ru/ |
16,26 |
16,25 |
2 | Томский госуниверситет | http://www.tsu.ru/ |
14,76 |
14,43 |
3 | Алтайский госуниверситет | http://www.asu.ru/ |
14,30 |
13,41 |
4 | Сибирский федеральный университет, г. Красноярск | http://www.sfu-kras.ru/ |
12,61 |
12,73 |
5 | Тюменский госуниверситет | http://www.utmn.ru/ |
12,57 |
12,65 |
6 | Иркутский госуниверситет | http://www.isu.ru/ |
12,24 |
12,08 |
7 | Омский госуниверситет | http://www.univer.omsk.su/ |
11,72 |
11,67 |
8 | Кемеровский госуниверситет | http://mmedia2.kemsu.ru/ |
11,58 |
11,42 |
9 | Бурятский госуниверситет | http://www.bsu.ru/ |
11,59 |
11,36 |
Таблица 3. Итоговый рейтинг сайтов библиотек от 7 июня и 1 сентября 2008 г.
№ | Организация | www | 7.06 | 1.09 |
1 | ГПНТБ России | http://www.gpntb.ru/ | 14,80 | 14,80 |
2 | Российская национальная библиотека, СПб. | http://www.nlr.ru/ | 14,16 | 14,14 |
3 | Российская государственная библиотека | http://www.rsl.ru/ | 13,00 | 12,98 |
4 | ГПНТБ Новосибирск | http://www.spsl.nsc.ru/ | 12,68 | 12,59 |
5 | Библиотека иностранной литературы | http://www.libfl.ru/ | 12,32 | 12,47 |
6 | Библиотека РАН | http://www.rasl.ru/ | 9,03 | 9,26 |
Рейтинг библиотек и университетов не претерпел существенных изменений. Начиная с ноября ИВТ СО РАН будет периодически публиковать на своем сайте (http://www.ict.nsc.ru/ranking/) рейтинги сайтов всех институтов СО РАН.
О.А. Клименко, Ю.И. Шокин
http://www.sbras.ru/HBC/hbc.phtml?5+479+1