Bí kíp xây dựng hệ thống nghiên cứu tại Đại học Oxford
“Vào bất cứ thời điểm nào, các nhà nghiên cứu cũng có thể làm việc trên từng mảng khác nhau của cùng một dữ liệu, tiến hành nghiên cứu và phân tích đồng thời cùng lúc với nhau mà không làm ảnh hưởng đến cá nhân khác.” M. Mostafavi, James Martin Fellow, Đại học Oxford.
Giới thiệu về tổ chức
Ban cơ sở dữ liệu của trường Đại học Oxford đứng đầu thế giới về quy mô của hệ thống tài liệu từ lý thuyết cho tới thực tiễn, từ vi mô đến vĩ mô, từ thao tác xử lý dữ liệu đến ứng dụng công nghệ kỹ thuật. Năm 2008, thống kê cho thấy 80% kết quả nghiên cứu của trường Oxford dẫn đầu thế giới về mặt ứng dụng nội địa.
Thử thách
Ở Oxford, chỉ riêng một thí nghiệm thôi đã chiếm tới 100GB dữ liệu. Theo ông Mostafavi thì việc truyền tải và phân tích khối lượng dữ liệu như trên thật sự là một thách thức. Càng đi sâu vào phân tích thì khối lượng càng nhân lên. “Khi tiến hành phân tích, kết quả của quá trình này là tiền đề của một quá trình khác nên không thể xóa bỏ bất kì chi tiết nào. Trong khi đó, một công việc thường do một tập thể đảm đương, mỗi cá nhân trong tập thể đó lại chuyên về những ngành khác nhau, làm việc ở các trạm khác nhau, nên việc truyền tải và chia sẻ dữ liệu đối với chúng tôi là hết sức quan trọng.” Với Mostafavi, việc nhiều người đồng thời cùng truy cập vào từng mảng khác nhau trên cùng một dữ liệu với tốc độ cao là một việc “như mơ” mà ông và các đồng sự vẫn hy vọng có thể đáp ứng được.
Giải pháp
Công việc của các nhà nghiên cứu là thu thập dữ liệu sau đó cùng nhau phân tích. Trao đổi dữ liệu giữa các cơ sở bằng ổ cứng di động rất tốn thời gian. Hơn nữa còn có thể xảy ra tình trạng đưa nhầm dữ liệu và không xác định vị trí cụ thể của dữ liệu trong ổ cứng đó. “Một đồng nghiệp công tác tại Đại học Southampton nói rằng ông ấy cũng từng gặp tình trạng tương tự. Sau khi sử dụng Synology NAS thì những rắc rôi đó chỉ còn là quá khứ”. Sau khi tham khảo bộ phân IT của trường, Ban cơ sở dữ liệu đã quyết định sử dụng sản phẩm DS3612xs.
Sau khi lắp đặt Synology, chỉ trong vài ngày Mostafavi đã chuyển xong 7TB dữ liệu. Sau đó ông kết nối Synology với 4 máy tính tốc độ cao, tập trung phân tích dữ liệu theo những phương thức khác nhau. “Nhiều dữ liệu cực nặng và đòi hỏi nhiều bộ nhớ RAM, thông thường là 48GB, nên những máy tính mà đã sử dụng cho việc phân tích thì không thể làm những công việc khác được nữa. Và nếu như dữ liệu nằm trong ổ đĩa gắn ngoài thì những người dung khác không thể nào truy cập được vì tốc độ truy cập chậm không thể tả, từ đó dẫn đến tình trạng ứ đọng công việc làm trì trệ tiến độ nghiên cứu.” Mostafavi nhận xét. DS3612xs với vai trò là một server lưu trữ hiệu suất cao có thể đáp ứng những đòi hỏi nêu trên mà không ảnh hưởng đến hoạt động của nhóm làm việc khi chia sẻ dữ liệu.
Mostafavi nói thêm “Vào bất cứ thời điểm nào, các nhà nghiên cứu cũng có thể làm việc trên từng mảng khác nhau của cùng một dữ liệu, tiến hành nghiên cứu và phân tích đồng thời với nhau mà không ảnh hướng đến các nhân khác. Nó đem lại cho các nhà nghiên cứu sự linh động vì giờ đây họ có thể làm chủ được thời gian và truy cập dữ liệu bất cứ khi nào họ cần ”.
Nhóm nghiên cứu giờ đây đang thu nạp thêm nhiều thành viên mới “Chúng tôi đang tiến hành rất nhiều thí nghiệm, và dữ liệu ngày một nhiều. Rất có thể sắp tới chúng tôi sẽ mở rộng thêm kho lưu trữ bằng những sản phẩm mở rộng của Synology để công việc có thể tiếp tục suôn sẻ” Mostafavi chốt lại.