Hỏi cách sinh dữ liệu ngẫu nhiên từ tổ hợp các cột có trước

Liên hệ QC

sonsian

Thành viên mới
Tham gia
16/8/10
Bài viết
5
Được thích
2
Em muốn ghép cột Họ, Đệm, Tên, Giới tính, Nơi sinh từ bảng dữ liệu gốc nhằm mục đích ra rất nhiều người khác nhau.
- Trường hợp không phân biệt được giới tính thì em nghĩ sẽ sinh ra được là 7 x 7 x 7 x 2 x 7 = 4802 người
- Trường hợp phân biệt được giới tính thì em nghĩ sẽ sinh ra được là 7 x 5 x 3 x1 x 7 (nam) + 7 x 2 x 5 x1 x 7 (nữ) = 1225 người
Em muốn sinh dữ liệu ngẫu nhiên từ tổ hợp các cột có trước như ảnh dưới đây nhưng chưa biết làm như nào trong excel để có dữ liệu đủ lớn phục vụ việc nghiên cứu. Rất mong các anh, chị hướng dẫn thực hiện trong excel hoặc cách nào khác.

1656576213786.png
 
Em muốn ghép cột Họ, Đệm, Tên, Giới tính, Nơi sinh từ bảng dữ liệu gốc nhằm mục đích ra rất nhiều người khác nhau.
- Trường hợp không phân biệt được giới tính thì em nghĩ sẽ sinh ra được là 7 x 7 x 7 x 2 x 7 = 4802 người
- Trường hợp phân biệt được giới tính thì em nghĩ sẽ sinh ra được là 7 x 5 x 3 x1 x 7 (nam) + 7 x 2 x 5 x1 x 7 (nữ) = 1225 người
Em muốn sinh dữ liệu ngẫu nhiên từ tổ hợp các cột có trước như ảnh dưới đây nhưng chưa biết làm như nào trong excel để có dữ liệu đủ lớn phục vụ việc nghiên cứu. Rất mong các anh, chị hướng dẫn thực hiện trong excel hoặc cách nào khác.
"dữ liệu đủ lớn phục vụ việc nghiên cứu"
Nghiên cứu vấn đề gì vậy?
 
"dữ liệu đủ lớn phục vụ việc nghiên cứu"
Nghiên cứu vấn đề gì vậy?
Có khi nào dữ liệu thô thế này không thầy nhỉ? Còn dữ liệu thật nó là số không? Thấy thầy có mấy chủ đề về cái chỉnh hợp tổ hợp này. Thớt vào coi có nghiên cứu được không này
 
Chủ bài đăng thử với con macro này:
PHP:
Sub TaoDanhSachNgay()
 Dim J1 As Long, J2 As Long, J3 As Long, J4 As Long, J5 As Long, J6 As Long, J7 As Long, W As Long
 Dim Arr()
 ReDim aKQ(1 To (10) ^ 7, 1 To 6) As String
 
 Arr() = [B2:F8].Value
 For J1 = 1 To 7
    For J2 = 1 To 7
        For J3 = 1 To 7
            For J4 = 1 To 7
                For J5 = 1 To 7
                    W = W + 1
                    aKQ(W, 1) = Arr(J1, 1):     aKQ(W, 2) = Arr(J2, 2)
                    aKQ(W, 3) = Arr(J3, 3):     aKQ(W, 4) = Arr(J4, 4)
                    aKQ(W, 5) = Arr(J5, 5)
                 Next J5
            Next J4
        Next J3
    Next J2
 Next J1
 MsgBox W
 [H2].Resize(W, 5).Value = aKQ()
End Sub

TTHọĐệmTênGiới tínhNơi sinh
1TrầnVănHòaNmHN
2TừThịHoaNuHuế
3ThuNm
4NgôVânHoàiNmTF HCM
5LaNgaNaNuTH
6ÂuCaNuNA
7MaAnhDyNuNT
 
Chủ bài đăng thử với con macro này:
PHP:
Sub TaoDanhSachNgay()
 Dim J1 As Long, J2 As Long, J3 As Long, J4 As Long, J5 As Long, J6 As Long, J7 As Long, W As Long
 Dim Arr()
 ReDim aKQ(1 To (10) ^ 7, 1 To 6) As String
 
 Arr() = [B2:F8].Value
 For J1 = 1 To 7
    For J2 = 1 To 7
        For J3 = 1 To 7
            For J4 = 1 To 7
                For J5 = 1 To 7
                    W = W + 1
                    aKQ(W, 1) = Arr(J1, 1):     aKQ(W, 2) = Arr(J2, 2)
                    aKQ(W, 3) = Arr(J3, 3):     aKQ(W, 4) = Arr(J4, 4)
                    aKQ(W, 5) = Arr(J5, 5)
                 Next J5
            Next J4
        Next J3
    Next J2
 Next J1
 MsgBox W
 [H2].Resize(W, 5).Value = aKQ()
End Sub

TTHọĐệmTênGiới tínhNơi sinh
1TrầnVănHòaNmHN
2TừThịHoaNuHuế
3ThuNm
4NgôVânHoàiNmTF HCM
5LaNgaNaNuTH
6ÂuCaNuNA
7MaAnhDyNuNT
Chủ thớt còn muốn nhiều hơn "Em muốn sinh dữ liệu ngẫu nhiên từ tổ hợp các cột có trước"
 
Chủ thớt còn muốn nhiều hơn "Em muốn sinh dữ liệu ngẫu nhiên từ tổ hợp các cột có trước"
Mình chưa thật sự hiểu chuyện này, nên nhường bạn tiến lên phía trước đi vậy!
(Từ tổ hợp các cột có trước: Chỉ có thể thực hiện ở 1 số cột thôi, như [Họ], [Đệm] , [Tên] & [Tỉnh, thành] . . . . . .(?))
 
Chủ bài đăng thử với con macro này:
PHP:
Sub TaoDanhSachNgay()
 Dim J1 As Long, J2 As Long, J3 As Long, J4 As Long, J5 As Long, J6 As Long, J7 As Long, W As Long
 Dim Arr()
 ReDim aKQ(1 To (10) ^ 7, 1 To 6) As String
 
 Arr() = [B2:F8].Value
 For J1 = 1 To 7
    For J2 = 1 To 7
        For J3 = 1 To 7
            For J4 = 1 To 7
                For J5 = 1 To 7
                    W = W + 1
                    aKQ(W, 1) = Arr(J1, 1):     aKQ(W, 2) = Arr(J2, 2)
                    aKQ(W, 3) = Arr(J3, 3):     aKQ(W, 4) = Arr(J4, 4)
                    aKQ(W, 5) = Arr(J5, 5)
                 Next J5
            Next J4
        Next J3
    Next J2
 Next J1
 MsgBox W
 [H2].Resize(W, 5).Value = aKQ()
End Sub

TTHọĐệmTênGiới tínhNơi sinh
1TrầnVănHòaNmHN
2TừThịHoaNuHuế
3ThuNm
4NgôVânHoàiNmTF HCM
5LaNgaNaNuTH
6ÂuCaNuNA
7MaAnhDyNuNT
Cảm ơn anh/chị. Chắc là phải lập trình như anh/chị này gợi ý chứ không có sẵn công cụ ở trong excel
Bài đã được tự động gộp:

Cảm ơn mọi người vào góp ý kiến. E có bài toán nghiên cứu, phân tích liên quan đến nhân khẩu học. Vì vậy cần có dữ liệu về giới tính, tuổi, họ, đệm, tên, khu vực địa lý (tỉnh/thành ở Việt Nam) của các dân tộc trên toàn quốc. Số liệu thật thì không thể có được rồi (ngoài bộ công an hay tổng cục thống kê) nên em mới nghĩ đến cách tự sinh từ các cột cho trước.
 
Lần chỉnh sửa cuối:
Mình chưa thật sự hiểu chuyện này, nên nhường bạn tiến lên phía trước đi vậy!
(Từ tổ hợp các cột có trước: Chỉ có thể thực hiện ở 1 số cột thôi, như [Họ], [Đệm] , [Tên] & [Tỉnh, thành] . . . . . .(?))
Nhìn kết quả sẽ thấy tính quy luật và đoán biết dữ liệu ma, nếu xếp lộn xộn xà ngầu khó phát hiện dữ liệu dỏm hơn :)
 
Để dữ liệu ma biến thành dữ liệu quỉ thì thêm 2 công đoạn nữa: Thêm cột số ngẫu & xép thôi.
Có khi chủ bài đăng đang thực hiện đề tài cấp Nhà nước chăng(?)
 
Để dữ liệu ma biến thành dữ liệu quỉ thì thêm 2 công đoạn nữa: Thêm cột số ngẫu & xép thôi.
Có khi chủ bài đăng đang thực hiện đề tài cấp Nhà nước chăng(?)
Chủ trì đề tài cấp nhà nước thường là dân có máu mặt, xoàng xoàng cũng có học vị tiến sỉ và có nhiều đệ tử sai bảo, không lang thang hỏi bài trên diễn đàn :p
 
Để dữ liệu ma biến thành dữ liệu quỉ thì thêm 2 công đoạn nữa: Thêm cột số ngẫu & xép thôi.
Có khi chủ bài đăng đang thực hiện đề tài cấp Nhà nước chăng(?)
Thường thường loại này là của mấy tay cần số lượng đăng bài báo khoa học. Những tạp chí dỏm ngược lại cũng cần bài (*1) cho nên không xét qua chất lượng, nhận đăng tuốt.
Hiện tượng này rất phổ biến ở Nam Hàn. Dân nghiên cứu ai cũng biết danh Nam Hàn:
1. dữ liệu ma
2. nghiên cứu bất chấp tính chất nhân đạo và đạo đức

(*1) GPE này cũng đang tiến dần về kiểu này. Một bên hỏi bài loạn xạ, bên kia đói bài, hai bên đều có lợi.
 
. . . . .
1. dữ liệu ma
2. nghiên cứu bất chấp tính chất nhân đạo và đạo đức
(*1) GPE này cũng đang tiến dần về kiểu này. Một bên hỏi bài loạn xạ, bên kia đói bài, hai bên đều có lợi.
Trên GPE này bạn nêu vẫn còn thiếu 1 thành phần thứ II nữa, xuất hiện gần đây:
3. Tạo Nick ảo để gặp dịp là đâm bị thóc, chọc bị gạo

Vui thôi & chúc các bạn vui vẻ, khỏe mạnh!
Bài đã được tự động gộp:

Chủ trì đề tài cấp nhà nước thường là dân có máu mặt, xoàng xoàng cũng có học vị tiến sỉ và có nhiều đệ tử sai bảo, không lang thang hỏi bài trên diễn đàn :p
Sau cái vụ Việt Á thì mình chả tin ngay cái điều xoàng xoàng như bạn nêu nữa là đằng khác
. . . .
 
Chắc bạn này đang theo học khóa phân tích dữ liệu và kiếm dữ liệu mẫu để làm bài tập thôi.
 
Các bác gặp nhiều "dữ liệu ma" rồi nên bị ám ảnh quá. Nếu làm bài nghiên cứu khoa học thì việc tạo dữ liệu từ các thông tin rất đơn giản này này thì sử dụng được cái gì và ai chấp nhận không. Không chỉ nghiên cứu khoa học, làm bài báo mà có rất nhiều công việc khác phải cần khối lượng/tập dữ liệu rất lớn để làm mẫu dữ liệu để phân tích, bóc tách, huấn luyện,... để xây dựng được mô hình phục vụ bài toán kinh doanh. Ví dụ như google, facebook,..., lĩnh vực thương mại điện tử,... đang thu thập rất nhiều loại thông tin cá nhân đó.
Thực tế trong cơ sở dữ liệu quốc gia về dân cư cũng có hết những thông tin như em liệt kê ra, nhưng ở mức độ chi tiết hơn.
 
Dữ liệu ma là dữ liệu ma. Lập luận về mục đích là đường lối "cứu cánh biện minh cho phương tiện".
 
Việc tạo dữ liệu là chuyện bình thường. Tôi nhớ lúc viết code để sắp xếp tiếng Việt tôi cũng cần có dữ liệu để test code. Mà tôi cần rất nhiều, ít nhất là nửa triệu, vì tôi cần test cả tốc độ. Với mục đích ấy tôi không cần biết có tồn tại ngoài đời bé Nguyễn Ánh Tuyết hay không. Vì có hay không thì nó cũng không ảnh hưởng tới việc test code của tôi. Để có được dữ liệu có vẻ "đời thực" một chút thì nếu tôi nhớ không lầm thì tôi đã tìm và tải về các kết quả thi đại học, và mọi kết quả khác. Cứ có danh sách khủng họ tên là được.
Nếu việc bạn cần làm chỉ là bước phụ, vd. chỉ để kiểm tra một cái gì đấy, mà tính "đời thực" của dữ liệu không quan trọng thì bạn hoàn toàn có thể sử dụng dữ liệu tự tạo. Excel không có hàm để làm y nguyên cái bạn muốn nên phải viết. Nếu không tự viết được thì phải nhờ người khác. Họ có thể giúp hoặc đùa cợt, đó là quyền của họ. Rất tiếc là tôi đã không còn giữ dữ liệu hồi xưa. Quãng gần nửa triệu luôn.
 
Web KT

Bài viết mới nhất

Back
Top Bottom